版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
项目三图像数据清洗(下)主讲教师:段晓亮Imagedatacleaning1.图像去重采集的口罩样本中,我们需要检查每个图像之间的样本相似度,达到去除重复样本的目的。图像去重原理:1、对比数据集内每张图像和其他图像的像素尺寸,如何尺寸相同,则进一步判断;2、利用OpenCV计算相同尺寸图像的灰度直方图,根据直方图之间的距离判断图像相似度。3、删除图像尺寸相同,相似度较高的样本,重新遍历数据集。2.尺寸过滤过大的像素具有更多的信息,即使在缩小尺寸之后仍然具备足够的内容信息。过小的像素本身就不具丰富的内容信息,即使放大尺寸之后仍然会导致内容模糊。像素值为:80X80所以,数据集内小尺寸样本应该删除3.尺寸变换我们用智能手机拍摄的图像样本存在像素分辨率较大情况。分辨率较大会存在两种问题:一个数据样本“5.29MB”1.很难建立统一的标注标准标注误差导致算法精度降低2.像素值为:72X723.尺寸变换同时,爬虫脚本采集到的图像数据也会存在像素过小情况”过小的像素虽然会使用更小的内存空间,但是同样也会丢失样本的主体信息“分辨率为200X2003.尺寸变换思考:针对大像素样本或者小像素的图像样本,我们应该如何处理?3.尺寸变换COCO和VOC数据集是目前学术界最常用开源数据集,许多新算法都以其准确率高低决定算法质量。观察两个开源数据集的图像数据像素情况,它们有什么共同特点?具有统一的最长边像素值VOC数据集COCO数据集3.尺寸变换所以我们需要将不同图像数据的尺寸调整到统一大小,既可以便于存储,还会加快模型训练速度。“最长边为统一像素值”COCO数据集4.格式转换与样本重新编号观察清洗后的数据集,观察我们采集到的图像,具有几种数据格式类型?常见的图像数据存储格式为“png”和“jpg”;如果是通过网络爬虫爬取到的数据,则数据格式还有webp、bmp两种;但是webp、bmp或者其他除png和jpg之外的数据格式并不是常用格式,并且我们的算法并不能识别该种数据存储类型;1.jpg2.png3.bmp4.webp4.格式转换与样本重新编号所以我们需要将其他数据类型统一转化为“jpg”后缀格式
同时,算法模型的输入端是以jpg为格式基础的数据样本,如果加入其他格式,容易产生不必要的BUG。4.格式转换与样本重新编号由于采集途径的不同,导致采集样本的名称多种多样;并且经过我们清洗之后,有序样本变为无序样本;数据的名称不规范,可能是汉字、长串字符和字母、数字等等,这样虽然可以标注,但是模型在训练需要读取图像名称时,会出现不必要的bug。所以我们需要先对数据集内的图像样本进行重新编号,并按照数字数序进行排序。5.图像二值化什么是图像二值化?图像二值化(ImageBinarization)是指将像素点的灰度值设为0或255,使图像呈现明显的黑白效果。二值化一方面减少了数据维度,另一方面通过排除原图中噪声带来的干扰,可以凸显有效区域的轮廓结构。OCR效果很大程度上取决于该步骤,高质量的二值图像可以显著提升识别的准确率。
5.图像二值化设置一个灰度阈值,对灰度图像内的所有灰度值做判断,大于阈值像素设为255,小于阈值设为0。去除彩色信息设置二值化阈值原图像(彩色图像-RGB)灰度图像二值图像0255127二值化阈值为“127”6.图像去噪我们在采集小票数据的过程中,可能会出现票据图像样本具有部分干扰信息,这类信息会给模型的识别带来很大的困难,我们成这类干扰信息为图像的噪声。图像噪声是指存在于图像数据中不必要的或多余的干扰信息,产生于图像的采集、量化或传输过程,对图像的后处理、分析均会产生极大的影响。对于存在噪声的图像我们需要进行:“图像去噪”7.图像矫正我们在采集数据时,很容易使拍摄的小票文本出现角度偏移的情况。如果旋转角度过大的样本会出现以下几个问题:忘言。。名名
名2、会加大后续标注工作的困难度。3、算法检测的是文本矩形框,需要尽量让文本水平。1、会影响后续算法训练时的特征提取操作。我们需要对样本进行:
“角度矫正”7.图像矫正霍夫变换(Hough
Transform)是目前图像预处理领域常用的检测文本倾斜角度的算法。霍夫变换可以检测出图像中的直线和圆等信息,具体原理如下:忘言。。名名
名原图像
Canny边缘检测图像
“检测出旋转角度”
7.图像矫正霍夫变换只能检测出文本的直线与水平方向的夹角,确定偏移角度。如果想要旋转图像,我们需要确定旋转中心点,利用仿射变换进行图像旋转矫正。“仿射变换”“检测出旋转角度”图像被旋转到水平角度旋转之后文本边界超出图像,所以旋转后的图像是经过等比例缩放的结果。任务实施Taskimplementation感知传感器包括视觉传感器、激光传感器、雷达传感器等类型。视觉传感器:即摄像头,摄像头分为单目视觉和双目(立体)视觉两类。比较知名的视觉传感器提供商有以色列的Mobileye,加拿大的PointGrey,德国的Pike等。激光传感器:分为单线和多线。每多一线,成本相应上涨,当然检测效果也相对更为出色。比较知名的激光传感器提供商有美国的Velodyne和Quanergy,德国的Ibeo等
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 血小板减少患者的护理质量控制
- 跌倒护理的心理支持
- 自体干细胞移植护理的未来发展方向
- 2026年国际货运代理合同协议
- 小学数学五下第8单元综合训练测试题
- 个人信用领域保护承诺书(7篇)
- 工业自动化控制系统选型与设计手册
- 商场爆管应急预案
- 费用核算周期及付款方式通知函5篇
- 2026年思想政治学科知识与教学能力
- 网络安全更新策略
- 2025年高考(福建卷)物理试题(学生版+解析版)
- 发型师培训课件
- 2026版《学军中学校本册》高中数学回归教材
- 2026广州水投集团招聘面试题及答案
- 2025贵州贵阳市某事业单位工作人员招聘(公共基础知识)综合能力测试题带答案解析
- 【《20万吨年产量的正丁醇生产工艺设计及Aspen仿真研究》12000字】
- DB13∕T 5308-2020 烧伤浸浴护理规范
- 【MOOC】《宋词经典》(浙江大学)章节期末慕课答案
- 工程质保及售后服务方案(3篇)
- 2025-2030中国煤矿行业发展分析及投资前景与战略规划研究报告
评论
0/150
提交评论