版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
图像识别垃圾分类模型的训练与测试案例目录TOC\o"1-3"\h\u3024图像识别垃圾分类模型的训练与测试案例 1139541.1实验环境 1163301.2数据预处理 1106351.2.1爬取结果 1139301.2.2数据增强 3247281.3训练模型 587361.3.1YOLOv3工作原理 5179211.3.2可视化模型 7263401.3.3训练结果 9196731.4测试模型 9139651.5实验结果 101.1实验环境系统:windows10处理器:Intel(R)Celeron(R)运行软件:Pycharm2021平台环境:Pytorch1.2数据预处理1.2.1爬取结果通过网页爬取到的数据结果,其中包括一些无效数据,需要通过数据清洗将一些脏数据去除。这里是对初步处理完的数据又进行了人为方式的数据清洗。以下是数据爬取结果:图4-1爬取结果文件夹表4-1图片爬取结果表类别文件夹名图片数量有害垃圾harm361厨余垃圾kith430可回收垃圾recyc482其他垃圾others426以有害垃圾为例:图4-2有害垃圾爬取结果1.2.2数据增强使用pytorch对图片进行数据增强。1.图像变换Classtorchvision.transforms.Resize(size,interpolation=2)功能:重置图像分辨率参数:size-Ifsizeisanint,ifheight>width,thenimagewillberescaledto(size*height/width,size),所以size设定为h*winterpolation-插值方法选择,默认为PIL.Image.BILINEAR2.中心裁剪classtorchvision.transforms.CenterCrop(size)功能:依据给定的size从中心裁剪参数:size-(sequenceorint),若为sequence,则为(h,w),若为int,则(size,size)3.随机旋转Classtorchvision.transforms.RandomRotation(degrees,resample=False,expand=False,center=None)功能:依degrees随机旋转一定角度参数:degress-(sequenceorfloatorint),若为单个数,如30,则表示在(-30,+30)之间随机旋转若为sequence,如(30,60),则表示在30-60度之间随机旋转resample-重采样方法选择,可选PIL.Image.NEAREST,PIL.Image.BILINEAR,PIL.Image.BICUBIC,默认为最近邻expand-?center-可选为中心旋转还是左上角旋转1.关键代码transforms.Resize((int(seltf=transforms.Compose([lambdax:Image.open(x).convert('RGB'),#将图片的路径转换可以处理图片数据#进行数据加强f.resize*1.25),int(self.resize*1.25))),#随机旋转transforms.RandomRotation(15),#设置旋转的度数小一些,否则的话会增加网络的学习难度#中心裁剪transforms.CenterCrop(self.resize),#既旋转了又不会导致图片变得复杂transforms.ToTensor(),transforms.Normalize(mean=[0.485,0.456,0.406],std=[0.229,0.224,0.225])])5.增强结果图4-3图片增强结果1.3训练模型通过目标检测(YOLOv3)的方式对收集到的垃圾数据集进行训练,进而获得高准确率的模型。1.3.1YOLOv3工作原理(1)分类器-类别预测:对于YOLOv3,这里主要考虑到两种方式不使用Softmax对每个框进行分类:第一种:Softmax会给每个框分配一个类别(score最大的一个),而OpenImages这种数据集,它的目标会存在有重叠的类别标签,基于此,得出Softmax不适用于多标签分类。第二种:多个独立的logistic分类器可以替代Softmax,并且它不会导致准确率下降,此时分类损失多采用binarycross-entropyloss的方式.(2)多尺度预测每种尺度预测3个box,anchor的设计方式仍然使用聚类,得到9个聚类中心,将其按照大小均分给3中尺度.尺度1:在基础网络之后添加一些卷积层再输出box信息.尺度2:从尺度1中的倒数第二层的卷积层上采样(x2)再与最后一个16x16大小的特征图相加,再次通过多个卷积后输出box信息.相比尺度1变大两倍.尺度3:与尺度2类似,使用了32x32大小的特征图.[5](3)网络结构图4-4YOLOv3网络结构(4)边界框预测YOLOv3以聚类预测到的边界框作为锚框。以边界框预测到的4个坐标值(t_x,y_y,t_w,t_h)为网络,假设图像的左上角偏移了(c_x,c_y)个单元格,并且边界框的宽度和高度为p_w,p_h,则预测如下图:图4-5YOLOv3边界框预测将上图公式里的反一下,就能通过真实框的坐标得到监督信息。YOLOv3可以预测一个objectnessscore给每个边界框作为逻辑回归,如果某个边界框和真实框重合度比其他都高,那么它的objectnessscore应该是1。而其他框虽然也与真实框有重叠,会被忽略掉。1.3.2可视化模型 对数据训练迭代10次,通过visdom可视化工具对训练结果可视化分析。
损失函数曲线:图4-6损失函数曲线图准确率曲线图4-7准确率曲线图将准确率和损失值放到一张图里图4-8准确率和损失值曲线图1.3.3训练结果 通过以上函数曲线,可以看到损失值越来越小,逐渐接近于0;准确率越来越高,逐渐接近1。 模型训练完成后,得到最终的结果。训练结果最好的为第6批次,准确率为98%。图4-9训练模型准确率1.4测试模型 模型训练完成后,可以看到测试准确率达到97%。图4-10测试模型准确率测试数据集包括以下15张不同类别的垃圾图片,可以通过调用选择其中某张图片识别其分类结果。图4-11测试数据集例:图片3为电池,其类别为有害垃圾。图4-12测试结果1.5实验结果使用pyqt技术,制作GUI可视
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人体胚胎发育:生物多样课件
- 2025年西安住建局事业单位考试及答案
- 2026年公共关系专业知识题库与答案解析
- 2026年餐饮从业者能力考核题库
- 垃圾压缩池施工技术方案
- 危岩凹腔封填施工方案
- 摸球两步型概率课件
- 2025年吉林科技职业技术学院马克思主义基本原理概论期末考试模拟题附答案解析
- 2025年云阳县幼儿园教师招教考试备考题库带答案解析(必刷)
- 2025年江西电力职业技术学院马克思主义基本原理概论期末考试模拟题带答案解析(必刷)
- 单杠引体向上教学课件
- 高级消防设施操作员试题及答案-1
- 2025年海南省政府采购评审专家考试题库(含答案)
- 绵阳普通话考试题目含答案
- 国企财务审批管理办法
- 新型农业经营主体法律制度完善研究
- 高中国际班数学试卷
- 北京市2019-2024年中考满分作文131篇
- 2024-2025学年湖北省武汉市常青联合体高二上学期期末考试语文试题(解析版)
- xx中学十五五发展规划(2025-2030)
- 快递保证金合同协议
评论
0/150
提交评论