【《基于数据增强的番茄病害分类方法分析案例》4700字】

上传人：E*** IP属地：湖北上传时间：2026-03-25 格式：DOCX 页数：12 大小：958.69KB 积分：13 举报 版权申诉

已阅读5页，还剩7页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

基于数据增强的番茄病害分类方法分析案例目录TOC\o"1-3"\h\u6849基于数据增强的番茄病害分类方法分析案例 1193111.1引言 232251.2数据增强思想 3281401.3数据增强的分类 3164321.4数据增强方法 4212441.5基于数据增强的番茄病害数据集 6142331.6卷积神经网络训练和识别过程 7124021.6.1VGG16 752001.6.2InceptionV3 8303141.6.3ResNet50 9317931.6.4MobileNetV2 1099941.7实验结果及分析 111.1引言最简单直接的方法就是进行数据增强，借由数据增强方法来产生新的番茄病害样本，加入到番茄病害样本数量较少的类属中，这样就会使得番茄病害数据集类属间样本数量更均衡。因此，本章将对原始数据集进行离线数据增强，扩充其中数量较少的类属样本，降低其因类属间样本数量不均衡带来的负面影响，提升模型的性能，经由VGG16、InceptionV3、ResNet50、MobileNetV2这四种卷积神经网络的训练和测试，通过对比相关的评估指标来验证数据增强的有效性。1.2数据增强思想计算机视觉中的图像增强，是人为的为视觉不变性（语义不变）引入了先验知识。数据增强也基本上成了提高模型性能的最简单、直接的方法了。首先增强的样本和原来的样本是由强相关性的（裁剪、翻转、旋转、缩放、扭曲等几何变换）。即我们强制网络学习了某些样本变换方式，而如果这些变换方式使得网络的性能有所提升，那么，可以简单的认为网络在之前并没有学到相关的变换，或者学的并不全面。而如果通过某些简单的操作，提高了最终性能，这说明网络可能并没有我们想象的那种方式去拟合数据，比如简单的平移不变性。即，如果我们通过简单的裁剪、平移提高了模型的性能，那么，恰恰说明网络可能并没有完全学习到平移不变性。再者，在一些对抗样本的研究中，CNN对图像中某些稍微的扰动，就可能导致致命的分类错误，这在某种程度上说明了CNN其实是非常敏感的，更别提各种变换了。CNN目前来说对平移不变性支持的最好，也就是CNN的分类结果和样本中的目标物体位置无关。这是假设CNN学习了很好的形状（全局）特征，而一些研究表明，CNN其实只学习了某些图像的纹理特征，如果一张图像中包含了足够多的纹理特征的话，其实CNN就不去管形状了，这在某些方面，也可以说是某种平移不变性，而对于真正的包含目标物体的形状的平移不变性，还有待考量。如果CNN真的具有平移不变性（目标位置无关性），或许，CNN就能捕捉某些长距依赖性，而其实CNN的长距依赖性目前对具体任务来说还不够好，但从分类任务来说或许够了。或许可以说，CNN具有某种程度的平移不变性。我们在训练过程中保证一定的几率使用原始数据，这样保证了原数据集是增强后集合的子集，只要训练轮数充足，网络无非是多学了某些样本，这对网络来说并非坏事。难学习的样本（hardsample）对分类决策面的决定十分重要，如果将这些样本通过数据增强发掘出来，或许对泛化能力很有帮助。严格来说，增强后的样本和原来的样本有很强的关系。我们希望增强后的数据集是原来整体样本分布的子分布，至少它们的交集中包含原来的数据集，从这方面讲，我们或许稍微扩展了原数据集的样本分布空间，使得网络捕捉到了一些额外的信息。我们把增强后的数据集包含原有数据集的假设称为增强保证性假设，也就是在增强保证性假设下训练的网络一定能够提高泛化能力。1.3数据增强的分类数据增强可以分为离线增强和在线增强。（1）离线增强：直接对数据集进行处理,常用于数据集较小的时候。（2）在线增强：适用于大型数据集,在模型训练过程中获得batch数据之后,再对该batch数据使用数据增强。由于本文数据集样本数量不大，且为了能够使得不同类属样本数目呈现出可视化的状态，便于更好的控制和把握参与训练的数据集。本文在后续工作中将采用离线数据增强的方式。1.4数据增强方法本章以数据集的某张番茄病害图像为例，探讨不同的数据增强方式带来的影响。原始图像如图4-1所示。图4-1原始图像（800，533，3）1.1.1缩放对图像进行缩放操作。图4-2本次实验某张病害图像缩放0.2倍后的例子。resize后的图像（160，107，3）rescale后的图像（160，107，3）图4-2缩放0.2倍后的图像（分别对应resize和rescale）这里采用两种不同的缩放方式，一种是方式，当对番茄叶片病害图像进行压缩时，选择算法实现效果较好，当对番茄叶片病害图像放大时，通常选择，但是速度较慢，或速度更快，效果也还不错。rescale参数只能按照一定比例进行缩放，实际中我们会有大量的样本，并且尺寸大小不一，需要缩放到指定大小，rescale启用抗锯齿，以免产生锯齿失真，指在缩小之前应用高斯滤波器来平滑图像再按比例缩放，比较平滑均匀。1.1.2角度翻转角度翻转作为一种数据增强方法，其区别于对番茄叶片病害图像进行180°旋转，角度翻转更像是一种镜面翻折。图4-3给出了几种不同的翻转方式。上下（垂直）翻转左右（水平）翻转旋转180°（逆时针）图4-3几种不同的图像翻转1.1.3旋转旋转是对番茄叶片病害图像内容进行旋转操作，分为两种情况：一是旋转之后丢失一部分，二是旋转之后对丢失部分进行填充，第一种情况会使番茄叶片病害图像的大小不变，反之，第二种情况会使其变大，如下通过两种方式结合实现。图4-4是几种不同的旋转方式。裁剪缺失形状黑色背景填充形状白色背景填充形状图4-4几种不同的图像旋转1.1.4裁剪随机裁剪减弱背景因素的权重，且使模型对于番茄叶片病害图像中的缺失部分不是那么敏感，也即能够使得模型学习效果更好，从而进一步增加模型稳定性。图4-5给出了几种不同的裁剪方式。裁剪左上角裁剪右上角裁剪中心块裁剪左下角剪右下角图4-5几种不同的图像裁剪1.5基于数据增强的番茄病害数据集本次实验对5、6、7、8等类属样本数量较少的病害图像进行数据增强，每次增强内容为：图像随机旋转0-180°左右随机平移比例0.2上下随机平移比例0.2随机裁剪比例0.2随机缩放比例0.2随机水平翻转随机垂直翻转本次实验采用的原始数据集为番茄叶片病害图像，共分为健康和8种不同的常见病害，合计共9种分类。只对训练集进行数据增强，后的番茄叶片的病害情况及其数据集数量和对应的标签号码如表4-1所示，分布直方图如图4-6所示。表4-1数据增强后的数据集分布情况及标号病害种类训练集测试集分类标签黄化病33828410晚疫病32143051斑枯病31202852健康30082553褐斑病33211844早枯病29881615叶霉病29881556细菌性斑点病30871297花叶病29881018合计280962416图4-6数据增强后的数据集分布直方图从图中可以看出，进行数据增强后，训练集类属样本数量较原始数据集相比更加均衡，且数量更多，每个类属的训练样本数量都在3000左右，解决了之前不同类属训练样本数据集数量差异过大的问题；其次，训练集总数达到了28096张图像，更有利于模型训练和泛化，而测试数据集没有变化。1.6卷积神经网络训练和识别过程1.6.1VGG16基于第三章的VGG16网络模型结构参数和训练参数，对9类进行数据增强后的类属样本较均衡的番茄叶片病害图像进行训练和识别，该训练数据集共包含28096张图片，测试数据集为2416张，对应的病害标签为0、1、2、3、4、5、6、7、8，由于batchsize大小为64，因此每个epoch共迭代439次。由于训练数据集数量增大，为使得模型得到充分训练，epoch设置为30。准确率变化曲线和loss曲线如图4-7和图4-8所示。图4-7数据增强后的VGG16训练和测试的准确率和Loss曲线图模型训练了30个epoch，训练曲线大概在25个epoch后准确率曲线保持平稳，波动幅度缩小，准确率接近85%，而loss曲线在25个epoch后逐渐趋于0.3。对比训练曲线，测试曲线的准确率在15个epoch后趋于平稳，大致在90%左右，而测试曲线的loss在15个epoch后趋于平稳。该模型最终预测的准确率为90.85%。1.6.2InceptionV3基于第三章的InceptionV3网络模型结构参数和训练参数，对9类进行数据增强后的类属样本较均衡的番茄叶片病害图像进行训练和识别，该训练数据集共包含28096张图片，测试数据集为2416张，对应的病害标签为0、1、2、3、4、5、6、7、8，由于batchsize大小为64，因此每个epoch共迭代439次。由于训练数据集数量增大，为使得模型得到充分训练，epoch设置为30。准确率变化曲线和loss曲线如图4-9和图4-10所示。图4-9数据增强后的InceptionV3训练和测试的准确率和Loss曲线图可以看出，模型训练了30个轮次，大致在训练了25个epoch后，训练曲线的准确率曲线保持平稳，波动幅度缩小，准确率达到90%，而loss曲线在训练了25个epoch后逐渐趋于0.3。从测试曲线来看，准确率在训练了10个epoch后趋于平稳，大致在90%左右，而测试曲线的loss在训练了5个epoch后就开始在0.3到0.4之间波动。该模型最终预测的准确率为90.52%。1.6.3ResNet50基于第三章的ResNet50网络模型结构参数和训练参数，对9类进行数据增强后的类属样本较均衡的番茄叶片病害图像进行训练和识别，该训练数据集共包含28096张图片，测试数据集为2416张，对应的病害标签为0、1、2、3、4、5、6、7、8，由于batchsize大小为64，因此每个epoch共迭代439次。由于训练数据集数量增大，为使得模型得到充分训练，epoch设置为30。准确率变化曲线和loss曲线如图4-11和图4-12所示。图4-11数据增强后的ResNet50训练和测试的准确率和Loss曲线图从图中可以看出，模型训练了30个epoch，大概在25个轮次后，准确率曲线保持平稳，波动幅度缩小，准确率达到95%以上，而loss曲线在训练了25个epoch后逐渐趋于0。从测试曲线来看，测试曲线的准确率在训练了10个epoch后趋于平稳，大致在90%左右，而测试曲线的loss在5个epoch后就开始在0.2到0.3之间波动。该模型最终预测的准确率为91.83%。1.6.4MobileNetV2基于第三章的MobileNetV2网络模型结构参数和训练参数，对9类进行数据增强后的类属样本较均衡的番茄叶片病害图像进行训练和识别，该训练数据集共包含28096张图片，测试数据集为2416张，对应的病害标签为0、1、2、3、4、5、6、7、8，由于batchsize大小为64，因此每个epoch共迭代439次。由于训练数据集数量增大，为使得模型得到充分训练，epoch设置为30。准确率变化曲线和loss曲线如图4-13和图4-14所示。图4-13数据增强后的MobileNetV2训练和测试的准确率和Loss曲线图从图中可知，模型训练了30个epoch，训练曲线大概在训练了25轮后准确率曲线保持平稳，波动幅度缩小，准确率达到95%以上，而loss曲线在训练了25个轮次后逐渐趋于0.1。从测试曲线来看，准确率在训练了10轮后趋于平稳，而测试曲线的loss在训练了10个epoch后就开始在0.2到0.3之间波动。该模型最终预测的准确率为91.87%。1.7实验结果及分析不同的神经网络对于原始数据集和数据增强后的数据集的识别准确率对比如表4-2所示。表4-2不同模型数据增强前后识别准确率对比网络模型原始数据集准确率数据增强数据集准确率VGG1689.40%90.85%InceptionV390.15%90.52%ResNet5093.87%91.83%MobileNetV291.00%91.87%由上表可以看出，数据增强后的识别准确率都得到了一定程度的提升，VGG16提升了1.45%，InceptionV3提升了0.37%，ResNet50提升了0.96%，MobileNetV2提升了0.87%。可以看出，提升幅度最大的是VGG16网络。数据增强后，识别准确率最高的模型仍然是MobileNetV2。实验结果表明使用数据增强技术可以在一定程度上提升识别的准确率。再来分析F1值，表4-3给出了不同的神经网络在数据增强前后F1值的对比情况。表4-3不同模型数据增强前后F1值对比网络模型原始数据集数据增强后的数据集分类标签VGG1697.37%83.94%78.56%96.75%86.24%88.15%81.51%73.46%92.61%96.35%87.48%79.27%98.83%85.88%91.01%86.96%75.08%96.94%012345678InceptionV398.35%88.26%71.81%97.45%85.86%91.67%81.32%71.95%91.54%97.55%90.09%77.59%97.62%85.79%86.98%81.25%76.09%93.75%012345678ResNet5098.57%90.60%86.53%96.91%91.89%92.75%90.51%87.72%95.15%98.80%93.06%91.40%97.85%91.06%90.86%91.82%

人人文库> 全部分类> 行业资料 > 工业设计

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

【《基于数据增强的番茄病害分类方法分析案例》4700字】

文档简介

温馨提示

最新文档

评论

【《基于数据增强的番茄病害分类方法分析案例》4700字】

文档简介

温馨提示

最新文档

评论

相关文档