下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
使用YOLOv4算法建立违禁寄递物品识别方法案例分析YOLO算法首创者首次性地提出了一个阶段方法,其主要解决了两阶段违禁寄递物品目标识别算法的共同存在的缺点,具备快速的识别速度和高度精准的检测精度。Yolov4更是相对于前几个yolo算法来说,它有一个相比之下更为复杂的网络结构,并通过很多次的训练学习技术来提高精度性REF_Ref25722\r\h[21]。Yolov4的组网结构如图3-1所示。图3-1YOLOv4网络结构输入端Yolov4REF_Ref26074\r\h[23]的输入端用于违禁寄递物品x光图像的马赛克数据增强方法借鉴了Butmix数据增强方法,使得马赛克的数据增强方法提升到了一定的理论相似性。Butmix使用两幅违禁寄递物品x光图像进行数据增强,而Kosaic使用四幅违禁寄递物品x光图像进行数据增强,本文认为这在违禁寄递物品x光图像被检测目标的背景方面占有极大的优先权力。同时,也可以对违禁寄递物品x光图像数据集进行随机缩放和一般的数据增强,但是马赛克增强训练可以直接计算违禁寄递物品四幅图像的数据,这样小批处理的大小不需要很大,GPU可以达到更好的效果。Bosaic数据增强实现思路:1)每次读取四张图片,如下图3-2所示图3-2随机读取四张图片分别对四张违禁寄递物品x光图片进行翻转、缩放、色域变化等,并且按照四个方向位置摆好。如下图3-3所示。图3-3处理图像进行图片的组合和框的组合。如下图3-4所示。图3-4运行结果BackBone主干网络CSPDarknek53REF_Ref26130\r\h[24]是Darknek的改进版本,其中包含了5个CSP模块,因为有5个CSP模块,输入图像是416*416,所以特征图变化的规律是416-208-104-52-26-13。经过五次CSP模块后,得到13*13大小的特征图,同时我们会得到3个有效特征层输出13x13x1024、26x26x512、52x52x256的特征层。如下图3-5所示,CSPDarknet53、主要由CBM模块和CSP模块构成,CBM模块由卷积层(Conv)、批归一化层(BatchNormolization,BN)和Mish激活功能组成,CSP模块包含两条支路,一条是主干部分的卷积,一条用来生成一个大的残差边,通过对两条支路的跨级拼接与通道整合增强CNN的学习能力,CSP结构如图所示,其中CBL模块由卷积层(Conv)、批归一化层(BatchNormolization,BN)和LeakyReLu激活功能组成。而CBM是将CBL中的激活层变成了Mish。图3-5CSPDarknek53结构使用YOLOv4算法的违禁寄递物品x光图像识别的Mish激活函数是十分平滑并且十分适合应用在违禁寄递物品x光图像识别的非单调激活函数,被定义为:图3-6Mish激活函数违禁寄递物品x光图像是被所使用的MISH激活函数REF_Ref26185\r\h[25]的特点如图3-6所示:1)没有最上面的限制:没有最上面的限制是所以日常研究意所用的激活函数平均具备和需要的特征,这是它避免了违禁寄递物品x光图像识别梯度饱和,从而导致违禁寄递物品x光图像识别的训练速度快速下降。所以我们可以得出,加快违禁寄递物品x光图像模型的训练过程。没有最上面的限制的属性有助于违禁寄递物品x光图像识别模型获得比较好的正则化效果。2)不是一直上升或者下降的函数:这种特征有助于保持违禁寄递物品x光图像识别模型保持较小的负值,从而稳定违禁寄递物品x光图像识别模型的网络梯度流。3)无限制的没有间断点和连顺性:Mish激活函数是十分平滑并且十分适合应用在违禁寄递物品x光图像识别的非单调激活函数,具有非常好的的广泛推广的能力和较好的违禁寄递物品x光图像训练结果提升能力,可以提高违禁寄递物品x光图像识别结果的质量。YOLOv4算法的违禁寄递物品x光图像识别中使用Mish函数的原因是该函数具有复杂程度低,而且具有无间断、不是一直上升或者下降的、没有最上面的限制、没有最下面的限制等特点,与其他经常使用的函数如ReLU、Swish相比,这个函数用在违禁寄递物品x光图像识别模型的性能有了很大的提高。Neck在违禁寄递物品x光图像的目标检测领域,为了更好地提取违禁寄递物品x光图像的融合特征,通常在Backbone层和output层中插入一些层,称为Neck。对等的颈部违禁寄递物品x光图像目标检测网络也是非常关键的。YOLOV4的颈部结构主要采用SPP(SpatialPyramidPoolingLayer)模块和特征金字塔网络。(FPN)和路径聚合网络(PAN)。在Yolov4中,SPP模块位于骨干网之后。在YOLO中,修改了SPP以保持输出空间维度。最大池适用于大小为1×1、5×5、9×9和13×13的卷积内核。空间维度得以保留。然后将不同内核大小的featuremap连接在一起作为输出,如下图3-7所示。图3-7本文SPP结构PANET对违禁寄递物品x光图像实例进行分割的原因是它能准确地保存违禁寄递物品x光图像的空间信息,有助于违禁寄递物品x光图像的像素点的正确定位和掩模的组成。PANETREF_Ref26264\r\h[26]在违禁基地物品x光图像识别模型的特点如下:1)从顶而底的进行识别路线的增强。当违禁基地物品x光图像图像通过深度学习卷积神经网络的每一层时,所提取的违禁寄递物品x光图像的特征的难度都会提升,违禁寄递物品x光图像的空间分辨率下降。因此,违禁寄递物品x光图像的像素级
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年空间探索技术卫星导航与遥感技术题库
- 2026年企业财务管理绩效评估模拟卷
- 2026年物联网IoT架构师试题库与专业分析
- 2026年人力资源高级管理人才笔试题
- 2026年心理咨询服务资质认证题库心理诊断与治疗方法全解
- 2025年天津职业大学单招职业倾向性测试模拟题库含答案
- 2026年自然科学天文地理及环境科学题目集
- 2026年全套心理测试与评估题目集如教师资认证等
- 2026年水域安全救援模拟演练习题与解析
- 2026年中医推拿按摩师高级笔试题目
- 2024-2030年中国异辛烷行业市场发展趋势与前景展望战略分析报告
- 力士乐液压培训教材
- JJG 692-2010无创自动测量血压计
- 人教版四年级数学下册第四单元大单元教学任务单
- 甘肃省安全员A证考试题库及答案
- 旋挖钻孔灌注桩施工记录表(新)
- 第25课《活板》同步练习(含答案)
- 北京市XXXX年度“小学数学测试方案”培训课件
- 浙江省高级法院公布十大民间借贷典型案例
- GA 1809-2022城市供水系统反恐怖防范要求
- 儿童舌诊解析
评论
0/150
提交评论