【深度学习算法介绍概述2300字】_第1页
【深度学习算法介绍概述2300字】_第2页
【深度学习算法介绍概述2300字】_第3页
【深度学习算法介绍概述2300字】_第4页
【深度学习算法介绍概述2300字】_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

深度学习算法介绍概述 1 1 2 4 51.1卷积神经网络原理络,是深度学习中最有代表性的网络结构之一。该研究最早于80到90年代间开冠军[46,引起越来越多研究者的关注,故其也是深度学习中最具影响力的网络卷积神经网络由下述几类节点层连接构成,即接的类似DNN的层进行激活计算并输出结果,其结构如图2-5所示。以一个红m乘n大小的矩阵与图像等大小区域逐个进行卷积运算的引入解决了单一线性表达的问题,一般用sigmoid、tanh、ReLU等激活函数作如普通DNN一样,每个节点接收前一层每个矩阵的各个元素的输出,并综合前卷积层卷积层卷积层全连接层最大值池化最大值池化Mask-RCNN⁴7由Faster-Rcnn进化而来,其识别目标的同时能做到区域分割。如图2-6所示,其流程主要分为两个阶段,首先找出候选区域,然后计算候选区域的边框和遮蔽区域。ConvstageoneMask-RCNN使用更优秀的ResNeXt-101,对其识别准确率带来了极大的提升,而FPN特征金字塔的助力,则使其拥有了多尺度信息。为了解决特征图对齐的问题,其改进RoIPoling提出RoIAlign方案。最后为了让语义分割训练预测效果,还优化了深度卷积网络的损失函数,获得了更好的效果。如图2-7所示,首先由CNN和RPN两个网络进行运算输出,然后交由FPN运算,经过RoIAlign后,即可以并行做分割区域识别和物体边框预测。图2-7Mask-RCNN层次结构进行处理,经过移动窗口扫描,查找出包含目标的关注区ROI,把ROI中的像素数据传递到Pooling层运算,Pooling结束后就可以做边框以及遮蔽区域的并行预测了。图2-8Mask-RCNN骨干网络ResNet-C4YOLOv4的流程结构见图2-9,采用CSPDarkNet53[49作为主干网络提取图像特征,Darknet53的大残差块上结合CSP便得到了CSPDarkNet53,这样的块有5卷积,然后进行了最大值池化运算,这些核的尺寸为化后进行张量拼接并通过1x1降维到512个通道1.4算法模型的评估指标通常采用这些计算来比较算法的好坏,如准确率Precision、召回率Recall、准确率和召回率通常从概念上容易被混淆,但他们的计算方式是不同的。如图2-10所示,他们的分子都是TruePositive,即判断结果为真并且实际该结果是真的数据量,而分母中,准确率关注的是FalsePositive,即判断结果为真,但是实际该结果是假;而召回率则关注FalseNegative,即判断结果是假,但是实际结果是真的数据。即准确率是找出判断结果中实际为真的比例,而召回率是找出实际为真的数据中判断为真的比例。真实为正真实为正检测为负召回率真实为负检测为正准确率P-R图是分别以Precesion和Recall作为x、y轴绘制的折线图,AP是折线与mAP是不同AP的均值,如图2-11所示:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论