【《基于深度学习目标检测算法方法综述》1700字】_第1页
已阅读1页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于深度学习目标检测算法方法综述目录TOC\o"1-3"\h\u24430基于深度学习目标检测算法方法综述 1177551.1深度学习常用函数介绍 1112661.1.2损失函数 2309681.2深度学习常用目标检测算法介绍 3288731.2.1FAST-RCNN算法 322831.2.2SSD算法 3119541.2.3YOLO算法 41.1深度学习常用函数介绍1.1.1激活函数在深度学习中,每个神经元接收来自上层神经元层的输出,输出被视为下一代神经元的入口点。神经元的输入和输出之间存在一种功能关系,通过激活该功能来表示。由于神经元的输出和输入都是线性的,大部分激活函数是非线性的。当线性函数被激活时,网络和非线性函数之间的线性关系就消失了。激活函数类型有很多,目前应用最多的是Sigmoid,Relu和LeakyRelu。Relu,Sigmoid和LeakyRelu函数图像分别如图1.1(a)(b)(c)所示图SEQ图\*ARABIC3.1(a)Relu函数R(x)=max(0,x)示意图图1.1(b)Sigmoid函数示意图图1.1(c)Leaky-Relu函数f(x)=max(αx,x)(α=0.2)示意图从上图1.1(a),(b),(c)可以看出每个函数的输入于输出都有着各自的线性关系。1.1.2损失函数深度学习中的损失函数其作用就是将预测值向真实值尽可能靠拢,损失函数值与网络模型受噪音影响成正比,即损失函数值越大,网络模型越容易受到噪音影响。最多被应用的有三种损失函数,分别是0-1、平方数、对数损失函数。在下面的章节中,将会有具体的图像说明来解释损失函数的应用。0-1损失函数较为简单,其取值要么为0,要么为1。在真实值与预测值相等时取1,反之取0。主要应用在感知机方面。平方数损失函数则需要计算真实值与预测值的平方和,其应用主要是用作线性回归。对数损失函数使用最大似然估计然后取对数,其应用主要是逻辑回归方面。1.2深度学习常用目标检测算法介绍1.2.1FAST-RCNN算法图1.2FastRCNN结构图由于RCNN在训练过程中消耗时间长,并且对计算机的GPU要求较高,RossGirshick在RCNN的基础上提出了FASTRCNN。其结构图如上图1.2所示,在FASTRCNN模型中,输入由原始图像和候选区域(RP)两部分构成,输入后被送到卷积网络中,得到卷积特征图。同时因为候选区不止一个,系统会判断出感兴趣区域,经过池化后作为全连接层的输入。再由全连接层拼接成一个完整的特征图,最后输出。一个输出层是为了分类,另一个则是为了定位,将目标的位置信息输出。1.2.2SSD算法SSD算法(SingleShotMultiBoxDetector)为单级式检测框架,采用多尺度检测方法。SSD直接用CNN来检测,没有使用FASTRCNN框架中的全连接层做预测工作。相比于FASTRCNN,SSD采用的多尺度检测,利用不同大小的特征图来检测目标。这是因为大的特征图包含更多的目标位置信息,对小目标检测有帮助。小特征图中有更多的语义信息,对大目标检测表现更加出色。SSD算法采用了先验框,且先验框的大小尺寸也不一样。先验框在修正改进后得到预测框,在SSD运行时,其会先匹配与真实框IOC(交并比)最大的先验框,并定义为正样本。但是在实际情况中,真实框的数量非常的小,所以对于其他的先验框,如果交并比大于某值,则应该输出匹配。但是当先验框与数量不唯一的真实框交并比都满足大于某值时,则需要取最大的那个。其他没有匹配的则定义为负样本。SSD在检测精度和速度上的表现都较佳。但是由于参数使用过多,使得泛化性能不高,也就成了SSD的一个较大缺点。1.2.3YOLO算法Yolo(youonlylookonce)算法,从英文直译“你只需看一次”也很体现出来yolo算法的计算机视觉系统思想,只需要将图片输入就可以得到目标物体。和SSD算法一样,yolo也属于级式检测框架,但是yolo相对于SSD检测速度还是更加优异一点。Yolo直接将图片送到卷积神经网络(CNN)提取图片特征,最后在用上文中提到的损失函数进行回归预测来检测目标。图1.3yolo结构示意图详细的来讲,yolo将输入的图像分割成a*a个单元格,每一个单元格的任务就是检测中心点落在单元格的物体。而单元格具体需要预测的就是边界框和对应的置信度。目标在边界框中的概率和边界框预测目标的准确率组成了置信度。表示标在边界框中的概率,取1时表示目标在框中,0则不在。IOU(交并比)则表示边界框预测目标的准确率。则置信度即为二者的乘积:*IOU。Yolo网络一共有26层,卷积层占24层,全连接层为最后两层,如图1.3所示。在图1.3中,ConvLayer代表一个卷积层和一个池化层,ConvLayers代表多个卷积层和一个池化层,ConnLayer则为全连接层。Yolo的训练和使用均为pascalVOC数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论