CN114241250B 一种级联回归目标检测方法、装置及计算机可读存储介质 (国网电力科学研究院有限公司)_第1页
CN114241250B 一种级联回归目标检测方法、装置及计算机可读存储介质 (国网电力科学研究院有限公司)_第2页
CN114241250B 一种级联回归目标检测方法、装置及计算机可读存储介质 (国网电力科学研究院有限公司)_第3页
CN114241250B 一种级联回归目标检测方法、装置及计算机可读存储介质 (国网电力科学研究院有限公司)_第4页
CN114241250B 一种级联回归目标检测方法、装置及计算机可读存储介质 (国网电力科学研究院有限公司)_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

装置及计算机可读存储介质,方法包括以下步经网络模型由带有标注信息的训练图片训练得2将调整后的待检测图片输入至训练好的深度卷积神经网络;;;;其中,i表示预设锚框的下标,pr和分别表示第一阶段的二分类预测概率和坐标检测结3输入两路回归分支进行预测,根据预测结果调整候选区域的大小和位置并提取两组特征,第二阶段:将第一阶段融合后的特征分别输入两路回归分支进第三阶段:将第二阶段融合后的特征分别输入两路回归分支进计算旋转后的矩形框之间的面积交并比,进行非极大值抑制对R,中的任意一个检测框b,将其和所有预测得分小于当前得分的预处理模块,用于对采集模块获取的检测图片和/或训练图片进行像素的标准化和缩4;;;;其中,i表示预设锚框的下标,pr和分别表示第一阶段的二分类预测概率和坐标检测结所述神经网络模块还用于借助训练图片进行训练并对待检测图片进行检8.一种计算机可读存储介质,其特征在于,所述5[0007]针对现有技术检测性能不佳的问题,本发明提供了一种级联回归目标检测方法、6[0013]作为优选,所述骨干网络通过若干分辨率不同的特征预测层对图片进行特征提结果调整候选区域的大小和位置并提取两组特征,使用卷积神经网络对两组特征进行融结果调整候选区域的大小和位置并提取两组特征,使用卷积神经网络对两组特征进行融[0024]其中xt是根据前一阶段两路回归分支预测的坐标融合的特征信息7q[0034]对初始检测结果R中同类别下的每个检测框的预测得分q[0039]预处理模块,用于对采集模块获取的检测图片和/或训练图片进行像素的标准化用于分步调整预设框的级联的区域建议模块、用于微调预设框的级联的两路回归器模块、8在检测头处使用级联策略带来的大量重复和9[0054]下面以具体的实施例对本发明的技术方案进行详细说明对于相同或相似的概念或过程可能在某些实[0056]一种级联回归目标检测方法,运行于带有处理器和计算机可读存储介质的装置[0058]获取检测图片的训练集,所述训练集包括M张训练图片为X={X1,X2,…[0060]所述M个标签中包括相应图片中的N个目标物体的类别与坐标信息为Ym={Pm,1,Pm,n表示第m张图片中的第n个目标物体在所0表示背景骨干网络之后,需要在骨干网络的基础上添加额外的卷积网络获得更低分辨率的特征图,[0076]在一些具体的实施例中,所述骨干网络采用ResNet50,其预训练模型来自[0077]在所述骨干网络和额外添加的卷积网络的基础上首先搭[0078]以VGG_16作为骨干网络为例,取VGG网络中的三层和额外添加的一层网络作为全分类以及回归模块的输入。不同于CascadeR_CNN中每个阶段都使用骨干网络输出的特征二分类以及回归模块和检测头的连接处也使用了特征融合进一[0090]级联的两路回归器模块中,两种架构的回归分支分别采用了SmoothL1用于优化分支的协同工作的能力。因此,对两路回归分支预测的偏移量使用SmoothL1函数进行优[0094]其中xt是根据前一阶段两路回归分支预测的坐标融合的特征信息[0095]SmoothL1经常用来优化回归器预测的偏移量和标注之间的差距。距离损失函数[0096]基础特征提取网络和额外卷积网络的基础上进行搭建第一阶段的分类网络CLS1参数为5个,与上文所述的物体坐标Bm,n相对应;strideh1和stridew1为卷积核的高度和宽[0104]其中特征金字塔网络包括特征图转换网络TS和特征图缩放网络INP,特征图转换[0110]其中,t为特征金字塔构造过程中的中间特征图;其中i的取值顺序为{F_1,F_网络由PyTorch函数库中的特征图插分别提取候选区域N×N的特征进行分类和回归,特征相加并取均值后得到融合的区域特[0114]以所述第一阶段定位网络LOC1的坐标检测结果LR1对第一阶段的分类网络CLS1和[0120]此时CR1为一个3×3的矩形区域,SP1表示所述卷积区域CR9个采样点坐标。参数为5个,与上文所述的物体坐标Bm,n相对应;strideh1和stridew1为卷积核的高度和宽层,J为CLS2f的卷积输出通道数,同时也是训练和测试图片中的物体类别总数,相较于算网络最后的分类与位置检测结果和图片标注信息中的真实类别与位置,得到一个数值,和:分别表示下标为i的预设锚框的真实类别和位置偏移向量,ci和ti为第二阶段的多分类预测概率和坐标检测结果,N1和N2分别表示第一阶段和第二阶段检测过程中qq[0150]最后对初始检测结果R计算旋转后的矩形框之间的面积交并比,进行非极大值抑q[0152]对初始检测结果R中同类别下的每个检测框的预测得分q[0161]基于对上述方案的理解,本申请的保护范围不应当局限于字面意思所表达的信不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论