版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
WO2023005186A1,2023.02.02本发明公开了一种自监督预训练目标检测在粘贴的patch块中随机选择一片区域将其改为与提取的色彩RGB值相应的颜色,优化了预训练的多尺度特征编码为objectquery;objectquery基于提取的合成图特征进行学习,并对学2S3:分别提取合成图的特征以及合成图中粘贴的patchS4:objectquery基于提取的合成图特征进行学习,并对学习S4中,objectquery和合成图的特征输入至Transformer中解码器中自注意力模块引入为objectquery设计的注意通过resnet50主干网络提取合成图的特征以及合成图中粘贴的patch块的多尺度特贴的patch块编码为objectqu基于获取的不同尺度的patch特征图定义对应的linear层,得到不同根据合成图提取的多尺度输入特征不同的大小比例,将每个patch在不同尺度特征编b;=f(v)=fa(v0)用于预测boundingboxes,预测是否是粘贴上的patch,用于重建objectb;=f(v)=fa(v0)37.根据权利要求1所述方法的一种自监督预训练目标检测系统,其特征在于,包括的patch块粘贴到背景图中,得到合成图,提取下游待检测目标的色彩RGB值,在粘贴的patch块中随机选择一片区域将其改为与提取的色多尺度特征转化模块,用于分别提取合成图的特征以及合成图中粘贴的patch块的多匹配模块,用于objectquery基于提取的合成图query进行类别和边界框预测,得到预测的集合,将预测的集合和真实的标注集合进行匹8.一种终端设备,包括存储器、处理器以及存储在9.一种计算机可读存储介质,所述计算机可读存储介质存4成本很高而且准确性也因为标注误差而受到影响。无监督任务是使用不需要标注的数据,用剩余部分来预测扣除的部分)、颜色补全(把图像的灰度图作为输入、预测真实的彩图)[0005]本发明的目的在于解决现有技术中自监督预训练代理任务在目标检测定位和分[0010]S3:分别提取合成图的特征以及合成图中粘贴的patch块的多尺度特征,并将5[0018]通过resnet50主干网络提取合成图的特征以及合成图中粘贴的patch块的多尺度[0021]通过主干网络对每个patch块进行特征提取,得到若干个不同尺度的patch特征[0024]根据合成图提取的多尺度输入特征不同的大小比例,将每个patch在不同尺度特[0025]所述步骤S4中,objectquery和合成图的特征输入至Transformer中学习,并在Transformer的解码器中自注意力模块引入为objectquery设[0028]fbox用于预测boundingboxes,fcat预测是否是粘贴上的patch,frec用于重建objectdescriptors,其中则v1……vk表示通过Transformer计算的与图像相关的object选择一片区域将其改为与提取的色彩RGB值相6[0032]多尺度特征转化模块,用于分别提取合成图的特征以及合成图中粘贴的patch块[0033]匹配模块,用于objectquery基于提取的合成图特征进行学习,并对学习后的行边界框预测保证了预测的patch和真实patch之间的7[0053]参见图1,本发明实施例公开了一种自监督预训练目标检测方法,本方法是基于[0055]微调阶段是基于预训练阶段保存的模型权重在相对较小的数据集进行有监督微[0056]基于DETR的自监督先验任务是将从前景图中使用裁剪策略裁剪的patch粘贴到背景图中构造合成图并让模型学习在合成图中检测粘贴的patch的任务,目的在于初步训练[0058]Transformer计算模块包括编码器Encoder和解码器Decoder,编码阶段对输入的图像特征进行编码,解码阶段利用objectq[0059]预测头模块是使用多层感知机MLP对经过Transformer计算的objectquery进行8[0065]为自监督预训练提供更准确的边界框弱监督,采用合成图的方式来构造输入图[0076]步骤3:基于粘贴的patch构造适配于多尺度输入特征的Transformerobject[0078]解码器的一个重要组件是objectquery,其作为解码器的交叉注意力模块的9query在编码器输出的特征memory中进行查找,所述memory解释为合成图特征经过Transformer的Encoder编码器计算的阶段和微调阶段,objectquery均是大小为[300,batch_size,256]的可学习编码,通过尺度特征,其将patch经过backbone主干网络提取的最后一个尺度的特征转换为了object[0082]对于主干网络从合成图提取的多尺度输入特征而言,其在输入Transformer的编例从大到小为本发明实施例中,本步骤得到的不同尺度特征图实际为4个尺[0088]进一步的,对于预测得到的每个objectquery,通过pytorch的repeat_[0090]进一步的,基于合成图特征图拼接的比例,在不同尺度patch特征构造的object数第二个特征图对应的objectquery重复3*4,最大的特征图对应的objectquery重复3*[0091]由于本发明采用了一对多的策略,即对于每个尺度的特征映射得到的object征负责不同patch之间的objectquery不需要交互,进一步在Transformer的解码器的Self_attention自注意力模块引入注意力掩码Attentio责重建objectdescriptors。瓦=fiox(v),盆=fec(vi),⃞=fiar(v),则[0098]其中,v1……vk表示通过Transformer计算的与图像相关的objectquery,所述objectquery是Transforme[0110]公式(4)中.表示面积,用预测框坐标和真实框坐标的交集和并集表示结果框本[0115]本发明实施例中,proposals可以解释为算法提取的候选簇或候选框;objectquery可以解释为Transformer中一组可学习的位置编码;CP_DETR可以解释为基于DETR的[0123]多尺度特征转化模块,用于分别提取合成图的特征以及粘贴的patch块的多尺度[0124]匹配模块,用于objectquery基于提取的合成图特征进行学习,并对学习后的[0129]所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行[0130]所述终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产上述实施例方法中的全部或部分流程
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 劳动故事 最美的校园最美的人教学设计小学劳动粤教版劳动与技术三年级-粤教版(劳动与技术)
- 第12课 毛泽东思想教学设计高中历史华东师大版上海第七分册-华东师大版上海2007
- 数学六年级下册比例的认识第1课时教案
- 中国农业发展银行校招试题及答案
- 人教版新课标《历史与社会》八年级下册教学设计第五单元第四课 资产阶级革命新体制的创立
- 中国建筑科学研究院秋招试题及答案
- 北京出版社教学设计-2025-2026学年中职中职专业课化工技术类67 生物与化工大类
- 酒店送客道别礼仪规范手册
- 保险理赔流程与标准操作手册(标准版)
- 高中英语人教版 (2019)选择性必修 第二册Unit 1 Science and Scientists公开课教案设计
- 2026年中考语文高效复习策略与核心考点突破
- 2025-2030中国DPU智能网卡行业市场发展分析及产能产量研究报告
- 2026年春季统编版(部编版)2024新教材二年级下册道德与法治教学计划、教学设计及教学反思(附目录)
- CT安全防护课件
- 2026年学校意识形态工作实施方案3篇
- 2026年保安员考试题库及答案(1000题)
- 固定式钢梯 防护栏 钢平台30个安全隐患附依据
- 招商金融服务协议书
- 招标代理机构选取服务方案投标文件(技术方案)
- 2025年广东省深圳市生地会考真题试卷及答案
- 2025年大学《动植物检疫-检疫法规与标准》考试模拟试题及答案解析
评论
0/150
提交评论