CN113723160B 目标图像的关键点检测方法、装置、电子设备及存储介质 (腾讯科技(深圳)有限公司)_第1页
CN113723160B 目标图像的关键点检测方法、装置、电子设备及存储介质 (腾讯科技(深圳)有限公司)_第2页
CN113723160B 目标图像的关键点检测方法、装置、电子设备及存储介质 (腾讯科技(深圳)有限公司)_第3页
CN113723160B 目标图像的关键点检测方法、装置、电子设备及存储介质 (腾讯科技(深圳)有限公司)_第4页
CN113723160B 目标图像的关键点检测方法、装置、电子设备及存储介质 (腾讯科技(深圳)有限公司)_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

DistillationforObjectDetection.本发明公开了一种目标图像的关键点检测另外通过标志函数能够让第二网络针对第一网无需花费其他计算负载来对错误样本的预测过2将所述训练数据输入第二网络进行可分离卷积处理,得到不同尺度的第二特征图集其中,所述根据所述第二损失值和知识蒸馏损失函数修改第根据第一预测结果确定第一预测分布,并根据所述第二预测结果确定第二预测分布,所述第一预测结果是所述第一网络基于所述训练数据进行第一关键点坐标值预测后得到将所述训练数据输入所述第一网络进行可分离卷积处理,得到不同通过所述第一网络的全连接层对所述第一特征图集合进采用第一损失函数确定所述第一预测结果和所述标签之间的第根据所述第一损失值修改第一网络模型参数,并根据修改后的对所述第一特征图集合中各个第一特征图进行全局平均池化处理,得到对所述第二特征图集合中各个第二特征图进行全局平均池化处理,得到3根据所述训练样本数量、所述第一特征图的通道数量、所述第一根据第一特征图的通道数量和所述第二特征图的通道数量,对所获取所述待检测的目标图像的人脸框信息,其中,所述人脸框根据所述目标图像中的关键点对所述目标图像进行关键点标注根据人脸图像中的关键点对所述目标图像进行关键点剔除,得到剔除第二训练模块,用于将所述训练数据输入第二网络进行可分4修改后的所述第二网络模型参数生成第二网络模型;对所述第二网络模型进行剪枝处理,检测模块,用于将待检测的目标图像输入所述关键点检测模型,得其中,所述根据所述第二损失值和知识蒸馏损失函数修改第根据第一预测结果确定第一预测分布,并根据所述第二预测结果确定第二预测分布,所述第一预测结果是所述第一网络基于所述训练数据进行第一关键点坐标值预测后得到所述处理器执行所述程序实现如权利要求1-9中任一项理器执行实现如权利要求1-9中任一项所56[0018]本发明另一方面还提供了一种计算机可读存储介质,所7[0034]人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控8[0040]模型剪枝即通过对模型结构和模型参数进行裁剪生成规模更小、内存利用率更[0043]参考图1,其示出了本发明实施例提供的一种目标图像的关键点检测方法的实施可以为例如个人计算机(PersonalComputer,PC)、手机、智能手机、个人数字助手9络,服务器端101可以具有获取训练数据,将训练数据输入第一网络训练得到第一网络模征提取网络包括若干个可分离卷积块,特征提取网络可以对训练数据进行可分离卷积处可以使得第一特征图集合中的不同尺度的各个第一特征图包含不同尺度的丰富信息。其定倍数下采样(例如包括但不限于2倍下采样)处理后的训练数据进行可分离卷积子处理;可以更加复杂和精细,即图4中所示的第一网络301的结构为用于对第一网络301的原理进卷积操作、卷积操作以及至少一次批归一化/ReLu(RectifiedLinearUnit,修正线性单下的多个第一特征图3041,然后将第二尺度下的第一特征图输入至第三可分离卷积块305[0057]S220、通过第一网络的全连接层对第一特征图集合进行标包括x和y两个值,则可设计最后一层全连接层的神经元个数为94x2=188,通过网络学数据泛化处理的参数(featurenormalizationandscaling)和BN处理的参数(batch可以为当修改第一网络模型参数后的第一网络的第一预测结果与真实坐标值之间的第一例中,对第一特征图集合中不同尺度的各个第一特征图进行GAP(GlobalAverage可分离卷积处理可以使得第二特征图集合中的不同尺度的各个第二特征图包含不同尺度的多个第二特征图402,类似地,将第一尺度下的第二特征图输入至可分离卷积块进行处[0072]S320、通过第二网络的全连接层对第二特征图集合进行泛化处理的参数(featurenormalizationandscaling)和BN处理的参数(batch馏学习的同时第二网络拟合第一网络模型的soft-target(即最小化第一网络模型和第二表示通过利用KL散度度量第一网络和第二网络的第一预测分布与第二预测分布一预测分布与第二预测分布之间的第三损失值。[0099]具体地,在确定第一预测分布中的正确样本和错误样本将第一预测分布中正确样本对应的标志函数置1,将第一预测分布中错误样本对应的标志测分布对第二网络进行蒸馏学习,从而使得第一网络模型对第二网络蒸馏学习的过程中,核对分组后的图像数据进行卷积计算,即可以获取与各个卷积核对应的卷积通道的特征为3。本发明实施例中,对第二特征图集合中不同尺度的各个第二特征图进行GAP(Global将第二网络对应的需要进行剪枝的剪枝层的通积核的权重,第二通道权重的绝对值是第二网络经过训练获得的第二通道权重的绝对值,ChannelAttention即通道注意力,通道注意力包括但不限于具有卷积操作、批归一化/中监督第二网络学习其每个通道的注意力信息,从而提升第二网络的关键点检测的效果。需要说明的是,图5中所示的第一特征图和第二特征图的通道数相同只是为了方便进行原convolutionalneuralnetn[0145]S704、通过教师网络的全连接层对第一特征图集合进行[0152]S707、通过学生网络的全连接层对第二特征图集合进行后的标志函数确定知识蒸馏损失函数,并计算第一预测分布与第二预测分布之间的差异机(PersonalComputer,PC)、手机、智能手机、个人数字助手(PersonalDigital[0185]本发明实施例还提供一种包括指令的计算机程序产品,说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现以是个人计算机,服务

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论