CN113569889B 一种基于人工智能的图像识别的方法以及相关装置 (腾讯科技(深圳)有限公司)_第1页
CN113569889B 一种基于人工智能的图像识别的方法以及相关装置 (腾讯科技(深圳)有限公司)_第2页
CN113569889B 一种基于人工智能的图像识别的方法以及相关装置 (腾讯科技(深圳)有限公司)_第3页
CN113569889B 一种基于人工智能的图像识别的方法以及相关装置 (腾讯科技(深圳)有限公司)_第4页
CN113569889B 一种基于人工智能的图像识别的方法以及相关装置 (腾讯科技(深圳)有限公司)_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一种基于人工智能的图像识别的方法以及本申请公开了一种基于人工智能的图像识别的方法以及相关装置,应用于计算机视觉技2将所述输入图像输入目标模型中的预设识别网络,以得到注意力图,将所述注意力区域进行掩盖,以对所述注意力图进行更新得到第一将所述注意力区域对应的权重参数进行强化,以对所述注意力图进行更新得到根据所述第一调整图像和所述第二调整图像对所述预设识将所述图像特征图输入所述目标模型中的分级识别网络,以得到第一签对于所述目标对象描述粒度小于所述第一类型标签对于所述目标对象描述根据所述负样本序列和所述正样本序列对所述预设识别网确定所述注意力区域对应的注意力一级标签和基于所述注意力一级标签对应的区域和注意力二级标签对应的区域进行根据所述注意力损失信息对所述目标识别网络进基于所述二级标签正样本和二级标签负样本对所述基于所述目标样本对应的批数据进行滑动均值计算,以得到动3基于所述预测值与所述动态阈值信息进行比较,以确定所述二级将所述预测值与所述动态阈值信息中的正样本将所述预测值与所述动态阈值信息中的负样本若所述预测值大于所述负样本阈值,且所述预测值小于所对所述媒体数据流中的图像按照目标时序进行提取,以得到所述输将所述第一关键信息和所述第二关键信息进行关联,以得到所述输入图像的描述信调整单元,用于将所述注意力区域进行掩盖,以对所述注意力图进的标签不变;根据所述第一调整图像和所述第二调整图像对所述预设识别网络进行训练,4识别单元,用于将所述图像特征图输入所述目标模型中的分级识所述第二类型标签对于所述目标对象描述粒度小于所述第一类型标签对于所述目标对象根据所述负样本序列和所述正样本序列对所述预设识别网确定所述注意力区域对应的注意力一级标签和基于所述注意力一级标签对应的区域和注意力二级标签对应的区域进行根据所述注意力损失信息对所述目标识别网络进基于所述二级标签正样本和二级标签负样本对所述基于所述目标样本对应的批数据进行滑动均值计算,以得到动基于所述预测值与所述动态阈值信息进行比较,以确定所述二级将所述预测值与所述动态阈值信息中的正样本将所述预测值与所述动态阈值信息中的负样本若所述预测值大于所述负样本阈值,且所述预测值小于所5对所述媒体数据流中的图像按照目标时序进行提取,以得到所述输将所述第一关键信息和所述第二关键信息进行关联,以得到所述输入图像的描述信所述存储器用于存储程序代码;所述处理器用于根据所述程序代码中的指令执行所述计算机指令,使得所述计算机设备执行上述权利要求1至11任一项所述的图像识6[0002]人工智能(AI,ArtificialIntelligence)是利用数字计算机或者数字计算机控型标签对于所述目标对象描述粒度小于所述第一类型标签对于所述目标对象描7信息进行比较,以确定所述二级标签训练数据中的所述二级标签正样本和二级标签负样[0037]若所述预测值大于所述正样本阈值,则确定所述目标样本为所述二级标签正样[0039]若所述预测值小于所述负样本阈值,则确定所述目标样本为所述二级标签负样8[0059]调整单元,用于基于所述注意力区域对所述注意力图进行图像调整得到增强图输入图像的第二类型标签,所述第一类型标签和所述第二类型标签用于指示同一目标对9本序列;所述二级标签训练数据中的所述二级标签正样本和二级[0081]若所述预测值大于所述正样本阈值,则确定所述目标样本为所述二级标签正样[0085]所述识别单元,具体用于将所述噪声样本设置为不参与所述二级标签分支的训得该计算机设备执行上述第一方面或者第一方面的各种可选实现方式中提供的图像识别[0105]图5为本申请实施例提供的另一种基于人工智能的图像识别的方法的场景示意[0106]图6为本申请实施例提供的另一种基于人工智能的图像识别的方法的场景示意[0107]图7为本申请实施例提供的另一种基于人工智能的图像识别的方法的场景示意[0108]图8为本申请实施例提供的另一种基于人工智能的图像识别的方法的场景示意进而将图像特征图输入目标模型中的分级识别网络,以得到第一类型标签和第二类型标用注意力图中的注意力区域进行增强图像的获取,使得模型专注于关键部位的数据学系统可以提供与多个信息源的图像识别的过程,即通过终端侧的触发操作获取多媒体数[0123]人工智能(AI,ArtificialIntelligence)是利用数字计算机或者数字计算机控图5所示,图5为本申请实施例提供的另一种基于人工智能的图像识别的方法的场景示意[0143]本实施例中,基于增强图像对预设识别网络进行识别的过程为引导注意力的过不变)。通过这种方式,能够达到主动地帮助模型学习它需要关注地可区分不同类别的区[0154]本实施例中,如图4所示的架构,分级识别网络包括一级标签分支和二级标签分[0157]为了避免噪声样本参与二级标签分支的训练过程,可以采用动态阈值的判断过pp是通过每个batch(批数据)模型筛选后的样本得分进行更新。该公式的目的是只训练经过频帧的内容之间存在一定的关联性,采用间隔式的采集方式并不会遗漏可能的低俗图像,得到第一类型标签和第二类型标签,所述分级识别网络包括一级标签分支和二级标签分[0216]所述识别单元1104,具体用于基于所述目标样本对应的批数据进行滑动均值计确定所述二级标签训练数据中的所述二级标签正样[0220]若所述预测值大于所述正样本阈值,则确定所述目标样本为所述二级标签正样[0226]所述获取单元1101,具体用于对所述媒体数据流中的图像按照目标时序进行提[0229]所述识别单元1104,具体用于将所述第一关键信息和所述第二关键信息进行关入图像的标记进行识别;systemofmobilecommunication,GSM)、通用分组无线服务(generalpacketradioservice,GPRS)、码分多址(codedivisionmultipleaccess,CDMA)、宽带码分多址[0239]存储器1220可用于存储软件程序以及模块,处理器1280通过运行存储在存储器使用手指、触笔等任何适合的物体或附件在触控面板1231上或在触控面板1231附近的操[0241]显示单元1240可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1240可包括显示面板1241,可选的,可以采用液晶显示器(liquid到在其上或附近的触摸操作后,传送给处理器1280以确定触摸事件的类型,随后处理器的明暗来调节显示面板1241的亮度,接近传感器可在手机移动到耳边时,关闭显示面板[0245]处理器1280是手机的控制中心,利用各种接口和线路连通过运行或执行存储在存储器1220内的软件程序和/或模块,以及调用存储在存储器1220述调制解调处理器也可以不集成到处理器12以上处理器)和存储器1332,一个或一个以上存储应用程序1342或数据1344的存储介质存储或持久存储。存储在存储介质1330的程序可以包括一个或一个以上模块(图示没标机上运行时,使得计算机执行如前述图3至图10所示实施例描述的方法中图像识别的装置[0259]所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论