CN113642472B 判别器模型的训练方法和动作识别方法（北京百度网讯科技有限公司）

上传人：1*** IP属地：山西上传时间：2026-06-17 格式：DOCX 页数：44 大小：1.27MB 积分：9.6 举报 版权申诉

CN113642472B 判别器模型的训练方法和动作识别方法（北京百度网讯科技有限公司）_第2页

CN113642472B 判别器模型的训练方法和动作识别方法（北京百度网讯科技有限公司）_第3页

CN113642472B 判别器模型的训练方法和动作识别方法（北京百度网讯科技有限公司）_第4页

CN113642472B 判别器模型的训练方法和动作识别方法（北京百度网讯科技有限公司）_第5页

已阅读5页，还剩39页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

本公开提供了判别器模型的训练方法和动板视频数据其中至少之一以及第三模板视频数2将包括待识别动作的待识别视频序列的第一时序特征向量、和结果包括所述待识别动作与所述模板动作是否为同一类别根据所述判别器模型的输出结果，得到与所述第一时序特征向量所根据所述目标模板动作确定所述待识别动作的动作类所述将包括待识别动作的待识别视频序列的第一时序特征向量、和包括将第一时序特征向量和至少一个所述第二时序特征向量输入所述判别所述第一时序特征向量的相似度大于或等于预设阈值的目标第二时所述根据所述判别器模型的输出结果，得到与所述第一时序特征向量将所述目标第二时序特征向量所表征的模板动作作为所所述目标模板动作确定所述待识别动作的动将出现次数最多的目标模版动作的动作类别作为所述待识别动作的动作类针对所述待识别视频序列中的目标视频帧，获取包括所述目将所述第一帧序列的特征向量作为所述第一针对所述模板视频序列中的目标模板视频帧，获取包括所将所述第二帧序列的特征向量作为所述第二6.根据权利要求1所述的方法，其中，所述判别器模型是通过以下操作进行训练得到确定第一正样本对，所述正样本对包括第一模板视频数确定第一负样本对，所述负样本对包括所述第一模板视频3生成包括与所述第三模板动作不同的第四模板动作的第将所述第四模板视频数据和所述第五模板视频数据其中至少之一以及所述第六模板模型处理模块，用于将包括待识别动作的待识别视频序列的第一扩展模块，用于响应于需要新增判别器模型可支持识别的模所述模型处理模块，用于将第一时序特征向量和至少一个所述第二时所述目标模板动作确定模块，用于将所述目标第二时序特征向量4确定单元，用于确定多个所述目标模板动作中的每个所述目标模板动作的出现次数；第二定义单元，用于将出现次数最多的目标模版动作第一获取模块，用于针对所述待识别视频序列中的目标第二获取模块，用于针对所述模板视频序列中的目标模板第一确定模块，用于确定第一正样本对，所述正样本对包括第第二确定模块，用于确定第一负样本对，所述负样本对包括第一训练模块，用于利用所述第一正样本对和所述第一负样本第一生成模块，用于响应于添加与所述第一模板动成包括所述第三模板动作的第四模板视频数据和包括所述第三模板动作的第五模板视频第二生成模块，用于生成包括与所述第三模板动作不同第一定义模块，用于将所述第四模板视频数据和所述第五模板第二训练模块，用于利用所述第二正样本对和所述第二负样本第一生成单元，用于基于第一生成场景，生成包括所述第第二生成单元，用于基于第二生成场景，生成包括所述第第三生成单元，用于基于第三生成场景，生成包括所述第5第四生成单元，用于基于第四生成场景，生成包括所述第所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被6识别视频序列的第一时序特征向量、和包括模板动作的模板视频序列的第二时序特征向7[0011]应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特[0013]图1示意性示出了根据本公开实施例的可以应用动作识别方法及装置的示例性系8[0029]图1示意性示出了根据本公开实施例的可以应用动作识别方法及装置的示例性系领域技术人员理解本公开的技术内容，但并不意味着本公开实施例不可以用于其他设备、[0035]需要说明的是，本公开实施例所提供的动作识别方法一般可以由终端设备101、[0036]或者，本公开实施例所提供的动作识别方法一般也可以由服务器105执行。相应9[0066]根据本公开的实施例，各深度特征向量的提取可以基于人体特征提取网络，如[0070]通过本公开的上述实施例，利用基于对抗训练得到的判视频帧，获取包括目标视频帧及与目标视频帧相邻的至少一个视频帧在内的第一帧序列。的目标模板动作可以为与待识别动作中所有的部分动作属于同一类别的多个目标模板动一类别的目标模板动作。由于举双手与待识别动作中的至少三个部分动作属于同一类别，不同的模板动作的模板视频401实现。模板视频401中不同的模板动作可以通过标注403区型406能够基于模板特征完成对待识别动作的动作识别。一时序特征向量。模板特征404可以代表模板视频数据中的各部分动作所对应的第二时序判别结果可以确定与视频特征属于同一类别的[0098]如图4D所示，判别结果410可以体现与各个视频特征属于同一类别的一个或多个模板特征。后处理模块411可以根据各模板特征的出现次数确定待识别视频中的动作的动征向量所表征的至少部分动作属于同一类别及与模板视频帧相邻的至少一个视频帧在内的第一帧视频帧及与模板模板视频帧相邻的模板视频帧在内的第二帧序列。因特网的计算机网络和/或各种电信网络与其他设备交换信单元708。在一些实施例中，计算机程序的部分或者全部可以经由ROM702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM703并由计算单元701执行机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器[0143]用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的包部分地在机器上执行且部分地在远程机器上执行或完全在器以及键盘和指向装置（例如，鼠标或者轨迹球用户可以通过该键盘面或者该网络浏览器来与此处描述的系统和技术的实施方式交互）、或者包括这种后台部字数据通信（例如，通信网络）来将系统的部件相互连接。通信网络的示例包括：过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

CN113642472B 判别器模型的训练方法和动作识别方法（北京百度网讯科技有限公司）

文档简介

温馨提示

最新文档

评论

CN113642472B 判别器模型的训练方法和动作识别方法 （北京百度网讯科技有限公司）

文档简介

温馨提示

最新文档

评论

相关文档

CN113642472B 判别器模型的训练方法和动作识别方法（北京百度网讯科技有限公司）