2025支持语音和视觉交互的虚拟数字人技术规范_第1页
2025支持语音和视觉交互的虚拟数字人技术规范_第2页
2025支持语音和视觉交互的虚拟数字人技术规范_第3页
2025支持语音和视觉交互的虚拟数字人技术规范_第4页
2025支持语音和视觉交互的虚拟数字人技术规范_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Technicalspecificationsforvirtualdigitalhumanssupportingvoiceandvisual 附录 GB3096-2008GB/T5271.29-2006信息技术词汇第29GB/T12060.5-2011声系统设备第5部分:扬声器主要性能测试方法GB/T12060.16-2017 16部分:通过语音传输指数客观评价言语可懂度GB/T14277-2013音频组合设备通用规范GB/T21023-2007GB/T21024-2007GB/T34083-2017GB/T34145-2017中文语音合成互联网服务接口规范GB/T35273-2020信息安全技术个人信息安全规范GB/T35312-2017中文语音识别终端服务接口规范GB/T36464.1-2020信息技术智能语音交互系统第1部分:通用规范GB/T36464.2-2018信息技术智能语音交互系统第2部分:智能家居GB/T36464.3-2018信息技术智能语音交互系统第3部分:智能客服GB/T36464.4-2018信息技术智能语音交互系统第4部分:移动终端GB/T36464.5-2018信息技术智能语音交互系统第5部分:车载终端SJ/T11380-2008自动声纹识别(说话人识别)技术规范SJ/T11540-2015GB/T38665.1-2020信息技术手势交互系统第1部分:通用技术要求GB/T38665.2-2020SJ/T11348-2016平板电视显示性能测量方法虚拟数字人virtualdigital语音交互speech[GB/T36464.2-2018,定义语音识别speech[GB/T21023—2007,定义3.1]语音合成speech[GB/T34145—2017,定义3.1]自然语言理解naturallanguage语音唤醒speechwake-up;voice[GB/T36464.2-2018,定义3.13]误唤醒falsewake-[改写GB/T36464.2-2018,定义噪声声纹[SJ/T11380—2008,定义3.1.1]声纹识别voiceprint[SJ/T11380—2008,定义3.1.6]麦克风阵列microphonespeech[GB/T36464.2-2018,定义privacygesturepose定义为:1(neck)、2(rightshoudler)、3(right_elbow)、4(left_wrist(left_hip(noseleft_ear12序号项目单位性能要求额定声频率响应范围由产品标准规定幅频响应差(L&R声压总谐波失真250对于超过允许值,但峰宽小于或等于1/3oct的独立的失真峰,允许不超3个;但不允许有大于1/3oct噪声声级3序号项目单位性能要求NTSC%4 1.5m~4m。 5不低于单类召回率不低于\h注1IoU指预测标记框与真实标记框的交并比(IntersectionOverUnion),用于定义图像中物体的CoatsorJackets状态下的步态识别。注3PCK是PercentageofCorrectKeypoints的缩写,\hh@0.5(像素单位)权同意,符合GB/T35273—2020相关规定。以及常用性角度进行设计,具体要求应按GB/T21023-2007执行。100GB/T21023-20076(可选(可选(可选1环境光强为200lx~250lx被测支持语音和视觉交互的虚拟数字人屏幕中心距离地面高度1.2m。摄像头应朝向虚支持语音和视觉交互的虚拟数字人的声学性能参照SJ/T11540-2015GB/T12060.5-2011、GB/T14277-2013测试。在低噪测试场景下,如下设置播测音源的音量:距离待测设备1m处,播放唤醒语料或识别语料,在待测设备麦克风处测的平均声压级为65dB(A),以此为基准音量。tetr,计算当次语音交互会话的响应时间;实时系数测试遵照GB/T21023-2007中5.3要求。PNsw 24h,记录被测系统被待测设备的内噪声85dB,信回比-15dB,并以此为音量基准在不同距离重复进行语音打断PNi e)进行测试。Lmin。以不大于10cm/sLmin。h)进行测试。Lmax。以不大于10cm/sLmax。16.6.1.1将被测支持语音和视觉交互的虚拟数字人恢复到起始角度,然后以不大于1°/s210100录识别正确的次数X和总测试次数Y。3识别率=×100%346.6.4.15第1第36.6.4附录60s;0.2s2s2s,A.1平稳噪声(家居环境噪声等非平稳噪声(电视噪声等0.3135(-5~15dB5(-35~0dB,步长5A.1测试集构建方法示例(续待测空间混响T60T60T600.1m10.1m10.4m10.4m110.71.5例如,AI音箱0dB,30dB,50dB,90dB,100正常较快135(1.5~1.62)0.80.4注:——高度:(1.10.01——半径

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论