版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1人工智能终端智能化分级第9部分:耳机本文件规定了耳机智能化关键能力等级划分和等级判定,给出了测试方法。2规范性引用文件GB/Z177.1—2026人工智能终端智能化分级第1部分:参考框架拾音soundpickup通过传声器采集声音信号的过程。语音识别speechrecognition主动降噪activenoisecancellation通过实时分析噪声特性,生成反相声波并抑制噪声成分,从而降低环境噪声干扰的技术。环境降噪environmentalnoisecancellat通过分离语音与环境噪声,识别并抑制非目标噪声成分,从而提升通话场景下语音传输清晰度的技术。注:环境降噪也称通话降噪。2能够与耳机建立连接,为耳机提供音频信号源、控制指令交互,可发起连接请求、配置耳机参数,并对相关功能进行控制的设备。GB/Z177.1和GB/Z177.2界定的以及下列缩略语适用于本文件。MOS:平均意见得分(MeanOpinionScore)5关键能力5.2L1响应级5.2.1.1用户信息感知用户信息感知能力应满足下列要求。1)安静环境下的语音识别准确率不低于90%;2)噪声环境下的语音识别准确率不低于80%。b)触控信息:具备感知用户触控输入信息的能力,如敲击、滑动等,触控操作准确率不小于90%。5.2.1.2设备信息感知设备信息感知能力应满足下列要求。a)软硬件状态:具备感知自身软硬件状态的能力,如电量、充电状态、连接状态、系统版本等。b)任务状态:具备感知当前执行任务及相关参数的能力,如音乐播放、通话等。5.2.1.3环境信息感知网络信息:应具备通过互联网感知环境信息的能力,如天气、地理位置等。单个简单指令:应具备理解用户的单个简单语音指令的能力,响应时间不高于1.5s。无要求。无要求。35.2.3.1工具调用5.2.3.2内容生成无要求。5.2.3.4表达输出清晰语音输出:应具备清晰的语音输出能力,不应出现影响正常使用效果的垃圾声、碰圈声和异常声。5.2.4.1短期记忆无要求。5.2.4.2长期记忆5.3.1.1用户信息感知用户信息感知能力应满足下列要求。2)噪声环境下的语音唤醒准确率不低于90%;3)安静环境下的语音识别准确率不低于90%;4)噪声环境下的语音识别准确率不低于80%。b)触控信息:具备感知用户触控输入信息的能力,如敲击、滑动等,触控操作准确率不小于90%。5.3.1.2设备信息感知设备信息感知能力应满足下列要求。a)软硬件状态:具备感知自身软硬件状态的能力,如电量、充电状态、连接状态、系统版本等。b)任务状态:具备感知当前执行任务及相关参数的能力,如音乐播放、通话等。c)佩戴状态:具备感知用户佩戴状态的能力。5.3.1.3环境信息感知环境信息感知能力应满足下列要求。4a)网络信息:具备通过互联网感知环境信息的能力,如天气、地理位置等。b)环境声音:具备感知环境声音信息能力,具备多频点噪声检测能力。5.3.2.1理解理解能力应满足下列要求。a)单个简单指令:具备理解用户的单个简单语音指令的能力,响应时间不高于1.5s。c)简单意图:具备理解用户的简单意图的能力。无要求。5.3.3.1工具调用工具调用能力应满足下列要求。b)多步骤工具调用:具备调用确定性组合工具完成预设且明确的多步骤任务的能力。内容生成能力应满足下列要求。多设备连接:应具备不少于2台设备同时连接的能力。表达输出能力应满足下列要求。a)清晰语音输出:具备清晰的语音输出能力,不应出现影响正常使用效果的垃圾声、碰圈声和异常声。b)主动噪声控制:具备主动降噪能力,能够实现降噪模式与通透或关闭等模式至少两档手动切换;具备环境降噪能力。5注:开放式耳机不要求主动降噪能力。5.3.4记忆5.3.4.1短期记忆5.3.4.2长期记忆无要求。5.4L3辅助级5.4.1.1用户信息感知用户信息感知能力应满足下列要求。1)安静环境下的语音唤醒准确率不低于95%;2)噪声环境下的语音唤醒准确率不低于90%;3)安静环境下的语音识别准确率不低于90%;4)噪声环境下的语音识别准确率不低于80%。b)触控信息:具备感知用户触控输入信息的能力,如敲击、滑动等,触控操作准确率不小于90%。c)头部姿态信息:具备感知用户头部姿态变化的能力。5.4.1.2设备信息感知设备信息感知能力应满足下列要求。a)软硬件状态:具备感知自身软硬件状态的能力,如电量、充电状态、连接状态、系统版本等。b)任务状态:具备感知当前执行任务及相关参数的能力,如音乐播放、通话等。c)佩戴状态:具备感知用户佩戴状态的能力。5.4.1.3环境信息感知环境信息感知能力应满足下列要求。a)网络信息:具备通过互联网感知环境信息的能力,如天气、地理位置等。b)环境声音:具备感知环境声音信息能力,具备多频点噪声检测能力。d)设备位置:具备感知耳机位置的能力。理解能力应满足下列要求。a)单个简单指令:具备理解用户的单个简单语音指令的能力,响应时间不高于1.5s。b)复杂指令:具备理解用户的复杂语音指令的能力。6d)复杂意图:具备理解用户的复杂意图的能力。f)感知融合理解:具备对两种以上感知信息进行融合理解的能力。推理能力应满足下列要求。a)单步或简单链式推理:具备单步推理能力或简单的链式推理能力,能够基于当前明确的上下文进行直接的推断,或解决规则清晰的逻辑问题。b)复杂链式推理:具备复杂的链式推理能力,能够综合多来源信息进行深度推演,或解决深度研究等需要抽象思维和复杂策略的逻辑问题。任务分解和编排执行序列:应具备将复杂任务分解为可执行的子任务,并为分解后的子任务编排合理的执行序列的能力。5.4.3.1工具调用工具调用能力应满足下列要求。b)多步骤工具调用:具备调用确定性组合工具完成预设且明确的多步骤任务的能力。5.4.3.2内容生成内容生成能力应满足下列要求。互联协同能力应满足下列要求。b)内容迁移:具备实现跨设备内容迁移的能力。5.4.3.4表达输出表达输出能力应满足下列要求。b)主动噪声控制:具备主动降噪能力,能够实现降噪模式与通透或关闭等模式至少两档手动切换;具备环境降噪能力。注:开放式耳机不要求主动降噪能力。7c)自适应降噪:具备根据不同环境场景或耳道结构自动切换降噪模式或降噪深度的能力。5.4.4.1短期记忆5.4.4.2长期记忆6等级判定测试过程优先采用附录B的场景测试,至少选取二级应用场景中的3个进行测试。选取的场景应覆盖对应等级的所有能力要求,若有些能力要求无法覆盖,则使用对应能力要求的测试方法进行测试。若委托方认为本文中的场景与产品定位不匹配,可自行制定测试场景,但应经过测试机构的评审,同时覆盖对应等级的所有能力要求。8(规范性)测试方法A.1测试环境测试环境包括:a)温度:15℃~35℃;b)相对湿度:25%~75%;d)安静环境:环境声音强度范围40dB~50dB;e)噪声环境:环境声音强度范围50dB~75dB;f)环境噪声频率范围覆盖20Hz~20kHz,融合白噪声、人声片段、交通环境音等。A.2L1响应级A.2.1.1用户信息感知A.2.1.1.1语音信息语音识别准确率应按照下列测试方法进行。a)在安静环境下,对耳机输入平均声压级为60dB的不同语音内容,测试耳机识别情况。b)按照公式(A.1)计算在安静环境下的语音识别准确率:……………………式中:P₂——语音识别词准确率;S——替换(错误)的字数;D——删除(遗漏)的字数;I——插入(增加)的字数;N——测试语音总字数。c)在噪声环境下,对耳机输入平均声压级为60dB的不同语音内容,测试耳机识别情况。d)按照公式(A.1)计算在噪声环境下的语音识别准确率。A.2.1.1.2触控信息触控准确率应按照下列测试方法进行:a)对耳机进行多次其能够实现的触控操作,测试耳机执行情况;b)按照公式(A.2)计算触控操作的准确率。式中:P₃——触控操作准确率;N₁——触控操作正确响应次数;9N₂——总测试次数。A.2.1.2设备信息感知A.2.1.3环境信息感知网络信息测试方法为:输入天气、地理位置等环境信息的查询指令,测试耳机能否反馈正确信息。A.2.2.1理解A.2.2.1.1单个简单指令理解能力a)向耳机输入单个简单指令的语句。b)通过查看日志或者验证耳机是否执行操作的方式,测试耳机能否理解指令。A.2.2.1.2单个简单指令理解响应时间单个简单指令理解响应时间应按照下列测试方法进行:a)向耳机输入单个简单指令的语句,分别测试指令结束时的时间和耳机做出反馈的时间,计算时间差,得到单次指令响应时间;不涉及。不涉及。A.2.3执行A.2.3.1工具调用单步骤工具调用采用场景化测试方法,在场景中测试耳机单步骤工具调用的能力。b)测试耳机能否正确执行相应操作。A.2.3.2内容生成不涉及。A.2.3.3互联协同不涉及。A.2.3.4表达输出清晰语音输出测试方法:通过耳机输出不同频率、不同声压级的语音信息,测试耳机能否进行准确、清晰的内容呈现。A.2.4记忆A.2.4.1短期记忆不涉及。A.2.4.2长期记忆不涉及。A.3L2工具级A.3.1感知A.3.1.1用户信息感知A.3.1.1.1语音信息A.3.1.1.1.1语音唤醒准确率应按照下列测试方法进行。a)在安静环境下,对耳机输入平均声压级为60dB的唤醒词,测试耳机被唤醒的情况。b)按照公式(A.3)计算在安静环境下的语音唤醒准确率:式中:P₁——唤醒准确率;N₁——设备被唤醒次数;N₂——总测试次数。c)在噪声环境下,对耳机输入平均声压级为60dB唤醒词,测试耳机被唤醒的情况。d)按照公式(A.3)计算在噪声环境下的语音唤醒准确率。A.3.1.1.1.2语音识别准确率测试方法同A.2.1.1.1。A.3.1.1.2触控信息测试方法同A.2.1.1.2。A.3.1.2设备信息感知A.3.1.2.1软硬件状态测试方法同A.2.1.2.1。A.3.1.2.2任务状态测试方法同A.2.1.2.2。A.3.1.2.3佩戴状态改变耳机佩戴状态,如佩戴耳机、取下耳机等,测试耳机能否准确检测到佩戴状态的变化。测试方法同A.2.1.3。A.3.1.3.2环境声音改变耳机的环境声音及外部噪声,测试耳机能否反馈对环境声音的识别情况。A.3.1.3.3定向拾音定向拾音应按照下列测试方法进行:a)在耳机定向拾音的目标方向播放音频信息,测试耳机接收声音的强度和清晰度;b)在至少2个不同角度播放同样声压级、同样内容的音频信息,测试耳机接收声音的强度和清晰度;c)对比a)和b)接收的声音,判断强度和清晰度是否有明显差别。A.3.2认知A.3.2.1理解A.3.2.1.1单个简单指令测试方法同A.2.2.1。A.3.2.1.2复杂指令采用场景化测试方法,在场景中测试耳机对复杂指令的识别和解析能力。a)向耳机输入复杂指令。b)通过查看日志或者验证耳机是否执行操作的方式,测试耳机能否理解指令。采用场景化测试方法,在场景中测试耳机对简单意图的识别和解析能力。a)向耳机输入包含简单意图的指令。b)通过查看日志或者验证耳机是否执行操作的方式,测试耳机能否理解指令。单步或简单链式推理采用场景化测试方法,在场景中测试耳机单步或简单链式推理的能力。a)向耳机输入需要单步推理或简单链式推理的指令,指令类型可涵盖典型推理类型(如演绎、归b)测试耳机能否执行相应的操作并反馈正确结果。不涉及。A.3.3执行A.3.3.1工具调用A.3.3.1.1单步骤工具调用A.3.3.1.2多步骤工具调用a)向耳机输入需要进行多步骤工具调用的任务指令。A.3.3.2内容生成A.3.3.2.1语音生成A.3.3.2.2文本生成多设备连接应按照下列测试方法进行:a)将耳机与两个不同设备同时连接;b)执行需要切换设备的任务,测试耳机能否完成设备切换。A.3.3.4表达输出主动降噪能力应按照下列测试方法进行:a)佩戴耳机,关闭降噪功能,在噪声环境中播放音频,测试通过耳机输出的音频;b)佩戴耳机,打开降噪功能,在相同的噪声环境中播放相同音频,测试通过耳机输出的音频;c)对比a)和b)两种音频,根据所听到噪声是否有明显差距判断是否具备主动降噪能力。A.3.3.4.2.2环境降噪能力环境降噪能力应按照下列测试方法进行:a)在噪声环境中,使用耳机发起通话任务,通过耳机输入人声,记录包含噪声和人声的音频;b)在通话接收方测试通过耳机输入的音频信号;c)对比a)和b)两种音频,根据所听到噪声是否有明显差距判断是否具备环境降噪能力。A.3.4.1短期记忆采用场景化测试方法,在场景中测试耳机单会话上下文记忆的能力。a)执行多轮对话测试任务,输入包含前文指代、省略、上下文依赖等语言内容。A.3.4.2长期记忆不涉及。A.4L3辅助级A.4.1感知A.4.1.1用户信息感知A.4.1.1.1语音信息测试方法同A.3.1.1.1。A.4.1.1.2触控信息测试方法同A.2.1.1.2。A.4.1.1.3头部姿态信息在佩戴耳机的状态下,改变头部姿态,测试耳机能否正确识别用户的头部姿态变化并做出反馈。A.4.1.2设备信息感知测试方法同A.2.1.2.1。测试方法同A.2.1.2.2。A.4.1.2.3佩戴状态测试方法同A.3.1.2.3。A.4.1.3环境信息感知测试方法同A.2.1.3。A.4.1.3.2环境声音测试方法同A.3.1.3.2。A.4.1.3.3定向拾音测试方法同A.3.1.3.3。A.4.1.3.4设备位置通过主设备查找耳机位置,测试能否正确执行查找指令。A.4.2认知A.4.2.1理解A.4.2.1.1单个简单指令测试方法同A.2.2.1。A.4.2.1.2复杂指令测试方法同A.3.2.1.2。A.4.2.1.3简单意图测试方法同A.3.2.1.3。A.4.2.1.4复杂意图采用场景化测试方法,在场景中测试耳机对复杂意图的识别和解析能力。a)向耳机输入包含复杂意图的指令。b)通过查看日志或者验证耳机是否执行操作的方式,测试耳机能否理解指令。A.4.2.1.5意图澄清采用场景化测试方法,在场景中测试耳机是否具有意图澄清能力。a)向耳机输入意图模糊的指令。A.4.2.1.6感知融合理解采用场景化测试方法,在场景中测试耳机的融合理解能力。b)通过查看日志或者验证耳机是否执行操作的方式,测试耳机能否理解指令。A.4.2.2推理A.4.2.2.1单步或简单链式推理测试方法同A.3.2.2。A.4.2.2.2复杂链式推理采用场景化测试方法,在场景中测试耳机复杂链式推理的能力。a)向耳机输入深度研究等需要复杂链式推理的指令,指令类型可涵盖典型推理类型(如演绎、归b)测试耳机能否执行相应的操作并反馈正确结果。采用场景化测试方法,在场景中测试耳机进行任务分级和编排任务执行序列的能力。a)向耳机输入需要多步骤完成的任务指令。b)测试耳机能否分解任务、编排任务执行序列。A.4.3.1工具调用A.4.3.1.1单步骤工具调用测试方法同A.2.3.1。A.4.3.1.2多步骤工具调用测试方法同A.3.3.1.2。A.4.3.1.3自动工具调用b)测试耳机能否调用正确工具执行用户要求的操作并输出预期结果。测试方法同A.3.3.2.1。A.4.3.2.2文本生成测试方法同A.3.3.2.2。A.4.3.3.1多设备连接测试方法同A.3.3.3。A.4.3.3.2内容迁移内容迁移应按照下列测试方法进行:b)在A设备执行完成后,将耳机与B设备连接,在B设备查看是否能够看到任务执行情况或耳机设置改变的状态。A.4.3.4表达输出A.4.3.4.1清晰语音输出测试方法同A.2.3.4。测试方法同A.3.3.4.2。A.4.4.1短期记忆测试方法同A.3.4.1。A
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 河南新乡牧野东于道社区卫生服务中心招聘笔试真题及答案
- 2026年小学二年级数学第二学期期末考试卷及答案(十九)
- 2023年病虫害绿色生物防控产品企业组织架构及部门职责
- 小班冬奥会健康 内容框架
- 超声诊断血管黏液肉瘤关节病变
- 高级执法资格考试题附答案
- 燃气公司三级安全教育安全生产管理人员考试试卷(答案)
- (2026年)三方合同转让协议范本
- 2026笔试面试题库及答案
- 2026北美统计学面试题目及答案
- 安全生产举报培训
- 防洪防汛隐患排查台账
- 2025年中国邮政集团有限公司湖北省分公司招聘笔试备考试题及参考答案详解1套
- 干细胞与健康讲座
- CJ/T 216-2013给水排水用软密封闸阀
- DB32/T 3958-2020化工企业安全生产信息化管理平台建设技术规范
- 福建省厦门市湖里区2023-2024学年六年级下学期期末语文试题(有答案)
- 利津游戏课件
- 教学课件-积极心理学(第2版)刘翔平
- 2025年福建武夷水务发展有限公司招聘笔试参考题库含答案解析
- 2025年炼焦安全生产表态发言稿(2篇)
评论
0/150
提交评论