《汽车智能座舱语音分级与测评方法》_第1页
《汽车智能座舱语音分级与测评方法》_第2页
《汽车智能座舱语音分级与测评方法》_第3页
《汽车智能座舱语音分级与测评方法》_第4页
《汽车智能座舱语音分级与测评方法》_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS43.020

CCST40

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

团体标准

T/CSAExx-20xx

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

中国汽车工程学会2341汽车智能座舱语音分级与测评方法中国汽车工程学会2341中国汽车工程学会2341

Voiceclassification,testingandevaluationmethods

forautomotiveintelligentcockpits

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

(征求意见稿)

在提交反馈意见时,请将您知道的相关专利连同支持性文件一并附上。

DraftingguidelinesforcommercialgradesstandardofChinesemedicinalmaterials

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

20xx-xx-xx发布20xx-xx-xx实施

中国汽车工程学会2341中国汽车工程学会中国汽车工程学会2341发布中国汽车工程学会2341

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

T/CSAExx—20xx

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

前言

中国汽车工程学会2341本文件按照GB/T1.1—2020《标准化工作导则中国汽车工程学会2341第1部分:标准化文件的结构和起草规则》的规定中国汽车工程学会2341

起草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

本文件由中国智能网联汽车产业创新联盟提出。

本文件由中国汽车工程学会标准化工作委员会归口。

本文件起草单位:清华大学、芜湖雄狮汽车科技有限公司、科大讯飞股份有限公司。

本文件主要起草人:

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

II

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

T/CSAExx—20xx

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

汽车智能座舱语音分级与测评方法

1范围

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

本文件确立了汽车智能座舱语音分级体系,规定了其测试要求,描述了相应的测试方法和评价方法。

本文件适用于搭载智能语音系统的车辆的语音分级、测试与评价。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

文件。

GB/T36464.1-2020信息技术智能语音交互系统第1部分:通用规范

GB/T3785.1-2023电声学声级计第1部分:规范术语和定义

3术语和定义

GB/T36464.1-2020中界定的及下列术语和定义适用于本文件。

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

3.1

感知能力perceptualability

智能语音系统对于语音输入的敏感程度和判断能力。

3.2

认知能力cognitiveability

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

智能语音系统通过输入的语音判断用户意图、理解所处场景的能力,以及通过学习了解用户及用户

群的能力。

3.3

交互能力interactionability

用户和功能单元之间通过语音进行信息传递、交流的过程中,体现出的拟人化程度,以及其功能权

中国汽车工程学会2341限范围。中国汽车工程学会2341中国汽车工程学会2341

3.4

固定语音唤醒fixedvoicetrigger

处于音频流监听状态的语音交互系统,在检测到指定的语音唤醒词后,切换到命令字识别、连续语

音识别等其他处理状态的过程。

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

1

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

T/CSAExx—20xx

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

3.5

模糊语音唤醒fuzzyvoicetrigger

处于音频流监听状态的语音交互系统,在检测到对话中存在语音唤醒词后,切换到命令字识别、连

续语音识别等其他处理状态的过程。

3.6

中国汽车工程学会2341免唤醒non-voicetrigger中国汽车工程学会2341中国汽车工程学会2341

处于音频流监听状态的语音交互系统,在限定时间与场景内,用户无需说出特定的唤醒词即可直接

下达指令或查询信息等功能。

3.7

全时免唤醒fulltimenon-voicetrigger

中国汽车工程学会2341处于音频流监听状态的语音交互系统,在任何时间与场景内,用户无需说出特定的唤醒词即可进行中国汽车工程学会2341中国汽车工程学会2341

语音交互功能。

3.8

用户画像userprofile

基于用户基本数据和特征标签构建的用户信息的一系列描述,将用户标记为某一个用户或某一类用

户。

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

3.9

用户学习userlearning

系统通过学习一段时间内的用户行为数据、偏好、习惯以及交互历史等信息,构建一套详细且动态

的用户模型的过程。

3.10

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

社会学习sociallearning

系统通过社会观察和互动,以及经验分享,具备在社会环境中学习和获取新的知识、技能及行为的

能力,理解社会规范和行为规则。

3.11

日常daily

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

结合对基本座舱场景上下文理解,能够进行简单非模板化的日常语言交流互动,快速建立与用户有

效关系的能力。

3.12

共情empathy

在日常交互能力(3.11)的基础上,识别、理解和回应他人正/负情绪,以及有效表达情感的能力。

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

2

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

T/CSAExx—20xx

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

3.13

社会情感socialemotion

在准确认知用户多类情绪的基础上,通过社会学习(3.10),获取有效社会群体交流的能力,能够

与用户建立较深层次的情感连接。

3.14

中国汽车工程学会2341自主任务构建autonomoustaskformulation中国汽车工程学会2341中国汽车工程学会2341

根据用户对确定性任务的指令,系统自动分解任务,并构建必要任务步骤,需用户确认或自动确认。

3.15

自主任务规划与反思autonomoustaskplanningandreflection

基于用户的任务指令,系统自动分解任务,并自主规划执行步骤,使用资源和工具,并根据中间反

中国汽车工程学会2341馈迭代计划直至完成,需用户确认或自动确认。中国汽车工程学会2341中国汽车工程学会2341

3.16

自主任务决策autonomoustaskdecisionmaking

基于场景理解和社会情感(3.13)认知,并理解用户意图,能够主动提供个性化服务。

3.17

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

成功率Interactionsuccessrate

系统完整且成功执行某项任务的次数与测试总次数的比率。

3.18

误唤醒频度falsewakeupfrequentness

语音交互系统处于休眠状态一段时间内,保持外部有多媒体声、人声、语音导航等不包含唤醒词或

中国汽车工程学会2341免唤醒指令的声源持续播放,无唤醒意图时语音交互系统被唤醒给出响应的次数。中国汽车工程学会2341中国汽车工程学会2341

3.19

满意度satisfaction

用户在使用系统、产品或服务时产生的身体、认知和情感反应,表示满足用户需求和期望的程度。

[来源:ISO9241-11:2018,3.1.14]

中国汽车工程学会23413.20中国汽车工程学会2341中国汽车工程学会2341

识别准确率recognitionaccuracy

在某段时间内,能准确判断并成功给出相应反馈的次数与测试总次数的比率。

3.21

记忆数量memoryquantity

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

3

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

T/CSAExx—20xx

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

座舱系统可记忆的最大用户画像信息种类数量。

3.22

记忆准确率memoryaccuracy

座舱根据用户画像信息所提供的服务中,成功给出相应反馈的次数与测试总次数的比率。

3.23

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

学习维度learningdimension

座舱学习维度包括行驶、办公、娱乐、休闲、社交、健康、日常(3.11)、应急、其他等9类场景。

3.24

学习准确率learningaccuracy

座舱根据用户学习信息所提供的服务中,成功给出相应反馈的次数与测试总次数的比率。

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

3.25

信息冗余度informationredundancy

在一轮问答过程中,成功给出相应反馈的最简短回答与正常回答的语音文字个数之比。

3.26

中国汽车工程学会2341任务完成率taskcompletionrate中国汽车工程学会2341中国汽车工程学会2341

在交互中,成功完成任务次数与任务总次数的比例。

3.27

交互准确性interactionaccuracy

在情感交互中,判断交互中的内容相关度。

中国汽车工程学会23413.28中国汽车工程学会2341中国汽车工程学会2341

拟人化程度degreeofpersonification

在单轮或多轮对话中,语音系统结合语境、用户情绪及行为认知,能够实现对话的自然度和流畅度。

3.29

构建准确率constructionaccuracy

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

在自主任务构建(3.14)中,成功构建该项任务的次数与测试总次数的比率。

3.30

规划与反思准确率planningandreflectingaccuracy

在自主任务规划与反思(3.15)中,成功规划与反思该项任务的次数与测试总次数的比率。

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

4

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

T/CSAExx—20xx

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

3.31

决策准确率decisionaccuracy

在自主任务决策(3.16)中,成功决策该项任务的次数与测试总次数的比率。

4缩略语

中国汽车工程学会2341无中国汽车工程学会2341中国汽车工程学会2341

5分级体系与评价指标

5.1汽车智能座舱语音分级体系

汽车智能座舱语音根据感知能力、认知能力(情绪认知、认知学习)、交互能力(情感交互、任务

交互),3方面进行L0-L4的分级,分级体系见表1。

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

5

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

T/CSAExx—20xx

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

表1汽车智能座舱语音分级体系

感知能力认知能力交互能力

层级主要特征情绪认知情感任务

唤醒

认知学习交互交互

L0

车控

功能式需用户语音输入单一或连续多个车控

无无无无任务

智能类任务指令,系统能够执行并反馈。

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341执行

语音

L1L0基础上,用户可以使用固定唤醒词

固定信息

信息式唤醒语音系统。系统具备信息交互能

语音无无信息任务

智能力,需用户语音输入信息类任务指令,

唤醒执行

语音系统能够执行并反馈。

L2L1基础上,用户可以使用模糊唤醒词

模糊

认知唤醒语音系统。具备用户画像和日常用户自主任务

中国汽车工程学会2341中国汽车工程学会2341语音无日常中国汽车工程学会2341

智能交互能力。基于用户指定的任务,可画像构建

唤醒

语音自主构建任务流程,并执行完成任务。

L2基础上,用户对话可免唤醒。通过

L3

对话或多模态判断用户正/负面情绪,

情感自主任务

具备用户学习和共情交互能力。基于用户

认知免唤醒正/负共情规划与反

用户指定的任务,系统自主规划执行学习

智能思

步骤,使用资源和工具,并根据中间

中国汽车工程学会2341语音中国汽车工程学会2341中国汽车工程学会2341

反馈迭代计划,直至任务完成。

L3基础上,用户对话可全时免唤醒。

L4

通过对话判断用户多类情绪,主动学

社会自主

习理解用户群和社会规范。具备社会全时社会社会

认知多类任务

情感属性和交互能力。系统感知用户免唤醒学习情感

智能决策

情境,理解用户记忆,能够主动提供

语音

个性化服务。

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

5.2分级评价指标

5.2.1感知能力

感知能力主要通过唤醒和免唤醒能力来衡量。具体指标见表2。

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

6

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

T/CSAExx—20xx

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

表2感知能力指标

一级指标二级指标三级指标评价指标

成功率

固定语音唤醒

误唤醒频度

成功率

模糊语音唤醒

误唤醒频度

中国汽车工程学会2341感知能力唤醒中国汽车工程学会2341中国汽车工程学会2341

成功率

免唤醒

误唤醒频度

成功率

全时免唤醒

误唤醒频度

5.2.2认知能力

中国汽车工程学会2341认知能力主要通过情绪认知和认知学习能力衡量。具体指标见表中国汽车工程学会23413。中国汽车工程学会2341

表3认知能力指标

一级指标二级指标三级指标评价指标

正/负情绪认知识别准确率

情绪认知

多类情绪认知识别准确率

记忆数量

用户画像

记忆准确率

认知能力

中国汽车工程学会2341中国汽车工程学会2341学习维度中国汽车工程学会2341

认知学习用户学习

学习准确率

学习维度

社会学习

学习准确率

5.2.3交互能力-情感交互

中国汽车工程学会2341情感交互能力由信息、日常、共情和社会情感表现衡量。具体指标见表中国汽车工程学会23414。中国汽车工程学会2341

表4情感交互能力指标

一级指标二级指标三级指标评价指标

信息信息冗余度

任务完成率

日常交互准确性

拟人化程度

中国汽车工程学会2341中国汽车工程学会2341任务完成率中国汽车工程学会2341

交互能力情感交互

共情交互准确性

拟人化程度

任务完成率

社会情感交互准确性

拟人化程度

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

7

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

T/CSAExx—20xx

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

5.2.4交互能力-任务交互

任务交互能力由车控任务执行、信息任务执行、自主任务构建、自主任务规划与反思、自主任务决

策等表现衡量。具体指标见表5。

表5任务交互能力指标

一级指标二级指标三级指标评价指标

任务完成率

车控任务执行

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341满意度

任务完成率

信息任务执行

满意度

构建准确率

自主任务构建任务完成率

交互能力任务交互满意度

规划与反思准确率

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

自主任务规划与反思任务完成率

满意度

决策准确率

自主任务决策任务完成率

满意度

6测试要求

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

6.1测试环境要求

6.1.1基本要求

测试环境应符合以下要求:

a)天气良好,无雨雪、冰雹、台风等恶劣天气。

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

b)车辆所处区域无强电磁信号干扰;

c)网络条件满足上行带宽不低于200kbit/s、下行带宽不低于100kbit/s,网络时延小于100m/s,

保持稳定的联通状态;

d)驾驶舱内光照强度应大于500lux且小于1500lux,测量位置在前排中央扶手,与天窗垂线中点

附近。外部光源在驾驶舱内无明显反光现象。

中国汽车工程学会23416.1.2场地要求中国汽车工程学会2341中国汽车工程学会2341

静态测试应在封闭场景(地上/地下停车场、室内车库等)进行。

6.1.3语音声源及噪声要求

语音声源及噪声要求见表6。

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

8

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

T/CSAExx—20xx

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

表6语音声源及噪声要求

测试设备声源设置车内环境

场景

测试设备10cm处目标MIC处测试设备10cm处

ID位置人声干扰

声压级回声声压级声压级

1副驾75dB~77dB75dB~80dBNAN/A

2主驾75dB~77dB75dB~80dBNAN/A

副驾后~~

中国汽车工程学会2341375dB77dB中国汽车工程学会234175dB80dBNA中国汽车工程学会2341N/A

4主驾后75dB~77dB无要求副驾:闲聊75dB~80dB

5副驾75dB~77dB无要求主驾:闲聊80dB~85dB

主驾后:

6主驾75dB~77dB无要求80dB~85dB

视频娱乐

6.2测试车辆要求

中国汽车工程学会2341测试车辆要求如下:中国汽车工程学会2341中国汽车工程学会2341

a)车辆功能正常,无故障报警;

b)所有屏幕表面无出厂后贴的膜;

c)车机系统调为出厂默认状态(系统设置、功能设置、交互界面等);

d)登录车辆账号,确保被测功能可用;

e)确保车辆正常联网,且在测试全程保持联网状态;

f)准备测评过程中依赖的数据,如联系人列表、实体信息(音乐列表、电台列表)等;

g)测试前,需安装测试相关APP,激活相关功能和响应反馈,保证功能可用。

中国汽车工程学会2341中国汽车工程学会2341中国汽车工程学会2341

6.3测试设备要求

测试设备应符合表7的要求。

表7测试设备要求

设备用途要求数量(个)

生成式语音信噪比:90dB;

中国汽车工程学会2341测试系统生成并播放中国汽车工程学会2341增益控制:0dB~25dB;中国汽车工程学会2341

2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论