语音用户界面设计简介_第1页
语音用户界面设计简介_第2页
语音用户界面设计简介_第3页
语音用户界面设计简介_第4页
语音用户界面设计简介_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1语音用户界面设计简介科大讯飞 章继东2006年3月7日2语音用户界面设计简介 VUI设计的定义及其重要性VUI设计(Voice User Interface Design) ,即用户与语音应用系统的交互设计;VUI是直接面向用户的界面,是能否满足用户需求的关键,是系统能否成功的决定性因素之一;优秀的VUI设计者不仅要对语音识别技术、市场需求、业务知识有深刻的理解,还需要具备一定的语言学及心理学的知识,了解用户的使用习惯和心理模型(Mental Model),从而设计出更符合用户的语音应用;随着语音识别技术的应用,在国外,VUI设计已成为一门新兴的科学,而在国内,还未被广泛关注;讯飞很早就成立

2、了专门的VUI设计团队,一直致力于此方面的研究及应用3语音用户界面设计简介 VUI设计的六个阶段需求定义(Requirements Definition ):确定系统基本功能、理解目标用户群、理解业务上下文(Business Context)概要设计(High-Level Design ):确定菜单框架、确定基本语法种类及范围、确定NVA(Nonverbal Audio)的使用、确定系统角色(Persona)详细设计(Detailed Design ):完成所有对话流程及所有提示音的设计,形成规格说明书开发(Development ):VoiceXML开发、动态语法开发等测试(Testing

3、):包含功能性测试、识别测试,更关注可用性测试(Usability Tests )优化调整(Tuning ):通过分析呼叫数据及呼叫录音、进行用户体验调查等,从而进行对话优化、识别优化(识别参数及声学模型)、语法优化4语音用户界面设计简介 VUI设计核心原则5语音用户界面设计简介 低认知负载(Low Cognitive Load)VUI不同于GUI,声音对于人来说是短暂记忆( Short-term Memory ),用户很难记住太多的新信息,尽量减少提示音长度及新知识;建议每次给用户的新知识不要多,并且要在上下文相关的环境中进行一般情况下,用户印象深刻的是最近听到的内容(End-Focus、R

4、ecency Effect ),例如比较下面两句话:“按一号键下载铃声,按二号键赠送铃声”、“下载铃声请按一号键,赠送铃声请按二号键”设置用户的全局性操作(Constancy、Universal Command)保持用户操作的一致性(Consistency)6语音用户界面设计简介 高效(Efficiency)抓住用户的主要需求(试听下载),让用户快速达到自己的目标系统支持语音识别的打断功能(Barge-in)品牌音效(Branding)替换欢迎语,减少时间,并提升品牌效应使用导航语(LandMark),让用户明确自己所处的位置;利用及时反馈(Direct Response),让用户及时了解自己

5、的选择区分新老用户,老用户的提示音更为简洁尽量减少菜单个数(Menu Size),建议不要超过6个尽量缩小菜单深度(Menu Depth),建议不要超过4层7语音用户界面设计简介 准确(Accuracy)可支持按键方式,保证接收的准确性支持近似结果的选择:N-Best Processing 利用识别置信度(Confidence Measures )来进行确认正确设计识别语法,收录大量流行的歌手歌曲,提高语法覆盖率,从而提高准确率识别命令字的构造(不要过短)建议长度在4字或5字文字与声音的区别文字:标点、粗细、大小、颜色、字体、特殊符号等;声音的韵律(Prosody):包括强调(Stress)、

6、声调(Intonation )、停顿(Pauses )、语速(Speed)设计提示音时,大声读出来,并安排时间读给别人听术语行话(Jargon)与大众化语言(坐席 vs. 人工服务;歌手列表 vs. 歌手姓名;铃音复制 vs. 铃音克隆)注意避免各种歧义(中场 vs. 终场;任意键;替换 vs. 设置)8语音用户界面设计简介 柔和的错误恢复(Graceful Error Recovery)一般情况下,只有当用户出现困难或者错误时,才会想到要寻求帮助;目前大部分语音应用系统都总是把主菜单的最后一个按键设置为帮助信息;我们建议把帮助信息融入到流程的上下文中,尤其是用户容易出错的地方;错误种类一:提

7、示音播完后用户3秒钟内都没有说话(或按键)(No-Speech Timeout):目前大部分系统采用重复播放同一个提示音的方式;我们建议主要采用延迟帮助 (Delay Help)的方式来提示用户如何操作,例如举例说明;错误种类二:用户按键或识别错误( Reject 、No-Match),两者区别对待:对于按键,明确告知用户应该如何按键(例如:您按了其它键,请按15号键选择);对于识别,提示用户重新说一遍或按键,并进行举例;9语音用户界面设计简介 柔和的错误恢复(Graceful Error Recovery)错误种类三:系统识别用户的输入后,系统认为正确或者让用户选择识别结果,但用户却没有确认

8、(错误接收),例如用户返回,我们也需要提示用户如何正确的操作;错误恢复策略主要有两种:快速重复提示(Rapid Reprompt)、逐步细化提示(Escalating Detail 、Progressive Prompting );除非提示音非常清晰明了,否则都建议使用第二种恢复策略;错误发生后,还要提示用户可以按键寻求详细帮助信息;当错误次数达到一定次数(一般为3次)后,提示用户可以按键回到主菜单;错误和帮助总是上下文相关的;并且任何时候都不要让用户有挫败感,特别注意音效的使用10语音用户界面设计简介 回顾:VUI设计核心原则11语音用户界面设计简介 其它补充(Others)NVA(Nonv

9、erbal Audio)的使用,即音效、背景音乐等的使用,适可而止,不宜滥用;在用户操作成功处,可以使用短促愉悦的音效;主菜单提示音可考虑配背景音乐,但音量不要超过原有提示音的40,注意不要突兀,一般做成渐入渐出效果;关联词(Cohesion)的使用:对不起、好的、现在、随时;录音人员(Voice Actors )的配合:建议是VUI设计团队成员,如不是,需要花更多时间让其理解提示音的上下文;注意提示音文本格式,例如 1860的读法;约定好一套标识规范,说明哪些文字是强调、哪些地方需要停顿 等等;录音环境及录音设备的稳定;每天录音建议不要超过两小时12语音用户界面设计简介 其它补充(Others)写样例对话( Script Sample Dialog )的设计方法:系统刚开始设计时,根据业务流

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论