一种基于语音识别的智能人机交互模式构想_第1页
一种基于语音识别的智能人机交互模式构想_第2页
一种基于语音识别的智能人机交互模式构想_第3页
一种基于语音识别的智能人机交互模式构想_第4页
一种基于语音识别的智能人机交互模式构想_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一种基于语音识别的智能人机交互模式构想近年来,随着人工智能技术的快速发展,语音识别技术越来越成熟,语音交互模式正逐渐发展成为一种简单、可依赖的智能人机交互模式。在以智能语音为主要交互方式的智能时代中,人们的双手和双眼将得以解放,人们的生活将更加便利和美好。计算机行业变革的原动力及前智能时代面临的问题科技改变生活、改变世界,计算机技术的兴起与发展历程真切有力地证实了这一点。20世纪末期,微软、苹果用鼠标点开了 PC时代的大门,让个人电脑走进千家万户,使得信息的传播摆脱了时空的束缚。21世纪初,苹果、谷歌在触屏上划开了移动时代的帷幕,让智能手机风靡全球,使得社交和娱乐无处不在。作为计算机领域最具典

2、型性的两种不同形态的产品,个人电脑和智能手机均以独有的方式得到了千千万万的人们的普遍认可和接受,从而引发了时代的变革。早期电脑依赖于键盘和字符屏幕的交互体验模式将多数人拒之于计算机的门外,而依赖于鼠标点击的图形用户界面交互模式的发明,无疑极大地降低了普通民众使用和理解个人电脑的门槛,使得PC时代的步伐悄然而至,进而深刻地影响了人们的生活。传统手机依赖于实体键盘或笔触交互的体验模式,让手机的使用总显得不那么便捷,而依赖于多点触控的交互体验模式让人们对手机的操作更加得心应手、方便快捷,使得移动时代的浪潮汹涌而至,从而改变人们日常生活的方方面面。事实表明,引发计算机时代变革的真正动力,源于技术,却并

3、非纯粹的技术。确切的说,那是一种建立在计算机技术上的最友好便捷的人机交互体验模式。这是一个用户体验至上的年代,计算机的使命是为人们创造出一个简单、可依赖,却又不乏趣味的多彩世界,只有最大限度地降低人们的学习和使用成本,才能创造出最具普适性的大众产品。紧随移动时代的步伐,我们即将迎来一个全新的计算机时代,智能时代。在这个时代,一切设备都将被纳入到计算机互联网组成的体系中接受支配和调动。那将是一个随心所欲的时代,一切设备的控制和调动都将变得轻而易举和不费吹灰之力。为了迎接美好智能时代的到来,人们仍在不断地努力和尝试。然而,何谓智能时代,智能时代用户的真正诉求和痛点何在,究竟什么才是真正的智能,这些

4、问题目前似乎尚未形成普遍的共识或意识。在我们目前所处的这个前智能时代,探索者们通常的做法是用智能手机触屏方式来控制我们的设备以求达到便捷控制的目的。那么既然如此,我们为什么不直接制造出一个智能的万能遥控器来实现这种控制?手机的使命不是应该定位于娱乐和社交才更加合理吗?设备的控制是否该另请高明,智能时代是否一定需要与智能手机以及它的那一套触屏操作模式捆绑在一起?这是真正的智能吗?值得注意的是,智能时代应该是一个不同于PC时代和移动时代的全新计算机时代。设备与人的距离已经超出了人手的势力范围,设备的反馈模式也脱离了屏幕的限制,依赖于双手和双眼的触屏交互模式对于用户而言显然已经有些力不从心和差强人意

5、。或许,智能时代亟须寻求一种不同于PC和手机的全新的用户交互模式来引发计算机领域的再一次革新,使得智能的理念深入人心。一种语音智能控制模式的构想及其可行性不妨做如下一个构想,在你的家居系统中,存在很多不同类型的设备,包括电视、冰箱、空调、洗衣机、电灯、空气净化器等。这些设备与传统的设备在核心功能上没有本质区别,甚至更加专一和简单,但是它们都具有一个共同的神奇特点,那就是听主人的口令行事。作为主人的你,首先需要为每一个设备取一个个性化的名字,比如电灯叫做亮亮,空调叫做大个头,电视叫做小明。然后就会出现这样一种交互场景:你说:亮亮,开灯!电灯回应:亮亮得令,亮亮已开灯。你说:大个头,启动空调!空调

6、回应:大个头得令,大个头已启动空调!你说:大个头,播报温度!空调回应:大个头得令,当前20摄氏度!你说:亮亮,关灯!电灯回应:亮亮得令,亮亮已关灯!你说:小明,湖南卫视!电视回应:小明得令,小明已跳到湖南卫视!你说:小明,关机!电视回应:小明得令,小明已关机!这将是一个美妙的场景,在这个场景中一切设备都被拟人化了,成为了听你口令调遣的仆人,语音成为你们之间最便捷的沟通方式,而你的双手和双眼也因此得到了解放,再也不用望着狭小的触屏点来点去了。不知道这样一种构想是否会让人有些小小的激动和期待。在我们所构想的那个美妙场景中,有以下几点要素需要明确和强调:1、每个设备都具有至少一个由“主人录入或系统默

7、认指定的个性化的语音名称,这个语音名称将被系统用来确定“主人命令下达的对象,因此不同设备其名称不能相同;2、每个设备具有有限的语音指令集,每条指令均可个性化定制或者由系统默认指定,这个语音指令也是系统决定使用何种指令的根本依据;3、设备指令执行的结果全部由预设的系统语音播报,播报效果友好音色甜美柔、富有感染力且语义明晰。总之,一切的要旨都是追求语音交互的极致体验,让人与设备的交流畅通无阻、亲切自然,让语音的这种交互模式成为另一种全新的简单可依赖的人机交互模式。从已有的技术现状来看,实现这样一个拟人化的家居系统似乎并非遥不可及,甚至可以说技术条件已然具备。其中,最关键的问题在于语音指令的识别。现

8、如今,语音识别技术在软件互联网科技行桨已经并不新鲜,甚至趋于成熟。或许识别准确率的问题仍然是这项技术的一个现有瓶颈,但需要明确的是,在构想中的那个拟人化的智能家居系统中,我们并不需要完全的语音识别。确切地说,我们需要的是一种语音指令匹配技术。当“主人发出一个语音指令时,系统需要在有限的指令集中挑选出匹配度最高的一项指令来执行,并反馈执行结果。我们有理由相信,在现有的语音识别技术水平上,语音指令匹配准确率可以达到一个实用性的高度。在这样一个智能体系中,控制中心负责语音指令的接收、匹配与分发,语音接收器是一个必备的终端,其他的设备作为接受控制的目标设备。每当一个目标设备接入系统时,需要注册设备语音

9、名称、设备指令集以及设备反馈集,而设备指令执行的反结果播报既可以直接由语音接收器来完成,也可以由执行指令的目标设备来完成,可视场景而定。对于语音接收器来说,手机可以是一个常规的选择,但可以有无限的想象空间,比如一个智能手表、智能手环、智能钮扣或者对讲机等,甚至还可以是隐匿于建筑物之中的语音接收器。总之,那将是一个充满无限可能的个性化设备。语音智能控制模式实施需要解决的问题当然,对于这样一个想想都觉得美妙的系统来说,也难免会存在一些问题或者漏洞。最显著的是识别准确率的问题,即由距离和环境噪声等因素导致的识别问题,这些问题有赖于研究者们探索出更可靠的办法来逐步优化和解决。此外,一些场景下可能还会涉

10、及安全问题。比如,如何解决语音开门时的安全性问题?对于任何一个人模拟下达“开门的用户指令时,系统是否都要执行?不过,倘假设指令的接收器是如同钥匙一样用户随身携带的物品如智能手表,那么这个问题就不是问题了。即便语音接收器被直接固定到墙上,我们仍可以使用音频指纹、人脸识别、指纹识别或者其他任何有效的途径来共同协助完成身份的识别。除安全问题外,同时可能还会涉及到用户隐私问题。比如在私人场合,语音接收器是否需要全程开启,这难免会让人担心正常的人与人之间的语音交流信息泄漏到互联网中。这种担忧却也并非关键问题,一种语音接收器启停的合理触发机制可以有效解决这种担忧。尽管语音交互体验模式或许潜存诸多问题,但倘

11、假设人们一旦发现并认可了它的无限潜力,那么我们相信这种模式定会在世人的集思广益和共同努力中不断被优化、改进和完善,以至达到极致体验。智能时代的展望如今,我们所处的时代是一个充斥着各色大大小小电子屏幕的时代,电子屏幕在创造多彩世界的同时也将人们的感官引向了视觉疲劳的边缘。上班时,我们需要面对13英寸大小的电脑屏幕办公。下班后,出于放松和休息的目的,我们的眼睛也一刻离不开那块5英寸大小的手机屏幕。屏幕无疑丰富了我们的世界,却也成为我们生活的羁绊,在屏幕的世界里,人们的感官能力陷入了一种使用失衡的畸形状态,我们太过依赖于那双业已疲惫的双眼,当我们走在车水马龙的街道上时,我们的眼睛显然已经不够用了。既然感官已失衡,视觉已疲劳,何不有所改变,换用听觉呢?形与色的世界固然炫丽多姿、令人依恋,但声音的世界同样五彩斑

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论