语音助手的系统设计与实现.pdf_第1页
语音助手的系统设计与实现.pdf_第2页
语音助手的系统设计与实现.pdf_第3页
语音助手的系统设计与实现.pdf_第4页
语音助手的系统设计与实现.pdf_第5页
已阅读5页,还剩68页未读 继续免费阅读

语音助手的系统设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分类号: 密级: 户紊 单位代码:1 0 4 2 2 学号: 力番 u n i v e r s i t y 硕士学位论文 t h e s i sf o rm a s t e r d e g r e e ( 专业学位) 论文题目: , 海吉少f ) 桶甬院澧7 1 十 矣配 作者姓名 苤垒幺 培养单位盔是蚪整当墨鑫堂巨 专业名称鱼土鳗盒遂 指导教师 隘垒犁堡 合作导师 鳗要8 延盛:高 山东大学硕士学位论文 目录 摘j i j i a b s t r a c t i i 第1 章绪论1 1 1 语音助手概述1 i 2 研究目的及意义j 1 1 3 语音助手主要研究内容2 1 4 论文的组织结构6 第2 章需求分析。7 2 1 需求获取模式7 2 2 语音助手功能性需求1 0 2 3 非功能性需求1 2 第3 章总体设计1 4 3 1 架构的目标和约束1 4 3 2 系统总体架构1 4 3 3 功能架构1 5 第4 章系统详细设计1 8 4 1 界面及交互设计( v i s u a l & i n t e r a c t i o nd e s i g n ) 1 8 4 2 交互过程设计1 9 4 3 语音助手系统设计2 0 第5 章系统实现与测试 5 1 语音助手核一已, ( s a c o r e ) 2 3 5 2 语音助手控制中- 已, ( s a s c c ) 2 6 5 3 语音助手显示平台( s a v i e w 、3 1 5 4 语音助手应用( s a a p p s ) 3 3 5 5 语音助手录音r e c o r d e r ( s a r ) 4 3 5 6 语音助手和智能遥控器接口( s r c ) 4 4 山东大学硕士学位论文 5 7 系统测试( s i t ) 4 7 第6 章系统的安装与运行 6 1 系统的安装5 0 6 2 语音系统的安装5 0 6 3 语音助手的运行5 6 6 4 本文的主要创新点5 7 第7 章结论砷 参考文献6 2 致 谢。6 5 山东大学硕士学位论文 c o n t e n t s c h i n e s ea b s t r a c t i e n g l i s ha b s t r a c t i i c h a p t e r1 i n t r o d u c t i o n 1 1 1v o i c ea s s i s t a n to v e r v i e w 1 1 2r e s e a r c hp u r p o s ea n ds i g n i f i c a n c e 1 1 。3v o i c ea s s i s t a n tm a i nr e s e a r c hc o n t e n t 2 1 4t h eo r g a n i z a t i o ns t r u c t i l r e 6 c h a p t e r 2d e m a n da n a l y s i s 7 2 1r e q u i r e m e n t sa c q u i s i t i o nm o d e 7 2 2v o i c ea s s i s t a n tf u n c t i o n a lr e q u i r e m e n t s 10 2 3n o n f u n c t i o n a lr e q u i r e m e n t s 1 2 c h a p t e r 3t h eo v e r a l ld e s i g n ;】【q l 3 1t h ea r c h i t e c t u r eo fg o a l sa n dc o n s t r a i n t s 1 4 3 2s y s t e mo v e r a l la r c h i t e c t u r e 1 4 3 3f u n c t i o n a la r c h i t e c t u r e 15 c h a p t e r4s y s t e md e s i g ni nd e t a i li nc h a p t e r 1 8 4 1i n t e r f a c ea n di n t e r a c t i o nd e s i g n ( v i s u a la n di n t e r a c t i o nd e s i g n ) 18 4 2i n t e r a c t i o nd e s i g n 1 9 4 3v o i c ea s s i s t a n ts y s t e md e s i g ni nt h e 2 0 c h a p t e r 5 s y s t e mi m p l e m e n t a t i o na n dt e s t i n g 2 3 1 ;1v o i c ea s s i s t a n tc o r e ( s a c o r e ) 2 3 5 2v o i c ea s s i s t a n tc o n t r o lc e n t e r ( s a s c c ) 2 6 5 3v o i c ea s s i s t a n td i s p l a yp l a t f o r m ( s a v i e w ) 31 5 4v o i c ea s s i s t a n ta p p l i c a t i o n ( s a a p p s ) 3 3 5 5t h et a p er e c o r d e rv o i c ea s s i s t a n t ( s a r ) 4 3 5 6s p e e c ha i d e sa n di n t e l l i g e n tr e m o t ec o n t r o li n t e r f a c e ( s r c ) 4 4 5 7t h es y s t e mt e s t ( s i t ) 4 7 c h a p t e r 6 s y s t e mi n s t a l l a t i o na n do p e r a t i o n 5 0 6 1t h ei n s t a l l a t i o no f s y s t e m 5 0 6 2t h ep r o n u n c i a t i o ns y s t e mi n s t a l l a t i o n 5 0 山东大学硕士学位论文 6 3t h eo p e r a t i o no f t h ev o i c ea s s i s t a n t 5 6 6 4t h em a i ni n n o v a t i o np o i n t so f t h i sa r t i c l e 5 7 c h a p t e r 7c o n c l u s i o n 6 0 r e f e r e n c e s 6 2 t h a n k s 6 1 ; 山东大学硕士学位论文 摘要 语音助手是一个通过语音识别、语音合成、语义分析等技术手段,使用户能 够方便、自然的通过无线m i c 及麦克风阵列等语音输入设备,可以使用自然语言 和语音助手进行交互,实现语音助手与智能应用的结合和功能的整合,以及实现 对智能电视的智能化控制的一个语音系统。 本文基于g o o g l e 的a n d r o i d 平台及a n d r o i da p i s 进行开发,以统一建模语言 ( u m l ) 为分析设计描述语言,采用j a v a 面向对象开发技术,对语音助手系统 的需求分析、系统设计、编码实现、系统测试和产品发布等情况进行了全面的介 绍。 本文针对语音助手的功能需求,简要描述了系统需要解决的主要问题;对系 统的架构设计进行了详细描述;对部分有代表性实例的详细设计和实现进行了描 述;对系统测试、系统安装部署以及实际运行情况进行了简要介绍。 本文解决的关键问题有以下几方面: 第一,在本系统中将敏捷开发模式与产品开发、c m m i 的过程化文档标准相 结合,提高了开发效率。 第二,通过智能电视整机控制命令接口的开发及封装,并通过和语音助手的 语音及语义识别功能的整合,实现了语音助手对电视的全面控制。 第三,通过合理的模块划分,将语音助手分为语音设备,语音引擎,语音核 心,语音交互界面等多个独立的模块,明确了各模块该做什么,不该做什么,降 低了系统耦合,提高了模块间的沟通效率。 第四,通过创新性的交互设计,提升了用户的交互体验。 关键词:语音助手;a n d r o i d ;敏捷开发;交互设计; 山东大学硕士学位论文 a b s t r a c t s p e e c ha s s i s t a n ti sa l li n t e l l i g e n tv o i c es y s t e m ,t h r o u g ha u t os p e e c hr e c o g n i t i o n , s p e e c hs y n t h e s i s ,s e m a n t i ca n a l y s i sa n do t h e rt e c h n i c a lt oe n a b l eu s e r st oe a s i l ya n d n a t u r a l l yt h r o u g haw i r e l e s sm i c r o p h o n e ,a r r a y sm i ca n do t h e rs p e e c hi n p u td e v i c e s , u s e r sc a nu s en a t u r a ll a n g u a g et oi n t e r a c t 晡t l ls p e e c ha s s i s t a n t ,s p e e c ha s s i s t a n ta n d s m a r tt v sa p p l i c a t i o n si n t e g r a t i o na n df u n c t i o n a li n t e g r a t i o n , a n dt h er e a l i z a t i o no ft h e s m a r tt vc o n v e n i e n tc o n t r 0 1 b a s e do ng o o g l e sa n d r o i dp l a t f o r ma n dt h ea n d r o i da p i st od e v e l o p ,t ot h e u n i f i e dm o d e l i n gl a n g u a g e ( u m l ) f o rt h ea n a l y s i sa n dd e s i g nd e s c r i p t i o nl a n g u a g e , o b j e c t - o r i e n t e dd e v e l o p m e n tu s i n gj a v at e c h n o l o g y , t h es p e e c ha s s i s t a n ts y s t e mn e e d s a n a l y s i s ,s y s t e md e s i g n ,c o d i n g ,i m p l e m e n t a t i o n ,s y s t e mt e s t i n ga n dp r o d u c tl a u n c h e st o c o n d u c tam o r ec o m p r e h e n s i v ei n t r o d u c t i o n t h i sp a p e ra n a l y z e st h ef u n c t i o n a lr e q u i r e m e n t so fs p e e c ha s s i s t a n t ab r i e f d e s c r i p t i o no ft h es y s t e mn e e d st os o l v et h em a i np r o b l e m ;d e s i g no ft h es y s t e m a r c h i t e c t u r ea r ed e s c r i b e di nd e t a i l ;f o rs o m er e p r e s e n t a t i v ee x a m p l e so ft h ed e t a i l e d d e s i g na n di m p l e m e n t a t i o na r ed e s c r i b e d ;s y s t e mt e s t i n g ,s y s t e mi n s t a l l a t i o na n d d e p l o y m e n tt h ea c t u a lo p e r a t i o no fab r i e fi n t r o d u c t i o n t h i sa r t i c l ea d d r e s s e st h ek e yi s s u e sa r e t h ef o l l o w i n g : f i r s t ,i nt h i ss y s t e mw i l lb ea g i l ed e v e l o p m e n tm o d e la n dp r o d u c td e v e l o p m e n t , c m m ip r o c e s so fd o c u m e n t a t i o ns t a n d a r d s ,a n dt o i m p r o v et h ee f f i c i e n c y o f d e v e l o p m e n t s e c o n d ,t h r o u g h t h e i n t e l l i g e n t t vm a c h i n ec o n t r o lc o m m a n di n t e r f a c e d e v e l o p m e n ta n dp a c k a g i n g ,a n dt h r o u g ha s s i s t a n ta n dv o i c er e c o g n i t i o nv o i c ea n d s e m a n t i ci n t e g r a t i o n ,t oa c h i e v eas p e e c ha s s i s t a n tf u l lc o n t r o lo ft h et v t h i r d ,t h r o u g hr e a s o n a b l em o d u l ed i v i s i o n ,t h es p e e c ha s s i s t a n ti n t ov o i c e e q u i p m e n t ,s p e e c he n g i n e ,t h e c o r ev o i c e ,v o i c ei n t e r f a c ea n dm a n yi n d e p e n d e n t m o d u l e s ,e a c hm o d u l ec l e a rw h a tt od o ,w h a tn o tt od o ,r e d u c i n gs y s t e mc o u p l i n g i m p r o v et h ee f f i c i e n c yo fc o m m u n i c a t i o nb e t w e e nm o d u l e s f o u r t h ,t h r o u g hi n n o v a t i v ei n t e r a c t i o nd e s i g nt oe n h a n c et h eu s e r si n t e r a c t i v e e x p e r i e n c e k e y w o r d s :s p e e c ha s s i s t a n t ;a n d r o i d ;a g i l ed e v e l o p m e n t ;i n t e r a c t i o nd e s i g n ; i i 山东大学硕士学位论文 1 1 语音助手概述 第1 章绪论 本技术应用于智能电视的人机交互领域,技术原理是通过无线m i c 和m i c 阵列采集音频信号,通过对音频的信息和语音转换后的文本信息进行处理,从而 通过自然手势来操控电视,通过自然语音来实现信息输入和操控电视的功能。 成果创造性在于通过普通的无线m i c 和m i c 阵列,利用先进的音频软件处理 技术,从音频信号中提取出声学特征,同时也可以将采集到语音信号,通过t c p i p 协议,发送到云端,通过云计算获得准确的语音信息。语音助手拓展了电视的功 能,为电视提供了新的人机交互模式,还实现了智能电视功能的丰富及拓展。 智能电视开创了电视产业的新时代。电视机和i t 技术的结合,使电视机平台 承载的业务迅速增加,远远超出了传统电视的范畴。视频作为电视平台的核心业 务,其内容来源、视频格式日益丰富;同时基于a n d r o i d 平台的游戏、音乐、资讯、 教育等其他富媒体应用开始在电视平台上集成,并出现了海量化的趋势。然而, 随着电视应用和视频资源的迅速增加,内容的丰富,传统的电视交互方式已经不 能满足需要。用户要寻找一个应用,或者搜索某一部电影,并打开播放等,传统 的电视输入方式非常麻烦,效率非常低,极大的影响了智能电视的操控体验。现 阶段,我们迫切需要一种全新的智能电视人机交互方式,简化用户操作,实现内 容、服务的人性化呈现,增强智能电视的用户体验。 基于上述情况,我们设计开发了语音助手系统,并给予语音和语义识别系统, 为智能电视机提供如下语音功能。1 ) 语音助手帮助功能;2 ) 影视搜索功能;3 ) d t v 搜索功能;4 ) 音乐搜索功能;5 ) 百科搜索功能:6 ) 上网搜索功能;7 ) 启 动核心应用功能;8 ) 天气的查询功能;9 ) 本地控制功能 1 2 研究目的及意义 与智能手机一帆风顺的发展不同,智能电视的发展遭遇了许多的瓶颈,而造 成这一发展瓶颈的主要原因是传统的电视遥控器与新一代智能电视不能实现很好 山东大学硕士学位论文 的交互操控,这样一来用户在对智能电视操控方面变得越加繁琐复杂。 随着语音识别和处理技术的成熟,语音库收集的语音数据越来越丰富,语音 的识别率越来越高,语义的纠错和理解能力越来越强。通过语音来实现和智能的 交互,以及通过语音指令来操控智能电视现在不在只是停留在实验室中或科幻影 片中,而是真正成为了现实。用户只需要说出:“我想看刘德华的电影”,“王菲的 传奇”,“中央一套”,“打开应用商店”,“上新浪网”,“青岛的天气”等,语音助手 就能通过语音识别,语义分析,并通过查询相应的数据接口,直接将满足用户需 求的结果呈现在用户面前,直接省略了智能电视通道切换( 如h d m i 切换到d t v ) 、 进入主页,找软件、启动软件,在软件中输入查询信息等一系列的操作步骤,让 用户在这些场景中使用起来非常方便。 智能电视开创了电视产业的新时代。智能电视和互联网技术领域的结合,使 电视机不再是传统的电视,传统交互方式已经不能满足需要。现阶段,我们迫切 需要一种全新的智能电视人机交互方式和界面,简化用户操作,实现内容、服务 的人性化呈现,增强智能电视的用户体验。基于上述情况,提出本项目。 本项目产生技术可以应用于消费电子领域,不仅是智能电视,也包括d t v 机 顶盒,网络机顶盒等,并利用多屏互动技术,以智能手机p a d 为辅助语音输入设 备,实现支持多通道语音输入的语音助手功能。建一套先进人机交互方式,实现 智能化、人性化的人机交互体验,充分发挥智能电视的平台价值,提供更加丰富 的智能电视应用和服务,营造沉浸式的使用体验,充分提升智能电视的品牌价值。 1 3 语音助手主要研究内容 语音助手要在智能电视上实现产品化,需要解决好硬件,智能电视操作系统, 语音、语义识别,智能电视核心功能和应用和语音助手的整合,人机交互设计及实 现。 1 3 1 语音输入设备 智能电视和手机首先就是输入设备不同,手机是内嵌的m i c ,干扰小,录音 质量高。但是智能电视只能采用无线麦克风,或者麦克风整列来作为拾音设备, 这两种设备都存在着如何提高录音质量和抗干扰能力的问题。 2 山东大学硕士学位论文 1 3 2 智能电视操作系统 语音助手基于标准的a n d r o i d 操作系统开发,很好的解决了语音输入设备的驱 动问题,语音识别技术的移植问题,以及应用开发的标准化。 1 3 3 语音、语义识别引擎 语音助手的功能实现离不开语音识别和语音合成技术,以及自然语言理解技 术。语音合成和语音识别技术是实现人机语音通信,建立一个有听和讲能力的口 语系统所必需的两项关键技术。使电脑具有类似于人一样的说话能力,是当今时 代信息产业的重要竞争市场。和语音识别相比,语音合成的技术相对说来要成熟 一些,并己开始向产业化方向成功迈进,大规模应用指日可待。自动语音识别技 术( a u t os p e e c hr e c o g n i z e ,简称a s r ) 所要解决的问题是让计算机能够“听匿”人类 的语音,将语音中包含的文字信息“提取”出来。a s r 技术在“能听会说”的智能计 算机系统中扮演着重要角色,相当于给计算机系统安装上“耳朵”,使其具备“能听” 的功能,进而实现信息时代利用“语音”这一最自然、最便捷的手段进行人机通信和 交互。本系统采用国内领先的科大讯飞的语音识别技术。 自然语言是几千年来人们生活、工作、学习中必不可少的元素,而计算机是 2 0 世纪最伟大的发明之一,如何利用计算机对人类掌握的自然语言进行处理、甚 至理解,使计算机具备人类的听说读写能力,一直是国内外研究机构非常关注和 积极开展的研究工作。这部分技术主要是自主开发为主。 1 3 4 智能电视棱心功能和应用与语音助手的整合 语音助手基于标准的a n d r o i d 操作系统开发,很好的解决了语音输入设备的驱 动问题,语音识别技术的移植问题,以及应用开发的标准化。 1 3 5 人机交互设计及实现 语音助手功能设计及实现的主要工作集中在软件开发上,人机交互的功能实 现,应用的扩展,用户交互体验的提升,主要是通过软件开发来实现。 1 3 6a n d r o i d 开发技术 a n d r o i d 有丰富的功能,因此很容易与桌面操作系统混淆。a n d r o i d 是一个分 山东大学硕士学位论文 层的环境,构建在l i n u x 内核的基础上,它包括丰富的功能。u i 子系统包括: 窗口、视图 用于显示一些常见组件( 例如编辑框、列表和下拉列表) 的小部件。 a n d r o i d 包括一个构建在w e b k i t 基础上的可嵌入浏览器,i p h o n e 的m o b i l e s a f a r i 浏览器同样也是以w e b k i t 为基础。 a n d r o i d 提供多种连接选项,包括w i f i 、蓝牙和通过蜂窝( c e l l u l a r ) 连接的 无线数据传输( 例如g p r s 、e d g e 和3 g ) 。a n d r o i d 应用程序中一项流行的技 术是链接到g o o g l e 地图,以便在应用程序中显示地址。a n d r o i d 软件栈还提供对 基于位置的服务( 例如g p s ) 和加速计的支持,不过并不是所有的a n d r o i d 设备 都配备了必需的硬件。另外还有摄像支持。 过去,移动应用程序努力向桌面应用程序看齐的两个领域分别是图形媒体和 数据存储方法。a n d r o i d 通过提供对2 d 和3 d 图形的内置支持,包括o p e n g l 库,解决了图形方面的挑战。由于a n d r o i d 平台包括流行的开源s q l i t e 数据库, 因此缓解了数据存储的负担。图1 显示一个简化的a n d r o i d 软件层次结构。 l lt 脚。揣,碱蝴。 a 0 0 i i t a l t 叼n 静翻拍啊融s 翔桕l 嫩o n 蠢m 鲈l o c a t i o nm 擎。n 锄融a 的nm g 文c 饼髓n lp f 铂硎e 蹲,锄n o o w i n 0 , r e s o u r c e 姆e r e t j 貌翻慨a t 霸n o a 谯搠瞻玎穆 i s i 驾嘲碡焉,m o 锄a 。d a t a b a s e 铡饼镰,e i c o a l v i kv i r t u a lm a c h i n e t a n u sk e r n e l 融嗍f i l es y s t e m 。墩i 幡愿,0 t o c l h i $ ,m 甜灞辨婀燃嚏。e q c 图1 - 1 a n d r o i d 软件层次结构 4 山东大学硕士学位论文 应用程序架构 如前所述,a n d r o i d 运行在l i n u x 内核上。a n d r o i d 应用程序是用j a v a 编程 语言编写的,它们在一个虚拟机( v m ) 中运行。需要注意的是,这个v m 并非 您想象中的j v m ,而是d a l v i kv t r t u a lm a c h i n e ,这是一种开源技术。每个a n d r o i d 应用程序都在d a l v i kv m 的一个实例中运行,这个实例驻留在一个由l i n u x 内 核管理的进程中,如下图所示。 图1 - 2 d a l v i k v m a n d r o i d 应用程序由一个或多个组件组成: 活动 具有可视u i 的应用程序是用活动实现的。当用户从主屏幕或应用程序启动 器选择一个应用程序时,就会开始一个动作。 服务 服务应该用于任何需要持续较长时间的应用程序,例如网络监视器或更新检 查应用程序。 内容提供程序 可以将内容提供程序看作数据库服务器。内容提供程序的任务是管理对持久 数据的访问,例如s q l i t e 数据库。如果应用程序非常简单,那么可能不需要创建 内容提供程序。如果要构建一个较大的应用程序,或者构建需要为多个活动或应 用程序提供数据的应用程序,那么可以使用内容提供程序实现数据访问。 广播接收器 山东大学硕士学位论文 a n d r o i d 应用程序可用于处理一个数据元素,或者对一个事件( 例如接收文本 消息) 做出响应。 a n d r o i d 应用程序是连同一个a n d r o i d m a n i f e s t x m l 文件一起部署到设备的。 a n d r o i d m a n i f e s t x m l 包含必要的配置信息,以便将它适当地安装到设备。它包括 必需的类名和应用程序能够处理的事件类型,以及运行应用程序所需的许可。例 如,如果应用程序需要访问网络一例如为了下载一个文件一那么m a n i f e s t 文 件中必须显式地列出该许可。很多应用程序可能启用了这个特定的许可。这种声 明式安全性有助于减少恶意应用程序损害设备的可能性。 下面讨论构建a n d r o i d 应用程序所需的开发环境。 1 4 论文的组织结构 全文共分为七章。 第一章是绪论,主要介绍了语音助手系统的开发背景,目地及意义等,说明 了系统需要解决的主要问题和本文的主要贡献。 第二章主要描述了需求分析的工作模式及工作成果。需求分析的成果具体分 为功能性需求和非功能性需求两部分,本文采用用例( u s ec a s e ) 的描述方法来描 述功能性需求。 第三章是系统的架构设计部分,通过对系统的总体架构、功能架构、应用架 构、部署架构、安全架构等的设计,确定了系统的整体架构和核心功能。 第四章是系统功能的详细设计,用类图和数据库设计描述了系统的静态功能。 用时序图描述了系统的动态功能。 第五章是系统实现与测试,对各功能模块采用操作流程图、重点代码和文字 说明等方式进行了详细描述。 第六章是系统的安装与运行,叙述了系统安装的详细过程,并用界面图片方 式对系统的应用实际效果进行了展示。 第七章是结论,对本文进行了总结,并对今后升级改进和应用系统集成进行 了展望。 山东大学硕士学位论文 第2 章需求分析 需求分析是软件系统开发过程中最重要的一环,需求分析工作是否准确到位 直接决定整个开发工作的成败,如果系统开发建立在一个错误的需求基础上,无 论无论系统框架和程序代码质量多么完美,系统都不会成功。本章概述了系统需 求分析过程,并从需求获取模式,功能需求和非功能需求方面进行了描述。 2 1 需求获取模式 需求是对一个产品的需要或要求的描述。任何一项工作在开始之前,首先应 该明确工作的目标和工作成果( 制品) 应满足什么要求。按照传统的软件工程理 论,需求分析的目标就是要确定“干什么? ”,而不是“怎么干? ”。按照r u p 的理 论,需求分析的主要目的是“致力于开发正确的系统。要做到这一点,就要足够详 细地描述系统需求( 也就是系统必须达到的条件或能力) ,使客户( 包括用户) 和 开发人员在系统应该做什么、不应该做什么方面达成共识。” 为了保证语音助手的可用性和易用性,一对能提供核心语音技术的公司,进行 了深入的了解:对语音助手可以整合的应用,做了深入的分析;对用户希望利用 语音助手实现的功能,以及对国内外竞争对手的产品做了深入的体验。获得了丰 富的第一手资料。 2 1 1 竞争对手情况 一) 国内c 公司的语音助手主要有以下功能: 1 ) 智能语音搜索主要包括搜索影视、歌曲、天气、图片等。 2 ) 语音换台:语音换台分为数字信号下的语音换台和模拟信号下的语音换台 两种。数字信号下的语音换台只能在d t v 智能一体机上方可实现( b 5 0 0 0 及以上 机型) ,直接语音输入“x x 电视台”即可切换到对应电视台节目。模拟信号下的语 音换台则在b 4 0 0 0 及以上机型均可实现,直接语音输入 x x 频道”即可切换到对应 频道数的电视台节目, 3 语音调音:语音控制电视的音量大小,直接语音输入“音量x x ”即可,调音 一步到位,免去了手动操作的繁杂。 山东大学硕士学位论文 - - ) 国内t 公司的语音小助手主要有以下功能: 用户通过t 公司的语音功能可以对电视机进行众多选项的操作,例如进入华 数视频、打开设置、打开浏览器等功能,在操控的过程中用户需要用手按住智能 手机上的语音按键,发出指令完毕之后就可松开手,语音机器人就会识别使用者 的指令。同时t 公司的语音小助手还可以与用户进行交互,使用者可以问语音小 助手几岁了、给我讲个笑话等操作,语音小助手会迅速的做出回应。 三) 国外的s 公司的语音电视主要有以下功能: s 公司发布的e s 系列智能电视支持语音控制功能,例如音量调节、频道切换、 网络资讯搜索等,很多复杂的功能用户都可以通过语音控制功能来进行操作。s 公 司的语音功能和场景结合较紧密,用户体验较好。 整体来说,国内的智能语音电视方兴未艾,发展较快,功能日渐丰富,用户 体验日渐提升。 2 1 2 语音识别技术开发公司 北京云知声信息技术有限公司 该公司是专注于语音识别及语言处理技术的移动互联网公司,拥有完全自主 知识产权的世界顶尖的智能语音识别和语义理解技术。借助云计算平台和移动互 联网技术,云知声已推出了一系列语音识别和语义理解的中间件及服务云平台, 为互联网企业和用户提供专业的智能语音服务。 云知声语音云让计算机“听懂”人类的语音,将语音中包含的文字信息识别出 来。云知声语音云支持大词汇量连续语音在线识别,支持应用通过a p i 直接调用 公有云服务。在云计算平台下,借助区分度训练、白适应训练、大规模网络动态 解码等技术和大规模语料支持,中文连续语音识别的准确率达9 3 以上,实时率 o 3 倍实时,达到世界领先水平。 科大讯飞信息科技股份有限公司 该公司是一家专业从事智能语音及语言技术研究、软件及芯片产品开发、语 音信息服务及电子政务系统集成的国家级骨干软件企业。公司中文智能语音核心 技术代表了世界的最高水平。 语音技术实现了人机语音交互,使人与机器之间沟通变得像人与人沟通一样 山东大学硕士学位论文 简单。语音技术主要包括语音合成和语音识别两项关键技术。让机器说话,用的 是语音合成技术;让机器听懂人说话,用的是语音识别技术。此外,语音技术还 包括口语评测、语音编码、音色转换、语音消噪和增强等技术,有着广阔应用空 间。 科大讯飞作为中国最大的智能语音技术提供商,在智能语音技术领域有着长 期的研究积累,并在语音合成、语音识别、口语评测、自然语言处理等多项技术 上拥有国际领先的成果。科大讯飞是我国唯一以语音技术为产业化方向的“国家 8 6 3 计划成果产业化基地”、“国家规划布局内重点软件企业”、“国家高技术产业化 示范工程”,并被原信息产业部确定为中文语音交互技术标准工作组组长单位,牵 头制定中文语音技术标准。 基于拥有自主知识产权的世界领先智能语音技术,科大讯飞已推出从大型电 信级应用到小型嵌入式应用,从电信、金融等行业到企业和消费者用户,从手机 到车载,从家电到玩具,能够满足不同应用环境的多种产品。科大讯飞己占有中 文语音技术市场7 0 以上市场份额,开发伙伴超过1 0 0 0 0 家,以讯飞为核心的中 文语音产业链已初具规模。 随着移动互联网“语时代”的到来,科大讯飞率先发布了全球首个提供移动互联 网智能语音交互能力的“讯飞语音云”平台,并持续升级优化。基于该平台,科大讯 飞相继推出了“讯飞语音输入法”、“讯飞语音助手”等示范性应用,并与广大合作伙 伴携手推动各类语音应用深入到手机、汽车、家电、玩具等各个领域,引领和推 动着移动互联网时代大潮下输入和交互模式的变革。 n u a n c e 公司( n u a n c ec o m m u n i c a t i o n s ,l n c ( n a s d a q :n u a n ) ) n u a n c e 是最大的专门从事语音识别软件、图像处理软件及输入法软件研发、 销售的公司。目前世界上最先进的电脑语音识别软件n a t u r a l l ys p e a k i n g 就出自于 n u a n c e 公司。用户对着麦克风说话,屏幕上就会显示出说话的内容。 自电脑问世以来,科学家们就一直致力于让电脑能够理解人们的讲话。几年 前,除了实验室内的演示之外,这方面还没有什么进展。不过现在电脑的语音识 别功能已经有了质的飞跃,随着语音识别技术慢慢走向成熟,n u a n c e 的解决方案 和技术能够让人们以更智能的方式工作。 n u a n c e 公司的语音技术致力于向客户提供绝佳的服务体验。这让n u a n c e 成为 山东大学硕士学位论文 全球领先的语音和影响解决方案提供商。 2 2 语音助手功能性需求 2 2 1 总体要求 语音助手定义为国内市场高端产品。目标客户:年龄适合1 8 岁6 5 岁中高端 消费者。用户按遥控器上的语音键,启动语音助手,并使用遥控器输入语音。 操作说明:长按遥控器的语音键,呼出语音助手界面,释放小聪键,等待麦 克风图标颜色由浅变深后输入语音。当麦克风图标有焦点的时候,可以直接点击 o k 键或者再次长按语音键再次输入语音。 用户输入语音,查询影视内容,语音助手界面内呈现影视内容的基本要素( 海 报、播放时间年代、类型等) ,用户通过语音助手界面内的基本要素对内容进行大 概了解,然后选择内容点击进入详情或播放 用户输入语音换台,电视切换到d t v 或机顶盒对应的频道 用户不明确要搜索的内容,输入模糊的语音命令,系统根据用户行为或热门 内容为用户推荐内容 用户只搜索出来一个结果,通过说“打开”、“播放”等词汇,打开当前结果 2 2 2 硬件功能需求 电视帆t a n d r o i d 2 2 及以上 c p u1 g h z 及以上 运行时剩余2 0 m 内存及以上 剩余5 0 m 的存储空间 播音功能 无线或有线联网功能 遥控器: 语音启动键支持 1 6 刚1 6 b i t 录音支持 1 0 山东大学硕士学位论文 2 2 3 软件功能要求 表1 - 1 功能需求表 需求名称需求播述 服务器要求 针对不同机型要有不同的服务器 股票 查询股票,更换新的接口 天气 查询天气,更换新的接口 百科 展现百科内容,更换新的接口 a t v 和d t v 换台控制d t v 换台,和原有基本保持一致 影视搜索搜索影视,以w i d g e t 形式展现,并提供推荐功能 音乐搜索搜索音乐,和原有基本保持一致 上网 打开网站,和原有基本保持一致 打开本地应用打开预置应用,针对不同机型应用不一样 整机控制控制电视基本设置功能,和原有基本保持一致 语音说明书 提供基本操作的问答,和原有基本保持一致 闲聊提供闲聊功能,使用重点实验室的闲聊库 未定义业务可展现百科词条、百度链接或闲聊业务,具体由 未定义业务 语义平台来判断 连续收音和交互麦克阵列调用语音助手,可连续收音,不需要再说出激活词 麦克阵列启动、输入和退出麦克阵列可连续收音 麦克阵列结果选择和确认可用语音选择结果 第三方业务整合整合更多视频资源 语义逻辑优化优化语义逻辑 提示优化未联网时给用户提示,同时给出设置网络的按钮链接 跟学指导提供跟学指导功能 日志上报与统计分析上报日志 按频道名称换台通过d t v 按频道名称换台 根据频道号换台通过d t v 根据频道号换台 按名称搜索节目通过d t v 按名称搜索节目 按类别搜索节目通过d t v 按类别搜索节目 热播推荐通过d t v 查询热播推荐节目 e p g 搜索通过d t v 进行e p g 搜索 按频道名称换台通过d t v 按频道名

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论