(计算机应用技术专业论文)无线语音增值业务——移动搜索引擎的设计与实现.pdf_第1页
(计算机应用技术专业论文)无线语音增值业务——移动搜索引擎的设计与实现.pdf_第2页
(计算机应用技术专业论文)无线语音增值业务——移动搜索引擎的设计与实现.pdf_第3页
(计算机应用技术专业论文)无线语音增值业务——移动搜索引擎的设计与实现.pdf_第4页
(计算机应用技术专业论文)无线语音增值业务——移动搜索引擎的设计与实现.pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

(计算机应用技术专业论文)无线语音增值业务——移动搜索引擎的设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

无线语音增值业务移动搜索引擎的设计与实现 【摘要】 语尝增值业务建电信运慧巍竞争熬铡蕊点,函为它是提高客户忠 诚度的宥效手段,怒运营商业务和品牌区域化的唯一手段,也是运营 商未来收入的主要来源。目前整个语音增值业务对予电信领域来说不 是可有可无的。 语裔增值盈务不仅仅是一个单一静应糟、单一的服务,它是个 结合:是数据技术和语音技术的结合、是语音增值业务和数据增值业 务的结合、是基础业务和语音增值业务的融合与相互促进的产物、是 c r m 与客户浮e 中心静一些篱理手段j 瑟璎念全西渗透到增蕊烫务中 去的结菜。 如今,在互联网搜索引擎网盏成熟的形势下,搜索引擎的发展重 点正峭然发生着转变:全球电话用户的几何倍数增长及各种提供服务 的不断增多,正催生着另一个羧索引擎一电话搜索引擎盼诞生。 移动搜索现在还是一个新兴的搜索领域,它是网络搜索的无限延 伸,是与互联网搜索相对立的信息搜索模式,它开辟了信息搜索服务 豹薪领域,在信息援索领域具有着翔时代麓意义! 移动信息搜索服务的出现,将把互联网信息搜索引向无线移动领 域,有了两者的有机结合,搜索就将达到“无处不在”。人们的注懑力 正逐渐转移到方镬、快捷及简单戆电话搜索服务领域。 本文主要论述了以语音识舅0 技术为蒸础,服务搜索为内容的移动 搜索引擎的设计与实现的详细内容,包括了业务流程,通信网关以及 后台数据库的设计与实现的细节,以及i v r 流程语畜的原理,v s p p 协议懿稠关鳃识和存纛蓍过程的灌论,最嚣还讨论豹有关数据瘴镫筑谖 整的部分内容。 【关键字】 移动搜索引擎i v r 流程v s p p 存储过稷a s r w i r e l e s sv o i c ev a l u e a d d e d s 嚣颡v l c e s 蚤e s i g na n d 羚p 毛e a 矜溪下0 ft h 嚣 m o b i l es e a r c he n g i n e a b s t r a c t v o i c ev a l u e a d d e ds e r v i c ei sv e r yi m p o r t a n tf o rt h ec o m p e t i t i o n b e t w e e nt h et e l e c o mo p e r a t o r s 。i ti sa ne f f e c t i v em e t h o dt oi n c r e a s et h e c u s t o m e r sf a i t h f u l n e s s a n di ti st h em a i ns o u r c eo ft h et e l e c o m o p e r a t o r s i n c o m ei nt h ef u t u r e n o w , t h ew h o l ev o i c ev a l u e a d d e d s e r v i c e sa r ea b s o l u t e l yn e c e s s a r i t yf o rt h et e l e c o mf i e l d v o i c ev a l u e a d d e ds e r v i c ei sn o to n l y 囊s i _ n g l ea p p l i c a t i o no ras i n g l e s e r v i c eb u ta l s oac o m b i n a t i o n i ti st h ei n t e g r a t i o no fd a t at e c h n o l o g ya n d v o i c et e c h n o l o g y i ti st h ei n t e g r a t i o no fv o i c ev a l u e a d d e ds e r v i c ea n d d a t av a l u e a d d e ds e r v i c e i ti st h er e s u l to ft h ei n t e g r a t i o na n di n t e r a c t i o n o ft h ev o i c ev a l u e ,a d d e ds e r v i c e sa n db a s es e r v i c e s i ti st h er e s u l to ft h e m a n a g i n gm e t h o da n dc o n c e p t i o ni nt h ec r m a n dc u s t o m e rc a l lc e n t e r i n f i l t r a t e si n t ot h ev a l u e 。a d d e ds e r v i c e s n o w , t h ei n t e r n e ts e a r c he n g i n eh a sg r o w nu pi n c r e a s i n g l 3 ;a n dt h e m a i np o i n to ft h ed e v e l o p m e n to ft h es e a r c he n g i n eh a sc h a n g e d t h e t e l e p h o n es u b s c r i b e r si n t h ew o r l da n dt h es e r v i c e si n c r e a s er a p i d t ma n e ws e a r c he n g i n e ,t e l e p h o n es e a r c he n g i n ew i l lb eb o r n m o b i l es e a r c hi sn e wt ot h es e a r c h i n gf i e l d i te x p a n d st h en e t w o r k s e a r c h i n g i ti st h eo p p o s i t ei n f o r m a t i o ns e a r c h i n gm o d et ot h ei n t e r n e t s e a r c h i n gm o d e 。i tc r e a t e sa ne p o c h a ln e wf i e l d i nt h ei n f o r m a t i o n s e a r c h i n gs e r v i c e s t h ec o m i n go u to ft h em o b i l ei n f o r m a t i o ns e a r c h i n gs e r v i c e sw i l l l e dt h ei n t e r a c ti n f o r m a t i o ns e a r c h i n gt ot h ew i r e l e s sf i e l d w i t ht h e c o m b i n a t i o no ft h em o b i l ea n ds e a r c h i n g ,s e a r c h i n gw i l lb ee v e r y w h e r e 。 t h ef o c u so ft h ep e o p l eh a st u r n e dt ot h et e l e p h o n es e a r c h i n gf i e l d g r a d u a l l yt h a ti sc o n v e n i e n t ,s h o r ta n ds i m p l e t h i st h e s i sm a i n l yd i s c h s s e st h ed e s i g na n di m p l e m e n to ft h em o b i l e s e a r c he n g i n ei nd e t a i lt h a ti sb a s e do na s rt e c h n o l o g ya n ds e r v i c e s 无线浯音增值救务一移动搜索基l 擎的设计与实瑰 s e a r c h i n g i n c l u d et h ed e s i g na n di m p l e m e n to ft h es e r v i c ef l o w , t h e c o m m u n i c a t i o ng a t e w a ya n dt h e 玉t a b a s es y s t e mi nt h eb a c k g r o u n d t h e p r i n c i p l eo ft h ei v rf l o wl a n g u a g ea n dt h ek n o w l e d g eo f v s p pa n dt h e c o n c e p to ft h es t o r a g ep r o c e d u r ea r ea l s ob e e nd i s c u s s e d f i n a l l y , d i s c u s s t h ep e r f o r m a n c ea d j u s t i n go f t h ed a t a b a s e 。 1 k e y w o r d s m o b i l es e a r c he n g i n ei v rf l o wv s p ps t o r a g ep r o c e d u r ea s r j ! 皇业! ! 查竺竺:! :兰些笙兰 至竺至童望堡些墨二壁垫望童! ! 兰塑塑堡量壅堡 图表目录 图1 系统壮体结构图一 图2 系统结1 = i = j 图 图3 主流稃 图4 主流积续一商务服务和电话本 图5 发送语音短信子业务流程 图6 语音短信收听子流程 图7 音乐盒子流程 图8 电话会泌于流稃 图9 有限状态机举例 图1 0i v r 流程语言描述 图1 1 简师例子流程图 图1 2 例子流稃的代码实现, 图1 3 _ 二秒空向音处理流程 图1 4 语音利按键输入方式并行 圈1 5胁 义会话所采用的服务方式 图1 6v s p p 西议会话建立与解除过稃 表1 7v s p pp d u 包格式 图18x m l 描述的z i 定长方式操作过程 图1 9 连接信息的x m l 描述 图2 0i 叫关程序结构圈 图2 1 接受连接线祝代码 图2 2 用t s l 指令上锁和清楚锁 图2 3 定州器线程代码 图2 4 接收数据线程和处理及发送线程代码 图2 5 读取短信内祥线程代码 图2 6 发送短信线程代码 图2 7 初始化及建立连接代码 图2 8 使用c o m m a n d p t r 接l j 代码 图2 9 读取g v s s i n i 文件代码 图3 0 读取g v s s _ m a p c f g 文件代码 图3 1 主线稃实现代码 图3 2 终i 开 序实现代码 图3 3 服务相关函数的定义 图3 4 发送语音短信存储过程 图3 5 取主菜单语法存储过程 图3 6白动添加电话本的存储过程 图3 7 使用d b m sj o b 包管理作业队列巧一。口:”佗他似似侣帖侣竹倡加纠趁巧撕拍”勰扪弛舛钳;5;蛇鹕惦非 独创性( 或创新性) 声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名: r 期 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保 留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借 阅:学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它 复制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论 文注释:本学位论文不属于保密范围,适用本授权书。 本人签名:日期 导师签名: 同期 j 采癣 趣夫学壤 一举控论冀觉线语音增攮韭务移动搜索葶 擎魏设计与实琏 第1 章概述 本文主簧擒述了我在颈士论文期间对课题的研究成果,所作的工作以及在这 些工作中获得瑕论上的提高和业务上的创新。 。, 磅究鸷桑 1 1 1 什么是电倦增值业务 电信增值业务是指凭借公用电信网的资源和其它通信设备而歼发的附加邋 信、韭务,其实瑷蟾徐僮使原纛潮鼹的经滂效益或功毙徐壤壤寒。鸯瓣髂之为增强 墅照务。 1 1 2 什么是语音增值业务 i v r ( i n t e r a c t i v ev o i c er e s p o n s e ) ,帮交互式语音应答,裁是基予瞧话斡语誊 增馕监务的统称。英基本功熊是通过电话、计算机语音设备实现入梳之淘豹语警 交互。用户可以通过电话等通讯终端拨号呼叫i v r 平台,根据t v r 平台的语音 提示进行互动搽作,从而完成交易、娱乐等业务。i v r 舔统通过电话按键识别、 用户语音识别柬收集拥护输入,使用预先激制或现场合成的语音文件向甩户播放 港潦。 1 1 3 语音增值业务在电信增慎北务中的地位和发展 对运营商柬波,语音增毯业务不是可肖可无的。过去,由于谱鸯增值业务在 运蘩麓懿韭务中掰占比铡i 鬻,l 、,语音溪壤照务又存在菇耱 豢多、不便于管理、 容易影响到晶牌建设的特点,所以对语誊增值业务豹认识一直存在误区,对这方 面的运营不够徽视但是,如果没有增值业务,运营商就只能有一个网络平台,运 营商的价值就会越来越小。从这个角度来说,增值业务烃未来整个电信运营商竞 争躺一个制高点。它是提甍餐户忠诚度的鸯效手段,是遮营商业务秘潞牌区蹑化 的雅一手段,也是运蓍蔼未来收入的主癸浓源。 函音增值业务用户基础非常庞大,其使用又很简单,用尸界面友好,j j 上应 用创瓤层出不穷,市场前景极为可观。语膏增值业务可分为两大类:鹪一类是信 息服务类,提供的是一种体骏;从某种角废来说,在服务类业务中,电信运营离 跫糕予被遥簿懿对象,一家澈努疆筷商嚣可隧选择这家遮营态遣可戬选择那家运 营商合作。还霄一类是通信功能类,这类渡务是跟电信运营商捆绑在起的,是 最好的一类。 语音增值业务未来发展的趋势是语音与数据结合。语音技术将与数据技术结 会,语音增僮数务姆积数据爆馕、监务绫合,泰寒懿业务瓣不是单一懿潺啻或数援, 鬣多会是多媒体的形式。基确韭务将帮语密增僮韭务融合并相互键避,c r m 与 客户呼叫中心的管理手段和理念将全面渗透到增值业务中。 1 1 4 无线语音增憾业务的发展 近年来,移动运营裔也开始重褫语啬增值业务这一市场的获震。中国移动先 后联合新浪、搜狐、网易等知名网站推出熬于“移动梦网”业务平台的两个语音 北京邮l u 火学倾l j 学位论义光线语脊增值业务移动搜索引擎的设计与实现 增值业务品牌“寄信互动( 1 2 5 9 0 ) ”和“娱音在线( 1 2 5 8 6 ) ”,2 0 0 3 年 i i 曩份,t o m 网彗寰蠢浚魏重蠹袋大豹无线语巍增蓬堑务提供饔“雷霆嚣辍”, f 式避军无线语音增值业务市场;2 0 0 3 年底黪讯科技联合中移动推出“开心宝 典”语啬增值业务:而中国联通则坦言语音增值业务是其主打业务之一。 可见,无线语音增值业务毕竟还处于起步阶段,并日益鼹到移动运营两的重 视,这怒语音增蓬曼务领域豹生力霉。无线语蠢堙蓬业务存农豹历史并不长,算 是语音增值业务领域翡“薪秀”。 1 2 相关技术介缁 。2 。 ,浯啻套戏( t t s ) 羧零 文谮转换,又称为计算机语音合成,是利用计算机将任意组合的文本文件( 文 字信息) 实时转化为声音文件( 自然流畅的语裔语音语音数据流) ,并通过声 卡、电话语音卡等多撵俸设备穆声瓷输出。把文字转纯为声啻静品质,决定了用 户对系统懿壹落惑爨,因瑟,语音合成静效莱奄慧影翡蔼户接受程度酶一个矮关 键的因索。 语街台成的方式肖很多种,用得较多的是菇振蜂合成和声道模拟合成。两类 合成器桶礴相成,可以合成出音强、音高和音瓴都依时而变的语音。 强嚣舀嚣枣场上,大量馀藏豹语音赣囊装鬟邑经溺褒。大多是一秘低数鹚率 的录敖设备,把要说的话或语音,经数字化和编码后,存在微机的存储器中,使 用时,再经解码和数模转换还原成话音。多用于汽车、家用电器、钟表、计算器 和电子游戏机等方面。 我戮的一些磅究郝f - j ( 如渍华大学,舷天郝棼) ,弱这手孛蒙誊编辑合成方式, 研翱崮熊输出普遥话豁诗算枫系统,开始应用予文字校对、添音教学等领域。这 种方式谢许多局限| 生,其输出音质受计算机存败容量的限制。如果要求输出的词 汇最按小,例如报电话号码,报时,报天气预报等,人们可以以短句和词组为单 位,录入计算机,其漕质是较好的。但如果要输如无限词语的活语,人们只得录 入较,j 、滟语音单元( 翔音节或音豢缀) ,簸出时,嚣事孥这些蘩元蕊良编辑撵台, 其音质就较差了,因为自然发音时,各语音单位怒连贯的,肖协同调音效应。较 完善的计算机语音输出装置,是文语合成系统,又叫言语规合成系统。这种系 统能够将输入的离散文字系列变换成连续的语啬声波,犹如朗读文章一般。嗣d h , 日s 熬技拳已经可以达到囊业纯弱圭| 燕步。 霉雨的t t s 厂商主要有科大讯飞、j e 京稳邋、t o n e 髓i n k s o f i 等,其中科大 讯飞在图内市场占有率最大。 1 2 2 语音识别( a s r ) 技术 蠡动语音谖鬟技术,是一静将人的语音转换为可被计算橇程序所识裁黪文字 信息的技术。它使计算机能理解用户的语音命令,产生相应的文字结果。 据统计,在同常生活中人类的沟通大约有7 5 左右是通过语音来完成的, 语音归根到底也将戏为人与计算机等信息设备进行交互的爆重要人机界西。 n 2 a a n c e 公司委托h a r r i s i n t e r a c t i v e 公司对语蠢庭蔫客户滚惑度豹枣瑟诵囊磷究 证明超过7 0 消费者接受和使用语街服务系统,服务更为便德和人性化,它显示 了传统的d t m f 按键式系统,电子邮件及互联网络服务等所不能比拟的极度优 势。 北京邮r u 人学坝_ i j 学位论史 无线语音增值业务一移动搜索引擎的设计与实现 一、谮营识别技术的特点: 1 疆器有限瓣渗法( g r a m m a r ) 来谖鬟鼷户懿语音薅每 语法决定了用户能说忭么、如何说。好的语法能带给用户良好的交互感 觉,也能从逻辑上提高语音识别引擎的识别率,使整个语音应用的浏览流畅 而轻松。 2 瘸户豹攘弱瀑义熬苓羁说法可敦褥载鞠瓣豹识裂羁溪矮 傍l 如:当用户想表达喜欢对可臣说:“枣欢”“我饕敬“我穰喜欢”。它 的实现在于特征参数提取技术:从语音信号中提取出对语音识别有用的信 息。它对语音信号进行分析处理,去除刘语音识别无关紧要的冗余信息,获 绻影响语音识别的重要信息。对于非特定人语音识别柬t 隽,希望特缎参数尽 霹熊多懿爱获落义售惠,尽熬减少浚话久懿令入菇怠( 瓣蒋定天语蠢渡鞠紊 讲,则相反) 。从信息论角度讲,这是信恿压缩的过稔。 3 。连续语音的识别 为提高响应速度,连续语音的识别不是等待用户说完后才开始进行识 剩,蠢是在用户连续说话毂鞫辩裁开始逡 亍谖象,识别系统鑫动迸嚣餐戆甄 旬,而后组成整旬。这种方式豹实现依赖予软件与高速识荆硬停的协同工作, 嗣前的识别系绒已有这种能力。 二、讲音识别的方式及识别率: 就强i # 的技术水准丽言,语蠢的自动识别麓本上有两条途径:孤立词豹模式 匹配识掰和有限谣挺熬连续识爱。 1 孤立词的模忒识别 使用时,发话人说出某一词,计算机经过分析和提取特征,逐与库存 样扳搬比较,选出一组匹配褥最好的,判为所说的词。出于受到计冀机存储 察嫠鞍楚理时潮静羧割这矜系统谖裂戆诵汇量一般只3 - 1 0 t 0 0 0 令。这秘 方式一般是认入的,能以较离的识鄹率( 一般都在9 5 以上) 识剐融训练它 的人所发的词。如果换了人,识别率明显下降。目前国际市场上已有许多种 这类孤立词识别装置,开始应用于产品质繁检验和记淤;邮件分类,电话查 询等场瑟。 近年来,我鼙在孤立谲识别静骈究方鬻也取得可簿豹进展。螽中謦科学 院声学研究所的单呼口令识别系统可识别1 4 0 0 - - 2 0 0 0 祭口令,反应时削已 经达到实时,垓系统已应用于模拟作战指撵系统等场合。清华大学和哈尔滨 工业大学等部门也都纷纷推出识剐率9 0 以上,词汇擞1 0 0 0 条左右的系统。 2 。鞋音素先谖掰摹元憋连续谖翳 在音素谈剐阶段,进行模式匹配式的识别,就某潜段选出几个候选音 索。在音节识别阶段,计算机根据音素识别的结果和库存的拼音规则来组合 音节。目前,还没有达到识别无限词汇的水平,只能将识别限定在巢一领域 誉黼豹 霹汇上,邂汇量一般褒1 0 0 0 左右。劐了语句识期殓段。诗冀撬要攫 掇攀先定好酶逶法鬣剜、语义信患,上下文关系等语畜学翘识,分揆候进语 匈,挑出最佳者。目前,连续语识别系统糖本处在实验室阶段,有少数几个 系统在情报检索、预约机票、旅费管理等方面试用,识别词汇几百列一千, 识副率约9 0 。 浯音谈鬻系统夔睦能丈数敬决于毒爨透素:l ,谈潮试汇表斡大,j 、纛语 音的复杂性;2 + 语音信号的质量;3 单个说话人还鼹多说话人;4 硬件。 托隶郝l 睦天掌鞭i 学旺论文光线语音增篷监务一移蘑接素弓l 鼙瓣设计与实骂要 1 3 课题的意义 练合以上艨述,我们在无线语音增篷照务夔基礁上,又提篷了移麓援索弓;擎 筑躐念,矮语誊的方式控锅搜索弓i 擎,帮助翔户我至l 想簧豹岗容或服务。 掘调查,在网络应用中,搜索引擎的使用频率仅次予电子邮件,可见搜索引 擎对人们r 常生活产生的巨大影响。相对传统互联网搜索的巨大市场效应,现在 的移动搜索市场避只是冈刚起步,两结台了语音技本的搜索g 擎更楚磐寥无几, 被褪为薮兴魏搜索领羲。 虽然互联网搜索得到了长照的发展,但相对手机而畜,毕竟个人电脑的总占 有爨藤少得多,而能上网的电脑就更少,再加上p c 携带不方便,根本无法与手 机在数量和便携方面相提并论,因此,移动搜索产业虽然新鲜。但一建会是一个 昆传统搜索还要太褥多豹蛋糕。它不仅l 扩大传统的互联鼷搜索鲎努,还链起动 新静无线增值业务的墙长。 1 4 作者所完成的工作 在宠藏论文羯阁本文襞俸熬王佟主要畜: 系统结构和湖络结构的设计、实掩,攥作系统和数据库软件的性麓比较和选 用。 业务逻辑的设计和实现,烹流程的编码实现,各子业务模块的编码实现,以 及予模块接墨豹设计君鞋实瑗。 磺究了网络遇信静c s 骥爱帮语音驻务平台 办议v s p p ,在魏墓旗上完或了 业务流程与后台数据库通信的网关的设计与实现。 对o r a c l e 数掘库系统及冀相应的p l s q l 进行了研究,并在此基础上结合实 际业务需要完成了届台数据库触设诗,表缀掏的设计,以及相关的数爨痒操作的 实璐。、韭务土线爝,又豢撰实瓣猿况对数攒露整i 骰密穗应夔调整。 1 5 文章内餐寂排 文章分为圈个部分。 第一部分分缡了系统静整体结构,主袋是说翡轰动链实俸掰完裁的具体功 能,以及它们之间的通信方式。 篇二部分详细说明了业务逻辑的设计与实现。包括主体流程的设计,各功能 模块的设计,以及在这些设计中的人性化,炭活性,可扩展性和易维护憾的考虑; 霜时电说骧了浚疆竣砉卡囊遵 蘩瓣原理,并讨论了一些技术实瑗嚣鳃苇润题。 第三部分详细阐述了v s p p 协议,进丽髓明了网关程序的设诗思想和工作方 式,并讨论了相芙的实现细节。 第四部分详细阐述了后台数据库的设计与实现,包搔表结构的设计,相关数 攒黪攘 乍的实瑰,以及数据摩瞧戆戆调整,这里重点论述了一些重要数据蓐操 乍 豹设计露怒帮实魏细节。 北京蛐濉大学破l 一学位论文 无线语音增值韭务移动搜索g i 擎特设计与实现 第2 章系统结构及工作流稷 2 1 系统整体结构 由于中阉移动指定高阳公司为平台提供商,所以我们所丌发的移动搜索引擎 业务也是在高阳平台t _ 丌发的,此业务系统主要由三大部分组成( 如图1 所示) , 移动网络为用户提供接入方式,高阳诿音鞭务平台负责业务的瓣接入翱业务静管 理,s p 的后台系统为业务提供相应的数据支持。 图1 系统整体结构图 为了遴一步菇明系统的工作方式,图2 中绘给出了系统结构的细节部分。根 据此务的需要,我们在此基础上又增加了短信接入平台为用户提供短信接入方 式,从而使用户能够通过多静途径方便地接入业务。 圈2 系统结构图 4营d誓霹d鞠 巍线语音增蕴韭势移动蓑索写l 擎瓣竣诗与实瑗 语音服务平台( v s p ) 主要出六个功能模块构成,每个模块负责相应的工作: s w i t c h :交换桃,负责谬音服务平台与中国移动网络之问的通信。 i v rs e r v e r :i v r 鼹务器,对话音罄弩,蓉键巍痿令豹处瑾,鼗务淡疆懿 运彳亍和管理,怒整个语音服务平台的菝心部分。 t t ss e r v e r :语音合成服务器,为业务提供语音合成服务。 a s rs e r v e r :语音识别服务器,为业务提供语音识别服务。 d b :数攒痒,为平台戆运行提供必甏豹数据支持。 g a t e w a y :篱阳公司嗣关,受责与s p 螽台系统之瓣魏通结 藻子v s p p 协议) ,主要完成业务所需数据和管理信息的交互工作。 d i g i c o t l ls y s t e m 也就是我们所做业务的后台系统,主要由四个功能模块构 成,每个模块负赉据应的工作: w e bs e r v e r :n j 菇鼹务器,运孳亍弱彗鞭务,为强户使瑶鲎务撬爨辘韵支薅。 s pg a t e w a y :业务嘲关,负责与高粥公司的网关通信,完成业务所需的数 据和管理信息的交互。 s m sp r o c e s s :短信处理模块,负责用户上行和下行短信的处理,为用户 镬璃业务篷供辅麓支持。 d b :业务数据痒,存德糯关的角户德息,为韭务的运行提供数据支持。 2 2 系统工作流程 臻户浮e 特定戆蓑入号戳猿入移羲秘终,镄如:1 2 5 9 0 4 9 8 0 ( 魏号弱为奉文 所讨论业务的接八号码,所以以后均以此号为倒) 。移动阚络判定祓叫号码为特 定的业务接入号码后,通过m s c 将呼叫转入语音服务平台( v s p ) ,r 服务器 收到呼叫后,根攒被叫号码选榉相应的业务流程加载并趱行。此时,用户既可听 到业务提示音,粥户可隧根撵提示使用按键竣语音的方式输入指令。姿i v r 收 到璃户指令后,镬袄疆角户捂令囱a s r 濂努器或t t s 溅务器发蠢请求,a s r 骚 务器和t t s 服务器对请求做出响应,返回处理结果,从而使i v r 服务器完成用 户所需的服务。 当业务流稷需要槌关的用户数据才能完成服务时,i v r 服务器会遵过赢阳公 司秘关自s p 丽荚发筵数据瘁撩 乍请求,s p 蠲关羧至l 数熬瘁操作请求焉,棂据涛 求的操作代码,执行相应的存储过程,并将结果通过网关送回i v r 服务器。i v r 服务器根掘业务流程所定义的方式处理返回结果,完成用户所需的服务。 北京邮乜人学坝卜学位论文 无线语音增值业务一移动搜索引擎的设计与实现 第3 章业务流程的设计与实现 3 1 业务流程设计 1 2 5 9 0 4 9 8 0 业务( 以后简称8 0 业务) 的设计的主体思想是以通话服务为基 础的搜索引擎,用户所找的内容大多最终会以通话的方式完成用户所需的服务。 在此设计思想的基础上,我们将8 0 业务分成两大类,一类是个人信息的查 询,例如个人电话本,通过个人电话本,用户可以跟好友通话或着给好友发语音 短信,也可以给好友点歌等等;第二类是公共信息的搜索,例如,预定酒店、机 票、火车票等商务服务,用户也可以搜索自己喜欢听的歌曲并收听。 接下来我将详细说明8 0 业务各功能模块的设计细节。 3 1 1 主流程的设计 图3 主流程 北京邮i u 人学坝i 学位论史 无线语音增值业务一移动搜索引擎的设计与实现 详纲设计如图3 所示,为了馒注册和非注勰用户都能收玎厅别人给他发送的语 音短馈,在设诗凌程瓣辩穰,薅氍懑音短售瓣溅程敖在了主菜单豹嚣嚣,绞褥露 户可以缀先听到别人给他的语音簸信,在没有谮音短信的情况下,昕语音矮信的 子流程会立刻返回,使用户感觉不到该子流程的存在,从而不会影响到用户使用 其他业务。同时,考虑到大多数用户会使用通话服务,为了使用户能够以最快的 速度找到鑫己筑好友箴孝想要的礴务骚务,我 j 将瘸户荮友黔姓名,商务服务名, 以及其它子业务名以并弼静方式都放在第一级逡荜,也就是主菜擎中。在设计时, 也考虑到了人性化的一面,当用户两次识别失败后,改变系统提示音,增加说明 内容,帮助用户做出选择。 为了降低用户馊髑业务的f 1 搬,即非注册髑户也可以使用部分业务,我们把 蠢务骚务设诗巍荚鬻语法,任 莓爱户进灭基豢爵戮选择定溪鹰、毒噩票等褒势缎务, 同时非注册用户也可以在主菜单中说激活,随即转向客服子流程,由我们的客服 人员帮助用户注册,从而是用户能使用更多的业务。 为了方便集团用户的使用,我们设计了集网通信录。用户可以以团体的方式 注溪监务,铡如一个公司或一个班缀,繇有囊戮蠹豹矮户都可以技裂该繁豳蠹静 箕拖入,主要是为节省用户添期电话本的时闻,也为了实现燮源的共享,德离资 源利用率。此外,考虑的企业用户的实际情况,在集团通信淤,我们增加了访问 权限的设置。 幽予蔼务瑕务鞠电话本属于通话服务,面虽和主流程结合静十分紧密,两且 它们之黼又有穰大懿裾颤之筵,掰以把它们一怒赦在主流稷中实凌,l 妻予鬻片大 小的限制,我将在图4 中展示主流程的后半部分,电话本和商务服务流獠,主要 是实现外呼和在外呼失败的情况下给好友发语音短信。 北京邮r u 人学坝i 学位论文 无线语音增值业务一移动搜索引擎的设计与实现 主流程续一商务服务和电话本 为了方便用户使用,考虑到很多用户不喜欢语音输入的方式,在设计流程时, 我们增加了按键输入方式,即在主菜单中,当系统问用户要找什么的时候,用户 可以直接输入对方的手机号码。这里需要注意的是,一定要对用户所输入的号码 的合法性进行判断,例如:输入的手机号码的位数不能小于1 1 位,不能是中国 联通的号码等。 此外,添加电话本对用户来说,是一项比较费时的工作,所以为了提高用户 的使用率,我们设计了自动添加电话本的功能,此功能放在了呼叫结束后进行, 由后台处理。例如:a 用户呼叫他的好友b ,b 虽然注册了8 0 业务,但是b 的 电话本罩并没有a ,此时,系统自动将a 加入b 的电话本中,同时会给b 发一 条短信提示添加,从而方便了a 和b 以后的电话交流。 3 1 2 发送语音短信子流程设计 当用户在主菜单中选择了语音短信流程将转向发语音短信子流程,或者当用 北京邮i u 火学坝i 。学位论文 无线语音增值业务一移动搜索引擎的设计与实现 户在电话本业务中呼叫失败时,系统也将自动转入发语音短信子流程,不过此时 用到的只是发语音短信流程的部分功能,因为不需要再次选择接收方。流程图如 图5 所示。 图5 发送语音短信子业务流程 这早,我们也为用户设计了两种并行的输入方式,语音输入和按键输入。考 虑到用户的实际需要,我们在这里设计了语音短信群发的功能,用户可以发短信 给一组好友,组的名字和组中的人员是由用户自己在网站上设定的。 3 1 3 收昕语音短信子流程设计 前面已经晚到,收听语音短信子流程被放到了主菜单之前,主要是为了方便 用户,直接拨进8 0 业务就能收听,不用其他的操作。流程图如图6 所示。 一一 鱼 事一 北京l i s 人学坝卜学位论义 无线语音增值业务移动搜索引擎的设计与实现 图6 语音短信收听子流程 为了不影响没有收到语音短信用户的征常使用,当流程判断用户没有收到语 音短信后,语音短信收听子流程将立刻返回,没有任何提示音,这样会使用户感 觉不到它的存在;但是有语音短信的情况下,当所有短信播放完毕后,流程会提 示用户所有语音短信收听完毕,系统将转入主流程,使用平滑的过度,不会让用 户感觉太突然。 当用户听完一条语音短信后,我们还设计了回复和转发的功能,方便用户之 问的交流。同时,考虑的大多数用户不会多次听同一条语音短信,当进入下条 语音短信后,前一条将被删除。 此外,为了能让用户能够及时地听到别人给他留的语音短信,我们设计了短 信通知的方式,通知接收方拨接入号码收听。 北京i 1 1 1 i b 人学坝l 学位论史 _ 无线语膏增值业务一移动搜索引擎的设计与实现 3 1 4 音乐盒子流程设计 一! 一 | 苎竺型茎竺竺! ! 一 l 参 : 重新选押 霾7 音乐盒子流疆 音乐盆的设计,除了能让用户自己上传歌曲,建立自己的歌曲库以外,更重 要的是用户可以接入8 0 业务,收听自己歌曲库中的歌曲,迸能将自己喜欢的歌 曲点送给朋友昕,流缀图如图7 所示。 为了方便霜户捷爝,我髓也为麓户准备了帮分戆经典熬整,援在公共歌基 库中,用户可以在网站上选择,并加入自己的歌髓库中。 一 竺 i 一一 一一 北京邮l _ :i 大学坝i 学位论文 无鼗语音增德韭务一移葫搜索弓l 擎静设计与蛮蠛 3 。1 。5 。毫话会谈子流耧设计 c 盎盘3 图8 电话会议子流程 考虑到髑户鼓使用习惯和矮捷程痰,我稻设计了如图8 所示豹电话会议子流 程,其主要功能是完成多方通话。现有的多方通话业务大多是基于聊天室的,需 要蠲户主动| l 每呼入监务,选择榻应数黪天室,送入嚣送行多方懑话。焉我钢联设 计的多方通话是由主叫用户轮流呼叫纂他用户,其他用户接听电话后即可进行多 方通话,聪于被动方式。 3 1 6 客服子流程设计 为了让用户能够随时获得人工帮助,我们设计了客服子流稔,在主流程和其 他子漉程中,可以输入谬音或按键豹地方只要按o 藏者说帮助,即可转入客照予 笼线话音增蓬韭势移葫接索;l 擎转浚 与霎瑰 流程,向我们的客服人员发起呼叫,从而遐用户获得需要的帮助。 3 。1 。7 。其他一些设计上的考虑 除了以上这懋各功能模块的主题设计以外,还有一磐细节上的设计,比如说 人性化设计,灵活性和可扩展性设计,以及流程的易维护性设计等,斌魑都将在 业务流程实现一节中详细讨论。 3 2 。韭务滚糕懿实褒 8 0 业务使用蒸于语音服务平台( v s p ) 的i v r 流程语言来开发,i v r 流程 语言的命令主要有放音、录音、接收按键、会议、外呼、数据库操作、计费、运 算、跟踪调试、港密舍或、语密识裂等。携黠予其毽开发语言寒澄,i v r 滚程语 言阮较简单。 3 - 2 _ 1 。i v r 流程语言蒸本原理 i v r 滚程语言是一耱基于存陵状态捉摸鍪戆辫本谱富,萁基本蹶璞霹弱下述 公式波述: 状态机+ 事件驱动+ 可叠加的原子功能模块 阁9 有限状态机举例 图9 以更直观的方式说明了这一原理,如果将上图阁i v r 流程语售的方式 描述是柬,将会褥列凰1 0 所示的结果。 一个流程由嚣干状态块组成,一个状态块由一系列的动作和若干状念转移列 北京懈r 乜人学颂l 一学位论文光线谱音增值业务秽动搜索引擎的设计与实现 表组成,两状念转移列表是由一魑事件、事件返回的结果和新的状念组成。 为了逶一多滋圈i v r 滚程潺蠡戆蘸理帮实瑷方式,我缴了一令麓攀懿绸子, 其流獠图如图1 1 所示。 开女台 l 欢迎进入本系统 j 1 :查询个人资料2 :点歌3 = 听留育 上土j l 鸯资料,惑歌l听留言 图1 1 简单例子流程图 将上圈所示流稷用i v r 流稷语言描述,绪果如图1 2 所示。例子中绘出了四 个状态滚:s t c o n n e c t e d ,s t g e t u s e r i n p u t ,s t c h e c k p u s h c d b u t t o n ,s t q u e r y p e r s o n a l i n f o 每个状惫块又包含了自己的动俸,例查蟊p l a y f i t e ,g e t d i g i t s 麓,以及状态转移列表 所有的e v t r e t u m 。 3 。2 。2 。关键懿分的实理缨慧 由于业务流稷的实现细节过于琐碎,我只挑些关键的部分加以讨论。 3 2 2 1 配置文件的使用 数势流程的部分箍惠是和轰绞糖关豹,为了在系统有敬韵豹凑况下,不蠲穆 改蛙务流程,我们逸择使孀配嚣文俘来动态酝邋篷务流稚掰用至i 的一骜参数,倒 如,系统提示音路径,用户提示啬路径,s p i d ,s e r v i c e i d 等。 3 2 2 2 语音识别谯流程中的实现 由予盐务中多照僮覆了潺啻谈爨菠零,在筵,我先余绍i v r 滚稷港言孛 语音识别的实现。 i v r 流程语毒+ 采用的是基于语法的识别方式,在识别之前,需要将语法先加 载入谚塌u 模板,然后调用语音识别函数进行谣啬识别。语法又分为静态语法和动 兹线语音增蓬韭静移动接索l l 擎鹩设| 千与实嚣 态谮法,静态语= 轰是在流程使用之前编译好的语法文件,并对应到相威的识别模 板。赢接使用即可;而动态语法是在流程中根据不同的此务,将语法动态地写如 识别模板,然后褥避行谈到,箕灵活性跑静悫语法要葛。出予8 0 业务豹需要, 我们後嗣静都楚动态语法。谬法格式如下: 语法l = 值1 :语法2 = 值2 :语法n = 值n 。 以电话本业务为例,a 用户的电话本中有三个好友:张三、李四、王五,写 成动态语法:蜀i - - = ;o i ;笋群0 2 ;王五= ,强将此语法加入识别模投,a 雳户 疆张三时,氮鬃谈剐戏功,裁会返霾1 0 l ,流程鬏据语誊识裂懿运叠镶裁霹粪断 出a 用户到底要拽哪位朋友了。 3 2 2 3 流程中计费之前3 秒空白音问题的解决 棂据中国移动管理援范的要求,撵放炎费提示结寒,3 秒之后才越发送计费 3 2 2 4 用户可选择是否听资赞提示的实现 为了握葛鬻户豹绩羯效率,我翻设诗透瘸户垂己选耩是否蓊资爨撬示。在羚 断角户是否注册的状态块中,数据库操作除了返回用户注册状态信息外,还返回 是否听资费提示的状念信息,并用寄存器保存。之后判断寄存器储存的值,如果 值为l ,则转入攒放自费提示的状态;如果傻为o ,则跳过资费提示裔状态块, 继续遴牙。 3 。2 2 5 。 两次谈潮失败矗更改生菜单提示音静寤现 使用一个整数型寄存器作为计数器记泶识别失败的次数,流程丌始时,将此 寄存器初始化为0 ,每议别失败一次,对计数器执行加l 操作,之后将计数器的 毽与比较,小予2 靖,运圈舔囊翡谖裂获拳头,继续攒赦骧柬夔撬示音;大予 等于2 时,跳转到新的识别状态块,使用新酌提示音。识别成功后将计数器清0 , 乾束邮 u 欠学霸| 学位论望 光线语音埭筐韭务一移旃搜索暑| 鼙静设诗等实瑗 戬方便磊鬻懿使糟。 3 2 2 6 语音和按键输入方式并行的察现 由于魇有的语音谚 澍函数a s r ( ) 的功能较弱,所以我们使用了增强蛩的语 音识别函数a s r e x0 束实现此功能,通过设鼍a s r e x 0 的输入参数,即可实现在 语潦识剐的同时绥枝用户按德输入。图 4 为实现代码,a s r e x 的参数”? ”表示可 以接收任意按键,返回事件3 ( e v t r e t u m 3 】) 表示收到用户按键,识别已经被打 断。 3 2 2 7 输入的学杌号鹨台法性检验的实现 由于鼓务滚程中癸送行多次号褥豹合法性检验,为了实臻复瘸,将噩乏功蠡努 装成子函数f u n pc h e c k m o b i l e n u m b e r 0 ,寄存器f i e l d l 作为输入参数,将输入 豹手援号褐传绘遗数。函数内透过s t r l e n ( ) 函数捻验竣入号码瓣长度是否符合标 准,s b e t w e e n ( ) 检验输入的号码是不是中闺移动的手机号码,s t r s t r 0 函数检验 输入的号玛中是西含意 # 法字符,例如”一稠鬻”。当所鸯的检验都通过后返回成 功,否则返回无效的号码。 3 。2 。2 。8 。主菜单孛非嗣缀业务救在同一级中所带来的问题及解决 用户在主菜单中所做的选择将囊接影响流程的下一步动作,如果用户说的是 好友姓名裁者是巍务鼹务,流程终投据瑁芦l 豹输入,透过数攥痒操髻,技到蠲户 好友的电话并发起呼叫;如果用户说的是戴他子业务,例如音乐盒或会议,那将 会避入耀应豹子暇务滤程。霜户歇嫩瓣这臻选择都是通过语音识别采完残麴,两 语音识别所返回的都悬语法所对应的值,即数字,对于后续的数据瘁操作来说, 又要以这些返殛值作为参数,那么该如何隧分这姥数字睨? 解决方案:将这些数字分区间,需要调用予她务流程的返回值放在一个区间 内,需要后续数掘库操作的返回值放在另一个区闻。这样,流程中先判断返回值 所属的区间,然后在避行下步动作。 以主菜单语法为例说明这一问题,还是a 用户,他在主菜单中获得的语法如 下: 帮助= o ;语请短信= 2 :营蕊盒= 3 ;会议嘲;酒唐= i 0 0 1 祝票= | 0 0 2 ;张三= i o i :

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论