(机械电子工程专业论文)基于家居服务器的cti研究.pdf_第1页
(机械电子工程专业论文)基于家居服务器的cti研究.pdf_第2页
(机械电子工程专业论文)基于家居服务器的cti研究.pdf_第3页
(机械电子工程专业论文)基于家居服务器的cti研究.pdf_第4页
(机械电子工程专业论文)基于家居服务器的cti研究.pdf_第5页
已阅读5页,还剩59页未读 继续免费阅读

(机械电子工程专业论文)基于家居服务器的cti研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于家居服务器的c t i 研究 摘要 【随着需求和技术的不断发展,电话终端正在向数字化、智能化发展,对智 能电话进行研究是非常必要的。、l , 论文首先对c t i 技术在国内外的发展状况进行研究,介绍了c t i 技术的相 关协议和主要应用。论文分析了电话终端的发展方向,以及电话终端发展滞后 和信息电话普及缓慢的原因,并讨论了智能电话发展过程中需要解决的几个问 题。在详细分析了面向家庭的两项电信增值业务的传输协议后,针对智能电话 成本高、操作性差的缺点,提出了基于家居服务器的解决方案,并对智能电话 的功能进行了分析,研究了现有的c t i 技术在智能电话中的应用。 “+ 1 。一 在论文的最后,从硬件电路、语音编码、控制软件和通信协议等方面介绍 了如何实现智能电话。4 关键词:c 叹增值业务j 智能u 话? 家居服务器 r e s e a r c ho fc t ib a s e do nr e s i d e n t i a ls e r v e r a b s t r a c t w i t ht h ei n c r e a s i n gd e v e l o p m e n to ft e c h n o l o g i e sa n dc u s t o m e r s r e q u i r e m e n t s , t e l e p h o n et e r m i n a li sd i g i t i z i n ga n di n t e l l i g e n t i z i n g i t i s v e r yn e c e s s a r yt os t u d y i n t e l l i g e n tt e l e p h o n e a tf i r s t ,t h i sp a p e rr e s e a r c h e so nt h ed o m e s t i ca n di n t e r n a t i o n a ld e v e l o p m e n to f c t i ,a n di n t r o d u c e st h es t a n d a r d sa n dm a i na p p l i c a t i o n s i ti sa n a l y z e dt h a tw h y t e l e p h o n et e r m i n a lt r a i l st h ed e v e l o p m e n t o ft e l e c o mn e t w o r k sa n dw h yi n f o r m a t i o n t e l e p h o n es p r e a d ss l o w l y i ti sp o i n t e d o u tt h a tt h ed i g i t i z i n ga n di n t e l l i g e n t i z i n gi s t h ew a yo f t e l e p h o n e t h ep a p e r d i s c u s s e ss e v e r a lp r o b l e m sa b o u tt h ed e v e l o p m e n t o fi n t e l l i g e n tt e l e p h o n e a f t e rs t u d y i n gt h et r a n s p o r t i n gp r o t o c o lo ft o wt e l e c o m v a l u e a d d e d o p e r a t i o n s i n d e t a i l s ,as o l u t i o nb a s e do nr e s i d e n t i a l s e r v e ri s p u t f o r w a r dt os o l v et h eh i g hc o s ta n dp o o ro p e r a t i o np e r f o r m a n c eo ft h ei n t e l l i g e n t t e l e p h o n e a tl a s t ,t h ep a p e ra n a l y z e st h ef u n c t i o no fi n t e l l i g e n tt e l e p h o n e ,a n d h o wc t i t e c h n o l o g i e sa p p l yt oi t a tl a s t ,t h ep a p e ri n t r o d u c e st h ei m p l e m e n t a t i o no fi n t e l l i g e n tt e l e p h o n ei n h a r d w a r ec i r c u i t ,v o i c ee n c o d i n g ,c o n t r o ls o f t w a r ea n dc o m m u n i c a t i o np r o t o c o la n d s oo n k e y w o r d s :c t i ,v a l u e a d d e do p e r a t i o n ,i n t e l l i g e n tt e l e p h o n e ,r e s i d e n t i a ls e r v e r 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究 成果据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已 经发表或撰写过的研究成果,也不包含为获得 佥胆至些盔堂或其他教育机 构的学位或证一 s 而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示谢意。 学位论文作者签名:筒善牲签字日期:工”;年牛月7 日 学位论文版权使用授权书 本学位论文作者完全了解佥妲工些太堂有关保留、使用学位论文的规定, 有权保留并向国家有关部门业机构送交论文的复印仆和磁盘,允许论文被查阅帚 借阅。本人授权盒工些太堂可以将学位论文的全部或部分内容编入有关数据 库进行检索,可以采川影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密厅适_ 【 本授权书) 学位论文作者签名:街,球旗 签字目 j j :弘。亏年乒月7 日 学位论文作者毕业后去向:科研 工作单位:彳砉鱼芋土都! 己孑嚣王研究所 通讯地址:f 州f 。m 宦锸,r 旆径 导师签名:;咨建孑, 签字日期:协声( 阴7 吕 电话: 邮编:o 跏 致谢 首先衷心感谢我的导师张建军副教授。本论文能够顺利完成,得益于张老师 的悉心指导和关怀。硕士研究生学习期间,张老师为我提供了非常好的研究和 学习环境,并在思想上、学习工作上给了我许多教诲,我取得的每一点成绩无 不凝结着张老师的心血和汗水。张老师不仅教会了我科研的方法,还使我懂得 许多为人处事的道理,这些将成为我的最大财富,使我终生受益。 特别感谢张利副教授和韩江洪研究员。在研究生阶段,张利老师为我提供了 良好的研究环境,并在学习和生活上给予无微不至的关怀和照顾。在课题研究 过程中,韩老师从理论、实验方法等方面给予许多非常有建设性的指导。在此 谨表示我诚挚的谢意。 同时还要感谢方平、魏振春、黄丽、吴瑜、王跃飞、潘承锦、路强以及实验 室里的其他同学,在课题研究阶段,给了我许多无私的帮助。 感谢合肥工业大学机械与汽车工程学院和微机所的全体老师,感谢他们几年 来对我的关心和帮助。 感谢我的家人,给予我极大的支持和鼓励,使我能顺利完成学业。 1 1c t i 的产生 第一章c t i 技术概述及课题背景 随着通信网络数字化和计算机处理能力的迅速发展,通信技术和计算机技 术相互渗透的进程明显加快,已远远超出传统意义上通信网采用计算机技术进 行处理和控制的范围,出现了两种技术的相互集成,这种集成不但体现在技术 层面,也体现在各种业务的不断推出和广泛开展上。计算机电话集成( c o m p u t e r t e l e p h o n yi n t e g r a t i o n ,c t i ) 技术就是在这种背景下产生的。c t i 发展的最初动 力来i 自于企业对增强客户服务能力和改善内部管理的不断要求,在目前市场多 变的形式下,如何有效地提高企业的服务水平和工作效率成为企业生存发展的 关键。企业内部的电话网可以有效提高这些方面的水平,但是在处理电话呼叫、 应答以及屯话系统管理等方面上却存在着许多问题,如管理成本过高、服务质 量难以保证等。计算机对信息的控制、处理和存储的能力是极强的,利用计算 机和l 删络的高速数据处型e 能力补充电话网的不足,可以提高对通信的控制能力, 实现高效、灵活的通信业务以满足企业的需求l 。 1 2c t i 在国内外的发展状况 目前,c t i 系统广泛运用于增强对客户的支持及加强企业内部的协调和沟 通上。c t i 技术的主要应用形式包括交互式语音应答( i n t e r a c t i v ev o i c e r e s p o n s e ,i v r ) 、呼叫中心( c a l lc e n t e r ) 、客户关系管理( c u s t o mr e l a t i o n s h i p m a n a g e m e n t ,c r m ) 、i p 电话( v o i c e o v e ri p ,v o l p ) 、i p 传真( f a xo v e ri p , f o l p ) 、统一消息服务( u n i f i e dm e s s a g es e r v i c e ) 等,适用范围包括大中型企业 的客户服务、办公自动化、服务行业中的产品推销和用户咨询、电话声讯服务 等。这些应用在围内外迅速地推广,形成一个市场日益扩大的c t i 产业,推动 c t i 技术在商业领域不断发展1 2 1 。 据分析,c t i 行业每年利润额己超过1 0 0 亿美元。( ( c o m p u t e rt e l e p h o n y 杂志在2 0 0 2 年对国外c t i 经销商和最终用户进行的调查表明,整体上c t i 产 品市场是一个迅速成长的市场,最终用户2 0 0 1 年在c t i 软件和服务上的花费 增加3 8 ,在硬件上的投资螬 加2 8 。根掘p i p e rj a f f r a y 分析人员的研究报告, 在过去5 年,c t i 产业年平均增长2 7 。未来5 年的年平均增长速度将超过2 5 , 2 0 0 3 年,i pi 乜话解决方案的产值将达到6 l 亿美元,i p 电话服务市场将达到8 6 亿美元1 3 j 。 在匡l j b ,有大量的电信公司矛【i 计算机公司介入c t i 技术的发展,例如 a t & t 、n o r t ht e l e c o m 、b r i t i s ht e l e c o m 等电信公司和m i c r o s o f t 、i n t e l 、n o v e l l 等b l 一算机公司,这些公司对于c t i 行业标准体系的建立起很大的推动作用。国 际上c t i 系统主要的供应商是d i a l o g i c ( i n t e l ) 、n a t u r a lm i c r o s y s t e m s 、m u s i c t e l e c o m 、a v a y a 利o r a c l e 等公司,囡内公司有深圳东进、杭卅i - - ,1 :、用友和科 大讯飞等:它们提供c t i 系统所需的各利,软硬件平台。开展c t i 系统集成的公 司更足数刁i 胜数,据不完全统计,刚内有5 0 0 多个公司从事c t i 集成服务。 随着市场的f 益扩大,c 1 、1 产j 在因际上普遍得到i t 行业大公司的高度重 视。1 9 9 9 年4 月,m i c r o s o f t 购买了c t i 领域最大的板卡供应商d i a l o g i c 的部分 股票;同年6 月1 日,最大的芯片制造商i n t e l 完全收购了d i a l o g i c 。d i a l o g i c 创建于1 9 8 3 年,在全世界有1 2 0 0 名员工,其产品线涵盖了语音卡、传真卡、 i p 网关等一系列范围,语音卡的国际市场上占有率约6 0 。m i c r o s o f t 和i n t e l 争相收购d i a l o g i c ,表明了传统l t 厂商对c t i 产业的重视。随着各大公司加大 投资力度,为c t i 产业的发展注入了更强的动力,将扩大c t i 的应用领域和发 展规模。 在国内,c t i 是这几年才兴起的,通过广泛开展各种市场宣传工作,c t i 渐渐地被了解,市场丌始逐步接受了c t i 、呼叫中心、统一消息、i p 电话等概 念。c t i 产业在1 9 9 9 年得到很大发展,市场逐步形成;2 0 0 0 年,i p 电话、呼 f i q 中心等应用丌始深入人心,发展速度惊人。特剐是i p 电话,几乎人人都在关 注、使用它。以需求为驱动的l p 电话技术取得了深刻的进步和广泛的应用,各 大电信、移动、网络运营商继续建设自己的骨干传输网,实现了全网l p 化( 接 入、传输、计费、与传统网互连互通) 。由于服务质量( q o s ) 的进一步改善, 更多的人将会选用l p 电话,因此市场将进一步扩大。现在各行各业都在讨论建 立自己的呼叫中心,电信、金融、保险、电力、i t 等行业的各大中型企业均已 建立自己的呼叫中心系统,仪2 0 0 2 年,全国的呼叫中心投入达1 0 0 亿左右。 1 3 研究c t i 的必要性 随着网络技术和无线通信技术的迅速发展,人们的通讯手段日趋多样,但 传统的电话通信仍然在日常生活中扮演重要角色。电话通信已经问世一个多世 纪了,然而电话机本身却没有多大的变化,基本上还沿着传统的道路独自缓慢 地发展,虽然这期间电话机新增了免提、无绳等功能但真正称得上革命性意 义的变革还没有,固定电话无论在功能和设计上仍停留在打电话的“原始”阶 段。随着人民生活水平的提高,普通电话机已经不能满足人们的需要,如何增 强电话机的功能,使其智能化、人性化是人们广泛关注的问题。 根掘信息产业部的数据,截至2 0 0 2 年7 月底,我国固定电话用户已经突破 2 亿,达到2 0 1 亿户,全国电话普及率达2 4 。从1 9 9 9 年的l 亿户到今天的2 亿户,仅仅花费了3 年时间。固话的普及度不断提高,固话运营商的市场份额 看似不断扩大,但营业收入这一关键指标却没有同步增长。2 0 0 1 年上半年,以 经营固定电话业务为主的中国电信集团是各电信运营商中收入增幅最小的,与 2 0 0 0 年相比,增幅仅为5 6 6 ,自1 9 8 4 年以来首次低于g d p 增长速度,这一 增长率与中国移动2 0 和中国联通5 0 的增长率显然无法相比1 4 j i ”。 导致固话业务发展减缓的原因有很多:业务本身的不足,电信运营商的观 念和经营手段等等。但更重要的是,作为基础操作平台的固定电话机,其技术 进步的缓慢限制了固话业务的发展。通信业全面竞争的重点在于运营商的业务 对用户有着多大的吸引力,而业务创新更是其中不可缺失的一环。这就需要加 大电话终端的开发力度,否则即使丌发出一种好的业务,也可能会因为没有成 熟的终端产帚的配合而不能顺利,f :展,造成该业务在竞争中败北。 我国f 乜信业正经历着从语音业务向数据业务的转变,电信运营商推出越来 越多的业务,而滞后的终端无法支持这个转变。运营商面临的难题往往在于如 何让用户充分利用这些新业务,在大多数情况下,用户只使用所提供的功能和 服务中的一小部分。原因往往不是他们不需要这些功能,而是依靠电话机所提 供的拙劣接口,用户无法方便快捷地使用这些功能,或者是使用这些功能的成 本太高。固网短信业务推广乏力就是一个很好的证明。另一方面,电话网已发 生了经翻天覆地的变化,交换机从人工到自动、由机电控制到程控、从电路交 换到软交换,技术创新层出不穷。这就突显出一个问题,即电话机终端的发展 滞后于电话网,限制了电话网向更高层次发展,进而影响到电信业务的创新与 ,1 :展。因此,加强电话机的丌发和创新已经成为决定固定电话网发展的重要因 素之一。 电话机终端创新的方向是使其数字化、信息化,以支持数据业务。目前, 固定电话网已经丌展的增值电信业务包括信息服务、语音信箱、可视电话会议 服务,以及来电且示和固网短信业务。前一部分业务主要是语音服务,这些业 务已经开展很久了;而来电显示和固网短信是固网运营商新开展的数据增值业 务,这些业务主要是面向家庭的。可见,固网运营商非常重视面向家庭用户的 增值业务丌发,这就迫切要求家用电话终端尽快实现数字化、信息化。 为了实现家用电话机的智能化、人性化、数字化、信息化,必须把计算机 技术融合到电话机中,这实际上是c t i 技术的一个崭新应用领域。在商业领域, 由于c t i 技术的发展和应用,计算机技术和电话技术的融合得到很好的发展。 而在家居生活领域,融合的过程才刚刚丌始。就目前来看,这种新的电话机存 在许多问题:成本过高、不易操作、可扩展性差等,它的发展遇到很大的阻力。 分析c t i 技术在这两个领域有着截然不同发展的原因,以及如何实现计算机技 术和家用电话的集成是论文将要重点研究的问题。 1 4 论文研究的背景 信息家电嵌入式系统及纽网技术的研究与开发是合肥工业大学承担的 圈家十五攻关计划和安徽省技术创新项目,项日主要进行智能家居系统主体结 构的研究、相关标准的研究与跟踪以及家居服务器的研制。家居服务器是信息 家居的核心设备,是一台具有丰富的软硬件资源的设备,内嵌家庭网关,可以 为每台信息家电提供i n t e r n e t 舶接入, :能为用户提供家政安防、影音播放、 网络浏览等服务。本课题的研究属于信息家电嵌入式系统及组网技术的研究 与开发项目中的一个部分,对智能家居环境中,如何实现电话机的智能化, 以及智能电话技术在未来家居中的应用进行研究;目的是构造家居服务器与电 话机的c t i 接口,实现两者的集成,为用户提供功能丰富的智能电话,并为家 电的远程控制和家政安防报警提供通道。 2 1c t i 的定义 2 1 1c t i 的定义 第二章c t i 技术的研究 c t l 技术从诞生开始,就随着电信技术和计算机技术的发展而不断发展。 传统c t i 技术关注的是如何将计算机智能技术运用到电话的拨打、接听以及管 理中,它处理的仅是语音。而如今的c t i 技术,还要处理其他媒体信息,如传 真、电子邮件和视频数据等,即同时支持语音通信和数据通信。一般认为交互 式语音应答、呼叫中心、客户关系管理、i p 电话、i p 传真、统一消息和电子商 务等均属于c t i 技术的应用l 州。 美国资深专家e d w i nm a r g u l i e s 认为:c t i 是一种将计算机智能结合到处理 电话呼叫和其它复杂呼叫巾的技术。笔者认为这个定义比较贴切,关键要准确 理解“呼叫”的含义。常规的呼叫是指电话拨打和接听。目前通信方式不再局 限于语音,还有传真、电子邮件和视频图像等其他数据通信方式,广义上讲, 这些形式都可以称作为呼叫。具体地,可以这样定义c t i :c t i 是通过软硬件 接口,把电话通信和计算机信息处理集成在一起,旨在把计算机的数据处理、 存储和控制功能综合应用到f u 话通信t l ,实现对语音和数据通信的相互控制和 综合应用1 2 1 1 7 】【8 】l 9 1 。 “c t i ”术语中的c 是指广义的计算机,也就是指可以通过编程来控制 或者监视电话系统的设备。因此这种设备除包括传统的大型机、小型机和个人 电脑外,还包括其他诸如p o c k e tp c 的小型手持设备;但随着个人电脑性能的 增强s u - 靠性的提高,它在c t i 领域中逐渐成为主流的计算机设备。“t ”指电 话终端设备,根据应用场合和规模的不同,具体可以是p b x 和电话语音卡等设 备。 2 1 2 c t i 系统的分类 根据电话终端设备的不同,c t i 系统主要分为两大类:基于板卡的c t i 系 统和基于交换机的c t i 系统。2 0 世纪9 0 年代初期,基于板卡的客户服务系统 逐渐兴起,应用主要集中于语音服务,如电话银行、自动声讯台等。基于板卡 的c t i 系统只能在模拟电话线路上: 作,在绝大多数情况下,这种控制只能完 成普通按键电话机所能够完成的功能。虽然这种解决方案有其局限性,但计算 机化的电话机仍可以提高劳动生产率。例如用户可以在计算机上建立电话号码 簿,并运行相关软件,使计算机能自动发送和接收传真、话音及邮件,或自动 拨号接入远端服务器下载文件。9 0 年代后期,c t i 技术和交换机技术得到很大 发展,大型呼叫中心的建设成为可能。基于交换机的c t i 系统可以直接接入交 换机系统,完成全丽的l 也龋i t , 3 5 叫控制,适合予集成的大型呼叫巾心环境j 。 2 2c t i 的发展 从技术丌放程度看。计算机的发展经历了三个阶段:专有阶段( 软硬件都 不开放) 、丌放的硬件平台( 软件仍为专有系统) 年l i j r - 放的系统( 软硬件都可以 选择不同厂商的产品) 。c t i 系统随着计算机技术的发展同样也经历三个发展阶 段。从2 0 世纪6 0 年代诞生起,c t i 系统处于专有系统阶段,各家的硬件和软 件都不兼容,开发和维护的难度都非常大。发展到8 0 年代末,c t i 系统步入开 放的硬件s r 台阶段,电话系统制造商为软件丌发人员和系统集成商提供统一的 a p i 接口,使应用程序可以独立于特定的电话系统和电话产品而运行,这样减 少了软件开发的工作量。9 0 年代中期,c t i 系统丌始步入完全开放的时代,通 过在第二阶段中丌发出来的a p i 基础上增加额外的标准c t i 协议,可以消除电 话系统制造商在不同操作系统上使用和维护不同的a p i 时所需要做的大量工 作。现在,组建个c ,l 、l 系统就如目买台p c 一样,可以挑选不同的硬件和 软j i t 6i o l 。 2 3 c t l 标准和协议 促使c t i 产业在最近2 0 年快速成长的一个重要原因是标准化。早些时候 c t i 所涉及的标准主要包括c t i 总线标准、接口标准等,而随着c t i 应用领域 的扩大,其所容纳的标准也逐渐:仁富起来。开发c t i 技术标准的国际性组织分 为两类,一类是以电信为基础的,另一类是基于计算机应用的。这些组织主要 研究丌发交换机和计算机、p c 机内部板卡的接口标准,以及应用程序接口( a p i ) 方面的技术规范【1 3 】。 c t i 领域应用最广泛的是各类a p i 接口。利用a p i 接口建立应用程序,可 以在应用层连接不同的系统,给丌发带来极大的方便,在系统升级时能避免重 复投资,降低费用。当前得到广泛认可的a p i 有三种:微软公司t a p i 、n o v e l l 和a t t 的t s a p i 以及s u n 公司的j t a p l l l 4 1 。 2 3 1t s a p i t s a p i 是n o v e l l 与a t & t 合作,f :发的,于1 9 9 2 年发布。由于n o v e l l 公司 在局域网操作系统市场上的统治地位,t s a p i 应用十分广泛,主要任务是将程 控交换机与n e t w a r e 网络集成在一起。因为有a t t 的参与,t s a p i 可以很好 地兼容大部分电话交换机。t s a p l 的一个主要不足是服务器与p b x 的链接必须 山p b x 厂家提供,另外,p b x 厂家可能不为他们所有的p b x 交换机提供t s a p i 驱动。t s a p l 支持所有主流的操作系统,包括各种版本的w i n d o w s 、o s 2 和 u n i x 。由于采用客户月务器结构设计,t s a p i 能够在计算机与电话之间没有物 理连接的情况下1 作1 1 5 1 1 1 。 t s a p i 是最早的语音a p i ,在市场方面也获得过一些成功。然而,由于公 司的经营策略和昂贵的客,o 讷:可赞川,以及n e t w a r e 在网络操作系统的竞争中 失去领先地位,因此它已经失去了发展的动力。 2 3 2t a p i t a p i 是m i c r o s o f t 推出的标准,从1 9 9 3 年公稚t a p i1 0 版,经过1 3 、1 4 、 2 0 、2 1 ,直到w i n d o w s2 0 0 0 推山,t a p i 也更新到3 0 版。t a p i 的目标是用 w i n d o w s 应用程序控制通信设备,如p b x 和m o d e m 。目前,t a p i 已嵌入到 m i c r o s o f t 的各种操作系统中,是w i n d o w s 开放服务结构( w 0 s a ) 的一部分, 可以与其他w i n d o w sa p i 有机地结合起来,构建灵活、强大的应用。t a p i3 0 采用面向c o m 模式的a p i ,允询:用任何语言开发应用程序,如j a v a 、c c + + 和v b 等【 1 。 t a p i 山w i n d w o s t e l e p h o n yd l l ( 电话动态链接库) 和两个标准组成的。 一个标准是s p i ( s e r v i c ep r o v i d e ri n t e r f a c e ) ,此标准发送给那些希望遵从t a p i 的硬件制造商。第二个标准被称为a p i ( a p p l i c a t i o np r o g r a m m i n gi n t e r f a c e ) , 它被发送给编写应用程序的软件丌发商。如果硬件制造商的产品遵从s p i ,就 可以与w i n d o w s t e l e p h o n yd l l 通讯。对于应用程序开发商,如果他们的软件 遵循a p i ,就可以利用w i n d o w st e l e p h o n yd l l 去驱动任何遵从s p i 的电话设 备: 2 3 3j t a p i t a p i 和t s a p i 尽管具有一些媒体控制功能,但侧重的是电话控制。在媒 体控制方面,d i a l o g i c 提出了信号处理系统架构( s c s a ) 方案。1 9 9 5 年,s c s a 被提交给新成立的企业计算机电话论坛( e n t e r p r i s ec o m p u t e rt e l e p h o n y f o r u m , e c t f ) ,e c t f 对s c s a 进行了丌发和改造,将其发展成为一种媒体控制a p i 标准,称为s 1 0 0 ,于1 9 9 6 年发枷。媒体控制a p i 的主要应用领域是建立基于 p c 机的媒体处理系统。在此基础上又推出了不同应用之间进行s 1 0 0 业务通信 的协议标准s 2 0 0 和对系统资源的控制的协议标准s 3 0 0 ,服务器管理一级的 m 1 0 0 、m 1 1 0 、m 5 0 0 和m 5 1 0 协协议。 j t a p i 是美国s u n 公司推出的。j t a p i1 0 版本于1 9 9 6 年1 0 月公布,在i b m 的参与下于1 9 9 7 年1 月和1 9 9 8 年2 月又推出了1 1 和1 2 版本。之后,s u n 和e c t f 结成战略伙伴,e c t f 组纵了j t a p l ,l :发组,领导j t a p i 的开发工作, 开发了j t a p i1 3 版。可以说j t a p i 是s u n 、m i c r o s y s t e m s ,l u c n e t ,n o r t e l , n o v e l l ,i n t e l 和i b m 的联合,r 发成果。j t a p i 基于s 4 1 0 ,可以看作是s 1 0 0 的 j a v a 版本。 j t a p i 是基于j a v a 语言的应用程序接口,本质上是一套可重用的语音呼叫 控制对象,它能在一些基于j a v a 的l 乜话应用中使用,而这些电话应用能够运行 在任何带有j a v a 虚拟机和j t a p i 电话子系统的计算机上。正是由于j t a p i 基于 j a v a 的特性,使得j t a p i 对缘独立于任何操作系统和硬件平台,从而支持跨平 台的应用。 2 3 4 比较 t s a p i 是交换机集成的标准,主要用于l a n 和采用n o v e l ln e t w a r e 的电话 交换,比较适合于运行在n e t w a r e 网络环境中。t a p i 是桌面集成方案的标准, 主要用于控制桌面通信设备( 如m o d e m ) ,适合于在计算机与电话之间建立直 接的连接的场合。j t a p l 的出现比t a p i 还要晚,在某些方面比t a p i 更加稳定, 其优越性胜过t a p i 和t s a p i ,它本质上是一套可重用的语音呼叫控制对象, 支持跨平台的应用,能与其他的a p i ,诸如t a p i 、t s a p i 等一起工作来处理语 音。 2 4 语音处理技术 c t i 技术跨越计算机技术和通信技术两大领域,涉及的内容很多,c t i 系 统所采用的核心技术也在不断变化。传统的核心技术有交换机排队机、呼叫 处理、数字脉冲识别等。而随着技术的发展和应用的拓展,一些新的技术也积 极融入c t i 的应用,如:语音处理、图像处理等。 语音处理中的关键技术是语音 : 别( a s r ) 和语音合成( t t s ) 。语音识别 技术,是指将人说话的语音信号转换为可被计算机程序所识别的文字信息的技 8 - 术。目前关于中文语音识别的研制和丌发的厂商有:s p e e c h w o r k s 、n u a n c e 、 p h i l i d s 、m i c m s o f t 、i b m 、中科模式识别、天朗、安可尔通信、声硕科技等。 而语音合成技术,是指将任意文本实时转换为自然语音的一项技术,它涉及声 学、语言学、数字信号处理技术、多媒体技术等多个学科,是信息处理领域的 一项前沿技术。目前致力于语音合成的研发的厂商有:i b m 、m i c r o s o f t 、i n f o t a l k 、 捷通华声、炎黄新星、科大讯飞等睇j 。 2 4 1 语音识别技术 1 a s r 的发展 语音识别的研究工作_ 丌始于2 0 世纪5 0 年代,当时贝尔实验室实现了第一 个可识别十个英文数字的系统a u d r y 。6 0 年代,计算机的应用推动了语音 识别的发展,这时期的重要成果是提出了动态规划( d p ) 和线性预测分析技术 ( l p ) 。7 0 年代,语音识别领域取得了突破。在理论上,l p 技术得到进一步发 展,动态时划归整技术( d t w ) 基本成熟,特别是提出了矢量量化( v q ) 和 隐马尔可夫模型( h m m ) 理论。在实践上,实现了基于线性预测倒谱和d t w 技术的特定人孤立语音识别系统。8 0 年代,语音识别研究进一步走向深入,其 显著特征是h m m 模型和人工神经元网络( a n n ) 在语音识别中的成功应用。 进入9 0 年代,随着多媒体时代的来i | i i ,语音识别系统从实验室走向实用【1 9 l 。 2 a s r 识别算法 计算机语音识别是一个模式识别匹配的过程。在识别前,首先要对语音信 号进行分析,并抽取所需的特征,根据人的语音特点建立语音识别模型库。计 算机在识别过程中要根据语音识别的整体模型,将计算机中存放的语音模板与 输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最 优的与输入的语音匹配的模板。然后,据此模板的定义,通过查表就可以给出 计算机的识别结果。这种最优的结果与特征的选择、语音模型的好坏、模板是 否准确等都有直接的关系。其次,模板训练的好坏也直接关系到语音识别系统 识别率的高低。为了得到一个好的模板,往往需要用大量的原始语音数据训练 语音模型【2 0 】。 一个典型语音识别系统的处理过程如图2 4 1 所示。 图2 4 ,1 语音识别的流程 h 前,主要的语音彭 别算法有:基于a n n 的训练雨i 识别算法、基于d t w 的识别算法及基于统计的t m m 训练和识别算法。基于a n n 的训练识别算法 山于实现起来较复杂,儿识别率,i :1 i 比丛予统计的语音识别模型好,因此,这 种算法目前仍处于实验室研究阶段。基于d t w 是目前最为小巧的语音识别算 法,其系统开销小,识别速度快,在小词汇量的语音命令控制系统中是一种非 常有效的算法。基于统计的h m m 算法是目前最为成功的一种语音识别算法。 几乎所有性能优良的连续语音识别系统均采用这种模型。 3 a s r 系统的分类 根据着眼点的不同,a s r 系统的分类见表2 4 i 。 表2 4 1a s r 系统的分类 分类方式对说话人敏感程度识别词汇量发音方式识别模式 1 命令识别 1 特定人系统1 小词汇量1 孤立发音2 关键词检测 分类2 一f f :特定人系统2 中词汇簧2 连续发音3 语言理解 3 说话人白适应系统3 火词汇量3 口语化语音4 文字记录 5 语音翻泽 按对说活人敏感程度进行分类足最常用的方法。s d ( s p e a k e rd e p e n d e n t , 特定人语音识别) 需要说话人训练语音识别模板,最大的优势是识别率高、通 过重新训练可以适应各种不同的声学环境。s j ( s p e a k e ri n d e p e n d e n t ,非特定人 语音识别) 无需用户训练,它的识别依赖于事先已经采集制作好了的语音模板, 因此它的局限性较大,不管是在语言上,还是在词汇量上,都受到一定限制, 但用户使用方便。s i 需要花费很大的人力和财力完成数据的采集、试验和模型 的建立。另外在p c 平台上的大词汇量语音识别,通过少量语音的自适应识别 达到特定人的效果,说话人自适应识别系统最具有优势。目前的许多语音识别 软件,是基于标准的发音来进行识别的;而实际上人们说话千差万别,发音也 各不相同,特别对于有地方口音的语音来说,更是对语音识别软件提出了严峻 的挑战。 4 声纹识别技术 1 9 6 2 年,美国贝尔实验的k e r s t a 博士首先提出了声纹( v o i c e p r i n t ) 的概 念。声纹以别( v o i c e p r i n tr e c o g n i t i o n ) 是a s r 技术的一个分支,是一种能通过 # 0 话者的声音特 i ,辨别“l j e 身份智能生物谚 别技术。每个人的语音声学特 征既有相对稳定性,又有变异性,刁i 是绝对的、一成不变的。这种变异可来自 生理、心理、模拟、伪装,也与环境于扰有关。但在一般情况下,声纹的鉴定 仍能区别不同的人或确定是否是同一人的声音,从而可以进行个人身份识别。 声纹识别有两方面应用: 说话人辨认( s p e a k e r i d e n t i f i c a t i o n ) 用以判断某段语音是若干人中的哪一个所说的说话人确认,即辨别某 一段声音样本和样本集c l l 的哪个匹配。 说话人确认( s p e a k e r v e r i f i c a t i o n ) 用以确认某段语音是否是指定的某个人所说的,即判断每个声音样本是 否和指定的样本匹配。这种应用可用于身份验证。 随着i v r 在余融交易系统( 如电话银行系统、电话证券委托系统) 中使用 得越来越广泛,系统的安全性受到业界人士的关注。传统的d t m f 密码输入方 式的安全性越来越受到了银行及证券业者的质疑。随着语音识别技术的发展, 业内一些厂商丌始在北美地区首先推广d t m f 与声纹识别并用的身份校验机 制来保证系统的安全性,代表厂商如s p e e c h w o r k s ,但是这些厂商的声纹识别 软件价格十分昂贵。 语音身份认证系统一般集成了声纹识别身份认证技术和语音识别技术,通 过一个语音对话系统与用户交流,在人机语音对答的过程中在后台进行用户的 身份认证。在进行身份认证的过程巾用来进行判定的信息有两种:一种是用户 的声纹特征,另一种是用户的资料信息,即系统可能会提问一些用户注册过的 个人资料,进一步确保登录者确是声称的用户。 2 4 2 语音合成技术 1 t t s 的发展 2 0 世纪6 0 年代,英语t t s 系统研制成功。8 0 年代,我国开始了汉语语音 合成领域的研究。中科院声学所首先玎展汉语合成的研究,之后,社科院语言 所、清华大学、中国科技大学、北方交通大学等单位陆续开展了对汉语语音合 成的研究;同时,台湾交通大学、台湾大学和国际上的贝尔实验室也研制了汉 语语音合成系统。目前语音合成技术已走向实用。 2 t t s 系统处理流程 t t s 系统的处理流程如图2 4 2 所示。 1 ) 语高学处理 语音学处理在t t s 系统小起着重要的作用,主要模拟人对自然语言的 理解过程文本规整、词的切分、语法分析和语义分析,使计算机对输 入的文本能完全理解,并给山后两部分所需要的各种发音提示。 2 ) 韵律处理 为合成语音规划出音段特征。如音高、音长和音强等,使合成语音能正 确表达语意,听起来更加自然。 3 ) 声学处理 根据前两部分处理结果的要求输出语音,即合成语音。 图2 4 2t t s 的处理流程 3 t t s 系统的分类 语音合成技术主要有两种类型: 1 1 基于规则的合成 主要是计算模型参数的轨迹,形成规则,完成语音的参数合成。常用的 参数有: 发音器官参数语音合成这利,方法对人的发音过程进行直接模拟, 占定义了唇、舌、声带的棚关参数,山这些发音参数估计声道截面 积函数,进而计算声波。 声道模型参数语音合成它基于声道截面积函数或声道谐振特性 合成语音,如共振峰、l p c 、l s p 等参数合成器。这类合成器的比 特率低,音质适中,易于实现韵律修改。 2 ) 拼接语音合成技术 它的基本思想是存储语音的基元,合成时读取基元、拼接、韵律修饰。 拼接语音合成直接把语音基元棚互拼接在一起,输出连续语流。这些语音 基元取自自然语音的词或句子,它隐含了声调、重音、发音速度变化时的 细微特性,合成的语音消晰自然,其质量普遍高于规则合成,但韵律参数 修改范围受限。 近年来,规则合成逐渐转向拼接合成。其原因是语音基元的存储不再受限, 某些声音如呼吸或爆破音很难由规则合成实现。特别是2 0 世纪8 0 年代末, e m o u l i n e s 和e c h a r p e n t i e r 提出了基于波形修改的语音合成算法p s o l a ,使拼 接合成得到很大的发展与广泛的应j 。 4 主要应用 t t s 技术主要应用在以下两个方面: 1 ) 电子文档的有声输山 t t s 技术可以将计算机中存有的文本数据转换成语音输出,弥补屏幕 显示的不足。把声音和文字、图像集成在一起,增强了人们的理解和阅读 兴趣,使人与计算机之州的交流变德“亲切”和“友好”。 2 ) 信息查询系统 在信息咨询、电话银行等交互式语音应答系统中,系统根据用户的输 入信息从数据库中提取数据,交给t t s 转换成语音播放给用户听。 2 5c t i 技术的应用 c t i 技术内容十分j 一泛,主要的应用形式有:客户关系管理( c r m ) 、统 一消息、i p 电话、i p 传真、交互式语音应答( i v r ) 、呼叫中心( 客户服务中心) 等。 2 5 1 户关系管理 c r m 从结构上说是一套智能化的信息处理系统,从功能上说是将企业的经 营、管理导向“以客户为中心”的一套管理和决策方法。一个完整的c r m ,不 仅包含了一个现代化的网络呼叫一i ,心( 基于p s t n 、i n t e r n e t 和无线接入) 的全 部功能,而且还包括了把前台系统( 前台数据信息收集系统不仅仅是呼叫中心, 也可以是电信行业的计费系统、网络的管理系统及银行的结算系统等) 收集来 的信息和数据进行存储、加工、分析和整理功能。这一部分人们习惯上把它叫 做数据挖掘,即对海量的数据进行研究,发现它们蕴含的规律,并运用人工智 能的各种优化算法建立数学模型,经过计算获得若干对企业决策( 尤其是高层 决策) 有用的数据1 7 j 。 2 5 2 统一消息服务 统一消息服务( u m s ,u n i f i e dm e s s a g i n gs e r v i c e ) 是2 0 世纪9 0 年代中期 提出的一种信息服务技术,它把人们以前通过电话网、寻呼网、移动网和互联 网接收的各种信息融合进接收箱( i n b o x ) 作统一的管理。简单地说,把统一消 息系统看作一一个整合的信箱,它可以存储或转发来自不同终端的各种类型的信 息,如语音、电子邮件、传真、短消息、即时消息( i n s t a n tm e s s a g e ) 等,用户 可以随时随地通过台式p c 、电话或笔记本电脑访问该接收盒中的消息,而且仅 需要一条线路即可完成。从技术上看,u m s 系统要解决的关键问题包括:各种 格式信息的有效存储和管理,各种类型信息之问的转换等。其实现依赖于相关 计算机软硬件技术和通信、网络技术的融合,涉及包括数据库、语音处理技术 等在内的多项技术【2 2 】。 2 5 3 i p 电话 自从1 9 9 5 年以色列v o c a l t e c 公司丌发出可以通过i n t e r n e t 打长途电话的软 件i n t e m e t p h o n e 以来,i p 电话取得了巨大发展,已经融合了分组语音

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论