(通信与信息系统专业论文)amg设备上分组语音处理模块的硬件设计与实现.pdf_第1页
(通信与信息系统专业论文)amg设备上分组语音处理模块的硬件设计与实现.pdf_第2页
(通信与信息系统专业论文)amg设备上分组语音处理模块的硬件设计与实现.pdf_第3页
(通信与信息系统专业论文)amg设备上分组语音处理模块的硬件设计与实现.pdf_第4页
(通信与信息系统专业论文)amg设备上分组语音处理模块的硬件设计与实现.pdf_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

电子科技大学硕士学位论文 摘要 v o l p 技术在近几年内得到了前所未有的迅猛发展,不少电信运营商纷纷上 马v o l p 项目,利用i p 网的开放便捷还有廉价,将传统语音承载在i p 网上。在 v o l p 实现方案中,接入媒体网关( a m g ) 扮演了非常重要的角色,它实现p s t n 到i p 的数据格式的转换,交换信令和协议的转换,实现系统控制等。本课题来 自港湾网络研发部横向项目接入媒体网关s y s 6 k 。 s y s 6 k 是一体化机架式设备,由分组语音处理模块p v m 和主控板a m u 及 模拟用户板a l u 配合完成语音接入、编解码及分组打包,再由1 0 0 m 网口接入 到上行汇聚设备或i p 网络中。分组语音处理模块p v m 是主控板a m u 上的一个 功能性可选配模块。 本文主要完成分组语音处理模块p v m 的硬件设计与实现。首先对v o i p 所 涉及的关键技术做了简单介绍,虽然在实际设计中对电路的考究多过对相关协议 的考究,但作为方案设计,芯片选型必不可缺的相关参数还是预先做了些考察。 然后,从总体方案设计到主要芯片选型,再到相关电路设计,单板结构设计,印 制板布局布线设计,一纸方案转化成了可兼容应用于多个媒体网关设备的分组语 音处理模块。重点对完成语音编解码和分组打包的核心芯片做了详细的分析,最 后,还对产品硬件驱动过程和实际调测信号质量作了较为仔细的分析,为进一步 提高产品稳定性掌握了第一手资料。 由于知识产权的原因,具体的电路原理图及p c b 工艺图纸不能在论文中做 完整的描述,但是论文中已较为仔细的叙述了单板功能模块的实现理论和实践应 用。 关键词v o l p 接入媒体网关分组语音处理 电子科技大学硕士学位论文 a b s t r a c t t h e r eh a sb e e nu n p r e c e d e n t e dp r o g r e s si nv o i pt e c h n o l o g i e si nr e c e n ty e a r s ,a n d m a n yt e l e c o m s e r v i c ep r o v i d e r sh a v ei n v e s t i g a t e di np r o j e c t sr e l a t e dw i t hv o i p t e c h n o l o g i e s t h e i rp u r p o s ei st ot r a n s m i tt r a d i t i o n a la n a l o gv o i c es i g n a l sv i ac u r r e n t i p c e n t r i cn e t w o r k s ,b e c a u s eo ft h ec o n v e n i e n c ea n dl o w - c o s to fi p - c e n t r i cn e t w o r k s a m o n g t h em a j o r i t yo ft h e i ri m p l e m e n t a t i o n ,m e d i aa c c e s sg a t e w a y ( a m g ) p l a y sa v e r yi m p o r t a n tr o l e i tt r a n s f o r m st h ep s t n d a t af l a m ef o r m a ti n t oi pp a c k e tf o r m a t , a n di ta l s ot r a n s l a t et h es w i t c hs i g n a l i n ga n dp r o t o c o l s ,t h ep r o j e c td e s c r i b e di nt h i s p a p e ro r i g i n a t e sf r o m ar e s e a r c hp r o j e c t a m gs y s 6 k ”f r o mh a r b o u rn e t w o r k si n c s y s 6 k i m p l e m e n t st h ep a c k e tv o i c ep r o c e s s i n gm o d u l e ( p v m ) ,a c c e s sm a n a g e m f i t ( a m u ) a n da n a l o gl i n eu n i t ( a l u ) t op r o v i d ec o m m o nt e l e p h o n es e r v i c ea c c e s s , v o i c ec o d i n g d e c o d i n ga n dp a c k e t f r a m i n g ,a n d c o l m e c tt o u p l i n kc o n v e r g e n c e d e v i c e so rt h ei p c e n t r i cn e t w o r k sv i al o o ml a n p o r t s p v mi sa i ro p t i o n a lf l m c t i o n m o d u l el o c a t e di na m u t h i sp a p e rf o c u s e so nt h eh a r d w a r ed e s i g na n di m p l e m e n t a t i o no ft h ep a c k e t v o i c ep r o c e s s i n gm o d u l e ( p v m ) w i t h i ns y s 6 k ab r i e fi n t r o d u c t i o no nv o l pc o r e t e c h n o l o g i e sh a sb e e np r e s e n t e d a l t h o u g hm o r ee m p h a s i s i sp u to nt h ec i r c u i td e s i g n r a t h e rt h a nt h er e l a t e dv o i pp r o t o c o l s ,as u r v e yo nt h ep a r a m e t e r sr e l a t e dw i t hc h i p s e l e c t i o nh a sb e e nc o n d u c t e d t h ed e s i g ni nd e t a i li n c l u d e so v e r a l lp r o j e c td e s i g n , c h i ps e l e c t i o n ,r e l a t e dc i r c u i td e s i g n ,b o a r ds t r u c t u r ed e s i g n ,p c bl a y o u td e s i g n ,e t c t h i s p a p e r c o n c e n t r a t e s0 1 2t h ed e t a i l e d a n a l y s i s o nt h ec o r e c h i p s f o rv o i c e c o d i n g d e c o d i n ga n dp a c k e tf r a m i n g m o r e o v e r , a na n a l y s i si nd e t a i lo n t h eh a r d w a r e d r i v e rp r o g r a ma n dt h eq u a l i t yo f t h ea c t u a l l yt e s t e ds i g n a l sh a sb e e nc o n d u c t e d d u et o i n t e l l i g e n c ep r o p e r t i e s ,t h ec i r c u i td e s i g na n dp c bl a y o u tw i l ln o tb e d e s c r i b e di nf u r t h e rd e t a i l sh e r ei nt h i sp a p e r , h o w e v e r , d e t a i l e dd e s c r i p t i o no nt h e i m p l e m e n t a t i o n t h e o r i e sa n d p r a c t i c a la p p l i c a t i o no f t h eb o a r dh a v eb e e nd i s c u s s e di n t h i sp a p e r k e yw o r d s :p a c k e tv o i c ep r o c e s s i n g a c c e s sm e d i a g a t e w a yp a c k e tv o i c e p r o c e s s i n g i l 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名:毒孚l 日期:2 0 0 4 年6 月5 日 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:啦导师签名:垂坶 日期:2 0 0 4 年6 月5 日 电子科技大学硕士学位论文 a m g c o d e c e c f e f o i p m i i p c b p v m r t p r t c p t d m v a d c n g v b i p s p i c e b u s s p i c e b r j d g e 缩略语 a c c e s sm e d i a g a t e w a y c o d ea n dd e c o d e e c h oc a n c e l l e r f a s te t h e r n e t f a xo v e ri p m e d i m n i n d e p e n d e n t i n t e r f a c e p r i n t e dc i r c u i tb o a r d p a c k e t v o i c e p r o c e s s i n g m o d u l e r e a l t i m et r a n s f e rp r o t o c o l r e a l t i m et r a n s f e rc o n t r o lp r o t o c o i t i m ed i v i s i o n m u l t i p l e x v o i c e a c t i v i t y d e t e c t c o m f o r tn o i s eg e n e r a t e v o i c eo v e ri p v i 接入媒体网关 编解码 静音消除器 快速以太网 因特网承载传真 媒体独立接口 印刷电路板 分组语音处理模块 实时传输协议 实时传输控制协议 时分复用 静音检测 舒适噪音生成 因特网承载语音 s p i c e 总线 s p i c e 桥接 电子科技大学硕士学位论文 1 1 课题背景 第一章引言 近几年来,以语音、多媒体网络与数据通信网络相融合、分层控制及i p 承 载为代表特征的下一代网络( n g n ) 正在悄然向我们走来,在此基础上展开的 对宽带接入、软交换、3 g 、综合传输、i p 视频艚音、多媒体业务承载等的研究 己经成为当前最热门的课题,也成为了国内外各大电信厂商竞争的焦点,为了构 筑一个统一的,高效的,低成本,提供综合业务的网络,越来越多的运营商正纷 纷开始着手营建n g n 。 作为n g n 网络的接入层面,接入媒体网关在现阶段的网络建设中占据着重 要的位置。在中华人民共和国通信行业标准y d t 1 2 4 3 3 2 0 0 2 ( ( 媒体网关设备 技术要求综合接入媒体网关) ) 中有定义如下:i a m g ( i n t e g r a t e d a c c e s s m e d i a g a t e w a y ) 为各种用户提供多种类型的业务接入,如:模拟用户接入、i s d n 接 入、v 5 接入、x d s l 接入、l a n 接入等,并至少接入到i p 网或a t m 网。自从 i p 长途揭开了i p 融合的序幕,人们正将i p 融合技术引入网络的边缘接入层、用 户终端,最终将逐步取代只能提供单一语音业务的传统电话网络。将各种业务融 合到一个全i p 的平台上,不仅可以大幅度降低网络成本,更将推动社会的信息 化进程。i p 网络平台将提供无比的灵活性;提供面向现在和未来的开放式接口; 提供最快捷、最新颖的业务。这就是接入媒体网关带来的全新的接入理念。 提到接入媒体网关,不能不提到v o l p 技术。随着现代微电子技术的发展, 处理能力更强、容量更大、集成度更高的各类c p u 、数字信号处理器、存储器 及各种高性能专用集成芯片不断涌现,使电信网络部件实现技术更新已经成为了 可能。高效利用资源,节约长途费用,合理利用基础设施和开放的i p 网络开发 新业务这些诱人的因素都推动着企业、i s p 以及电信网络开始通过因特网协 议( i p ) 或以太网分组网络来传输时分多路复用( t d m ) 的语音和数据业务,即 v o l p f o i p 。就原理上,即以i p 分组交换网络为传输平台,对模拟的语音信号进 行压缩、打包等一系列的特殊处理,并采用无连接的u d p 协议进行传输,再进 行解压缩解码等恢复为模拟语音。即语音数据i p 包传送数据 语音的v o i p 模型结构。对于运营商而言,如何利用现有的正在快速发展中 的宽带网络来发展综合性的语音、视频和数据服务;利用有效的技术手段解决业 务质量问题;利用网络带宽来进一步降低电话资费、扩大客户群并提升综合性业 务收入,已成为运营商现阶段最为关心和迫切需要解决的课题。语音作为人们的 电子科投大学硕士学位论文 基本通信需求,分组化语音的研究是其中最根本也是最重要的一个方面。本课题 f 着眼于此。 1 2 研究目标 本课题来源于港湾网络有限公司综合接入媒体网关产品s y s 6 k 上的分组语 音处理模块p v m 。 本课题的最终目标是设计实现可与主控设备相配合的分组语音处理模块,可 应用于多个综合接入和中继网关设备,降低原有分组语音处理模块的成本,增大 系统处理容量,并且完成软硬件调试及硬件测试,可转量产并批量销售。 第二章分组语音处理关键技术分析 v o l p 技术当前的主要应用是在连接p s t n 和i p 网的媒体网关中,其分组语 音处理的典型应用层次如图2 。1 , 在c p u 或f p g a 中实现 在i ) s p 中实现 图2 - 1v 0 i p 典型应用层次 在s y s 6 k 的系统设计中,t d m 接口和i p 接口均由主控板a m u 提供,故 分组语音处理模块p v m 的功能主要是实现语音编解码和数据打包的功能。因为 牵涉到芯片选型,性能设计等因素,这里对分组语音处理的关键技术做一些分析, 其中信令部分的技术和实现更多的在主控板的软件部分,这里仅对媒体处理方面 的技术做个简要分析。 国际上研究i p 多媒体网络技术的有两大体系:i t u t 和i e t f ,此外还有r f c 论坛也发展了许多i p 通信的协议。目前,v o i p 的标准主要有国际电信联盟技术 部( i t u t ) 建议的h 3 2 3 系统和i e t f 建议的会话发起协议( s e s s i o ni n i t i a t i o n p r o t o c o l ,s i p ) 系统两种。前者主要在电信网络上实现多媒体业务制订,技术已 趋成熟,后者基于动态的i n t e r n e t 模式建网,是基于软交换技术的面向网络会议 和电话的简单信令协议。二者各有所长。两个协议体系中使用的媒体流传输协议 电子科技大学硕士学位论文 及媒体处理是一致的。在我国主要以i t u t 的h 3 2 3 为实现v o i p 的标准。 v o i p 技术就原理而言,即以i p 分组交换网络为传输平台,对模拟的语音信 号进行压缩、打包等一系列的特殊处理,并采用无连接的u d p 协议进行传输, 再进行解压缩解码等恢复为模拟语音。采用u d p 协议在i p 网上的传输,不可能 象p s t n 那样为用户提供专门的端到端的电路连接,网络带宽为用户共享,这样 带来了较高的带宽利用率,但是,其“不保证可达”也增加了数据包的丢失概率, 而且共享资源的用户数、申请的带宽、网络路由及传输能力的变化,都有可能会 造成数据包的传输延迟、抖动和丢包现象,直接影响通话质量。因此,目前的分 组网无法提供服务质量( q o s ) 保证,而只能提供有等级的、非高品质的语音服 务。所以,分组语音处理技术除了解决分组语音的传输可达性,很大程度上是为 提高通话质量而产生的。 目前对i p 电话业务语音质量评分的评价主要有三种模型:m o s 模型、p s q m 模型和e 模型。国标中对接入网关的q o s 质量评价分为主观评定和客观评定, 即m o s 模型和p s q m 模型。 m o s 是i t u t 建议p 8 3 0 描述的种对语音的主观评定方法一m o s ( m e a n o p i n i o ns c o l e ) 方法。根据p 8 3 0 建议的要求,特定的发话者与听话者在特定的 环境下,通过收集测试者在各种不同情景下的主观感受,根据p 8 3 0 的分析法则 得出该语音的品质。p 8 3 0 对测试的要求非常严格,所有的操作都要严格地服从 操作流程,对录音系统、语音采样、语音输入级别、听者级别、差错处理、不同 语音编码方式的兼容性、过失、环境噪音、音乐等等,都作出了详细严格的规定。 测试者的主观感受结果也被分为很多不同的范畴,如听者感受的网络质量结果、 质量降级结果、比较结果等。对于相应的质量得分的描述主要是:5 分,优秀,压 缩过程难以觉察;4 分,好,略有觉察,无伤大雅:3 分,一般,略感不适;2 分,较差,令人不适:1 分,差,无法忍受。 p s q m 是i t u t 在r 8 6 1 中建议的p s q m ( p e r c e p t u a ls p e e c hq u a l i t y m e a s u r e m e n t ) 方法,用来作为客观质量度量的评估。p s q m 的客观性是指模仿现 实生活中主观声音,选择符合条件的基准信号源进行客观和主观的双向比较,得 出评定结果。p s q m 仍以m o s 的5 个级别作为客观标准,所不同的是其对每一 个级别都以百分比的方式作出了差最差和好最好的进一步描述。 2 1 语音压缩编解码技术 对于语音处理,第一步也是关键的步即为语音的压缩和编码,编解码算法 和压缩技术直接影响到v o l p 业务的语音质量。语音的编码及压缩过程在网关中 电子科技大学硕士学位论文 完成,这个过程需要经过专门的d s p 芯片进行数据压缩,最后再形成i p 数据包, 送到i p 网络上传输。 根据语音信号的不同特征,语音编码通常可以分为波形编码和参数编码。语 音编码按比特速率又有高速编码,中速编码和低速编码之分。 s p e e c h q u a l i t y b i t r 船 ( k b i t s s ) 图2 - 2 编解码器的对比 已经用到的几种语音编解码器是: a ) 波形编解码器( w a v e f o r mc o d e r ) :不利用生成话音的信号任何信息,将 话音视为一种普通的声音,直接对波形信号进行采样和量化,再编码。例如脉冲 编码调制p c m 、差分脉冲编码调制d p c m 、自适应脉冲编码调制a d p c m 等。 波形编码不适于低速话音编码,一般属于中高速编码。 b ) 音源编解码器( s o u r c ec o d e r ) :也叫参数编译码器,从话音波形信号中 提取生成话音的参数,使用这些参数通过话音生成模型重构出话音,参数编码一 般属于中低速编码。 c ) 混合编解码器( h y b r i dc o d e r ) :综合使用上述两种技术,使用的激励信 号波形尽可能接近于原始话音信号的波形。图2 2 给出了三种编解码器的对比。 i p 电话网关的一个最主要性能指标是它的处理密度( 即能同时处理的话路 数) ,而i p 电话网关的处理密度主要取决于它所使用的语音编解码器处理一帧 数掘的延迟大小。i t u t 在g 系列建议中对语音编码技术进行了标准化,已经公 布了一系列语音编码协议。这些协议采用不同的算法,具有不同的速率。较高速 率的编码协议对话音质量较易保证,但占用网络资源较大;较低速率的编码协议 对话音质量较难保证,但占用网络资源小。在i t u t 的g 系列中,音频压缩编 码标准主要有g 7 1 1 ,g 7 2 3 ,g 7 2 9 等。 4 电子科技大学硕士学位论文 g 7 1 1 ,规定了速率为4 8 k b p s 、5 6 k b p s 和6 4 k b p s 的晋通电话的晋频,米用 脉冲编码调制( p c m ) 。p c m 编码的方法是对语音信号进行采样,然后对每个样 值进行量化编码。g 7 1 1 的采样速率为8 k h z ,每个样值用8 b i t 非线性编码,总 速率为6 4 k b i t s 。编码方式分为u 律和a 律, f ( x ) :s g n ( x ) 黜,1 0 0 5 0 0 , ( 1 ) f 一( x ) = s x ) 五粉, ( 1 ) f “( x ) = s g n ( x ) 热, o i x i 士, ( 2 ) f 一( x ) = s s n ( x ) 三 ;:譬j ! ,去i x i , 。, u 律主要用在北美和日本等地区的数字电话通信中,我国和欧洲主要采用a 律。 2 1 2g 7 2 3 g 7 2 3 ,规定了速率为5 3 k b p s 到6 。4 k h z 的音频,其话音质量接近于普通 电话,采用声码器技术( v o c o d e r ) ,通过模拟人的发声器官,提取模型参数来降 低话音信息编码率。压缩编码采用代数码激励线性预测编码( a c e l p ) 。a c e l p 是a l g e b r a i cc o d ee x c i t e dl i n e a rp r e d i c t i o n 的缩写,代数激励码是码激励线性预 测( c e l p ) 的一种简化形式,采用+ 1 或1 作为激励矢量中的激励样值。g 7 2 3 1 采用5 2 7 k b i t s 和6 3 k b i t s 两种速率,其中5 2 7 k b i t s 速率就是以a c e l p 算 法为基础 ( 3 7 2 9 ,规定了速率为8 k b p s 的语音编码器的音频,压缩编码采用对生结构 代数码激励线性预测c s a c e l p ( c o n j u g a t es t r u c t u r e d - a l g e b r a i c c o d ee x c i t e d l i n e a rp r e d i c t i v e ) 。c s a c e l p 在标准p c m 或线性p c m 的话音采样基础上,每 1 0 m s 生成一个1 0 字节长的话音帧。这个算法提供了优秀音质,且延时很小。 c s a c e l p 也是为先进的定点运算数字信号处理器设计的,因为它要求强大的 运算处理能力。h 3 2 3 标准首选语音编码器是i t u - tg 7 2 9 a 。g 7 2 9 a 是g 7 2 9 的简化版本,它可将经过采样的6 4 k b s 话音以几乎不失真的质量压缩至8 k b s , 有很高的语音质量。但是,该编码器的算法复杂,一帧语音的处理延迟较大,在 电子科技大学硕士学位论文 很大程度上影响i p 电话网关的处理密度。 表2 1 给出了各种语音编码算法的比较。i t u - t 统- n 定了编码压缩方法并 标准化,其压缩能力由d s p 的处理能力决定,这也决定了编解码器硬件的成本 和功耗,也必然会影响到编解码器的实时性。在实际选择压缩算法时,要综合考 虑各种因素。例如,高比特率可以保证良好的话音品质,但要占用大量的存储空 间,耗费更多的系统资源;而过低的比特率又会影响话音的品质和增加延迟。所 以,在较低比特率的前提下,保持较好的话音质量,是选择压缩算法的原则。 从互通往角度考虑,i p 电话网关对其它编码协议也应该全部支持或部分支 持。特别是对于g 7 2 9 g 7 2 9 a ,由于其编码速率较低,而且编码时延较g 7 2 3 1 小,因此建议i p 电话网中给予支持。为保证一定的通话质量,网关必须设有输 入缓冲,以尽可能地消除时延抖动对通话质量的影响。另外,网关应该具有语音 编码的动态转换功能,即网关设备能够自动地在较高速率的语音编码和较低速率 的语音编码之间转换。当网络拥塞时可以由高码速转换到低码速,当网络条件较 好时可以由低码速转换到高码速以提高语音质量。语音编码的动态转换是网关设 备在i p 电话q o s 管理方面的一个重要功能。 表2 - 1 语音编码算法比较 算法 名称数据速率标准应用质量 p c m均匀量化 公 波 _ l :| j u ( a )u ( a )6 4 k b s g 7 1 1 嘲 形 a p c m自适应量化 罚 d p c m差值量化一 呈4 0 编 , 4 5 a d p c m 自适应差值量化 3 2 k b sg 7 2 1 里码 子带自适应差值 6 4 k b sg 7 2 2 日 s b a d p c m 量化 5 3 k b s ,6 3 k b sg 7 2 3 参数 保密2 5 , l p c线形2 4 k b s 编码话音 3 5 c e l p c码激励l p c4 8 k b s 移动 混 通信 合 v s e l p c矢量和激励l p c8 k b s 语音 编 邮件 3 7 4 0 r p e l 1 、p- 民时 】3 2 k b si s d n 码 g 7 2 8 , l d c e l p低延时码激励1 6 k b s g 7 2 9 m p e g1 2 8 k b sc d5 o a c 3 感知编码音响 5 o 电子科技大学硕士学位论文 2 2 静音压缩技术( v a d c n g ) 人在打电话的时候,话音总是有停顿的,停顿的时间主要是由于正在昕对方 说话,或是由于思考,稍事休息等原因引起的一段话之间的停顿,或是说话中的 停顿。第一种情况下停顿间隙长,出现频率低;第三种情况停顿间隙短,出现频 率离;第二种情况界于一、三种情况之间。语音源的这种特性叫做丌关特性,有 时也叫话音静默特性。根据传统电话业务的统计,一方用户实际占用通话信道 的时间不会超过整个通话时间的4 0 。在电路交换中,不管打电话的人说话多少, 都要固定占用6 4 k b i t s 的带宽,在分组交换中,不说话时就不发包,这样可以节 省大量的网络带宽,这正是分组语音交换的优势所在。 实现静音压缩的两个关键技术是语音活动检测( v a d ) 和舒适噪音生成 ( c n g ) 。 静音检测( v a d ) ,即判断话音信号能量,当低于一定门限时就认为是静默 状态。v a d 如果检测到话音,则以正常的编码发送出去;如果检测到静音,则 通过s i d ( 静音指示) 通知对方。静音抑制可以节省带宽资源,也可以有利于减少 用户感觉到的端到端的时延。在进行静音检测时需要注意背景噪声问题,即如何 在较大的背景噪声中检测静音。还有前后沿剪切问题。所谓前后沿剪切就是还原 语音时,由于从实际讲话开始到检测到语音之间有一定的判断门限和时延,有时 语音波形的开始和结束部分会作为静音被丢掉,还原的语音会出现变化,因此需 要在突发语音分组前面或后面增加一个语音分组进行平滑以解决这一问题。 舒适噪音生成( c n g ) ,就是在对方不说话的时候,给听者采用某种方式重 构舒适的背景音。通话中听者会因为昕不到对方任何动静而感到不舒服,甚至认 为对方已经挂机,c n g 是根据v a d 产生的静音指示( s i d ) 来重构舒适的背景 音,提高通话的质量。舒适噪音生成,必须保持解码器和编码器之间的同步,有 音段和无音段的平滑过渡。 目前v o l p 产品中,实现静音压缩存在一些难度,原因是在各种编码类型, 不同的打包时长中,分组数据中s i d 和语音包的打包形式没有统一,各个芯片厂 家的组合和内容都不一样。 2 3 回声消除技术( e c ) 回声是信号通过网络时的反射。本地扬声器输出的模拟语音信号可能又被话 筒接收,当信号被传回到源端时,就会产生不必要的回声。在传统固话网中,从 4 线交换到2 线本地环路时的阻抗会导致回声,由麦克风和扬声器或耳机之间的 耦合效果不好也会导致回声。在i p 网中,呼叫必须经过多个路由器和网关,其 电子科技大学硕士学位论文 相当长的延迟会造成回声问题的进一步恶化。 回声消除主要是基于预测滤波器来实现的,该滤波器能根据参考信号,预测 出接收信号的回声,并将回声从信号中扣除,从而获得“干净”的信号。 - _ 一 图2 - 3 回声抑制原理 l e c :剧声抵消器,是一个典型的横向滤技器 y ( n ) :远端语音,滤波器的参考输入 s c n ) :近端语音,滤波器的输入信号 “1 1 ) :参考信号的回波 x c n ) :来自电话b 的近端语音信号 i e s t ( n ) :滤波鼎输出的估计的回声 e c n ) :误差信号,在x ( n ) 印的时候,e ( n ) = s ( n ) r e s t ( n ) , e c n ) y 耳反馈网l e c 并且自适应校正横向滤波嚣抽头系数,使得实际回声和估计回声之阐的误差蛙小。 当回声路径较短,时延较小时,通话人很难区分存在话音中的回声,这个时 候回声的影响不大;当回声路径变长,时延较大时,回声的干扰就很明显。在不 同的应用场合,对回声抵消的要求不一样,接入网关需要e c 能消除的延时1 6 m s 一3 2 m s 就够了,而中继网关往往需要e c 能消除的延时大于6 4 m s ,甚至1 2 8 m s 。 e c 时延越大,算法复杂度就越高,需要的内存也越大。 2 4 语音实时传输控制( r t p r t c p ) 话音通信是一种对实时性要求很高的业务。p s t n 通过建立端到端的连接, 并且给每一通道分配固定的带宽进行语音传输以保证实时连通性。而i p 网因其 存储转发的模式,虽尽力而为但是难免出现拥塞、丢失、乱序等,语音分组在i p 网络上传输的时候,在不同的网络状况下,存在延时、抖动、乱序、丢包等情况, 如果不进行相应的处理,将会严重的影响话音质量。r t p r t c p 正是通过建立缓 冲消除抖动,通过编号以正确排序,通过产生丢包指示,帮助解码器产生近似数 电子利技大学硕士学位论文 据,消除丢包影响,在一定场合下还可以传输d t m f 信号,信号音和信令等方 式来提高话音质量。每个r t p 数据报报头都包含使接收者可以恢复原始数据 时序的时间标记,以及使接收方可以处理丢失、重复或错误的数据报的顺序号, 而与之对应的实时传输控制协议( r t c p ) 则是使接收方可以向r t p 发送方反馈 信息。i 丁u t 在多媒体通信标准h 3 2 3 中采用了r t p r t c p 。 r t p 位于用户数据报协议( u d p ) 之中,因此它是无连接的。r t p 并不是 t c p i p 协议栈的一部分,所以必须对应用进行编码,在每个u d p 数据报增加 新的长度为1 2 字节的报头,最终体现为r t p 数据包。由发送方填写每个报头, 报头包括: 有效载荷类型:对音频或视频等数据类型予以说明,并说明数据的编码方式。 序列号:帮助接收方重新组合数据,并对丢失、损坏和重复的数据报进行 检测。 时间标记:用于重新建立原始音频或视频的时序。另外,它还可以帮助接收 方确定数据到达时间的一致性或变化( 有时被称为抖动) 。 源i d :帮助接收方利用发送方生成的唯一数值来区分多个数据流。 r t p 报文格式如图2 4 : t i m e s t a m p s y n c h r o n i z a t i o ns o u r c ei d e n t i f i e r s ( s s r c ) c o n t r i b u t i n 垡s o u r c ei d e n t i f i e r s ( c s r c 、 h e a d e re x t e n s i o n p 1 n 口一,a 1 1 一; 、,:一声、 j t a ya u g u r 4 u u j u ,vj u i u ,j o x o o 图2 - 4r t p 报文格式 以上报头各项内容分别为: 1 、v ;协议版本号,目前为2 2 、p :填充指示位,加密时候要求数据块大小固定 3 、x :扩展位 4 、c s r cc o u n t :c s r c 数目,只用于混合器 5 、m :话音突发标志,m = i 表明静默后的第一个语音帧 9 电子科技大学硕士学位论文 6 、p a y l o a d t y p e :载荷类型,g 7 1 1 a - - 8 ,g 7 1 l u - - 0 ,g 7 2 9 - - 1 8 7 、s e q u e n c e n u m b e r :r t p 序号 8 、t i m e s t a m p :r t p 时戳 9 、s s r c :源端标志符 r t p 的在v o l p 中的作用主要体现在: 1 、消除抖动,由于网络的阻塞,引起转发数据的突发性,导致每个分组到达 目的地的时间不相同,这就是抖动,我们需要使用一个缓冲区来保证分组能均匀 的送给解码器进行解码,这就是j i t t e r b u f f e r 。j i t t e r b u f f e r 越大,能消除的抖动就 越大,但带来的时延也越大。 2 、排序,由于分组可能经过不同的路由到达目的地,这就可能存在乱序的情 况,先发出来的分组可能后到。我们就必须利用r t p 头的序号来对r t p 分组进 行排序,以便解码器对语音分组进行正确的解码。 3 、消除丢包影响,目前,r t p 采取的方式为通过丢包指示( b f i ) 告诉籍码 器,解码器利用内差的方法来产生近似的数据,消除丢包影响。 4 、在一定场合下可以传输的d t m f 信号,信号音和信令。 根据数据有效载荷的长短,r t p 报头可能会造成额外的开销。例如,典型的 l p 语音数据有效载荷为4 0 字节。在采用r t p 时,报头的总开销包括:r t p ( 1 2 字节) + u d p ( 8 字节) + i p ( 2 0 字节) = 4 0 字节。因此大约5 0 的数据为报 头。 r t p 的优点是它在应用中的一致性。在出现r t p 之前,使用u d p 的应用程 序员可以生成自己的数据报报头。由于每种应用都有不同的报头长度和格式,因 此路由器或其它网络设备很难对报头进行压缩。此外,发送和接收也必须非常地 匹配。在使用r t p 的情况下,来自一家厂商的接收应用可以接收来自另一家厂 商发送应用的r t p 数据。 与r t p 对应的r t c p 协议( 实时传输控制协议) ,由s r , r r ,s d e s ,b y e 等类型的包组合而成,完成的主要功能为: 1 、实时报告网络和收发包统计情况,包括抖动,丢包,还可以计算双向时 延。 2 、通过s d e s 和s r 来实现视频会议中的唇音同步。 r t c p 的发送间隔是根据网络带宽的占用情况来计算的,以便控制。r t c p 所占的带宽不超过总带宽的5 。 o 电子科技大学硕士学位论文 2 5f o i p 技术 i p 电话要取代传统电话,传真功能是不可少的。f o l p ,即f a xo v e ri p ,是在 i p 网络上实现传真功能。这里将f o i p 技术也作为一项相关技术来谈,是由于市 场应用上,传统电话和传真的紧密结合使v o i p 和f o i p 的需求也紧密结合起来 了。提到v o i p 产品,支持f o l p 也成其为一项技术指标。 2 5 1 传真原理综述 我们所说的传真,是指传真3 类机,传真机的发展从传真1 类机发展到传真 4 类机,4 类机用于i s d n 标准之上,主要应用是传真3 类机。传真3 类机按t 4 及t 3 0 及g b 3 3 8 2 - - 8 2 关于话路传真三类机在电话中的互通技术条件为标 准,在一分钟内一个话路上传送一页a 4 幅面原稿的设备。 传真的基本原理如图2 5 : 图2 - 5 传真原理图 传真3 类杌的通信过程与电话通信过程类似,分为以下五个阶段:呼叫建立 报文前证实报文中过程报文后过程传真过程结束。 2 5 2f o i p f o l p ,分为存储转发传真和是实时i p 传真,这里指的是实时i p 传真。和特 定传真呼叫一样,两个传真机同步以后,在本地电话连接上发送数掘,该电话连 电子科技大学硕士学位论文 接上标有一个i p 标签。如果传真忙,呼叫方可以选择重试或者转入存储转发方 式。存储转发方式的i p 传真工作形式类似于e m a i l ,呼叫方发送传真消息给服务 器,服务器再将传真发给接收方,最后,通知发送方处理的结果。 实时i p 传真的标准是t 3 8 ,由i t u 第8 研究组于1 9 9 8 年6 月1 8 号批准认 可。并定名为“t 3 8 :p r o c e d u r e sf o rr e a l t i m eg r o u p3f a c s i m i l ec o m m t m i c a t i o n o v e r i p n e t w o r k s ”,该标准定义了终端之间发送传真3 类机的过程,定义了终端 之间传输路径的部分。 一个传统的传真3 类机终端连接到一个网关,通过一个i p 网络向另外一个 网关发送传真。接收网关产生一个p s t n 呼叫给网络另一侧的传真3 类机终端设 备。一旦一个p s t n 呼叫在两端建立,两个传真3 类机终端便建立了虚拟连接。 终端便建立一个t 3 0 会话,并协商传真的功能,比如页数确认和最小呼叫时长。 t 3 8 也定义了另外一种情况,就是连接一端或者两端是可以收发传真的设备,像 p c 等,直接连接到i p 网络上。 在t 3 8 的体系结构中,传真信号被话音传真网关调制后在1 p 网络上传输, 因为i p 传真包使用t c p 和u d p 协议,具体采用哪一种协议取决于业务环境。 t c p 提供1 0 0 无差错传输,但是会降低实时性,当拥塞发生时,路由器会丢 弃t c p 包。而u d p 具有很好的实时性,因为u d p 不像t c p 那样丢弃数据报, 但是传输质量稍差一些,这是由于数据包的丢失,数据报到达失序,多个数据报 重复到达等原因造成的。在网络的另外一端,远端网关对i p 数据包解码,重新 生成传真信号。t 3 8 中可以使用的调制方法有:v 2 1c h a n n e l2 ,v 2 7 t e r2 4 0 0 , v 2 7 t e r4 8 0 0 ,v 2 97 2 0 0 ,v 2 99 6 0 0 ,v 1 77 2 0 0 ,v , 1 79 6 0 0 ,v 1 7 1 2 0 0 0 ,a n dv 1 7 1 4 4 0 0 。 t 3 8 定义了第3 类传真在终端问传输的过程,除了包括p s t n 或者1 s d n 部 分的传输,还包括i p 网络部分的传输。t 1 3 8 系统是由第3 类传真设备( g 3 f e ) 、 网络传真设备( i a f ) 和t 3 8 网关组成。在t 3 8 架构中,传真信号首先经过语 音传真网关的调制后,通过t c p 或者u d p 协议在i p 网络中以i p 传真包的形 式传送。 h 3 2 3 协议是i p 网络传

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论