已阅读5页,还剩54页未读, 继续免费阅读
(计算机应用技术专业论文)基于网络qos的amr语音编码算法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
, c l a s s i f i e di n d e x : u d c : ad i s s e r t a t i o nf o rt h ed e g r e eo fm e n g r e s e a r c ho nn e t w o r kq o s b a s e da m r a l g o r i t h m c a n d i d a t e :l o uj i a s u p e r v i s o r :a s s o c i a t ep r o f y a oa i h o n g a c a d e m i cd e g r e ea p p l i e df o r :m a s t e ro fe n g i n e e r i n g s p e c i a l t y :c o m p u t e ra p p l i e dt e c h n o l o g y d a t eo fs u b m i s s i o n :d e c e m b e r , 2 0 0 9 d a t eo fo r a le x a m i n a t i o n :m a r c h ,2 010 u n i v e r s i t y :h a r b i ne n g i n e e r i n gu n i v e r s i t y 哈尔滨工程大学 学位论文原创性声明 本人郑重声明:本论文的所有工作,是在导师的指导下,由 作者本人独立完成的。有关观点、方法、数据和文献的引用己在 文中指出,并与参考文献相对应。除文中己注明引用的内容外, 本论文不包含任何其他个人或集体己经公开发表的作品成果。对 本文的研究做出重要贡献的个人和集体,均己在文中以明确方式 标明。本人完全意识到本声明的法律结果由本人承担。 作者( 签字) :布笏馅已 日期:如p 年乡月俗日 哈尔滨工程大学 学位论文授权使用声明 、 本人完全了解学校保护知识产权的有关规定,即研究生在校 攻读学位期间论文工作的知识产权属于哈尔滨工程大学。哈尔滨 工程大学有权保留并向国家有关部门或机构送交论文的复印件。 本人允许哈尔滨工程大学将论文的部分或全部内容编入有关数据 库进行检索,可采用影印、缩印或扫描等复制手段保存和汇编本 学位论文,可以公布论文的全部内容。同时本人保证毕业后结合 学位论文研究课题再撰写的论文一律注明作者第一署名单位为哈 尔滨工程大学。涉密学位论文待解密后适用本声明。 本论文( 留在授予学位后即可口在授予学位1 2 个月后 口 解密后) 由哈尔滨工程大学送交有关部门进行保存、汇编等。 作者( 签- 7 - - ) :莅伍 日期:3 , o o 年弓月a e l 导师( 签- - 7 - ) :炉压矿 舻年弓月麒日 哈尔滨t 程大学硕七学位论文 摘要 基于互联网协议的语音通信( v o l p ) 技术将传统的基于电路交换的公用 交换电话网与基于分组交换的数据通信网结合起来,利用互联网实现语音数 据包的远程传输,具有成本低廉、服务内容丰富和易于升级扩展等优点,逐 渐成为通讯市场的主流。在v o l p 系统中,需要将语音数据实时压缩以降低 网络带宽需求。自适应多速率( a m r ) 编码算法可以提供多种不同压缩码率, 成为一种重要的v 0 p 编码器,并被广泛地应用于第三代移动通信系统。 本文研究了a m r 编码器的基本原理和工作过程,详细讨论了线性预测 分析和码书搜索算法。在此基础上,提出基于网络q o s 参数估计的自适应 a m r 语音编码算法。通过实时获取当前网络服务质量的三个主要参数:端到 端延时、抖动和丢包率,评估网络负载状态,自适应地调整编码速率,以提 供较好的语音通话质量。仿真实验表明,在不同的网络状态下,改进的a m r 算法能够改善用户的通话质量。 另一方面,由于实时语音通信中网络时延的变化对通话质量影响较大, 论文提出一种自适应抖动缓冲区算法。延时、抖动和丢包率之间并不是相互 独立的,通过合理设置抗抖动缓冲区的大小可以优化语音分组的丢包率、包 延迟和时延抖动。在接收端设置自适应抗抖动缓冲区,依据网络当前状态实 时调整抖动缓冲区大小,可以在端到端时延和丢包率之间进行折中,取得较 佳的通话效果。仿真实验表明,网络延时小于4 0 0 m s 、丢包率为1 至6 之 间时,抖动缓冲区大小在1 2 0 1 7 0 m s 之间变化。主观听测表明,用户对语音 质量比较满意。 关键词:v o 口;服务质量;语音编码器;a m r l 。 哈尔滨丁程大学硕士学位论文 a b s t r a c t t h ei _ n t e m e tp r o t o c o l b a s e dv o i c ec o m m u n i c a t i o n s ( v o l p ) t e c h n o l o g yh a s c o m b i n e dt r a d i t i o n a lp u b l i cs w i t c h e dt e l e p h o n en e t w o r kt h a tb a s e so nc i r c u i t s w i t c h i n gw i t hd a t ac o m m u n i c a t i o nn e t w o r kt h a tb a s e so np a c k e ts w i t c h i n g m a k i n gu s eo fi n t e m e tt or e a l i z ea r e m o t ep a c k e tv o i c et r a n s m i s s i o ni sc o s ts a v i n g , aw e a l t ho fs e r v i c e s ,e a s i l yu p g r a d e a b l ea n de x p a n d a b l e ,e t c i th a sg r a d u a l l y b e c o m et h em a i n s t r e a mo fc o m m u n i c a t i o nm a r k e t i nav o i ps y s t e m r e a l t i m e v o i c ed a t ac o m p r e s s i o ni sn e e d e dt or e d u c en e t w o r kb a n d w i d t hr e q u i r e m e n t s a d a p t i v em u l t i - r a t e ( a m r ) c o d i n ga l g o r i t h mp r o v i d e sav a r i e t yo fd i f f e r e n t c o m p r e s s i o nb i tr a t e s a n dh a sb e c o m ea ni m p o r t a n tv o i pe n c o d e r m e a n w h i l e , a m rh a sw i d e l yu s e di nt t l i r dg e n e r a t i o nm o b i l ec o m m u n i c a t i o ns y s t e m i nt h i st h e s i s ,t h eb a s i cp r i n c i p l eo fa m rc o d e ca n dt h ew o r kp r o c e s so f a m rc o d e ca r es t u d i e d a tt h es a m et i m e ,t h el i n e a rp r e d i c t i o na n a l y s i s ,a n d c o d e - b o o ks e a r c ba l g o r i t h ma r ed i s c u s s e di nd e t a i l o nt h i sb a s i s ,t h i st h e s i s p r o p o s e sa na d a p t i v ea m rs p e e c hc o d e ca l g o r i t h mt h a tb a s e so nn e t w o r kq o s p a r a m e t e r se s t i m a t i o n i no r d e rt op r o v i d eb e t t e rv o i c ec o m m u n i c a t i o nq u a l i t y , t h i s a l g o r i t h mt a k e sa d v a n t a g eo ft h r e er e a l - t i m en e t w o r kq o sp a r a m e t e r sw h i c ha r e e n dt oe n dd e l a y , j i t t e ra n dp a c k e tl o s sr a t et oa s s e s st h es t a t eo fn e t w o r kl o a da n d a d a p t i v e l ya d j u s tc o d i n gr a t e s i m u l a t i o nr e s u l t s s h o wt h a t ,u n d e rd i f f e r e n t n e t w o r k c o n d i t i o n s ,i m p r o v e da m ra l g o r i t h mi m p r o v e st h eu s e r sc o m m u n i c a t i o n q u a l i t y o nt h eo t h e rh a n d ,d u et ot h eg r e a ti m p a c tc a u s e db yn e t w o r kd e l a y st h a t o c c u ri n r e a l t i m ev o i c ec o m m u n i c a t i o n s ,t h i st h e s i sp r e s e n t sa na d a p t i v ej i t t e r b u f f e ra l g o r i t h m d e l a y , j i t t e ra n dp a c k e tl o s sr a t ea r en o tm u t u a l l yi n d e p e n d e n to f e a c ho t h e r ar e a s o n a b l es e to fa n t i - j i t t e rb u f f e rs i z ew i l lo p t i m i z et h ep a c k e tl o s s r a t e ,p a c k e td e l a ya n dd e l a yj i t t e ro f p a c k e tv o i c e s e tu pt h ea n t i - j i t t e rb u f f e ro f r e c e i v i n ge n da d a p t i v e l ya n da d j u s tj i t t e rb u f f e r s i z eb a s e do nt h ec u r r e n ts t a t eo fn e t w o r k ,w h i c hm a k ec o m p r o m i s eb e t w e e ne n d t oe n dd e l a ya n dp a c k e tl o s sr a t ea n da c h i e v eb e t t e rc o m m u n i c a t i o nq u a l i t y 哈尔滨t 程大学硕十学位论文 s i m u l a t i o nr e s u l t ss h o wt h a tw h e nn e t w o r kd e l a yi sl e s st h a n4 0 0 m sa n dp a c k e t l o s sr a t ei sb e t w e e n1 a n d6 ,t h ei i t t e rb u f f e rs i z ev a r i e sb e t w e e n12 0 17 0 m s t h r o u g hs u b j e c t i v el i s t e n i n gt e s t ss h o wt h a tu s e r sa r es a t i s f i e dw i t hv o i c e q u a l i t y ,k e yw o r d s :v o l p :q o ss p e e c hc o d e c :a m r 、_ i _ 哈尔滨t 程大学硕士学位论文 目录 第1 章绪论l 1 1 研究的背景及意义1 1 1 1 研究背景1 1 1 2 研究意义2 1 2 国内外研究现状”2 1 2 1v o i p 系统的服务质量保证“2 1 2 2a m r 语音编码算法“4 1 3 本文的主要研究内容及组织5 1 3 1 主要研究内容5 1 3 2 论文的组织6 第2 章v o i p 系统及其服务质量保证”7 2 1v o i p 系统7 2 1 1v o i p 系统的组成7 2 1 2 影响v o d 语音质量的因素8 2 2v o i p 的通信过程”9 2 3 通话质量评估技术l o 2 4v o i p 系统的服务质量保证1 2 2 5 本章小结1 3 第3 章自适应a m r 语音编码算法研究“1 4 3 1a m r 编码器1 4 3 1 1 预处理1 4 3 1 2 线性预测分析1 5 3 1 3 码书搜索算法2 1 3 2 w r 解码器2 6 3 3 基于q o s 的a m r 码率控制算法2 7 3 3 1 算法基本思想2 7 3 3 2 算法具体描述”2 8 哈尔滨t 程大学硕士学位论文 i i 3 3 3 实验方案设计2 9 3 3 4 实验结果及分析3 0 3 4 本章小结3 2 第4 章自适应抖动缓冲区算法研究3 4 4 1 抗抖动缓冲区的作用3 4 4 2 自适应抖动缓冲区算法设计3 5 4 2 1 抖动缓冲区大小与丢包率及延时的关系”3 5 4 2 2 自适应调整抖动缓冲区算法3 6 4 3 算法涉及的主要数据结构3 9 4 3 1 缓冲区的数据结构3 9 4 3 2 语音包的数据结构3 9 4 4 缓冲区储存语音包的规则4 0 4 5 实验方案及结果分析4 2 4 5 1 实验方案4 2 4 5 2 实验结果分析公4 2 4 6 本章小结4 4 结论4 6 参考文献4 7 攻读硕士学位期间发表的论文及取得的科研成果5 1 致谢5 2 哈尔滨工程大学硕士学位论文 1 1 研究的背景及意义 1 1 1 研究背景 第1 章绪论 随着移动通信与互联网技术的迅速发展,网络电话【l 】( v o l p ,v o i c eo v e r i n t e r n e tp r o t o c 0 1 ) 逐渐普及,基于分组交换数据网的语音通信技术成为当前 通信领域的研究热点。相比于传统的基于电路交换的公共交换电话网( p s t n , p u b l i cs w i t c h e d t e l e p h o n en e t w o r k ) ,基于互联网协议的数据网络上的语音传 输具有成本低廉、服务内容丰富、易于升级和扩展等优越性,在通讯市场中 占有的份额正迅速增长。著名咨询公司a n a l y s y s 预测互联网电话将取代传统 交换系统,话音质量最终将可以达到传统话音质量( t o l lq u a l i t y ) 。 因为m 网络在设计之初是为了传输数据,数据传输要求数据完整,但能 够容忍较大的网络延时,如f t p 、e m a i l 等服务。而v o 口语音特性对网络传 输的要求与数据传输不同,它要求具有很高的实时性,很小的网络延时和允 许少量数据丢失( 小量的数据丢失不会影响到通话质量) 。t c p 协议是一种 面向连接的协议,它提供了检错和拥塞控制机制,但并不适用于语音传输。 目前v o l p t 2 】主要使用u d p 协议传输语音,而u d p 却不提供任何质量控制机 制。此外,口是为数据传输设计的,它提供的是“尽力而为”的服务,不能 为语音传输提供可靠的端到端服务质量保证。 语音传输要考虑人耳对语音的感受能力,由于人类的听觉系统特性和 听觉心理模型分析可知,语音延迟、噪声及数据断续都会造成通话无法正常 进行,通话质量决定了用户是否会使用v o l p 系统,成为影响网络语音系统 生存的关键要素。通过分析网络服务质量要素,如端到端时延、抖动和分组 哈尔滨工程大学硕十学位论文 丢失,了解不同的网络状态下的通话质量,将v o l p 系统中的语音编码算法 与当前网络状态结合起来。一方面可以利用变速率语音编码提高网络带宽的 利用率;另一方面,可以根据网络服务质量动态地调整语音压缩码率,获得 较佳的语音通话质量。 1 1 2 研究意义 当前语音编码的研究转向实用化、高性能以及低复杂度。2 0 世纪9 0 年 代,c d m a ( c o d e d i v i s i o nm u l t i p l ea c c e s s ) 移动通信系统的发展,带给语 音编码技术发展的契机,也把变速率语音编码技术推上了前台。各种通信组 织争相推出了不同的变速率语音编码技术标准,其中主要包括了q c e l p 、 e v r c 、a m r 、a m r w b 和s m v 五种算法标准1 4 【5 1 。 本文主要研究自适应多速率( a m r ,a d a p t i v em u l t i r a t e ) 语音编码算 法,属于码激励线性预测编码( c e l p ,c o d ee x c i t e dl i n e a rp r e d i c t i v ec o d i n g ) 的一种。由于a m r 算法具有较高的压缩比和适应性,被3 g p p ( 3 r dg e n e r a t i o n p a r t n e r s h i pp r o j e c t ) 组织采用,作为第三代移动通信系统和改进的第二代移 动通信系统中的语音编解码标准。本论文主要研究基于网络服务质量因素的 a _ m r 语音编码算法及自适应抖动缓冲区的动态设置算法。 1 2 国内外研究现状 1 2 1v o l p 系统的服务质量保证 随着计算机通信网络的飞速发展,用户对数据需求的质量也在朝着复杂 化与多样化发展,越来越多用户提出了包括多媒体通信在内的综合服务要求。 传统的分组交换网络,如i n t e m e t ,是面向非实时的数据通信( 如f t p 和e - m a i l 的传输) 而设计的,采用的t c p i p 协议主要是为了优化整个网络的数据吞吐 2 哈尔滨工程大学硕士学位论文 量并保证数据通信的可靠性。而当今分布式多媒体应用尤其是数字多媒体技 术的飞速发展,使得网络用户对通信网络的要求更高,于是,通信网络的服 务质量( q u a l i t yo f s e r v i c e ,q o s ) 这一概念被提出来,并且针对此概念,各 种保证网络q o s 的技术也应运而生。服务质量( q o s ) 1 6 】其实质是一组服务 要求,为了保证数据达到适当的服务级别,网络必须满足这些服务要求。数 据在网络中传输的过程中,q o s 机制通过各种方法区分业务流,并且制定了 例如:立即发送、延迟发送、丢弃等不同策略,以保证不同优先级别的数据 业务能得到不同服务质量要求。 计算机网络q o s 的研究起始于2 0 世纪8 0 年代初期,s e i t z 和w o r t e n d y k e 等人在研究a r p a n e t 中的x 2 5 通信,提出基于用户的性能评价问题。由 于计算机网络性能所限,之后的很长一段时间内,人们对q o s 的研究只停留 在数据流传输中的正确率、吞吐量和延迟等单一服务质量的评价与控制上。 直到2 0 世纪8 0 年代末期,a t m 交换网以及b i s d n 技术的出现和分布式多 媒体应用的急剧增加,人们才开始系统地对q o s 管理和控制进行较为深入的 研究。与此同时,实验性系统也随之出现,例如:美国哥伦比亚大学的扩展 的集成化参考模型( x r m ) 系统、英国兰开斯特大学的q o s a 工程、国际合作 项目t i n a c2 1 2 程、i b m 公司黑森伯格欧洲网络中心的h e i p r o j e c t 工程、美 国加州伯克利大学的t e n e t 工程等【7 1 。同时i n t e m e t 商业化日益发达,网上 多媒体信息传输日益增多,网络拥塞日益严重,这些现象都要求必须进一步 深入研究i n t e r n e t 的q o s 问题。时至现今,q o s 控制技术的研究和开发都进 展得非常迅速,并且已经取得了许多基本的成果。近几年,国内也开始着手 于q o s 控制方面的研究。目前,计算机网络的q o s 问题已经成为国际网络研 究领域公认的最重要、最具前景的研究领域之一,并且被称为下一代计算机 网络最重要的研究领域之一。 哈尔滨t 程大学硕士学位论文 1 2 2a m r 语音编码算法 数字语音编码技术是语音数字化处理的重要组成部分,其随着网络语音 通信的迅速发展也得到了充分的关注以及发展 8 3 。带宽在网络通信中是十分 宝贵的资源,语音编码技术可以压缩语音信号的传输带宽,提高网络语音通 信的网络带宽利用率【9 】。语音信号存在着很多冗余,包括时间冗余、信息冗 余、听觉冗余、知识冗余和谱间冗余等。采用语音编码可以减小语音信号的 冗余度、压缩原始语音数据并重构出自然而真实的语音。 采用变速率语音编码技术是现代网络语音通信的特点之一【l0 1 ,近年来越 来越广泛地应用于无线通信的多址系统中。例如,在e t d m a ( e x t e n d e d - t i m e d i v i s i o nm u l t i p l ea c c e s s ) ,p r m a ( p a c k e tr e s e r v a t i o nm u l t i p l ea c c e s s ) 和 c d m a 中都用到了变速率语音编码。 在国际标准化工作中,语音编码技术是最为热门的领域之一【1 1 1 。2 0 世纪 9 0 年代,随着c d m a 移动通信系统的飞速发展,语音编码技术受到相应的 关注,变速率语音编码技术也逐渐成为人们关注的焦点【1 2 】。各种通信组织争 相推出了不同的变速率语音编码技术标准,其中主要包括了q c e l p 、e v r c 、 a m r 、a m r - w b 和s m v 五种算法标准。 a m r 语音编码器被广泛地应用于第三代移动通信系统,它可以根据自适 应算法选择当前信道最佳的语音编码速率。每一语音帧的编码速率都是由当 时的信道环境决定的。传输环境较为理想时,选择最佳的语音编码模式;传 输环境较为恶劣时,选择最健壮的编码模式,以此获得最佳语音质量【l 】。在 移动通信中,决定编码的自适应性的因素有:移动台和网络对信道质量的测 量,以及随语音数据一起通过空中接口传送的带内信息。 由于传统口网络的“尽力而为的特点,不能为语音传输提供可靠的端 到端服务质量保证,提高语音服务质量成为现今急需解决的问题之一。采用 变速率语音编码算法可以根据网络实时状态改变编码速率,提供较佳的语音 通话质量【1 3 】。a m r 具有8 种速率模式,如表1 1 所示,分别是:1 2 2 k b p s 、 4 哈尔滨工程大学硕士学位论文 1 0 2 k b p s 、7 9 5 k b p s 、7 4 k b p s 、6 7 k b p s 、5 9 k b p s 、5 1 5 k b p s 和4 7 5 k b p s 。不同 的编码模式具有不同的容错能力。决定语音编码速率的因素是网络传输环境: 当网络状态较好时,在传输中,并不需要过多的冗余比特数来对数据进行前 向纠错,因此,可以采用较高速率的语音模式;反之,当网络状态较恶劣时, 需要较多的冗余比特数来对数据进行前向纠错,此时系统将选择较低速率的 语音编码模式。总之,a m r 可以依据网络当前状态自适应地改变编码速率, 使得语音通信可以获得最佳的语音质量。 表1 1a m r 编码器的信源编码速率 编码模式信源编码速率 a m r1 2 2 012 2 0 k b p s ( g s m - e f r ) a m r1 0 2 01 0 2 0k b p s a m r7 9 5 7 9 5 k b p s a m r7 4 0 7 4 0 k b p s ( i s 一6 4 1 ) a m r6 7 0 6 7 0 k b p s ( p d c e f r ) a m r5 9 0 5 9 0 k b p s a m r5 1 5 5 1 5 k b p s a m r4 7 5 4 7 5 k b p s 1 3 本文的主要研究内容及组织 1 3 1 主要研究内容 本论文主要研究内容主要包括: 1 介绍v o i p 系统基本概念、基本原理及通信过程,分析影响v o i p 系统 通话质量的主要因素,即端到端延时、抖动和丢包率。同时,介绍目前常用 的几种语音质量客观评估方法:i t u te 模型和感知语音质量评估技术 p e s q ,以及v o i p 的服务质量保证技术,包括服务质量的定义、业务模型和 5 哈尔滨工程大学硕七学位论文 基于感知加权等提高服务质量的方法。 2 研究自适应多速率语音编码算法的基本原理并提出一种基于网络q o s 的a m r 自适应码率控制方案。该方案将a m r 编码技术与网络q o s 的实时 估计结合在一起,根据当前的网络参数自适应地调整码率,即根据当前网络 端到端延时、抖动和丢包率调整压缩率,获得较为理想的语音质量。 3 提出一种自适应抖动缓冲区算法。在接收端为了对接收到的语音包进 行平滑处理,往往需要设置抗抖动缓冲区。研究通过测量当前网络端到端时 延和丢包率参数,自适应地调整抗抖动缓冲区大小,在时延和丢包率之间进 行折中,提高接收语音质量。本文设计了算法中涉及的缓冲区和语音包的数 据结构,并详细地描述了自适应抖动缓冲区算法。同时,仿真实验表明该算 法可以改进接收语音质量。 1 3 2 论文的组织 本论文是基于网络q o s 的a m r 语音编码算法研究,研究自适应多速率 语音编码器的基本原理以及a m r 编解码器的算法,并进而提出一种基于q o s 的a m r 自适应码率控制方案和一种自适应抖动缓冲区的算法。论文组织结 构如下: 第1 章:概述了本课题的选题的背景、意义和国内外当前的研究现状进 行; 第2 章:介绍v o i p 相关的基本概念、基本原理及通信过程,分析影响 v o i p 系统通话质量的主要因素以及v o i p 的服务质量保证技术。 第3 章:研究自适应多速率语音编码器的基本原理以及a m r 编解码器 的算法,并提出一种基于q o s 的a m r 自适应码率控制方案,详细描述基于 q o s 的a m r 自适应码率控制算法。 第4 章:提出一种自适应抖动缓冲区算法,设计算法涉及的数据结构并 详细描述该算法,并通过实验,验证该算法的性能。 6 哈尔滨工程大学硕十学位论文 第2 章v o i p 系统及其服务质量保证 2 1v o i p 系统 v o l p 即网络电话,利用口网络实现即时语音通信。其基本原理是将电 话语音数字化并进行压缩,然后将压缩后的数据打包转换成便于网络传输的 数据包,最后将该数据包通过口网络传输到目的地;目的终端设备收到数据 包后,只需将数据重组、解压缩,即可将该数据还原成声音。 2 1 1v o l p 系统的组成 v o l p 系统中 1 4 1 ,有4 个基本组件:终端设备( t e r m i n a l ) 、网关( g a t e w a y ) 、 多点控制单元( m c u ,m u l t i p o i n tc o n t r o lu n i t ) 和网守( g a t e k e e p e r ) 。 ( 1 ) 终端设备 终端设备是一个口电话客户终端,可以是软件( 如s k y p e ) 或是硬件( 如 a p p l e 公司的i p h o n e ) ,可以直接连接到p 网络上进行实时的语音或多媒体 通信。 i p 电话的终端是多种多样的,例如:传统的语音电话、i s d n 终端、多 媒体p c 等,或者是集语音、数据和图像于一体的多媒体业务终端。由于不 同的终端产生的数据结构不同,为了在相同的网络上进行数据传输,必须要 由网关或者是通过适配器进行数据转换,以形成统一的口数据包。 ( 2 ) 网关( g a t e w a y ) 网关的功能主要是:具有p 网络接口和与p s t n i s d n p b x 交换机互连 的接口、完成实时语音压缩,将语音信号压缩成低码率语音信号、和完成寻 址和呼叫控制。它是语音通信中非常关键的设备。v o l p 网关较为重要的一项 哈尔滨工程大学硕士学何论文 ;i i ;i i i ;i i i i i i i i i i ii i - _ - - 一- 功能是路由管理功能,即将各地区电话区号映射为相应的地区网关i p 地址。 用户拨打i p 电话时,i p 电话网关首先查找电话区号数据库资料,以确定相应 网关的m 地址,然后将此口地址加入i p 数据包中,并选择最佳的路由,以 减少传输延时,最后i p 数据包经由因特网到达目的地v o l p 网关。 ( 3 ) 多点控制单元( m c u ) m c u 的功能是利用i p 网络实现多点通信,使得m 电话能够支持如网络 会议这样的多点应用。 ( 4 ) 网守( g a t e k e e p e r ) 网守的职能是用户注册和用户管理。主要功能包括地址映射、呼叫认证 和管理、呼叫记录和区域管理。 2 1 2 影响v o l p 语音质量的因素 为保证v o l p 中的语音通话质量,通过参数以衡量网络状态,这些关键 参数包括【 】: 延迟( d e l a y ) :包括建立连接时的延迟,传输数据时的延迟,发送数据包 时的延迟等等,通常以时间间隔来计量。 抖动( j i t t e r ) :一般是指语音流中两个连续的语音包的端到端时延的差 值。时延抖动对需要规则化传输包的v o i p 等应用的性能有着显著的影响。 丢包率( p a c k e tl o s sr a t e ) :指在最大建立连接延迟内不能建立可靠连接的 可能性。数据的丢失会对数据的传输质量产生很大的影响 吞吐量( t h r o u g h p u t ) :指在没有数据丢失的情况下,网络能够接受的数据。 通常,吞吐量可以用速率单位计,也可以以输入速率与输出速率的百分比计 量。一般来讲吞吐量越大越好。 复杂度( c o m p l e x i t y ) :这是一个非常重要却经常被忽视的参数,通常指有 效完成信息传输的难易程度的一个量化级数。复杂度的提出使得理论研究和 实际硬件实现的联系成为可能,高复杂的度意味着低实现速率,只有在复杂 哈尔滨工稗大学硕士学位论文 度允许的前提下设计的机制才有现实意义。 为了更清晰地描述特征并能更细致地实现控制,需要尽量多的参数。但 是在实际定义q o s 参数时并不是每个应用都给出全部参数的值,这需要在描 述程度和实现效率之间进行折中,根据应用的特点以及其对服务质量的要求, 决定需要哪些q o s 参数。本文着重研究的参数是:延时、抖动和丢包率。 2 2v o i p 的通信过程 v o l p 是建立在口技术上的分组化、数字化传输技术,其基本原理:在 发送端,首先将输入的模拟语音信号经过采样、量化、编码,再经过数据压 缩后进行分组、打包,然后在分组网上进行传输。在接收端,将到达的语音 数据包进行拆包、重组,再经过解压、解码等步骤恢复成语音信号,送至受 话者。 图2 1v o p 的模型结构 传统的电话网的带宽是6 4 k b p s ,以电路交换方式传输语音。v o l p 则是以 分组交换网络为传输平台,通过对模拟语音信号进行压缩、分组等处理,然 后采用无连接的u d p 进行传输。最简单的v o l p 系统网络是由两个或两个以 上具有v o l p 功能的设备组成的,这些设备通过i p 网络连接,其基本结构如 9 哈尔滨工程大学硕士学位论文 图2 1 所示。从图中可以看出v o l p 设备最为重要的三个流程:将语音信号转 换成口数据流、将这些m 数据流转发至i p 目的地以及i p 目的地将m 数据 流转换成语音信号。 2 3 通话质量评估技术 在i p 网络中,对传输提供的是一种“尽力而为”的服务机制,i p 本身并 不提供保障机制。所以在无保障的网络中传送对质量服务非常敏感的实时语 音数据是非常不可靠的,q o s 的提出,便很好地平衡了这个问题 1 6 】。q o s 作 为一种对用户所提供的服务的综合衡量手段。其作用是确保在网络中特定类 别的应用可以获得相应的资源保证。 通话质量评估的目的是通过主观或者客观的测量方法,即通过人为的测 量项目或基于计算机的测量工具,对一种或多种以上的呼叫质量类别给出一 个可信的估计【1 7 】。v o l p 通话质量受噪声、回声、畸变、信号幅度过高或过 低、通话间隙及很多其他因素的影响,通过评价输出语音的质量以评判不同 v o l p 系统的性能。 目前,对于在网络中进行语音质量测量的研究主要集中于语音质量的评 估模型,如e 模型( e - m o d e l ) 、人工神经网络以及感知模型等。 e m o d e l 的优点是其关注了数据全面的网络损伤因素,很好地适应在数 据网络中语音质量的评估。e m o d e l 首先假设语音质量损伤因素总是物理附 加的,也就是说,它考虑了延时、抖动、噪声、回音、丢包率和编码器性能 等网络损伤因素对语音质量的影响。 e m o d e l 结果是尺值来表示,被称为全面的网络传输等级要素,取值范 围从0 到1 0 0 。r 值的计算从没有网络和设备的损伤影响开始,此时语音质 量是最好的即r = 风,r 。是基本信噪比。但是因为网络和设备损伤因素的存 在,减少了通过网络的语音质量,r 值的基本计算公式如下: r = r o i ,一i d i e + a 1 0 哈尔滨工程大学硕士学位论文 其中,。为与语音信号传输同步的损伤;,。为语音信号传输延时后的损 伤;,。为由设备引入的损伤,例如编码器损伤;彳为优势因素,致力于考虑 呼叫者的期望因素、一般设置为0 。实际应用中,基本公式中的输入尺。、j ,、 ,j 和t ,每一个都需要考虑各种各样的实际网络损伤因素,通过非常复杂的 数学计算而得到。 语音质量的感知模型是对人类听觉系统的直接模拟【l8 1 ,它包括了对时频 分析特性和听觉掩蔽效应在内的人类听觉系统的特性进行了分析与建模。目 前基于感知模型的语音质量评估方法主要有三类:p s q m ( p e r c e p t u a ls p e e c h q u a l i t ym e a s u r e m e n t ) 模型、p a m s ( p e r c e p t u a la n a l y s i s m e a s u r e m e n ts y s t e m ) 模型和p e s q ( p e r c e p t u a le v a l u t i o no f s p e e c hq u a l i t y 模型。语音质量的感知 模型参考语音与退化语音信号的差异计算得分,它是一个心理声学模型,能 够对给定的主观测试语音提供主观分m o s 的预测值。预测分可以映射到 m o s 分刻度范围,在1 5 之间,但通常为1 4 5 之间。 文中采用的是p e s q 模型。p e s q 是感知语音质量评价的缩写,是窄带 电话网络和语音编码解码器的端到端语音质量的客观评价方法。它是针对现 代通信系统中出现的可变时间延迟和系统引入的线性滤波这两方面做了改 进。对差值曲面的解释中不但考虑误差的总量还虑误差的分布,增强了对于 端到端的通信系统质量的可靠评价。 p e s q 通过了由九种语言,不同的真实和仿真的网络中采集的语音构成 大规模样本库的全面测试评价,被选为i t u t 标准。当前还没有其它的算法 能证明性能优于i t u 的这个标准。 p e s q 的总体思路为:首先将参考语音信号和失真语音信号的电平调整 到标准听觉电平,再用输入滤波器模拟标准电话听筒进行滤波,然后将两个 信号进行时间对齐,将对齐的信号进行听觉转换,转换之后的输入和输出信 号差值称为干扰度,通过认知模型处理,最后得到p e s q 分值。在干扰度的 处理中可能会识别出坏区间,这样就需要对坏区间进行重新对齐。 p e s q 模型主要有以下优点:一、包括一个动态的、感知的时间对齐过 哈尔滨1 = 程大学硕士学位论文 程,以此解决了延迟带来的影响。二、能够正确地处理线性频率响应。三、 考虑了增益变化所带来的影响,并予以补偿。四、更好地模拟了非对称效应。 2 4v o l p 系统的服务质量保证 计算机网络q o s 的研究起始于2 0 世纪8 0 年代初期, 服务质量往往体 现了消费者对服务者所提供服务的满意程度。在计算机系统,特别是计算机 网络系统,作为计算和信息等服务的提供者,同样存在服务质量( q o s ) 优劣的 问题。从计算机系统诞生伊始,人们就一直孜孜不倦地致力于提高系统的服 务性能和服务质量。目前,关于q o s 这一词的定义有多种形式。r f c 2 3 8 6 中, 将q o s 定义描述为:网络在传输数据流时要求满足的一系列服务请求,具体 可以量化为带宽、延迟、延迟抖动、丢失率、吞吐量等性能指标 6 1 。q o s 反 映了网络在保证信息传输和满足服务要求方面的能力。 在v o l p 系统为保证服务质量,相关研究主要集中于针对语音分组丢包 率、包延迟和时延抖动的优化。其中主要针对网络q o s 中重点考虑的三个因 素:端到端时延、抖动和丢包率【19 1 2 0 1 。这三个因素也是评价网络状态重要 的指标。端到端时延是影响交互式语音通信质量的最重要因素之一。严格的 端到端时延是指语音信息从说话方的嘴到接收方的耳朵所经历的时延,但通 常只考虑承载语音信息的包从发送系统到接收系统所经历的时延。根据不同 的网络负载状况,端到端的时延会发生变化,而时延过大会导致语音失真, 严重时甚至导致通话无法进行。抖动一般是指语音流中两个连续的语音包的 端到端时延的差值。丢包率是由于语音i p 包的实时性,没有时间重发丢失的 包,因而丢失的p 包会使通话中断。如今的i p 网络是为传输数据而设计的, 采用“尽力而为的服务方式,对所有的业务均一视同仁,这样便难以满足 实时语音通信的要求。当前的v o l pq o s 保证研究主要是基于i e t f 所提出的 综合业务服务( i n t s e r v ) 1 2 1 1 和区分业务服务( d i f f s e r v ) 2 2 1 网络服务模型。 区分业务服务基于业务分类及其相关质量保证策略,它根据用户需求将服务 哈尔滨
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 眼科:青光眼筛查及治疗方案
- 康复医学科:脊柱骨折康复流程
- 2020-2025年咨询工程师之工程项目组织与管理综合练习试卷B卷附答案
- 2025健身中心外墙油漆工程施工合同
- 2025关于外籍员工合同范本
- 2025贺雅彬装修合同官方版
- 网络舆情与危机管理
- 2025年财政部建设工程合同管理范本
- 2025渔业养殖合同(农业承包合同)
- 手机管理与网瘾预防
- 国家广播电视总局直属事业单位招聘笔试真题2024
- 2024年系统架构师考试全面分析试题及答案
- 起重吊装安全作业专项方案
- 《思想道德与法治》(23版):绪论 担当复兴大任 成就时代新人
- 离婚协议书正规打印电子版(2025年版)
- 跨境电商 的物流
- 压疮的评估与上报流程
- 报批报建流程
- 音标表48个国际音标发音教学视频
- 2024年度人工智能数据采集与算法优化服务合同3篇
- 2024年中国创新方法大赛考试题库(含答案)
评论
0/150
提交评论