(通信与信息系统专业论文)基于无线网络的voip中wsola算法的改进研究.pdf_第1页
(通信与信息系统专业论文)基于无线网络的voip中wsola算法的改进研究.pdf_第2页
(通信与信息系统专业论文)基于无线网络的voip中wsola算法的改进研究.pdf_第3页
(通信与信息系统专业论文)基于无线网络的voip中wsola算法的改进研究.pdf_第4页
(通信与信息系统专业论文)基于无线网络的voip中wsola算法的改进研究.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(通信与信息系统专业论文)基于无线网络的voip中wsola算法的改进研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

。嬲攀 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名:苍啄 互 b t 日期:圣! ! ! :三! 苎 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保 留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借 阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它 复制手段保存、汇编学位论文。 本学位论文不属于保密范围,适用本授权书。 本人签名: 导师 殊啄丧 签名:丝盔生 日期:三:坠三:苎 日期:堑翌:2 :墅 北京邮电大学硕士学位论文基于无线网络的v o i p 中w s o l a 算法的改进研究 基于无线网络的v o ip 中w s o l a 算法的改进研究 摘要 随着无线网络技术的迅速发展,基于无线网络的各种应用也层出 不穷。利用i p 网络传输话音信息的实时语音业务,由于其相对于传 统电话业务强大的优势,得到了长足的发展。在无线网络中传输实时 话音信息,由于无线网络本身的不稳定性,面临着许多方面的挑战, 其中最大的问题就是丢包和时延。由于实时语音业务对时延指标严格 的要求,使得数据业务中广泛使用的丢包重传策略无法很好地应对无 线网络的不稳定问题。除了使用拥有强纠错能力的信道编码以外,各 种丢包隐藏技术成为在实时语音业务中应对无线网络不稳定问题的 主要手段。在各种主要的丢包隐藏技术中,波形相似叠加算法由于其 出色的基音周期保持能力,通常能够得到非常好的恢复效果。但由于 标准的波形相似叠加算法对幅度控制能力的缺失,导致在有的情况 下,算法所恢复出的语音波形与原始语音波形的幅度值之间存在巨大 差异,甚至可能导致恢复语音波形中出现不规则的幅度突变,产生语 音撕裂的声音,极大地降低了算法的语音恢复质量。 针对上述问题,本文对标准的波形相似叠加算法进行了改进,在 其语音段叠加时期引入了一个可变的幅度增益,用于加强对恢复波形 幅度的控制。通过在标准的波形相似叠加算法中加入强有力的幅度控 制策略,使得算法的波形恢复效果得到了很大的提升,当算法应用于 丢包隐藏时,所得到的语音波形和原始语音波形通常更加接近。 本文所做的工作主要有以下几个方面: 第一,分析当前实时语音业务领域中,应对无线网络高丢包率的 各种手段及其效果。 第二,对标准的波形相似叠加算法进行深入研究,并分析其在丢 包隐藏技术中的效果和表现。 第三,针对当前标准的波形相似叠加算法在幅度控制能力上存在 缺失的现状,对其进行改进,引入了一个可变的幅度增益,用于加强 算法的幅度控制能力。 第四,通过建立仿真环境和编程,模拟出高丢包率的无线信道和 电大学硕士学位论文基于无线网络的v o i p 中w s o l a 算法的改进研究 靠的传输过程,并分别使用标准的波形相似叠加算法和改进的算 受损语音进行恢复,分析对比恢复过程,得出最终结论。 关键词:波形相似叠加v o i p 增益幅度丢包隐藏 r e s e a r c ho fw s o l aa l g o r i t h mi nv o i p b a s e do nw i r e l e s sn e t w o r k s a b s t r a c t w i t ht h e r a p i dd e v e l o p m e n to fw i r e l e s sn e t w o r k s v a r i o u so f a p p l i c a t i o n sb a s e do nw i r e l e s sn e t w o r k sg oi n t oo u re y e b e c a u s eo fi t s h u g ea d v a n t a g e sc o m p a r e dt ot r a d i t i o n a lt e l e p h o n e s ,r e a l t i m ev o i c e c o m m u n i c a t i o n so nt h ei pn e t w o r k s g o t a r a p i dd e v e l o p m e n tt o o b e c a u s et h ew i r e l e s sn e t w o r k sa r en o ta ss t a b l ea st h ew i r e do n e s , r e a l t i m ev o i c ec o m m u n i c a t i o n sa r ef a c i n gal o to fc h a l l e n g e s ,i n c l u d i n g p a c k e tl o s sa n dd e l a y a n db e c a u s et h er e a l t i m ev o i c ec o m m u n i c a t i o n s r e q u i r e sal o wd e l a y ,t r a d i t i o n a lw a y so fd e a l i n gw i t ht h ei n s t a b i l i t yo f w i r e l e s sn e t w o r k s ,s u c ha sr e t r a n s m i t i o n ,s e e m st ob eu n r e l i a b l e o t h e r t h a nv a r i o u sf e cc o d e s ,m a n yk i n do f p a c k e t l o s sc o n c e a l m e n t t e c h n i q u e sa r ea p p l i e dt od e a lw i t ht h ei n s t a b i l i t yo fw i r e l e s sn e t w o r k si n t h er e a l t i m ev o i c ec o m m u n i c a t i o n s b e c a u s ei t sf e a t u r eo fm a i t a i n i n gt h e p i t c hf r e q u e n c y a n d t i m b r e ,w a v e f 0 1 t 1 1s i m i l a r i t yo v e r l a pa n d a d d ( w s o l qa l g o r i t h mc a na l w a y sg e tag o o dr e s u l ti nt h ep a c k e tl o s s c o n c e a l m e n tp r o c e d u r e u n f o r t u n a t e l y ,t h ew s o l a a l g o r i t h mi sl a c ko f e f f i c i e n t a m p l i t u d ec o n t r o l s ,a n dc a l l n o tg e tb e s tr e s u l t si ns o m e c i r c u m s t a n c e s i no r d e rt os o l v et h e p r o b l e ma b o v e ,t h i sp a p e ri m p r o v e dt h e s t a n d a r dw s o l a a l g o r i t h mb yi n t r o d u c i n ga na m p l i t u d eg a i ni n t oi t b y t h i s w a y ,t h es t a n d a r dw s o l 气a l g o r i t h mg e t sap o w e r f u la b i l i t yo f a m p l i t u d ec o n t r o l ,a n di sa b l et og e tb e t t e rr e s u l t si nt h ep a c k e tl o s s c o n c e a l m e n tp r o c e d u r e i nt h i sp a p e r ,t h ew o r kd o n ei sm a i n l yi nt h ef o l l o w i n g a s p e c t s : f i r s t ,a n a l y s et h ew a y so fd e a l i n gw i t ht h eh i g hp a c k e tl o s sr a t ei n r e a l t i m ev o i c ec o m m u n i c a t i o n sb a s e do nw i r e l e s sn e t w o r k s s e c o n d ,d os o m er e s e a r c hi nt h es t a n d a r dw s o l a a l g o r i t h m a n d g e ta na n a l y s i so ni t sp e r f o r m a n c e i 北京邮电大学硕士学位论文 基于无线网络的v o l p 中w s o l a 算法的改进研究 t h i r d ,i n t r o d u c eag a i ni n t ot h es t a n d a r dw s o l aa l g o r i t h m ,i no r d e r t oi m p r o v ei t sa b i l i t yo fa m p l i t u d ec o n t r 0 1 f o u r t h ,d ot h es i m u l a t i o n sb yp r o g r a m m i n g ,c o m p a r et h es t a n d a r d w s o l a a l g o r i t h mw i t ht h ei m p r o v e do n e ,a n dg e tt h ec o n c l u s i o n k e yw o r d s :w s o l av o i p ( 孔u na m p l i t u d ep l c 2 3v o i p 9 2 4ie e e 8 0 2 1lx 无线局域网1 0 2 5 数字语音信号 2 6 语音编码技术。1 1 2 6 1 语音质量1 1 2 6 2 编码技术一1 2 2 7 汉宁窗1 5 第三章主要的丢包处理技术1 7 3 1 丢包恢复技术1 8 3 1 1 前向纠错技术1 8 3 1 2 低比特冗余编码2 0 3 1 3 交织技术2 0 3 2 丢包隐藏技术( p l c ) 。2 1 3 2 1 与编码标准相关的丢包隐藏技术2 2 3 2 2 与编码标准不相关的丢包隐藏技术2 3 第四章时域尺度修改技术2 6 4 1 基音同步叠加法2 6 4 2 波形相似叠加法。2 7 第五章对标准w s o l a 算法的改进2 9 5 1 标准w s o l a 算法2 9 5 2 改进的w s o l a 算法3 3 5 3 算法仿真。3 7 5 3 1 仿真环境3 7 5 3 2 仿真效果3 9 5 4 结论4 l 第六章结束语4 2 6 1 工作总结4 2 m 北京邮电大学硕上学位论文 基于无线网络的v o i p 中w s o l a 算法的改进研究 6 2 展望与未来研究方向4 3 参考文献4 4 致j 谢4 5 作者攻读学位期间发表的学术论文目录4 7 北京邮电大学硕士学位论文 基于无线网络的v o i p 中w s o l a 算法的改进研究 1 1 课题背景及意义 1 1 1 课题背景 第一章绪论 随着通信技术和计算机硬件水平的发展,遍布世界的因特网的规模、结构和 复杂度都达到了一个前所未有的高度。因特网的爆炸式发展,使其从一个基于数 据业务的网络,转变为向用户提供视频、音频等多种业务的综合性的网络,互联 协议电话( v o i c eo v e ri n t e m e tp r o t o c o l ,口) 作为一种新兴的基于因特网协议 ( 口) 的实时语音传输技术,成为了目前研究的热点。 互联协议电话指的是用口网络进行话音传输,由于在分组网络上的语音传 输可以很容易地和其它业务结合,实现多媒体通信,并且以分组形式传输的语音 信息利用了互联网络低成本的特点,使其费用通常比传统的电话网传输要低,受 到了广大用户的欢迎。根据调查,长途电话中有7 0 已经使用了互联协议电话技 术,作为一项新兴的技术,互联协议电话具有逐步取代长途电话的趋势。 在互联协议电话技术快速发展的同时,基于i e e e 8 0 2 1 1 x 标准的无线网络技 术也得到了长足的发展,无线网络的带宽、传输速率等都能够得到一定的保证, 各类无线自组织网络和路由协议的发展,也极大地提升了无线网络的可靠性和应 用范围,无线网络作为有线网络一种强有力的补充,正在越来越多地融入人们的 日常生活之中。在无线网络技术蓬勃发展的背景下,基于无线网络的互联协议电 话技术的研究也成为了无线应用研究领域一个重要的组成部分。 由于无线网络介质本身的不稳定性,以及无线信号在传播过程中暴露在大气 之中,容易受到来自各方面的干扰,导致基于无线网络的互联协议电话语音包的 传输情况不容乐观,通常会遭受到较大程度的丢包影响。研究表明,当互联协议 电话业务的丢包率超过5 了以后,由于影响了语音波形的连续性,将对语音通 信质量产生比较明显的影响,而在前向纠错已无法产生作用的时候,就需要靠接 收端通过一系列的丢包恢复技术来抵消无线网络大量丢包对语音通信质量造成 的不良影响。 丢包恢复技术属于丢包处理技术的一种,它指的是在丢包已经确实发生了的 情况下,所采用的隐藏丢包事实、蒙骗人耳,使人主观上产生一种并没有丢包的 感觉的技术。其主要原理是利用了人类在听到不完整波形的时候的一种下意识的 修复能力,在对收到的波形进行一定的改动以后,可以在相当大的程度上减轻丢 北京邮电大学硕士学位论文 基于无线网络的v o i p 中1 r s o l a 算法的改进研究 包对人产生的主观影响,让接收端的人耳感观上认为并没有丢包或者丢包并不是 特别严重。其中,波形相似叠加方法是一种常用于丢包恢复技术的语音波形处理 方案。 1 1 2 课题意义 利用口网络传输实时话音信息,相比传统的电话网络,在成本以及业务多 样性等方面,都有着无可比拟的优势。但由于口网络其本身尽力而为的特性, 导致无法保证每一个语音包都能够顺序地从发送端毫无损害地传输到接收端,而 如果在传输过程中遭受的网络丢包太多的话,将在很大程度上影响实时语音业务 的通话效果,利用口网络传输实时话音的优势也将不再明显。 由于当前无线网络技术的飞速发展,使得基于无线网络的互联协议电话业务 也逐渐成为一个贴近人们日常生活的应用,在无线网络中通过口包传递话音信 息,得到了越来越多的用户的支持和喜爱。 但是,在无线网络中传输实时话音信息,相对于有线网络来说,面临着更大 的挑战。由于无线网络本身的不稳定性,导致建立在无线网络基础之上的传输链 路也是不稳定的,无线网络中的语音传输业务可能面临着非常大的时延和丢包情 况。而对于实时语音业务来说,大的时延可能导致语音通信无法正常进行,过大 的丢包率也可能极大地损害语音传输的质量。由于实时语音通信对时延的高要 求,使得无法通过数据传输领域中的重传技术来恢复由于网络错误丢失的语音 包,实时语音通信业务要求能够使用一种技术,在不引入过大时延的基础上,恢 复被丢失了的语音包,用于对抗无线网络的高丢包率。 由于人耳的掩蔽效应【1 】以及人类语音信号的短时相关性1 2 1 ,使得根据已正确 传输至接收端的语音信息恢复在传输过程中丢失的语音信息成为可能,丢包隐藏 技术成为应对实时语音业务中高丢包率的主要技术之一,被广泛地使用。在使用 最多的几种丢包隐藏技术中,波形相似叠加( w s o l a ) 算法作为一种能够保持 原始语音基音周期的时域扩展算法【3 1 ,通常能够取得非常好的恢复效果。 由于标准的波形相似叠加算法只注重了对语音信号基音周期的保持,而缺乏 强有力的幅度控制,因此导致在有的情况下,由标准波形相似叠加算法所恢复出 来的语音波形在幅值上与原始波形差距过大,严重影响了语音恢复效果。本论文 在标准波形相似叠加算法的基础上,对其进行改进,提升了该算法在丢包隐藏领 域的语音恢复效果,对拥有高丢包率的,基于无线网络的实时语音业务语音传输 质量的提升,起到了非常好的促进作用 2 北京邮电大学硕上学位论文 基于无线网络的v o i p 中w s o l a 算法的改进研究 1 2 国内外研究综述 由于口网络本身的不稳定性,在口网络上传输实时语音信息,必然会受到 一定程度的丢包影响。国内外大量的论文对实时语音传输过程中所遇到的丢包问 题的应对情况作出了许多深入的分析和讨论【4 】【7 1 。目前,应对实时语音传输过程 中的丢包情况,主要使用的技术为丢包恢复技术和丢包隐藏技术两大类。 丢包恢复技术侧重于从接收端收到的信息中,恢复出与原始语音信息完全一 样的信息,通常是直接利用所传递的信息的冗余来抵抗信道错误和干扰,达到降 低接收端的实际丢包率的效果。丢包隐藏技术的重点则在于利用人耳的掩蔽特 性,利用接收端所收到的语音信息,按照一定的逻辑仿造出已经丢失了的语音包。 由于人耳在听声音的时候会在潜意识中对不完整和不正确的波形进行修补,因此 使用丢包隐藏技术所恢复出来的波形,通常不会让人明显地感觉到错误,可以在 很大程度上提升接收端人耳的听觉感受。 在众多丢包隐藏技术中,基于时域尺度变换的波形相似叠加算法属于一种运 算量较小,但恢复效果很好的算法。波形相似叠加算法由于其出色的语音基音周 期保持能力,可以在恢复语音波形的同时,很好地保护住原始语音的基音周期, 因此是一种受到广泛关注的算法。 波形相似叠加算法的基本思想是,将几段波形按照相位最一致的位置相互部 分重叠叠加,使叠加后的语音波形伸长,覆盖过了由于丢包而造成的语音波形空 隙,达到恢复出近似于原始语音波形的效果。由于波形相似叠加算法拥有很广泛 的发展前景,在国内外都得到了许多研究人员的关注,如何提升波形相似叠加算 法的恢复效果,进一步降低恢复过程中的运算量,都成为了这一领域最值得研究 的课题。 目前国内外在提升波形相似叠加算法的丢包隐藏恢复效果方面,主要的研究 方向为恢复语音和原始语音的平稳过渡。在得到一段输入语音之后,分解第一语 音段墨的时候,可以直接取输入语音的前己个样点做为墨的分解位置,这样做的 优势在于不需额外的运算量,逻辑简单。但由于这种语音段分解方法可能在有的 情况下对恢复语音造成一些不连续的感觉,因此,通常在决定& 的位置之前,需 要添加一个帮助语音波形过渡的辅助语音段& ,由于& 跨越了不被算法修改的 语音波形和将被算法修改的语音波形,因此既辅助了墨语音段的定位,又很好地 直到了对恢复波形的平滑过渡作用,如图1 - 1 所示。 在恢复波形的尾部,同样拥有促进波形平滑过渡的恢复技术。比如适当延长 最后一个语音段的长度,使其能够比正常的算法跨过更长的语音波形,让恢复波 形的尾部和原始波形能够更加平滑地过渡。 3 北京邮电大学硕士学位论文基于无线网络的v o l p 中w s o l a 算法的改进研究 输入信号k 1 3 论文的主要工作及章节安排 本文主要阐述了在基于无线网络的互联协议电话业务中,使用波形相似叠加 算法应对网络丢包,实施丢包隐藏的技术细节,以及在标准波形相似叠加算法的 基础上,对其进行改进,在语音段叠加过程中引入了一个幅度增益,极大地提升 了标准波形相似叠加算法在语音波形恢复过程中的幅度控制能力,提升了标准波 形相似叠加算法的恢复效果,取得了一定的研究成果。 本文的结构如下: 第二章主要介绍了互联网与其相关技术的基本原理。包括互联网协议( i p ) , 实时传输协议,互联协议电话,i e e e 8 0 2 1 l x 无线局域网,数字语音信号,语音 编码技术,汉宁窗等基本知识的原理和细节,为下文的深入研究作铺垫。 第三章主要介绍了当前流行的各种丢包处理技术的现状以及各自的特点。其 中分别介绍了丢包恢复技术和丢包隐藏技术,以及它们各自的具体实施方法和优 缺点。 第四章是对第三章的深入补充,主要介绍了时域尺度修改技术的细节和现 状。 第五章是全文的核心,介绍了标准波形相似叠加算法的全部运算细节以及在 改进的波形相似叠加算法中,幅度增益因子的引入以及计算方法,和最终的仿真 结论。在实时语音通信的丢包隐藏过程中,改进的波形相似叠加算法通常能够得 4 盈 北京邮电大学硕士学位论文 基于无线网络的v o i p 中w s o l a 算法的改进研究 到比标准波形相似叠加算法更好的恢复效果 第六章是论文的总结与展望,并提出了下一步研究的方向。 5 北京邮电大学硕士学位论文基于无线网络的v o i p 中w s 0 l a 算法的改进研究 第二章互联网与相关技术原理 2 1 互联网协议( ip ) 互联网协议( p ) 是互联网协议群( i n t e r a c tp r o t o c o ls u i t e ,i p s ) 中众多通信 协议中的一个,也是其中最重要的一个。专家们一般将i p s 解释为一个协议堆栈, 它可以将应用程序的信息( 比如电子邮件或者网页传输的内容) 转换为网络可以 传输的数据包。 互联网协议主要负责通过网络连接在数据源主机和目的主机间传送数据包, 是一个用来在网络中将数据分组从源地址到目的地址进行路由选择的协议。一个 数据分组被加上口报头,在口报头中含有信源信息和目的地地址信息。带有碑 报头的数据分组被称为口数据包,路由器利用报头中的信息将分组路由到目的 地。 i p 工作在开放系统互联( o p e ns y s t e mi n t e r c o n n e c t i o n ,o s i ) 参考模型的第 三层,提供了在分组交换网络中通信的语法和语义规则。协议详细说明了报文的 格式,描述了当报文到达计算机时如何响应,指明计算机如何处理错误或其它异 常情况。更为重要的是,和其它协议一样,i p 向开放系统互联参考模型上层屏 蔽了其下层的协议和通信实体,使其上层的协议可以工作于统一的接口之上,有 利于网络结构的抽象和多种底层硬件技术的协同工作。因特网能在全世界范围内 实现互联,依赖的正是这种屏蔽底层实现细节的强大特性。 开放系统互联参考模型是国际标准化组织( i s o ) 在1 9 8 5 年研究的网络互 联模型。国际标准化组织发布的最著名的标准是i s o i l e c7 4 9 8 ,又称为x 2 0 0 协议。该体系结构标准定义了网络互连的七层框架,即国际标准化组织的开放系 统互连参考模型。在这一框架下进一步详细规定了每一层的功能,以实现开放系 统环境中的互连性、互操作性和应用的可移植性。 开放系统互联参考模型将机器之间的通信问题分成了7 层,每层只同另一台 机器相对应的同一层交谈,这就意味着第7 层只需考虑接收方机器的第7 层,而 无需考虑实际的物理介质是什么。开放系统互联模型的分层结构如图2 - 1 所示。 北京邮电大学硕士学位论文基于无线网络的v o l p 中w s o l a 算法的改进研究 主执 虎彤昭 蠢示0 套话誓 蝮,税 : 传输 i 臻罂闷络毯 i 唾略屡 眠露踊叛啦- 雅蜷 截曩l 磁增i 垃 艇 l 黟翟物墙鬈 蝴1 1 4 鬟 iil l 参编介磁。翰介贩,i 翻开辩 图2 - i 。开放系统互联参考模型 3 会话层:会话层负责建立、管理和终止应用间的会话。会话层同步表示 层实体间的对话以及管理它们的数据交换。除了提供会话的基本规则外, 会话层也提供会话层、表示层和应用层的传输和异常报告。 4 传输层:传输层负责提供网络间的可靠数据传输。这需要通过流量控制、 错误检测、端对端确认、重传和数据队列等方法来完成。 5 网络层:网络层提供了主机的逻辑地址。这样,通过这个地址,可以使芗 两个在完全不同的逻辑网络上的不同系统确认一条通信路径。路由协议 位于网络层。 6 数据链路层:数据链路层通过物理层提供可靠的传输。链路层有它自己 的寻址方法,这个寻址方法关心物理连接,可以根据数据链路层地址传 输帧。 7 物理层:物理层的功能是确认使用电脉冲和电压变化来在物理介质上创 建o 和1 ,用以表示数字化的信息。 开放系统互联参考模型的每层都为它的上一层提供服务,并向它的直接下一 层请求特定的服务。这种层次方法使每层只需处理网络信息的- 4 , 部分,就可以 对所传递的数据进行必要的修改,并可以在将数据传递给下一层前增加必要的内 容和功能。 口是一个“尽力而为”的协议,其本身并不能保证某个既定的分组被传送,更 不能保证多个分组被顺序地传送,网络中的传输错误、拥塞或链路故障,都可能 导致目的地接收到的i p 包存在乱序、丢失或者重复的现象。所以,基于口的应 用都将面临不可靠传输的风险,可靠的传输必须靠口上层协议或应用本身来实 现 7 北京邮电大学硕士学位论文 基于无线网络的v o i p 中w s o l a 算法的改进研究 2 2 实时传输协议( r e a l - t i m et r a n s p o r tp r o t o c o l ,r t p ) 实时传输协议是一个网络传输协议,它是由互联网工程任务组( i n t e r a c t e n g i n e e r i n gt a s kf o r c e ,i e t f ) 的多媒体传输工作小组1 9 9 6 年在r f c1 8 8 9 中公 布的。 实时传输协议( r e a l t i m et r a n s p o r tp r o t o c o l ,r t p ) 详细说明了在互联网上传 递音频和视频的标准数据包格式。它一开始被设计为一个多播协议,但后来被用 在很多单播应用中。实时传输协议常用于流媒体系统( 配合实时传输控制协议) , 视频会议和一键通系统,使它成为i p 电话产业的技术基础。实时传输协议和实 时传输控制协议通常一起使用,而且它是建立在用户数据报协议上的。 实时传输协议本身并没有提供按时发送机制或其它服务质量( o o s ) 保证, 它依赖于低层服务去实现这一过程。实时传输协议并不保证传送或防止无序传 送,也不确定底层网络的可靠性。实时传输协议实行有序传送,协议中的序列号 允许接收方重组发送方的包序列,同时序列号也能用于决定适当的包位置。 在互联协议电话业务中,由于传输控制协议( t r a n s p o r tc o n t r o l p r o t o c o l , t c p ) 巨大的开销以及协议本身引入的时延无法很好地满足实时语音传输的要 求,因此在传输层上的互联协议电话语音数据一般是通过用户数据报协议( u s e r d a t a g r a mp r o t o c o l ,u d p ) 进行传输的。 由于用户数据报协议其本身的不可靠性,导致接收端收到的语音包可能出现 重复、乱序和丢失的现象。因此,单纯的用户数据报协议不能很好地满足接收端 对于恢复原语音信号的要求,实现语音信号的正确恢复,必须依靠实时传输协议 的参与。 实时传输协议,是针对因特网上多媒体数据流的一个传输协议,它被定义为 在一对一或一对多的传输情况下工作,其目的是提供时间信息和实现流同步。由 于用户数据报协议无法做到避免分组丢失和确保分组有序传输,运行在用户数据 报协议之上的实时传输协议通过使用序列号和时间戳等标记,帮助其实现了这些 功能。值得注意的是,实时传输协议本身并不确保流的同步,它只是提供了一些 附加的信息给高层的应用,以便高层的应用能够合理地决定数据分组或是语音分 组如何能被最好地处理。 与实时传输协议相伴的还有一个实时传输控制协议( r e a l t i mt r a n s p o r t c o n t r o lp r o t o c o l ,r i t i :p ) ,这个协议为会话用户之间提供了大量的可供交换的信 息和关于会话质量的反馈信息实时传输协议和实时传输控制协议配合使用,能 以有效的反馈和最小的开销使传输效率最佳化,故特别适合传送网上的实时数 据。 8 北京邮电大学硕士学位论文基于无线网络的v o i p 中w s o l a 算法的改进研究 2 3 、7 0 i p 互联协议电话( v o i c eo v e ri n t e m e tp r o t o c o l ,v 0 p ) 指的是利用因特网协议 ( 口) ,将模拟声音信号数字化后,在分组交换网络中进行实时语音传输的一种 技术。一般来说,语音信号经过抽样、编码以后,将连续的几帧语音数据放入一 个口包内进行传输,在收端再通过相同的方法恢复出原语音数据和波形,实现 语音信号在分组交换网内的实时传输。运用互联协议电话的原因之一就是有机会 利用高效的话音编码,使用较少的比特数来表示被传输的语音,从而降低所需的 带宽和成本。 互联协议电话是建立在互联网上的新型数字化语音传输和交换技术,由于互 联协议电话能广泛地采用互联网和全球p 互连的环境,因此互联协议电话的使 用可以极大地降低用户的通信费用,而互联网的蓬勃发展也促进互联协议电话技 术的迅猛发展。互联协议电话的成功开发和应用,预示了以口为基础的新一代 信息网络的出现,积极地探索和跟踪这项新技术无疑具有十分重要的意义。 除了成本因素以外,使用口网络传导话音,与传统的公共交换电话网( p s t n ; p u b l i cs w i t c h e dt e l e p h o n en e t w o r k ) 相比,还拥有许多优点如下p j : 1 公共交换电话网不能足够快地建立部署新的功能。公共电话交换网是 建造在由设备厂商提供应用的基础架构上的,这就意味着用户一次购 买了所有需要的服务。但一个公司满足所有客户的所有需求是非常困 难的,而在目前的架构上,许多厂商为公共交换电话网开发新应用是 不可能的。相对于公共交换电话网,如果将语音业务移植到以l p 网 络为基础的开放平台上,则任何厂商都可以为其提供应用服务。 2 数据、语音和视频无法三者合一。单一的实时语音业务只占所有语音 业务的很小的一部分,数据、语音和视频三者合一是将来多媒体业务 的主要需求。在口网络上承载话音业务,可以很容易地与i p 网络上 的其它业务交互合作,能够更好地满足用户的需求。 3 为语音而建的架构很难足够灵活地承载数据。在公共交换电话网中, 由于承载信道、呼叫控制和服务逻辑都被紧紧地捆绑在一个固定的平 台上,因此很难为了新的需求而对其进行改变,哪怕只是为了稍微提 升一点语音质量。 然而互联协议电话与传统电话语音相比,也有其致命的弱点,即语音质量较 差,这已成为互联协议电话研究领域的一个难题。影响互联协议电话语音质量的 因素可以分为两类:语音传输因素和网络条件因素,具体的影响因素有以下几个 方面:丢包、延迟和抖动。令人欣喜的是,随着口技术的发展,互联协议电话 9 北京邮电大学硕士学位论文基于无线网络的y o i p 中骼o l a 算法的改进研究 的服务质量( q o s ) 研究取得了不少成果,提出了许多改进服务质量的策略。归 纳起来可以分为三类:注册许可控制策略、资源预留策略和自适应策略。前两类 策略分别采用资源预留( r s v p ) 等协议和改变口网络的结构,以改善互联协议 电话的语音质量,但这两类策略的实施涉及到整个网络环境的改造,实现起来困 难较多;后一类策略是在互联协议电话的终端产品( 如口电话网关) 中,采用 一些能根据网络状态变化而进行相关参数调整的技术,因此实现起来较为简便。 由于口层分组传输的不可靠性,使得在口层上承载实时语音业务,与口 层上传输数据的业务相比,要更加地复杂。由于口包在到达接收端的过程中, 可能出现乱序、丢失和重复的现象,而对于实时语音业务来说,并不能简单地通 过重传和设置接收缓存来应对口层的不可靠问题。因为不同于数据业务,实时 语音业务对于时延和时延抖动有着比较高的要求,一般来说,接收端人耳可以接 收的时延要求在2 0 0 m s 以内,而如果时延超过4 0 0 m $ 的话,其语音传输的质量 就很难满足人耳的要求了。 2 4i e e e 8 0 2 1 1 x 无线局域网 无线局域网( w i r e l e s sl o c a l a r e an e t w o r k ,w l 气n ) 是一种能在几十米到几 公里的范围内支持较高数据速率的无线网络,i e e e 8 0 2 1 1 系列标准是无线局域 网领域的主流标准之一。 i e e e 8 0 2 1 1 系列标准指由i e e e 8 0 2 1 1 标准任务组提出的协议族,主要包括 i e e e 8 0 2 1 1 、i e e e 8 0 2 1 l a 、i e e e 8 0 2 1 l b 、i e e e 8 0 2 1 l g 等,i e e e 8 0 2 1 1 系列标 准定义了单一的m a c 层和多样的物理层,向上层提供了一个基于无线环境的网 络接口。 i e e e 8 0 2 1 1 和i e e e 8 0 2 1 l b 用于无线以太网,其工作频率大多在2 4 g h z 上, 传输速度为:i e e e 8 0 2 1 1 是1 到2 m b s ;i e e e 8 0 2 1 l b 的速率为5 5 到1 1 m b s , 并兼容i e e e 8 0 2 1 1 速率。 i e e e 8 0 2 1 l a 的工作频率在5 到6 g h z ,它使用正交频分复甩技术( o r t h o g o n a l f r e q u e n c yd i v i s i o nm u l t i p l e x ,o f d m ) 使传输速率可以达到5 4 m b $ i e e e 8 0 2 1 l g 工作在2 4 g h z 上,采用补码键控调制、正交频分利用技术和 分组二进制卷积码,可提供5 4 m b s 的速率并兼容i e e e 8 0 2 1 l b 标准。 尽管i e e e 8 0 2 1 1 系列标准在物理层上使用了合理的调制技术以保证信道的 稳定性,但由于无线信道其本身的特性,以及多径衰落等难以完全避免的客观 象,使得基于i e e e 8 0 2 1 1 系列标准的无线网络并不十分的稳定因此,基于 线网络的互联协议电话应用就将面临比较高的时延和较高的丢包率,这也是无 环境下互联协议电话应用所要面临的个挑战。 1 0 北京邮电大学硕士学位论文 基于无线网络的v o i p 中w s o l a 算法的改进研究 2 5 数字语音信号 由于人类的语音属于一种模拟信号,对于传输、运算来说都不够方便,因此 在处理人类语音之前,应该首先将其转换为数字信号。脉冲编码调制( p u l s ec o d e m o d u l a t i o n 。p c m ) 就是一种常用的把模拟语音信号数字化的方法。 p c m 的编码过程如下: 1 模拟波形通过一个音频过滤器,将输入信号中所有超过4 k i - i z 的部分过滤 出来。根据奈奎斯特定理,这要求采样器每秒采样8 0 0 0 次才能得到高质量的话 立 目o 2 对过滤后的模拟信号进行每秒8 0 0 0 次的采样。 3 波形被采样后转换成离散的数字表达方式。 对于原始的p c m 采样值,通常需要用1 6 比特的二进制位来表示一个采样 值,即一共有6 5 5 3 6 个量化台阶,这是一个在样值幅度上比较精确的离散数字信 号。然后,这个离散数字信号作为各种编码器的输入数字信号,进行编码,则可 以得出各种不同的语音编码。 经过编码器编码以后的p c m 编码有两种,北美标准的肛律和欧洲标准的a 律,这两种方法很相似,都能够使用8 比特的编码得到1 2 至1 3 比特的语音质量。 矽 2 6 语音编码技术 为了使互联协议电话技术能够可靠地运用于无线网络,必须解决好两个问 题:一是尽量保证传输媒介的稳定和传输链路的可靠性,另一个问题是在保证一 定话音质量的前提下尽可能地降低编码比特率。由于在无线网络中,网络带宽是 非常宝贵的资源,因此在保证质量的前提下尽量降低语音编码所需带宽,是语音 编码技术的主要研究方向之一。 语音信号主要存在两方面的冗余度,即语音信号幅度分布的非均匀性和样本 之间的相关性1 9 1 。非均匀性表现为小幅度语音信号出现的概率大而大幅度语音信 号出现的概率小,非均匀量化技术正是针对语音信号的这一特点而提出的:样本 之间的相关性表现为样本点之间的短时相关性和相邻基音周期之间的长时相关 性,利用语音信号的相关性,可以在实现低速率编码时,也能保持较高的语音编 码质量。 2 6 1 语音质量 由于话音质量是一个比较主观的概念,难以对其下一个精确的定义,因此现 北京邮电人学硕士学位论文基于无线网络的v o i p 中w s o l a 算法的改进研究 在国际上最常用的语音质量评估标准是平均意见得分( m e a no p i n i o ns c o r e , m o s ) 等级评价法【1 0 1 。 平均意见得分等级评价法按语音质量给出五个得分等级如下: 5 分:非常好 4 分:好 3 分:一般 2 分:差 1 分:非常差 常用平均意见得分等级评价方法包括主观平均意见得分评价法和客观平均 意见得分评价法。 主观平均意见得分评价法采用国际电信联盟电信部u te 8 0 0 建议书,由 不同的人分别对原始语料和经过系统处理后有衰退的语料进行主观感觉对比,给 出平均意见得分,最后求平均值。 客观平均意见得分评价法采用国际电信联盟电信部r r u te 8 6 2 建议书提 供的语音质量感觉评价( p e r c e p t u a le v a l u a t i o no fs p e e c hq u a l i t y ,p e s o ) 方法, 由专门的仪器或软件进行测试。 2 6 2 编码技术 目前应用中的主要编码技术,按其基本原理大致可以分为三种类型:基于波 形的编码技术、基于参量的编码技术和混合编码技术【1 1 】。 基于波形的编码技术将输入的模拟信号抽样编码而不考虑信号是如何产生 的,然后,它将量化后的样值传送到终端,由终端根据样值重组出与原始信号大 致接近的恢复信号。波形编码的比特率一般在1 6 k b i t s 至6 4 k b i t s 之间,总的来 说,这类技术能够提供较高的语音传输质量,而且实现简单、技术成熟。它最大 的缺点是同其它编码技术相比,需要占用大量的带宽。当基于波形的编码技术用 于低带宽环境时,其话音质量下降得非常快。 基于参量的编码技术试图使输入信号符合话音产生的数学模型。这类技术通 常使用声道的线性预测过滤模型,用一个清( 浊) 音标志来代表使用于过滤器的 激发信号。换一句话说,过滤器代表声道,而清( 浊) 音标志代表了从声带接受 的是一个清音还是一个浊音。被传送到接收端的信息是一组参数模型,而不是信 号本身,使用相同模型的接收端可以通过收到的参数模型重建发端的模拟信号 基于参量的编码技术可以以很低的比特率传输语音信息,一般在2 k b i t s 至 4 8 k b i t s 之间,语音的可懂度好,但有明显的失真,而且由于模型本身的限制, 即使使用更高的比特率,也不会对所传输的语音质量起到太大的提高作用。 1 2 北京邮电大学硕士学位论文基于无线网络的v o i p 中w s o l a 算法的改进研究 混合编码是一类新的语音编码技术,它将波形编码技术和参量编码技术结合 起来,力图保持波形编码语音的高质量和参量编码的低速率。采用混合编码的语

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论