（信号与信息处理专业论文）ip语音通信中媒体处理技术的研究与实现.pdf

上传人：扣*** IP属地：宁夏上传时间：2019-12-15 格式：PDF 页数：100 大小：2.08MB 积分：0 举报 版权申诉

（信号与信息处理专业论文）ip语音通信中媒体处理技术的研究与实现.pdf_第2页

（信号与信息处理专业论文）ip语音通信中媒体处理技术的研究与实现.pdf_第3页

（信号与信息处理专业论文）ip语音通信中媒体处理技术的研究与实现.pdf_第4页

（信号与信息处理专业论文）ip语音通信中媒体处理技术的研究与实现.pdf_第5页

已阅读5页，还剩95页未读，继续免费阅读

（信号与信息处理专业论文）ip语音通信中媒体处理技术的研究与实现.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

摘要摘要论文采用模块化的思想对v o i p 系统进行设计，按照功能的不同，将其分为七大模块：语音获取、语音编码、分组传送 ( r t p r t c p ) 、分组接收、语音解码、抖动处理、语音播放。在研究了d i r e c t s h o w 的f i l t e r 的基础上，借鉴f i l t e r 的工作原理，设计了各功能模块之间统一的接口，并且实现了这些模块的基本功能。为了完成软交换( s o f t s w i t c h ) 的信令与嫡淋的分离，设计和实现了媒体、信令的中间层一媒体管理模块。此模块向上受到信令的控制，向下控制媒体的处理，为媒体和信令的交互起到桥梁的作用。在实时语音处理中，服务质量( q o s ) 是必须解决的问题。论文中深入研究了，i p 网络中影响语音质量的因素：时延、抖动、分组丢失、语音编码。提出一种可以有效的仿真网络时延的模型，并且实现了自适应抖动缓存的处理。总之，在整个设计和实现的过程中，本研究注重科研课题的继承性，不仅集成了已经成熟的科研成果，还开发出性能稳定的媒体处理模块。规范化的接口、模块化的设计为媒体处理系统的继续开发和完善提供了良好的平台。【关键字】媒体处理，模块化，v o l p a b s t r a c t a b s t r a c t t h i st h e s i sa d o p t sm o d u l a r i t yt h r o u g h w a yt od e s i g nt h es y s t e mo fv o l e a c c o r d i n g t ot h ed i f f e r e n c eo ff u n c t i o n s ，i ti sd i v i d e di n t os e v e nm a j o rm o d u l e s ： v o i c e c a p t u r e 、v o i c ec o d e 、r e a l - t i m et r a n s p o r t c o n t r o lp r o t o c o l 、p a c k e tr e c e p t i o n 、 v o i c ed e c o d e 、j i t t e rp r o c e s s i n ga n dv o i c e p l a y o u t 。i na d d i t i o n ，a f t e rr e f e r r i n gt o t h eo p e r a t i o np r i n c i p l eo ff i l t e ro fd i r e c t s h o w , t h i st h e s i sf r a m e st h ec r i t e r i o n i n t e r f a c eb e t w e e nt h e s ef u n c t i o n a lm o d u l e st om a k e st h e mw o r kt o g e t h e rw e l l ， a n di m p l e m e n t st h eb a s i cf u n c t i o no ft h e s em o d u l e i no r d e rt o s e p a r a t et h e m e d i af r o m s i g n a l i n g ，t h ep a p e rd e s i g n sa n di m p l e m e n t s a ni n t e r m e d i a t el e v e lt o m a n a g e r t h em e d i a m e d i a m a n a g e m e n t m o d u l e q u a l i t yo fs e r v i c e ( q o s ) i sas i g n i f i c a n tp r o b l e mt h a tm u s tb es o l v e di n r e a l - t i m ev o i c ep r o c e s s i n g t h i st h e s i sf u r t h e ri n v e s t i g a t e st h ef a c t o r st h a ti m p a c t t h eq o so f v o i c ei ni pn e t w o r k ：d e l a y 、j i t t e r 、p a c k e tl o s sa n d v o i c e c o d e c ，a n d t h e np r o v i d e sa ne f f e c t i v em o d e lt os i m u l a t et h en e t w o r kd e l a y , a n di m p l e m e n t sa p r o c e s s i n g o f a d a p t i v ej i t t e rb u f f e r i nc o n c l u s i o n ，t h i st h e s i sp a y sm o r ea t t e n t i o nt oi n h e r i t a b l ec h a r a c t e ro ft h e p r o j o c t ，n o to n l yi n t e g r a t e st h em e t h o d st h a th a v ea l r e a d yb e e nu s e d ，b u ta l s o d e v e l o p s am o d u l eo fm e d i a p r o c e s s i n g t h a te x h i b i t s s t e a d yp e r f o r m a n c e s t a n d a r d i z e di n t e r f a c ea n dm o d u l a r i z e dd e s i g nh a v eo f f e r e dag o o dp l a t f o r mf o r c o n t i n u a t i o na n dp e r f e c t i o no ft h em e d i ap r o c e s s i n g s y s t e m k e y w o r d s | m e d i a p r o c e s s i n g , m o d u l a r i z a t i o n ，v o l p 独创性声明 v 7 4 1 9 4 4 本人声明，所呈交的学位论文是我个人在导师指导下进行的研究上作及取得的研究成果。尽本人所知，除了文中特别加以标注利致谢的地方外，论文中不包含其他人已经发表或撰写过的研究成果，也不包含为获得北京交通大学或其他教学机构的学位或证书而使用过的材料。与我起工作的同志对本研究所做的任何贡献已在论文中作了明确的说明并表示了谢意。本人签名：释采舞日期：) 修年弓月3 】日关于论文使用授权的说明本人完全了解北京交通大学有关保留、使用学位论文的规定，即：学校有权保留送交论文的复印件，允许论文被查阅和借阅；学校可以公布论文的全部或部分内容，可以采用影印、缩印或其他复制手段保存论文。论文中所有创新和成果归北京交通大学计算机与信息技术学院所有。未经许可，任何单位和个人不得拷贝。版权所有，违者必究。本人签名：监 e 1 期：泖年弓月2 2 日综述第一章综述 1 1 论文的选题背景 n g n ( n e x tg e n e r a l i o nn e t w o r k ) 是一个非常广泛的概念，它是电信史上的里程碑，标志着新一代电信网络的到来1 。语音、视频以及其它多媒体流在下一代网络中的实时传输成为亮点，流媒体技术随着网络的发展、带宽的增加，以及各行各h p 的信息化建设，已被越来越重视。v o l p 技术的兴起使得基于i p 的语音服务更是贯穿于下一代网络各种复杂的多媒体业务当中。因此实时媒体通信技术备受关注。 1 1 1n g n 的到来目前电信业务发展迅猛，以互联网为代表的新技术革命正深刻地改变着传统电信的概念和体系，电信界正丽临着一场百年未遇的巨变，基于t d m 的p s t n 语音网必将和分组交换数据网融合，形成可以传递话音和数据等综合业务的新一代网络【甜。作为理想网络，n g n 已经提出了一段时问，许多研究机构对此也做了很多工作。不过，对n g n 至今还没有一个统一的定义，但是却有一个共同的目标，那就是消除现有电信网络的弊端。现有的电话交换网以交换机为核心，交换机对业务的处理如同黑箱操作，它集中了业务接入、媒体处理、呼叫控制和业务管理的全部功能。这必然带来些负面的影响，一方面对设备制造商来说，升级北京交通大学硕士论文交换机比较困难；另一方面也造成一定程度的垄断，使新业务的发展比较缓慢。所以，在构造以i p 为基础的n g n 的时候，采用了开放式的结构，将业务接入、媒体处理、呼叫控制和业务处理分离开，并在它们之间采用标准的协议进行互连。根据这种思想，可以得出 n g n 的概念模型。如图1 1 所示：图i in g n 分层体系结构接入层主要解决业务接入问题，这种接入可以是一个完整的网络，也可以是一些有线或无线的按入网络。接入层发展的很快，主要的问题是提高带宽。媒体层主要处理接入层送来的媒体，完成媒体类型的转换和传送，还包括一些网关和统计的功能。控制层是n g n 中最重要的一层，主要是完成信令的处理，包括信令网关、软交换等设备。网络业务层处理业务逻辑1 1 i 。 2 综述 1 1 2 软交换技术软交换是在将智能融入v o l p 网络、i p 网络接口、公共交换电话网，以及协调网问特性的需求推动下提出的【”。软交换是一种功能实体，位于n g n 分层体系结构的控制层，为其提供具有实时性要求的业务的呼q 控制和连接控制功能，是下一代网络呼叫与控制的核心。简单的看，软交换是实现传统程控变换机的“呼叫控制”功能的实体，但传统的“呼叫控制”功能是和业务结合在一起的，不同的业务所需要的呼叫控制功能不同，而软交换则是与业务无关的，这要求软交换提供的呼叫控制功能是各种业务的基本呼叫控制。未来的软交换应该是尽可能简单的，智能控制功能则尽可能的移至外部的业务和或应用层。软交换是一项突破性的技术，它使v o l p 能取代t d m 成为一项电话技术。在软交换的软交换机开发之前，v o l p 因为缺乏通过网络路由呼叫所需要的足够信息，而只能算是一种有缺陷的技术。没有这些信息，l p 要取代p s t n 将是不可能的【3 j 。软交换的发展使得媒体的发展更加独立，也使得选择模块化处理实时媒体更加合理。 1 1 3 流媒体技术现代网络中，由于宽带接入技术、媒体压缩技术的发展，以及宽带多媒体业务需求的增加，流媒体技术被广泛应用于铁路、交通、金融、石油、石化、煤炭、海关、港口、水利、林业等企事业单位 3 北京交通大学硕士论文的信息化建设当中l 。流媒体指在i n t e r n e t i n t r a n e t 中使用流式传输技术的连续时基媒体，如：音频、视频或多媒体文件。流式媒体在播放前并不下载整个文件，只将开始部分内容存入内存，流式媒体的数据流随时传送随时播放，只是在开始时有一些延迟。流媒体实现的关键技术就是流式传输。流式传输定义很广泛，现在主要指通过网络传送媒体( 如视频、音频) 的技术总称。实现流式传输有两种方法：实时流式传输 ( r e a l t i m es t r e a m i n g ) 和顺序流式传输( p r o g r e s s i v es t r e a m i n g ) 。一般说来，如果视频为实时广播，或使用流式传输媒体服务器，或应用如r t s p 的实时协议，即为实时流式传输。如果使用的是h 1 t r p 服务器，文件即通过顺序流发送。流式文件同时也支持在播放前完全下载到硬盘。流媒体主要采用的传输协议是实时传输协议r t p 与r t c p 。还有种协议是实时流协议r t s p ( r e a l - - t i m es t r e a m i n gp r o t o c 0 1 ) r t s p 在体系结构上位于r t p 和r t c p 之上，它使用t c p 或u d p 完成数据传输。h t t p 与r t s p 相比，h t t p 传送h t m l ，而r t s p 传送的是多媒体数据。h t t p 请求由客户机发出，服务器做出响应；使用r t s p 时，客户机和服务器都可以发出请求，即r t s p 可以是双向的。但是它的体系结构更为复杂。 1 1 4v o l p 的发展 i p 的最大优势是已经具有一个全球统一的网络，它所具有的统一的网络层和传输层协议，为未来三网的融合打下了基础。因此 4 在以i p 为核心的网络上传送语音( 即v o i p ) 将是下一代语音网络发展的主导方向。 v o i p ( v o i c eo v e ri n t e m e tp r o t o c 0 1 ) 是传统电话网络的语音技术和i p 网络中语音的传输技术的融合。l p 语音网络系统是基于包的交换网络，数字化后的语音被分成若干个数据包在i p 网络上传输。跟传统的语音通信相比，它大大提高了传输线路的利用率，从而降低通信成本，并能方便的开展增值的多媒体应用，如统一消息、虚拟电话、虚拟语音，传真邮箱、查号业务、i n t e m e t 呼叫中心、 i n t e r n e t 呼叫管理、电视会议、电子商务、传真存储转发和各种信息的存储转发等。传统电话技术通信公司使用电路交换传输语音通信。用电话交换传送语音既有优点又有缺点。尽管有人认为电路交换是一种昂贵的解决方案，毫无疑问电路交换传输话音有其优点。但是，电路交换不能适合多媒体通信新世界的技术需要i 5 1 。 i p 作为话音传送是1 个富有吸引力的选择有许多原因，主要包括以下几个方面： t 设备费用低； s 话音和数据应用的集成； + 带宽需求低： i p 的广泛可用性。为了提供传统电路交换电话的可靠替代品，v o l p 定要提供同样的可靠性和语音质量。换句话说，必须满足“5 个9 ”的可靠性需求，语音必需具有钟声的音质。 v o l p 中最重要的事情就是确保高语音质量。时延、抖动、包 5 北京交通大学硕十论文丢失以及语音编码技术是影响语音质量的几个关键性的因素。 1 2 论文的意义及所做工作 1 2 1 论文的意义学术性：先进性在于本课题立足于信息网络发展的大潮流，以软交换为核心的下一代网络技术是众望所归，大家关注的焦点，国内外都在积极的投入到v o i p 的研究中。前瞻性在于v o i p 的产生和应用与开发v o i p 技术资源方案所引起的轰动，无论如何也意味着v o i p 已成为语音通信的重要选择。也就是说，v o i p 是我们多年熟知的电路交换电话技术的一个重要替代技术。v o i p 技术现在不仅能够提供直接的电话服务，而且，能以与我们熟知的传统电话相同的服务质量提供更多的附加服务。创造性在于采用模块化思想设计和实现媒体处理系统。不但充分利用了已有的科研成果，还实现了很多新的功能。并且，设计了规范的模块接口，使得功能模块可以很好的交互：设计的仿真网络时延的模型可以为媒体的继续开发、提高语音q o s 提供基础平台。实用性：实用性体现在本论文所研究的内容已经应用在“基于i p 的呼叫中心”和“基于i p 的语音信箱”，目前处于试验阶段。并且，由于实现时采用的是模块化编程思想，所以各模块功能清晰，很容易进行移植。一些模块已在多种环境下应用，例如r t p 、r t c p 模块可以用于任何实时媒体的传输之中。 6 1 2 2 论文所做工作研究了v o l p 网络的发展及状况，总结了v o i p 的前景和日前i p 网络影响语音质量的主要因素。充分理解模块化设计的优势，并采用模块化设计思想设计和实现实时媒体的处理。实现i 0 ；实现了r t p 、r t c p 协议；设计了一种在特定环境下动态调整抖动缓存的方法。掌握和集成了多种语音编解码算法，总结了选择编解码对 q o s 的影响。设计了一种仿真网络时延的模型。为了和系统其它功能模块共同工作，制定一些标准接口。考虑到软件的测试，移植等多种因素，媒体处理的实现采用了两种方式：使用f i l t e r 的方式、不使用f i l t e r 的方式，并对这两种方式进行比较。结合其他同学的工作，共同建立了基于i p 的呼叫中心试验系统。 1 3 论文的内容概要这里简要介绍一f 本论文的特色和主要内容，本课题“i p 语音通信中媒体处理技术的研究与实现”隶属于“基于n g n 核心技术的网络c t i 体系研究与实现”，在论文的意义一节我们已经看到，本论文兼具学术性和实用性两个基本特征。论文共分为四章。第一章综述，说明两个问题：论文的选题背北京交通大学硕i ：论文景和意义，以及论文所作的具体工作。第二章简要的介绍了v o i p 系统所涉及的规范要求以及影响i p 实时语音质量的几个因素，通过本章的内容，我们可以对v o i p 网络中媒体处理的过程及涉及的技术有个大致的了解。三、四章是论文的核心部分，第三章介绍了媒体处理系统的设计和实现，首先介绍v o l p 的c t i 体系框架，以及本论文在整个系统所处的位置，接着介绍了整个媒体处理系统所采用的模块化思想以及所设计的功能模块，本章内容可以使我们对整个系统以及系统实现所采用的方法有所了解。第四章详细介绍了媒体处理的主要功能模块，然后提到了一些相关问题的设计和实现的方法，论文的最后提出一种仿真网络时延的模型。 8 媒体处理所涉及的关键技术第二章媒体处理所涉及的关键技术 2 1v o i p 是怎样工作的软交换日益被认为是v o l p 的一个同义词，然而，它也可以应用在时分复用( t d m ) 、异步转移模式( a t m ) 网络中。在一个 v o l p 系统中，第一步要做的是将说话者的话音数字化；在第一步中用户的话机通过p s t n 网络连接到网关的系统，_ f 一步通常要做的是尽量抑制不需要的信号，并压缩语音信号，这又可以分为两步执行：首先，系统检测最近数字化的信息中是否包含语音信号，或者仅仅是环境噪声，然后决定是否丢弃；其次，引入复杂的算法来减少传到对方的信息量。智能编码能够进行噪声抑制，并对话音数据流进行压缩，标准g 7 2 3 ，g 7 2 8 和g 7 2 9 中包含了相应的压缩算法。我们需要对压缩编码之后的语音数据进行分组，并添加相应的 v o l p 协议。语音数据通过网络传输之前要进行分组成帧，为了分组成帧，发送单元必须对语音数据做一定的存储，这会产生一定的对延。为了便于话音数据能在网间顺利传输，在分组包中需要添加相应的协议部分，例如每个分组需要包含其要到达的目的地地址；为了保证数据包能以正确地顺序到达目的地，还需要在分组中添加传输顺序号；同时还需要安排一定量的字节进行差错检测。由于 i p 协议是被设计用来连接异构网络的，与单一网络相比，需要考虑更多的处理过程。网络中的地址处理系统非常复杂，有时需要把 9 北京交通大学硕十论文一个分组封装到另一个里面，随着数据的传输，又需要进行重新打包，重新寻址，以及重新安排数据。分组到达目的地后，需要检查数据包到达的先后顺序，按照发送的先后顺序重新排序，并采用与发送方相对应的解压缩算法来恢复数据。为了保证语音数据之间适当的时间间隔，需要相应的时钟同步及时延处理技术。因为数据分组在网络中是通过不同的路由传输的，所以它们不一定是按照原理的顺序到达目的地。为了纠正到达的顺序，数据分组在下一个分组到来之前必须在一个抖动抑制缓存中存储一定的时间，这个时间的长度依赖于整个网络的性能。在i p 网中，可能有一定量的分组在传输过程中丢失，或者有一定的时延，特别是经过一段时间的拥塞后尤其如此，同时还有一些分组在传输过程中因为出错而被丢弃。丢失、时延以及对错误数据分组的丢弃将会导致语音质量的恶化。在其它协议中，对于传输出错的数据，通常是采用差错校验技术，接收到的错误数据块丢弃后，接收方计算机会向发送方发出重新传输的要求，因此最终传递到用户的消息与发送方完全一样。但是由于v o l p 系统对时间的敏感性，不允许出错重传，在接收端为了重现出错分组所对应的话音，需要采用更智能的差错检测纠正机制。在这个过程中，需要存储一部分接收到的说话者的话音，然后通过一个复杂的算法来近似模拟丢失分组的内容，得到的新的话音信息将有助于提高通信质量。因此，接收者听到的声音与发送者发出的并不完全一样，其中相当一部分是由系统产生的，其目的是为了增强话音质量【3 j 。 1 0 媒体处理所涉及的关键技术 2 2v o l p 的几种接入方式 v o l p 的接入方式主要有三种，如图2 - 1 所示： p c p c 的工作方式 p c p h o n e 的工作方式 p h o n e - - p h o n e 的工作方式圈2 1v o l p 的几种接八方式 2 3v o l p 的相关协议 v o l p 可以被理解为完成一定功能的一组协议，这些协议与传统的可以分为接入、交换和传输三部分的p s t n 网络的协议有类似之处，与v o l p 相关的三组协议分别是：信令、路由和传输。信令协议，例如h 3 2 3 ，s i p 用于为媒体流和通话建立路由。网关控制协议，例如媒体网关控制协议( m g c p ) 和m e g a c o ( 也是一个信令协议) ，用于建立媒体和信令网关中的控制和状态。路由和传输协议的功能是，媒体流的传输路径一旦确定，立即 1 1 北京交通大学钡+ 论文对媒体流( 会话) 进行路由( 使用用户数据报协议u d p 和传输控制协议t c p ) 传输( 应用实时传输协议r t p ) 。 r t p 完成传输功能。信令和路由协议确定媒体流选择哪条路径，路由协议将传输响应的数据，即会话。 2 3 1s i p 协议 s i p 简介会话初始协议( s e s s i o ni n i t i a t i o np r o t o c o l ，简称s i p 协议) 是 v o i p 未来的信令方式。事实上，许多人认为s i p 结合m g c p 或 m e g a c o ( 媒体网关控制和软交换体系结构) 将在未来支配语音 i p ( v o l p ) 的信令体系【5 1 。 s i p 是一个信令协议，用来处理多媒体会话的建立、更改、拆卸，与其它协议相比较，s i p 描述了潜在的会话者的会话特征。尽管严格来讲，s i p 会话中的媒体交换可以使用任何传输协议，但般都以r t p 作为传输协议。 s i p 消息有可能通过一些与媒体交换所通过的相同的介质来传输，但是s i p 信令应该从媒体本身分离出来单独考虑。图2 - 2 信令与媒体的分离图2 - 2 展示了信令与会话数据的逻辑分离关系，这种分离很重媒体处理所涉及的关键技术要，因为信令在传输过程中可能要经过个或多个代理服务器或重定向服务器，而媒体数据流更多的是采用直接通路，可以认为这个过程与h 3 2 3 中描述的信令与媒体分离的情景类似。卜s i p 在v o l p 中的应用1 6 】图2 3 一个简单的s p 呼叫的例子卜s i p 的基本功能 7 1 t 用户定位( u s e rl o c a t i o n ) ：决定哪个终端系统参加通信。 t 用户能力( u s e rc a p a b i l i t i e s ) ：决定通信所采用的媒体和媒体参数。用户可用性( u s e ra v a i l a b i l i t y ) ：决定被叫方是否愿意加入通信过程。 1 3 j e 京交通大学硕士论文 + 呼叫建立( c a l l s e t u p ) ：振铃、主叫方和被叫方的连接和参数的建立。 t 呼叫处理( c a l lh a n d l i n g ) ：前转或终结呼叫。卜选择s i p 而不是h 3 2 3 的原因 v o l p 协议演变的结果是比以前更有效。协议的简单性越来越被大家所接受。在这一方面，s i p 明显要比h 3 2 3 进步，主要是因为s i p 做了很多简化，信令翻译之后也更加可靠。相对于h 3 2 3 ，s i p 的伸缩性更好，伸缩性主要涉及管理大范围区域的能力、服务器处理能力、多方会议以及反馈能力。 s i p 比h 3 2 3 的可扩展性强。 s i p 相比h 3 2 3 能够轻松的提供业务和功能。 2 3 2h 2 4 8 协议 h 2 4 8 协议，也叫m e g a c o 协议，是软交换设备或m g c 与m g 之间的一种媒体网关控制协议，它是一项作为l t u t 与i e t f 合作的新标准。h 2 4 8 协议使得语音、传真和多媒体信号在公共电话网与新兴l p 网络之间交换成为可能。h 2 4 8 协议不涉及i p 电话的体系结构，只涉及网关分解问题，因而它不仅可以用于h 3 2 3i p 电话系统，也可以用于s i p 的i p 电话系统。 2 3 3 媒体网关虽然v o l p 有其自身的优点，但是由于现在p s t n 网络的广泛存在，要想i p 网络完全取代p s t n 的地位是不可能的，所以它们之间的无缝连接至关重要。 1 4 媒体处理所涉及的关键技术 v o l p 和p s t n 通过使用网关相互作用，网关的作用是使得 v o l p 网络相对于电路交换网络来说更像一个本地电路交换系统 ( 反之亦然) 。换句话说，v o l p 网络应该能接受来自电路交换网络本地格式的信令和媒体，并且一起转换成l p 网络使用的格式。一个v o l p 呼叫中包括的信令可能选择条与媒体本身的路径不同的路径。媒体可以直接从端到端，而信令则能经过一个或更多的中间实体，比如说代理。所以，一个网络网关有两项相关但相互分离的功能：信令转换和媒体转换。信令转换方面是和网络中呼叫控制过程的运转情况相结合的。实际上，信令可以理解成是呼叫控制实体之间通信使用的一种语言。媒体转换和传输可以被认为是从属的过程，被调用和操作以满足呼叫控制和发送信令规定的需要。图2 - 4 显示了p s t n v o i p 网络以及其它网络与v o l p 相连的结构。。科堕鱼：曼曼删煦铲? 信令。v * 驴? 1i 。煎生皇壁型壁墅降专 |i 蓑裳与|薹簇蓑与| ，懈同鼍叫一谪f 卜1 黔一斗厂森丽每一圈2 4 外部罔卑联之同的v o i p 罔络罔关 2 3 4 实时传输控制协议( 删r t c p ) 实时传输协议( r t p ) 和实时传输控制协议( r t c p ) ，这两个协议提供了可以支持实时应用( 例如语音和影像) 的网络传输服务。 r t p 传输真正的语音分组，r t c p 则是用于传输质量反馈的信息包。在i p 网中传输实时语音偶尔的分组丢失并不会引起语音质量北京交通大学硕士沧文的大幅度降低，但是语音对时延很敏感，所以在语音传输中，少量的分组丢失比引入时延要好的多。由于t c p 的重传机制、拥塞控制机制、及包头太大、启动速度慢的特点，在传输层我们选择不保证町靠传输的u d p 协议来传送语音数据分组以提高传输的实时性。 u d p 是一种无连接的数据报投递服务，虽然没有t c p 那么可靠，由于u d p 的传输延时低于t c p ，能与音频和视频流很好地匹配。因此，在实际应用中，r t p r t c p u d p 用于音视频媒体，而t c p 用于数据和控制信令的传输。 2 3 4 ir t p ( 实时传输协议) u d p 无法做到避免分组丢失和确保分组有序传输。运行在u d p 之上的r t p 帮助实现了这些功能。例如，r t p 分组包括序列号，这样，使用r t p 应用程序至少能够检测到分组丢失的发生并确保收到的数据以正确的次序提交给用户。r t p 分组还包含了一个时间戳，这个时问戳对应于分组从源媒体流进行抽样的时间。目的应用程序可以利用这个时间戳来确保信息同步地传递给目的用户并计算出时延和抖动。注意：r t p 本身并不处理这些事情，它只是提供了一些附加的消息给高层的应用，以便高层应用能够合理的决定数据分组或是语音分组如何能被最好的处理。 r t p 支持实时传输、包重新排队、封装数据、有效载荷类型鉴定、多播、鉴定发包来源和同步源。r t p 报头的消息就是为了让r t p 能够支持这些服务。图2 5 显示了r t p 报头的格式吼 1 6 媒体处理所涉及的关键技术 0 0 000 0 001 111i11l2 2 2 水 2 2 2 3 33 333 33 l2 3456781 2 34s 678l236781 234 s 6 78 v = 2p陡c cmp t 序列号时间戳( t i m e s t a m p ) 同步源标志( s s r c ) 有用标志源( 0 1 s 4 条目) ( c s r c ) 图2 - 5r t p 报头格式 r t p 报头的简单介绍【8 i ： v ：版本号 p ：填充，表示在净荷的尾部分组是否有一个或多个填充字节。 x ：扩展，表示固定长度的报头是否包含一个报头扩展区。 c c ：c s r c 计数器，表示有用源标志符的数量。 m ：标记，表示的意义依据传输的净荷类型而定。 p t ：净荷类型，表示r t p 净荷的格式。序列号：这个标题使接收方可以检测到分组的丢失或分组到达顺序的是否错误。时间戳：记录净荷中第一个抽样产生的时间，在媒体同步和抖动计算中是不可缺少的。 s s r c ：同步源，表示r t p 包的来源。 c s r c ：贡献源列表，它包含了所有对该r t p 包中数据存在贡献的同步源的标识符。 r t p 用于语音时，对于g 7 1 l 、g 7 2 3 1 、g 7 2 9 、g 7 2 8 编码，产生时间戳的采样频率取8 k h z 。当用于视频时，目前所有的视频编码的时间戳采样频率都取9 0 k h z 。 1 7 北京交通大学硕士论文 2 3 4 2r t c p ( 实时传输控制协议) r t c p 足r t p 的一个伴随协议，这个协议为用户会话之间提供了大量的可供交换的信息和关于会话质量的反馈信息。信息的类型包括这样的一些细节问题，诸如丢失的r t p 分组的数目、时延和到达间隔的抖动。这些信息可以用来检测并潜在地解决发送问题，通过使用r t c p 和i p 多播，第三方( 例如不是会话参与者的网络操作员) 就可以控制会话质量和检测网络问题。 r t c p 定义了多种类型的包，用于承载多种控制信息。每个r t c p 包都和r t p 数据包类似，都以一个固定的包头开始，后面跟着个随包类型的不同而不同的结构化元素。该元素可能是变长的，但总是在3 2 比特边界上结束。 _ r t c p 定义了五种不同类型的r t c p 分组9 】：发送方报告( s r ) ：由活动的会话者使用，可以进行分组的转发和接收统计数据。接收方报告( r r ) ：用来发送参与者的统计信息，这些参与者只接收媒体信息，而不发送媒体信息。源描述( s d e s ) ：包括一个或多个关于某个会话参与者的描述。特别是，s d e s 必须包含一个规范名( c n a m e ) ，用来标志会话参与者。在s d e s 分组中可能存在其它信息，例如参与者的名字、电子邮件地址或是电话号码。 b y e ：表示参与会话的结束。 a p p ：应用相关的功能，a p p 使r t c p 可以发送包含与特定媒体类型或应用相关的信息的分组。r t c p 并没有规定a p p 分组的具体内容。 1 8 媒体处理所涉及的关键技术 2 a 影响v o i p 服务质量( q o s ) 的因素 v o i p 和软交换网络的主要缺陷是它们的服务质最( q o s ) 比公芡电话交换网( p s t n ) 要差。为了能够使v o i p 成为电路交换技术的商业挑战，v o l p 提供的语音质量至少要有现在电话网提供的那样好，而且语音质量不能有波动。这个目标对v o i p 是一个大挑战，其原因是l p 最初设计不是用来传输语音和类似的实时交换媒体的。影响包交换网络语音质量的三个重要因素是：时延、抖动和包丢失1 1 0 i 。这曼个因素由包交换网络的本质所产生，包交换网络不能保证语音数据包及时到达接收方，甚至不能保证到达。传统的电路交换网络很少，甚至不会出现分组丢失的情况，而且传输的时延是一个固定的参数不会随时间的变化而改变，网络的这些影响是区别v o l p 网络和传统网络的重要因素。 2 4 1 时延时延的产生端到端的时延是指从信号在信源生成到它到达信宿所需要的时问。传统的电话，只有长距离的呼叫以及和移动电话之间的呼叫才会引起长的时延。与传统电话网通话双方建立一个可靠连接不同，i p 电话中的通话双方之间并不存在一条固定的独享连接，i p 网络的拥堵、不同数据包对信道的竞争以及不同的路由选择等，使得网络传输时延很难控制【”1 。时延主要有编码器时延、解码器时延、缓存时延和网络传输时延、网关处理时延、网络节点设备时延 1 9 北京交通大学硕士论文和中继传输时延几个部分组成。其中，后三项时延对i p 电话的时延影响较小。图2 - 6 是前四种时延的关系【2 】：编码时延传输时延缡中时延解码时延 k 卫爿卜坠；k 熙。一马* 图2 - 6 时延模型时延为t = t 1 + t 2 + t 3 + t 4 。有些低速率编码算法是根据当前或下一帧的部分数据，称之为 “前视”生成语音编码器的，这样编码时延就可以表示为帧长和前视长度之和再加上d s p 的编解码处理时延。g 7 2 3 1 和g 7 2 9 对应的帧长和前视长度分别为3 0 m s 、7 5 m s ；1 0 m s 、5 m s 。解码时延t 4 则是d s p 的解码处理时延。随着d s p 硬件处理性能的提高，可以认为时延t 主要由编码算法要求的帧长( 帧长和前视长度之和) 、传输时延t 2 、缓冲时延t 3 来决定。在终端进行去抖动操作以减少时延抖动时，通常的方法就是加入去抖动缓冲器，这也会引入。定的去抖动时延t 3 。t 3 的取值是在分组时延和分组丢失率之间的折中。t 3 过小，会使分组丢失率上升。t 3 过大，会引入太大的时延。由于通话的时间较短，自适应去抖动算法往往不能发挥很好的作用，一般采用固定的去抖动时延，取值为网络的平均排队时延。时延的影响时延对语音通信的影响主要在于引入回声和交互性的丧失。媒体处理所涉及的关键技术图2 7 表示了v o l p 网络中时延和语音质量的关系时延d ( m s )语音质量 d 8 0 达到电路交换网络的语音质量 8 0 d 1 8 0 达到一股商业要求，强于移动通信的语音质量 1 8 0 d 4 0 0 不可接受，网络本身已经难以保持正常的通信囝2 7v o i p 中时延与语音质量的：羌系环路时间是很重要的。例如，考虑a 与b 之间的一个对话。a 正在说话，而b 想打断他。但是，因为有时延，b 当前听到的是a 早就说过的。而且，当b 打断时，a 听到b 的打断也需要花些时间。因此，对b 来说，a 好像忽略了他的打断。因此，b 就不说话了。但是，现在a 已经听到b 的打断，并且也停止了说话，因此现在双方都不说话了。然后，他们又都尝试重新开始说话，而又发生冲突，又都不说话。试验表明，如果环路时延超过3 0 0 m s ，通信质量基本无法接受。 2 4 2 抖动时延抖动的产生对于i p 网络这样的尽力传送的网络来说，传送实时数据并不能保证数据包能够按时到达，到达间隔的不一致就产生了抖动。抖动值就是数据包到达间隔时问差的平均值1 2 】。如图2 8 所示：在i p 网中有两种方式造成抖动。第一种，数据包从发送者传输到接收者的过程中选择的路由不同，也就带来了不同的时延。第二种，在语音会话中，某个数据包可能比它前面的数据包经历了更北京变通大学硕十论文长的排队时间一尽管它们选择的路由足相同的。即时延抖动主要是由网络引起的，如果端到端的传输路径中经过的中问节点( 路由器、交换机等) 越多，带来的时延抖动越大。 p i ：第i 个数据包；p l + 1 ：第i + 1 个数据包 s i 和r 分别表示第i 个数据包发送和收到的时间 s i + 1 和脚1 分别表示第i + 1 个数据包发送和收到的时间图2 8 抖动 _ 抖动的影响分组传输中的抖动会严重影响实时i p 业务的质量。抖动值如果超过2 0 m s ( 假设采用常见的设置，2 0 m s 产生一个数据包) 就会产生可听出来的语音质量问题。过度抖动的效果与过大时延的效果很接近，因为当包抖动超过抖动缓存可以容忍的限度时同样会发生分组丢失。另外局域网设备的传送机制对抖动也有影响，因为数据交换的网络里面比共享式网络里的数据碰撞及重传的机率小，抖动产生的机率也就小。抖动的解决媒体处理所涉及的关键技术解决抖动的方法：保证最小的时延抖动，使得存在的时延保持同定值。这个h 标可以通过使用时延抖动缓存来实现，语音数据包被放置在抖动缓存中使得它们能够以固定的频率播放给收听者。但是抖动缓存的负面影响是增加了总的时延。所以，抖动缓存的大小选择要有一定的尺度，不能太大，电不能太小。太大，过大增加总的时延，如果时延超出语音听觉可接受的范围，则播放出的语音质量再好，也是无法接收的。太小，不能解决抖动引起的问题。抖动缓存的设置有两种方法：一种是设置固定的抖动缓存，另一种是设置自适应的抖动缓存，也就是说，可以根据网络的运行状况适当的调整抖动缓存的大小。 2 4 3 分组丢失影响网络分组丢失的原因f 1 3 】传输损伤一网络中由于传输设备出现损伤如线路断裂等，会导致大量数据分组的丢失。分组超时丢失一1 p 数据报由于是b e s te f f o r t 的，其在i p 网络中的寻径是随机的，为避免数据进入死循环，需要进行数据报的生存时闻控制。在一个新的数据报产生时，就在其头部的t t l ( t i m et ol i v e ) 位设定其在网络中存在的最大时间，超时便丢弃，如果网络状况很差，会造成许多分组由于超时而丢失。网络拥塞一i p 网中的分组是经过中间设备，一跳一跳传输的。对于i p 协议采用无连接传输机制，拥塞是不可避免的。造成拥塞的主要原因在于网络中的设备没有足够的缓北京交通大学硕士论文冲区接收数据，使得通向某一路由的队列过长，当队列出现溢出时会造成分组丢失。应用超时一在实时的应用程序中，如果包到达目的地太晚，即便到达，也会在目的地被丢弃，这种情况，也称之为丢包。分组丢失的影响 i p 语音包的丢失对语音质量会产生影响，典型的语音编码可以允许包丢失率为3 ，采取一些特殊措施后，包丢失率达到8 1 0 时语音质量也还可容忍。l p 语音业务服务质量与时延和分组丢失的关系如图2 9 所示：单项时延( m s ) 4 0 0 2 0 0 51 0 包丢失率( ) 圈2 9m 网络的时延和丢包对语音服务质量的影响分组丢失的解决方法当出现包丢失的情况，必须有一些机制去进行处理，我们通常称之为包丢失恢复算法( p l c ) 。在最好的情况下，包丢失恢复算法可以精确的预知语音信号并且在先前已经解压的语音信号和现在插入的语音信号之间有一个平滑的转变。既然丢包大部分发生在网络负载很重的情况下，包丢失不会突发。突发会引起大量连续的包丢失并且这段时间包的丢失率极高。媒体处理所涉及的关键技术如果几个连续的分组丢失，最好的p l c 算法也不能产生可以接受的较好的语音质量。为了节约带宽，存一个包中通常携带很多帧语音数据，所以丢失一个包会丢失很多帧语音数据。即使包丢失随机发生，听上去也感觉像发生了突发的包丢失事件。解决分组丢失的措施主要是通过改善网络环境来实现的，如增加带宽、扩大路由器的缓冲区、设置优化的路由表等。但采取这些措施的同时还要考虑到与成本、业务需求等方面的平衡。 2 5 分组语音技术 2 s 1 语音编码技术在高语音质量中还有一个要素就是语音编码方案的选择。 g 7 1 1 是如今使用最普遍的编码技术，它是一种波形编解码器并且在全世界的电路交换嘲中会使用的编码技术。目前，i p 分组语音主要采用的编码技术有i t u t 定义的g 7 2 9 、g 7 2 3 1 等，g 7 2 9 a 是g 7 2 9 的d s v d ( 话音和数据同时传送数字系统) 型式，与( 3 7 2 9 比特流兼容，即它们的编码都能被对方的解码器接收并重建信号。 v o l p 网络常用的语音编解码算法的性能比较：编解码方法 g 7 2 3 1q 7 2 9g 7 2 9 a 比特率( k b i t s )5 3 6 3 88 帧长度f m s ) 3 01 01 0 处理时延( m s ) 3 01 01 0 北京交通大学硕十论文观看时延( m s ) 7 555 - 帧亨节数 2 0 ，2 41 01 0 d s p ( m i p s

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（信号与信息处理专业论文）ip语音通信中媒体处理技术的研究与实现.pdf

文档简介

温馨提示

最新文档

评论

（信号与信息处理专业论文）ip语音通信中媒体处理技术的研究与实现.pdf

文档简介

温馨提示

最新文档

评论

相关文档