（通信与信息系统专业论文）基于rtp的实时语音传输的实现与研究.pdf

上传人：伐*** IP属地：宁夏上传时间：2019-12-11 格式：PDF 页数：71 大小：1.68MB 积分：0 举报 版权申诉

已阅读5页，还剩66页未读，继续免费阅读

（通信与信息系统专业论文）基于rtp的实时语音传输的实现与研究.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

华中科技大学硕士学位论文摘要 v o l p 是一种以i p 电话为主，爿一推出相应增值j l p 务的技术。其最大的优势是能广泛地采用全球i p 互连的环境，提供比传统业务更多、更好的服务。采用v o l p 技术的 i p 电话是以l p 为标志的网络分组化和以流媒体传输为目标的网络业务综合化两大主流技术融合的结果，并成为传统电信与l p 网络优势互补的一个突破口。然而由于i p 分组网络自身的局限性，其在传输文字、图形等离散媒体时尚能胜任，而在传送语音、视频等实时媒体t j q n 显得有点力不从心。如何在因特网上商质量地传输实时语音流媒体业务，已成为v o l p 的关键问题之。在这样的背景下，作者结合参与的v o l p 接入网关的研发1 一作，对实时语卉传输进彳亍了深入的研究，从n j 延、抖动、丢包等发剥语音质景提了改进的措施与算法，并在此基础上实现了多播音频会议。文章首先蜕明了实时语音传输的，”生背景以及各酱编码、信令技术、流媒体挑议等相关技术。接着较为详细的介绍了实时传输协议r t p r t c p ，并对协议使用环境进行了分析。然后详尽的闸述了基丁嵌入式l i n u x 的实时语齐传输设1 ；i + 方案，陔方案采用了环形多缓冲技术和多线程技术实现了基。rr t p 的多播音频会议，并对多路混音提出了解决方案；通过去抖缓冲算法有效去除语音包的荆动问题，在时延与抖动之闸达列良好平衡：并对语音质量密切相关的丢包、溢出、语膏、i ，滑等问题给予了改蘅。文章的最后对实时语音传输占用带宽、时延给出t n 试结果，并对r t p 在大规模应用中的可扩展性以及存在的问题提出了些看法。关键词：v o l p 、实时传输、r t p 、r t c p 、q o s 华中科技大学硕士学位论文 a b s t r a c t v o l pj sat e c h n o l o g yt h a t m o s t l y u t i l i z e di n1 pp h o n e a n dr e l e v a n tv a l u e a d d e d s e r v i c e s t h em o s ta d v a n t a g eo fv o l pi st h a tc a nm a k eu s eo ft h eg l o b a li pi n t e m e t w o r k i n g e n v i r o n m e n t ，t op r o v i d et h em o r ea n dm o r e 、t h eb e t t e ra n db e t t e rs e r v i c e st h a nt r a d i t i o n p s t nn e t w o r k t h ei pp h o n eu s i n gv o l pt e c h n o l o g yi st h er e s u l to ft h ec o m b i n a t i o no f s u c hc h i e ft e c h n o l o g y , t h ep a c k e tt e c h n o l o g yo nn e t w o r kt a k i n g1 pa si t ss i g n ，a n dt h e i n t e g r a t i n gt e c h n i q u eo fs e r v i c e so nn e t w o r kt a k i n gr e a l - t i m em e d i a t r a n s m i s s i o n8 si t sg o a l i th a sb e c o m et h ej o i n to ft r a d i t i o n a lt e l e c o ma n di pn e t w o r k ，m u t u a l l ys u p p l y i n ge a c h o t h e r sa d v a n t a g e s d u et ot h ei n t r i n s i cc h a r a c t e ro f1 pn e t w o r k ，i tm a y b eb ec o m p e t e n tf o rt r a n s m i s s i o n d i s c r e t em e d i as u c ha s t e x t 、p i c t u r ee t c ，b u t i ti si n s u f f i c i e n tt ot r a n s m i tr e a l t i m em e d i a s u c ha sa u d i o 、v i d e oa n ds oo n h o wt ot r a n s m i tr e a l t i m em e d i aw i t hh i g hp e r f o r m a n c e o v e ri pn e t w o r kt h a th a sb e c o m et h em o s ti m p o r t a n t p r o b l e mi nv o l p f i e l d u n d e rs u c hab a c k g r o u n d ，a sap a r to ft h er e s e a r c hw o r ko nv o l pg a t e w a y , t h ea u t h o r c a m e dt h r o u g ht h er e a l - t i m ev o i c et r a n s m i s s i o nd e e p l y ，a n db r i n gf o r w a r ds o m em e a s u r e s t oi m p r o v ev o i c eq u a l i t yo nd e l a y 、j i t t e r 、p a c k e tl o s ta s p e c t s ，t h e nr e a l i z et h em u l t i c a s ta u d i o m e e t i n g t h i sa r t i c l ef i r s ti n t r o d u c e ds o m e b a c k g r o u n dk n o w l e d g ei n c l u d i n g v o i c e e n c o d e r d e c o d e r 、s i g n a l i n gt e c h n o l o g y 、s t r e a m m e d i a p r o t o c 0 1 a n d t h e n g a v e a n e x h a u s t i v e d e s c r i p t i o n o nr t p l u c p p r o t o c 0 1 a n a l y z e t h e p r o t o c o lu s i n g s c e n a r i o s a f t e r w a r dp r o v i d e dar e a l t i m ev o i c et r a n s m i s s i o nr e s o l u t i o nu p o ne m b e d d e dl i n u x t h i s r e s o l u t i o na d o p t e dm u l t i p l er i n gb n f i e ra n dm u l t i t h r e a dt e c h n o l o g yt oi m p l e m e n tm u l t i c a s t a u d i o m e e t i n g b a s e do n r t p r t c p , s u p p l y r e s o l v e dm e a n so n m u l t i p l e v o i c e s y n c h r o n i z a t i o n ；d e c r e a s et h en e t w o r kv o i c ej i t t e rt h r o u g ht h ed e - j i t t e rb u f f e ra l g o r i t h m ， i i 华中科技大学硕士学位论文 a n dt r yt of i n dt h et r a d e - o f fb e t w e e nt h ev o i c ed e l a ya n dj i t t e r ；a tt h el a s to fa r t i c l e ，t h e a u t h o rp r o v i d e dt h et e s tr e s u l t sa b o u tr e a l t i m ev o i c et r a n s m i s s i o nb a n d w i d t h 、d e l a y ，p u t f o r w a r ds o m ep e r s p e c t i v ev i e w st a i l o rt op r o b l e m sw h i c he x i s t so nl a r g e s c a l er t p r t c p 0 a p p l i c a t i o ns c e n e r y k e y w o r d s ：v o i p 、r e a l - t i m et r a n s m i s s i o n 、r t p 、r t c p 、o o s i 独创性声明本人声明所呈交的学位论文是我个人在导师指导f 进行的研究工作及取得的研究成果。尽我所知，除文中已经标明引用的内容外，本论文不包含任何其他个人或集体已经发襄或撰写过的研究成果。对本文的研究做出贡献的个人和集体，均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名：力勿z r 期尹。，年，月箩同学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定即：学校有权保留并向国家有关部门或机构送交论文的复印件和电子版，允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索，可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密口，在年解密后适用本授权书。本论文属于不保密区 ( 请在以上方框内打“4 ”) 学位论文作者签名：矽以日期：，年，月9 日指导教师签名：闩期：幽口睁耐饬饥一 j 月罩只华中科技大学硕士学位论文 1 绪论 1 1 背景与发展现状随着计算机网络与通信技术的迅猛发展，基于i n t e r n e t 的网络实时多媒体服务证r 益受到人们的重视，v o l p ( v o i c e o v e ri n t e r n e tp r o t o c 0 1 ) 是目前基于i p 分组网络多媒体通信的一个典型业务，成为当前计算机网络技术和通信技术研究的热点，同时也是基于 i n t e r n e t 增长最快的业务之一。 v o l p 是一种以i p 电话为主，并推出相应增值义务的技术。其最大的优势是能广泛地采用i n t e r n e t , 和全球i p 互连的环境，提供比传统业务更多、更好的服务。它把语音进行压缩编码、打包分组、分配路由、存储交换、解包解压等交换处理在i p 网或互联网上实现语音通信。人们之所以对v o l p 具有如此浓厚的兴趣，主要有以下三个原因：( 1 ) 它促进了网络资源利用，降低语音业务成本。( 2 ) v o l p 的使用标志着一种全新的功能更强的通信方式的产生，从而可以打破电话的的垄断市场。因为与传统的传输媒体相比较，l p 电话不仅具有传统媒体所具有的一切表现方式和特点，而且传播信息容量大、不受时空限制，突破了传统地源政治、地源经济的概念。( 3 ) 符合未来“三网合一”( 乜话网、数据网、有线电视网) 的发展方向。然而由于i p 分组网络自身的局限性，其在传输文字、图形等离散媒体时尚能胜任，而在传送语音、视频等实时媒体时则显得有点力不从心。为此i e t f ( 因特网工程组) 制定了一系列支持流媒体实时传输和服务控制的协议，如r t p r t c p 、r s v p 、 r t s p 等。其中，r t p 是所有这些协议的基础。这一系列面向实时应用的| 办议，在兼容现有网络基本体系的基础上，增强了对音频、视频等多媒体实时应用的支持。华中科技大学硕士学位论文 1 2 语音质量的影响因素 i p 网络采用的机制是b e s te f f o r t 方式传送l p 数据包，数据分组在分组网络中传输时会由于网络的传输差错、语音处理、网络拥塞等原因造成分组丢失、传输时延和时延抖动，使得用户听到的话音会出现不连贯甚至中断的现象，无法为实时通信等对服务质量要求很高的业务提供质量保证。下面就时延、抖动、丢包这三个因素对 q o s ( q u a l i t y o f s e r v i c e ) 的影响进行讨论。 1 2 1 时延时延是指说话人开始说话到受话人听到所说内容的时间，时延对话音通信的影响主要在于引入回声和交互性的丧失。i t u u 建议g 1 1 4 和g 1 3 1 描述了时延参数对普通电话呼叫的影响 2 l ：正常情况下端到端时延大于2 5 m s 时，或者虽然试验小于2 5 m s ，但回声水平非常大时，要加入回声抑制。当回声得到充分抑制时，1 5 0 m s 以下的时延，对于大多数应用来说是可以接受的；1 5 0 m s 到4 0 0 m s 之间的时延，在用户预知时延情况的前提下，是可以接受的；大于4 0 0 m s 的时延，即使完全没有回音，已有1 0 的人感觉到通话困难，它的语音质量基本上是不可接受的。时延主要由编码时延、解码时延、缓存时延和网络时延等部分组成。f 图表示了它们之间的关系。编码时延传输时延缓冲时延解码时延缓冲队列图1 1 时延分解模型时延为t o = t i + t 24 - t 34 - t 4 在终端进行去抖动操作以减少时延抖动时，通常的方法时加入去抖动缓冲器，这也会引入一定的去抖动时延t 3 。t 3 的取值是在分组时延和分组丢失率之间的折中。 t 3 过小会使分组丢失率上升。t 3 过大，会引入太大的时延。1 1 1 i ：通话时间短，自适 2 华中科技大学硕士学位论文应去抖动算法往往不能地发挥作用，般采用固定的去抖动时延，取值为网络的5 f 均排队时延。 1 2 2 抖动分组传输中的抖动也会严重影响实时语音业务的质量。话音分组以近似等间隔从源端发出，但在网络传输过程中的排队和服务处理时会存在差异，使其不再是等时间问隔到达目标端点，即有时延抖动。而话音解码器通常需要接近恒速率的输入码流，时延抖动的存在会影响其正常工作。有效改善分组传输抖动的方法是增加接收端的缓存，利用缓存来消除到达的数据分组之间时间间隔的差异：或者在终端进行去抖动操作。通常的方法为加入去抖动缓冲器，对分组进行延时缓冲平滑。这样做虽然可以减少时延抖动，但会增加接收端的处理时延。从统计意义上讲，总有某个分组的传输十分顺利，其传输的时问接近网络线路的固定传输时间。因次可以假设一次连接中，所有分组中传输时间最短的那个时延值等于固定传输时间，即： t m i n = m i n t n ) ，t n 是一个分组的时延，所以每一个分组时延抖动 x = d r n t m l 。d 一段时间内最大的时延抖动 j = m a x ( x n ) 一段时间内平均时延抖动 m = e ( x 。) 平均时延抖动也称为平均排队时延，用来确定消除抖动的缓冲区人小。在相对稳定情况下，设某种语音编码方式使用了带宽b ( 字节，秒) ，帧大小为f ( 字节帧，假设对语音采用了帧编码方式) 。最近段时问内的平均抖动为m 秒，帧速为f 帧秒，则存在下列关系： f f = b 缓冲区大小= m f f 华中科技大学硕士学位论文 1 2 3 丢包遵循b e s te f f o r t 规则的i p 层并不能保证将数据报币确递送到目的端，实时语音传输一般用不保证可靠传输的u d p 协议来传送语音数据分组以提高传输的实时性。语音数据分组出现丢失情况时，如果是偶然一个数据丢失，上层应用可以根据一定的机制恢复该数据分组，以保证语音质量。当出现连续分组丢失情况时，就会影响话音质量。一般来说在语音传输中分组丢失率3 0 5 是允许的。影响网络分组丢失的原因有： ( 1 )网络拥塞。l p 网中的分组是经过中间设备，一跳一跳传输的。对于i p 协议采用无连接传输机制，拥塞是不可避免的。造成拥塞的主要原因在于网络中的设备没有足够的缓冲区接收数据，使得通向某一路由的队列排队过长，当队列出现溢出时会造成分组丢失。 ( 2 ) 分组超时丢失。l p 数据报由于是b e s te f f o r t 的，其在i p 网络中的寻径是随机的，为避免数据报进入死循环，需要进行数据报的生存时间控制。在一个新的数据报产生时，就在其头部的1 ，r l ( t i m et ol i v e ) 位设定其在网络中存在的最大时问，超时便丢弃，如果网络状况很差，会造成许多分组山予超时而丢失。 ( 3 )传输损伤。网络中由于传输设备出现损伤如线路断裂等，会导致大量数据分组丢失。至于i p 语音包的丢失对语音的影响，典型的语音编码可以允许包丢失率为3 ，采取一些特殊措施后，包丢失率达到8 l o 时语音质量也还可以容忍。解决分组丢失的措施主要是通过改善网络环境来实现的，如增加带宽、增大网络设备的缓冲区、设置优化的路由表等。但采取这些措施的同时还要考虑到与成本、业务需求等方面的平衡。i p 语音业务质量与时延和丢包的关系如下图所示。 4 华中科技大学硕士学位论文 1 3 信令协议巾向时延 ( m s ) 1 3 is i p 协议简介 0 0 5l o 玉包率( ) 圈1 2 时延与丢包对服务质量的影响 s i p 3 】( s e s s i o n i n i t i a t i o n p r o t o c 0 1 ) 是i e t f 提出的在i p 网络上进行多媒体通信的应用层控制协议，利用s i p 可实现会话的发起、建立和释放，f ：支持单播、纽播和移动性。此外，s i p 还与s d p i 4 】配合，动态调整和修改会话属性，如通话带宽、传输媒体类型及媒体的编码格式等，s i p 以其简单、灵活的特点越来越受到青睐。 1 s i p 网络体系 s i p 网络采用i n t e r n e t 的c l i e n t s e r v e r 的工作方式，网络结构如图所示。s i p 网络包含两类组件：用户代理( u s e ra g e n t ) 和网络服务器( n e t w o r ks e r v e r ) 。 5 华中科技大学硕士学位论文图1 - - 3s i p 系统结构图用户代理又分为用户代理客户端( u a c ) 和用户代理服务器( u a s ) ，其中u a c 负责发起s i p 呼叫请求，u a s 负责对呼叫请求做出响应。网络服务器主要为用户代理提供注册、认证、路由服务，分为代理服务器( p r o x y s e r v e r ) 、重定向服务器( r e d i r e c ts e r v e r ) 、注册服务器( r e g i s t e rs e r v e r ) 。p r o x y 提供路由功能，负责将s i p 用户请求和响应转发到相应的下一条，p r o x y 分为有状态的 ( s t a t e f u l ) 和无状态的( s t a t e l e s s ) 两类，有状态的p r o x y 会记录经其转发的呼叫的状态信息，而无状态的代理服务器一旦将消息转发后就丢弃其状态信息，有状态的p r o x y 通常位于s i p 网络的边缘，而无状态的p r o x y 位于网络的核心，因为通常核心p r o x y 需要处理大量的呼叫，不保留呼叫状态可大大提高系统的处理能力。重定向服务器则提供地址解析服务，功能非常类似d n s ，通常将s i p 呼叫的目的地址映射成0 个或多个新地址。注册服务器接收终端的r e g i s t e r 请求，记录终端的s i p 地址( s i pu r l ) 和l p 地 6 华中科技大学硕士学位论文址，注册服务器通常与代理服务器或重定向服务器位于同一物理实体巾。用户终端在启动后都需要进行注册，用于记录其当前位置信息，这种基于注册服务器的转发特性是实现号码移动性服务的基甜：。此外，在s i p 中还经常提到定位服务器( l o c a t i o ns e r v e r ) ，定位服务器提供定位服务，作用是帮助s i p 重定向和代理服务器获得被叫方的可能位置信息，它可以和s i p 网络服务器合在一起，但是定位服务器并不属于s i p 服务器范畴。在建设实际的s i p 应用系统时，除了以上提到的功能实体外，s i p 服务器还需要与其他协议配合，才能实现真正意义上的可管理的运营网络。如s i p 服务器需通过 r a d i u s 协议与r a d i u s 服务器通信，为终端进行认证、鉴权，实现对业务的计费。综上所述，s i p 的基本功能主要有下列5 个方面：用户定位( u s e rl o c a t i o n ) ：决定哪个终端系统参加通信。用户能力( u s e r c a p a b i l i t i e s ) ：决定通信所采用的媒体和媒体参数。用户可用性( u s e r a v a i l a b i l i t y ) ：决定被叫方是否愿意加入通信过程。呼叫建立( c a l ls e t u p ) ：振铃、主叫方和被叫方的连接和参数的确认。呼叫处理( c a l l h a n d i n g ) ：转接或终结呼叫。 2 s i p 消息 s l p 采用文本编码格式，其消息分为两种：u a c 到u a s 的请求( r e q u e s t ) 雨iu a s 到u a c 的响应( r e s p o n s e ) ，消息包括消息头和消息体两部分。 s i p 消息由一个起始行( s t a r t l i n e ) 、一个或多个字段( f i e l d ) 组成的消息头、一个标志消息头结束的空行( c r l f ) 以及作为可选项的消息体( m e s s a g eb o d y ) 组成，其中描述消息体( m e s s a g eb o d y ) 的头称为实体头( e n t i t yh e a d e r ) ，其格式如f ： g e n e r i c - m e s s a g e = s t a r t l i n e + m e s s a g e - h e a d e r c r l f 【m e s s a g e b o d y l 起始行分请求行( r e q u e s t l i n e ) 和状态行( s t a t u s 1 i n e ) 两种，其中请求行是请求 7 华中科技大学硕士学位论文消息的起始行，状态行是响应消息的起始行。s i p 定义r f 述方法： i n v i t e ：邀请用户加入呼叫。 b y e 终止呼叫上的两个用户之问的呼叫。 o p t i o n s ：请求关于服务器能力的信息。 a c k ：确认客户机已经接收到对i n v i t e 的最终响应。 r e g i s t e r ：提供地址解析的映射，让服务器知道其它用户的位置。 i n f o ：用于会话中信令。下图所示的场景为参与会话的两个u s e ra g e n t ，从发起呼叫、建立链路、媒体流传输、到拆除s i p 信令链路的全过程。 8 华中科技大学硕士学位论文 u s e r a g e n t a p r o x yap r o x yb u s e ra g e m tb l n v i t ef l i n v n 毫f 2 1 0 0 t r y i n gf 3 i n v i t ef 4 1 0 0 t r y i n g f 5 j 8 0 r i n g i n g f 6 1 8 0 r i n g i n g f 7 1 8 0 r i n g i n g 聃 2 0 0 0 k f 9 2 0 0 0 k f i o 2 0 0 0 k f l l a c k f l 2 m e d i as e s s i o n b y e f l 3 2 0 0 0 k f l 4 1 3 2h 3 2 3 协议簇图1 _ _ 4s i p 信令链路的建立与拆除过程目前，在我国使用的i p 电话系统基本上都采用h 3 2 3 协议，浚协议现已成为i t u t 近几年在通信领域推出的商用程度最高的协议。 h 3 2 3 1 5 1 是一个框架性协议，它是由系列协议组成的，下图列出了h 3 2 3 协议栈的基本内容。华中科技大学硕士学位论文 g 7h 2 x x6 x j u t 图1 5h 3 2 3 协议栈框图 1 h 2 2 5 0 协议 h 2 2 5 0 1 6 1 协议主要有两大功能：r a s 功能和呼叫信令功能。 r a s 信令功能就是采用h 2 2 5 0 中的消息在端点和网守之州实现注册、接入许可、带宽修改、状态和拆除。打开r a s 信令通路后才建立其他h 3 2 3 通路。r a s 、呼叫信令通路与h 2 4 5 控制通路是各自独立的，没有网守的网络环境是不使用r a s 信令的。呼叫信令功能采用h 2 2 5 0 呼叫信令在h 3 2 3 端点之间建立连接，包括呼叫的建立和拆除流程。呼叫信令通路是在h 2 4 5 控制通路和其他逻辑通路之前打丌的。 2 h 2 4 5 协议 h 2 4 51 7 】【8 1 协议具备以下功能：控制功能、能力交换、逻辑通路信令、模式选择、主从决定。控制功能采用h 2 4 5 控制通路交换端到端控制信息，从而保证h 3 2 3 实体的运作其中包括能力交换、打开关闭逻辑通路模式选择、流控消息、一般命令和指示。能力交换是指提供独立的接收和传送功能。终端通过它描述自身的能力，以便在各种模式中工作。接收能力描述终端接收和处理输入流的能力，即发送方发送的信息是接收方已经指明能接收的。传送能力描述终端传送信息流的能力，即为接收方提供几种可能的操作模式，让接收方选择它更愿意的模式。 1 0 华中科技大学硕士学位论文每个逻辑通路承载从一个发送方至另个或多个接收方的信息，当一。个逻辑通路被打丌，用o p e n l o g i c a l c h a n n e t 消息全面描述逻辑通路的内容，包括媒体类型、使用的运算法则、任选项和所有接收方解释逻辑通路内容所需的信息。逻辑通路不再使用时可以关闭。接收方可以使用r e q u e s t m o d e 消息请求发送方发送一个特定模式，通常情况下发送方必须顺从。主从决定主要解决冲突问题，例如两个端点都是一个会议中的m c 或者在两个端点间试图建立一条双向通路。在这个流程中的两端点在m a s t e r s l a v e d e t e r m i n a t i o n 消息中交换随机数以界定主从端点。 1 4 流媒体协议流媒体技术是一种从i n t e m e t 上获取音频和视频等连续媒体数据的新技术，该技术支持多媒体数据流的实时下载和会放。流媒体技术的实现离不开新型网络协议的支持，目前已有的协议包括：实时传输协议r t p 9 j 1 1 0 ( r e a l t i m e t r a n s p o r tp r o t o c 0 1 ) 。r t p 基于多播或单播网络为用户提供端到端连续媒体数据的实时传输服务。实施传输控制协议r t c p l 9 1 1 1 0 i ( r e a l t i m ec o n t r o lp r o t o c 0 1 ) 。r t c p 协议是r t p 协议的控制部分，用于实时监控数据传输质量，为系统提供拥塞控制和流控制。实时流化协议r t s p t l ( r e a l t i m e s t r e a m i n gp r o t o c 0 1 ) 。该协议是一个基于客户服务器结构的多媒体流传输控制协议，它能够对多媒体流提供v c r 风格的远端控制功能，如播放、停止等。资源预留协议r s v p 1 2 i ( r e s o u r c er e s e r v a t i o np r o t o c 0 1 ) 。它允许用户为某个数据流向支持该协议的路由器预定满足其特定需求的网络资源，以保证该数据流传输的端到端服务质量( q o s ) 。在流媒体技术中，r t p r t c p 、r t s p 、r s v p 协议阱同工作，共同完成网络实时多华中科技大学硕士学位论文媒体应用的数据传输和控制、资源预留及服务质量保证等= 王：作。其中r t p 阱议负责数据传输，r t c p 协议提供数据传输质量反馈，r s v p 防议用于资源预留以保证网络服务质量，r t s p 协议则提供数据传输的远端控制。 r t p r t c p 是流媒体技术的核心，在流媒体技术中具有举足轻重的作用。 1 5 语音编码方式模拟语音信号必须经过处理，转换成适合在i p 网络上传输的l p 数据包。这个过程需要先进行a d 转换，变成p c m 码，然后经过数据压缩，最后打上i p 包的标记形成i p 数据包在网络上传输。在传统的电路交换网中，电话业务采用的是脉冲编码调制( p c m ，p u l s ec o d e m o d u l a t i o n ) 是目前世界上主要采用的方式。p c m 分组包括抽样、量化和编码三个过程。抽样：是指用脉冲对要处理的模拟信号进行调制的过程，即对模拟信号进行脉冲调制。量化：是指把抽样信号的幅度离散化的过程。根据量化过程中量化器的输入输出的关系，可以有均匀量化和非均匀量化两种方式。编码：模拟信号经过抽样和量化后，还要进行编码处理，才能使离散样值成为更适宣传输的数字信号形式。语音编码可以分为两类：波形编码和参数编码，上述编码过程就是波形编码采用的思路。典型的波形编码p c m 语音编码比特率为6 4 k b i t s ，要进一步降低其编码比特率，必须采用低速波形编码技术。低速率波形编码技术一般采用自适应差分脉冲编码调制( a d p c m ) 技术。自适应线性预测算法的基本原理是跟据话音波形的时间相关性确定预测系数，使差分信号的方差为最小。作为a d p c m 技术的代表i t u g 7 2 6 ，有三种不同的压缩级别：3 2 kb 、 2 4 k b 、1 6 k b 。与p c m 相比语音质量几乎没有差别，但大大节省了带宽。华中科技大学硕士学位论文参数编码是跟掘声音形成机理的分析，着眼。r 构造话音生成模型，浚模型以一定精度模拟发话者的发生声道，接收端根据该模型还原生成发话者的因素。参数编码发送的主要信息就是该模型的参数，是话音的主要特征，而不是波形编码所发送的具体的话音波形幅值。参数编码比波形编码能够达到更低的话音编码速率，一般小于 1 6 k b i t s 的低比特率话音编码都采用参数编码。目前，i p 分组语音主要采用的编码技术有i t u u 定义的g 7 2 9 1 13 1 、g 7 2 3 1 f 1 4 l 等。其中g 7 2 9 可将经过采样的6 4 k b i t s 话音以几乎不失真的质量压缩至8 k b i t s 。 g 7 2 3 1 采用5 3 6 3 k b i t s 双速率话音编码，其话音质量好，但处理时延较大，它是目前已标准化的最低速率的话音编码算法。 1 6 论文的主要工作及安排 1 6 1 论文的主要工作实时语音传输技术是当前下一代网络的核心技术之一，符合三网合一的发展方向。作者结合参与的科研课题，紧跟相关技术的最新进展，主要做了以下方而的工作： 1 对实时语音传输的产生背景、基本原理、语音编码、信令技术、流媒体协议等相关技术进行了较为深入的研究。 2 在嵌入式l i n u x 平台上，采用多线程技术实现了基于r t p 的多播音频会议，并对多路混音提出了相应的解决方案。 3 对语音质量的各种因素进行了深入的分析，并解决了传输中的丢包、溢出、语音平滑等问题。 4 通过去抖缓冲算法有效解决了语音包的抖动问题，在时延与抖动之间达到良好平衡。 5 针对实际应用的特点提出了r t c p 的解决方案，井对r t p 的可扩展性提m 了前瞻性的看法。 1 3 华中科技大学硕士学位论文 1 6 2 论文的安排论文共分为六章：第一章介绍了实时语音传输的背景知识与发展现状，对论文的的总体安排进行了说明。第二章对r t p r t c p 协议进行了详尽的介绍与分析。第三章仔细论述了基于r t p 的实时语音传输的软件实现方案。第四章详细介绍了系统的硬件架构与实现。第五章给出了系统的测试结果，并进行了相关的理论研究。第六章全文的总结与展望。 1 4 华中科技大学硕士学位论文 2r t p r t c p 协议分析 r t p l 9 l ij 0 l 协议是由i e t f 的a v t ( a u d i ov i d e ot r a n s m i s s i o n ) 小组开发的，1 9 9 6 年成为r f c 正式文档，为l p 网上语音、图像、传真等数据等多种需实施传输的媒体数据提供点到点和点到多点的端到端的传输功能。r t p 协议实际上包含两个相关的协议，r t p 协议和r t c p 协议。前者用于传送实时的数据。r t p 本身不提供任何保证实时传送数据和服务质量的能力，而是通过提供负荷类型指示、序列号、时戳、数据源标识等信息，在收端根据这些信息来重新恢复正确地数据。r t c p 协议是用来提供r t p 数据传输质量的反馈的，同时可以在会议业务中传送与会者的信息。 2 1 实时语音传输与t c p t c w i p 协议最初是为提供非实时数据业务而设计的。1 p 咖议负贵主机之问的数据传输，不进行检错和纠错。因此，经常发生数据丢失或失序现象。为保证数据的可靠传输，人们将t c p 协议用于l p 数据的传输，提高接收端的检错、纠错能力。当检测到数据包丢失或错误时，要求发送端重新发送，但这样不可避免地引起传输延时和耗用网络带宽。因此传统的t c p i p 协议传输实时音频、视频数据的能力较差。当然在传输用于回放的视频和音频数据时，t c p 也是一种选择。如果有足够大的缓冲区，和充足的网络带宽，在t c p 协议上，接近实时的传输也是可能的。然而如果在丢包率较高、网络状况不好的情况下，此时利用t c p 协议进行视频或音频通讯几乎是不可能的。 t c p 作为运输层协议不适合实时传输主要有以下三个原因【1 5 j ： t c p 的重传机制我们知道在t c p i p 协议中，当发送方发现数据丢失时，它将重传丢失的数据包，然而这将需要一个甚至更多的周期，这种重传对于实时性要求较高的多媒体数据传输来说是灾难性的，因为接收方不得不等待重传数据的到柬，从而造成了延迟和断点( 音华中科技大学硕士学位论文频的不连续或视频的凝固等1 。 t c p 的拥塞控制机制 t c p 拥塞控制机制在探测到有数据包丢失时，它就会减小它的拥塞窗口。另方面，音频、视频在特定的编码发式下，产生的编码数量是不可能突然改变的。例如，标准的p c m 音频需要6 4 k b s ，加上一些额外的控制信息，它不能在低于这个带宽要求的网络上传输。f 确的拥塞控制应该是变换音频、视频信息的编码方式，调节视频信息的帧频或图像的大小。而在r t p 协议中，发送方能够根据r t c p 返回的信息进行调节。报文头的大小 t c p 另外一个不适合于实时传输的缺陷是，它们的报文头都l t u d p 的报文头大 ( t c p 的报文头为4 0 字节，而r t p 的报文头为1 2 字节) 。并且这些可靠的运输层协议不能提供时间戳( ，n m e s t a m p ) 和编解码信息( e n c o d i n g ，d e c o d i n gi n f o r m a t i o n ) ，而这些信息正是接收方应用程序所需要的。启动速度慢即便在网络运行状况良好，没有丢包的情况下，由于t c p 的启动需要建立连接因而在初始化的过程中，需要较多的时间。而在一个实时多媒体的应用巾，尽量减少数据流的延迟是我们所期望的。综上所述，t c p 协议是不适合进行实时多媒体数据的传输，于是专门为实时传输而设计的r t p 协议也就应运而生。 2 2 协议使用环境 r 1 1 p 协议主要有以下三类应用：简单的多播音频会议、音频和视频会议以及混合器和翻译器。下面分别简述这三类应用【9 11 1 0 1 。简单的多播音频会议这里的多播主要指i p 网的多播业务用于语音通信。这类语音通信通过个多播组地址和端口对来实现。一个用于音频数据，另一个用于控制( r t c p ) 包。这个地 1 6 华中科技大学硕士学位论文址和端口的信息发布给每1 个与会者。当一个参与者发言时，他的话音将以时州为单位分成许多音频帧( 如2 0 毫秒为帧) ，以帧为单位发送。发送之前，会为每一个音频数据帧加上一个r t p 头，然后按照头在前，数据在后的顺序交由u d p 打包。r t p 头指明每一包使用的音频编码类型( 如g 7 2 6 、g 7 2 9 等) ，这样发送方就可以在一次会议中按照需要( 如网络阻塞，要求变更更低速率的编码) 改变编码的类型。类似于其他分组网络，i p 网中有时也会出现包的丢失和乱序，包的时延也不完全相同，为了克服这种现象，r t p 包头携带计时信息和序列号，使接收方能跟据源端产生的计时信息，按分割音频帧的单位( 如2 0 毫秒) 连续地播出。在包的计时重组过程中，重组方按照不同的源，将r t p 包分组分别进行。接收方还可以根据序列号估计丢包的数目。与会者可能在会话过程中加入或退出会议，因此有必要知道在某一时刻有哪些人参加以及他们接收音频数据的情况。为此，每一个与会者在会议中不时通过r t c p 控制端口向同一会话中的成员组播带有自己用户名的接收报告。接收报告指出当前接收音频数据的情况，收发双方可以根据它来协商调艇编码类型。在r t c p 包巾除了用户名外，还可以在控制带宽的限制范围内添加其他的用户信息。当一个参与者要退出会议中时，发送r t c p b y e 包。音频和视频会议如果在一次会议中同时使用了音频和视频会议，这两个媒体将分别在不同的r 1 1 p 会话中传送，每一个会话使用不同的传输地址。如果一个用户同时使用了两个会话，则在每个会话对应的r t c p 包中使用相同的名字，这个名字在一次会议中是唯一的，这样，来自同一站点的两个会话可以相互关联。这个名字是这俩个会话在r t p 级唯一一的关联。通过将不同的媒体在不同的会话中传送，与会者可以选择只接收其中一种媒体，尽管是分开传送的，同源的音频和视频可以依据两个话路数据包中携带的计h 寸信息来同步回放。混合器和翻译器当与会者能接收的音频格式不一样，例如某个与会者是通过一条低速链路连接到华中科技大学硕士学位论文一个高速会议，这是就要使用混合器。混合器是一个r t p 中继。在进入音频数据格式需要变化的网络前，混合器将送来的音频包进行再同步，重构原来的2 0 毫秒时段，把重构后的多个音频合并，采用另一种音频编码进行编码后，再通过单播或多播的方式转发出去。r t p 包头中有一项c s r c ，是专门为混合器标志被混合的包的源准备的，这样在接收端就可以获得f 确的来源标识了。翻译器也是一种r t p 级的中继，用在通过l p 多播不能直接到达的用户区，例如发送者和接收者之间存在防火墙。这种情况下，在防火墙的两边各装一个翻译器，外边的翻译器检验收到的包的合法性后，经过一条与防火墙内的翻译器直接相连的通道将这些包送进来，再由防火墙内的翻译器把音频流单播或多播至各个与会者。混合器和翻译器可以针对不同的目的而设计。例如视频混合器按比例把来自不同的视频流的单个图像合成一个，以模仿一个群体场景。下而分别介绍r t p 数据传输协议和r t p 控制协议。 2 3 r t p 协议介绍 2 3 1r t p 协议格式每个r t p 数据包都由一个头部和不定长的媒体数据组成，其中，r t p 包头的前1 2 个字节是固定的。i n p 包头结构如下图所示【1 0 】。 o81 62 43 1 v = 2pxc cmp r r s e q u e n c en u m b e r t i m e s t a m p s y n c h r o n i z a t i o ns o u r c e ( s s r c ) i d e n l i f l e t c o n l f l b u t i u gs o u r c e ( c s r q i d e n t i f i e r 图2 1r t p 包头的格式前面1 2 个

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（通信与信息系统专业论文）基于rtp的实时语音传输的实现与研究.pdf

文档简介

温馨提示

最新文档

评论

（通信与信息系统专业论文）基于rtp的实时语音传输的实现与研究.pdf

文档简介

温馨提示

最新文档

评论

相关文档