(通信与信息系统专业论文)无线voip语音质量增强技术研究.pdf_第1页
(通信与信息系统专业论文)无线voip语音质量增强技术研究.pdf_第2页
(通信与信息系统专业论文)无线voip语音质量增强技术研究.pdf_第3页
(通信与信息系统专业论文)无线voip语音质量增强技术研究.pdf_第4页
(通信与信息系统专业论文)无线voip语音质量增强技术研究.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

(通信与信息系统专业论文)无线voip语音质量增强技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

妒 ” 。曩 独创性( 或创新性) 声明 j iirljr i iir l l lil llr l i l i l l l l l l l i j i l l l l u l y 17 5 9 5 8 2 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名:椰吟 日期:丑! 女:! 墨 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保 留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借 阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它 复制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 本学位论文不属于保密范围,适用本授权书。 本人签名:塾遂监- 一 日期: 导师签名: “um移?“7。 北京邮电大学硕士学位论文 无线v o i p 语音质量增强技术研究 摘要 v o i p 是利用互联网进行话音传输的一种技术。该技术将模拟的声 音信号经过压缩与封包之后,以数据包的形式在i p 网络环境中进行传 输,与传统电话相比,它的成本更加低廉,并且可以更加方便引入新 的多媒体业务。 随着音视频压缩算法、高质量网络传输技术的高速发展,v o i p 的应用也逐渐成熟。无线网络的广泛应用,也使得v o i p 的使用更加 灵活多变。在无线多跳网络上传送实时的语音业务是一种日益增长的 需求,但是网络拥塞、传输路径不同等原因将会使得v o l p 数据包出 现丢失、突发大时延的状况,难以保证v o i p 的服务质量。 语音业务是对时延比较敏感的业务,较大的时延会影响话音的交 互性和舒适性。v o l p 使用u d p 协议发送固定速率的数据流,由于缺 乏拥塞控制策略,当网络处于饱和状态的时候,节点还将按照既定速 率向网络中注入数据包,引起某些节点的局部拥塞,进而造成网络时 延和丢包率迅速上升,出现突发大时延现象,严重影响语音质量。本 文提出了一种动态调整源端速率的策略来有效的解决这个问题。一 本文首先讨论了v o l p 的系统组成及基本原理,并阐述了v o l p 的 关键技术,包括信令技术、实时传输协议、以及编解码技术。作者对 影响v o i p 语音质量的因素以及语音质量增强技术进行了详细调研, 应策略,根据网络状态动态得调整源端语音的发送速率,以有效的缓 解网络拥塞,并最大限度的提高语音质量。该策略也可用于其它实时 业务领域,如视频业务、多媒体会议业务等。 关键字:v o i pa dh o c 网络r t pm o s n v o i c eq u a u t ye n h a n c e m e n tt e c h n o l o g y f o rw i r e l e s sv o i p a b s t r a c t v o l pi st h et e c h n o l o g yo fu s i n gt h ei n t e m e tf o rv o i c et r a n s m i s s i o n t h ea n a l o ga u d i os i g n a lw i l lb ec o m p r e s s e da n de n c a p s u l a t e di n t oad a t a p a c k e ta n dt h e nb et r a n s m i t t e di nt h ei pn e t w o r k c o m p a r e dw i t h t r a d i t i o n a l t e l e p h o n e ,i t sc h e a p e ra n dc a nb em o r ec o n v e n i e n tt o i n t r o d u c en e wm u l t i m e d i as e r v i c e s w i t ht h ed e v e l o p m e n to ft h ea u d i o v i d e oc o m p r e s s i o na l g o r i t h m s a n dh i g h - q u a l i t yn e t w o r kt r a n s m i s s i o nt e c h n o l o g y , v o i p a p p l i c a t i o n sh a s g r a d u a l l ym a t u r e d e x t e n s i v eu s eo fw i r e l e s sn e t w o r k sa l s om a k e sv o l p m o r ef l e x i b l e t h e r ei sag r o w i n gd e m a n dt op r o v i d er e a l - t i m ev o i c e b u s i n e s si nw i r e l e s sm u l t i h o pn e t w o r k s ,b u tt h en e t w o r kc o n g e s t i o n , d i f f e r e n c e so ft r a n s m i s s i o np a t ha n do t h e rr e a s o n sw i l ll e a dt op a c k e tl o s s a n d d e l a ys p i k e s s ot h ev o i c eq u a l i t yc a n tb ee n s u r e d l a t q ys e n s i t i v eb u l ,t h el a r g ed e l a yw i laffectvoice l saa t e n c y - s e n s i t i v eb u s i n e s st h el a m ed e l a yw i l la t h e, i n t e r a c t i o na n dc o m f o r to fv o i c eb u s i n e s s i nv o l p s y s t e m ,u d pi su s e dt o i i i h a sm a d ea ni n t e n s i v e l yi n v e s t i g a t i o no nt h ef a c t o r sa f f e c t i n gv o l pv o i c e q u a l i t ya n dv o i c eq u a l i t ye n h a n c e m e n tt e c h n o l o g ya n dr e p r e s e n t e dt h e m i nt h et h i r dc h a p t e r , i n c l u d i n gt h ep a c k e tl o s sc o n c e a l m e n t r e c o v e r y t e c h n o l o g ya n dt h ej i t t e rb u f f e rt e c h n o l o g y t h ef o u r t hc h a p t e re x p l a i n s t h ed e l a y s p i k ep h e n o m e n o ni nt h ew i r e l e s sn e t w o r ka n di t s c a u s e s i n d e p t h o n t h i sb a s i sas t a t e a w a r ea n dr a t e a d a p t i v es t r a t e g y i s p r o p o s e d t h es e n d i n gr a t eo ft h es o u r c ev o i c ei sd y n a m i c a l l ya d j u s t e d a c c o r d i n gt on e t w o r ks t a t u s i no r d e rt oe f f e c t i v e l ya l l e v i a t en e t w o r k c o n g e s t i o na n dt o m a x i m i z et h e i m p r o v e m e n to fv o i c eq u a l i t y t h e s t r a t e g yc a na l s ob eu s e df o ro t h e rr e a l - t i m eb u s i n e s sa r e a s ,s u c ha sv i d e o i v 北京邮电大学硕士学位论文 s e r v i c e s ,m u l t i m e d i ac o n f e r e n c i n gs e r v i c e sa n ds oo i l k e yw o r d sv o i pa dh o cn e t w o r kr 皿m o s v 北京邮电大学硕士学位论文 目录 第一章引言。1 1 1 概j 2 罡1 1 2 选题背景和意义。1 1 3 本论文的研究内容2 1 4 论文的组织结构。2 第二章 v oip 的基本原理和关键技术。4 2 1 v o i p 基本原理和传输过程4 2 2 信令协议( s l p & h 3 2 3 ) 6 2 2 1h 3 2 31 9 9 、议6 2 2 2s i p 协议7 2 3 实时传输协议( r t p 瓜r c p ) 8 2 3 1r t p 协议 ; 2 3 2 r ,r ( 、p 协议。1 0 2 4 编解码器1 2 2 4 1 采用波形编码的编码器1 2 2 4 2 采用c e i ,p 模型编码的编码器t 3 2 4 3g i p s 公司提出编码协议1 4 2 4 4v o i p 语音编码器的比较1 5 2 5本章小结1 6 第三章语音质量增强技术17 3 1 语音质量的测试方法( m o s ) 1 8 3 2 丢包处理技术1 9 3 2 1 丢包恢复技术1 9 3 2 2 丢包隐藏技术2 1 3 3 抖动缓存技术2 3 3 4 本章小结。2 9 第四章源端速率自适应算法3 0 4 1网络突发大时延3 0 4 2 源端速率自适应调整算法3 1 4 3 本章小结3 5 第五章0 p n e t 仿真3 6 5 1 网络拓扑3 7 5 2 仿真设计4 4 5 2 1 注册全局统计量4 4 5 2 2 修改进程模型4 6 v l 北京邮电大学硕士学位论文 5 3 仿真结果4 7 5 4 本章小结4 9 第六章 总结与展望5 0 6 1 总结5 0 6 2 展望5 0 参考文献5 2 附录5 4 致谤,5 5 作者攻读学位期间发表的学术论文目录5 6 v 北京邮电大学硕士学位论文 第一章引言 随着计算机网络技术的飞速发展和多媒体应用技术的日益深入和普及,基于 因特网的多媒体通信已成为当前因特网发展的趋势之一,而基于因特网的语音通 信技术v 0 口,也得到了广泛的应用。不仅指提供双方会话的传统网络电话技术, 而且是包含话音、图像和数据、支持各种智能业务的双方及多方多媒体的通信技 术,因此v o p 技术是目前综合业务中最具前景的多媒体应用。 1 1 概述 v o 口( v o i c eo v e ri n t e r a c tp r o t o c 0 1 ) ,即互联网上的语音传输,亦可称之为p 电话、i pp h o n e 等,其实质是以分组的形式传输语音数据。如今,i p 电话成为因 特网多媒体通信的一个典型业务,也成为了当前计算机网络技术和通信技术的热 点。据国际数据公司统计,口电话在2 0 0 0 年的营业额已达到3 0 亿美元,全球 有1 5 的用户使用口电话,预计在2 0 0 5 年,使用i p 电话的用户数将会增至3 4 。 五年的增长率为1 4 9 ,而传统电话的增长率则仅为1 5 。可见,发展基于互联 网的实时语音,无论从技术发展趋势,还是从市场前景和投资回报来分析,都是 非常有价值的。 此外,口以分组的形式传送语音数据,它使语音和数据业务综合,使带宽 得以合并,符合未来“三网合一 的发展方向;它提供的低成本语音业务,对用 户极具吸引力;它传播信息容量大、不受时空限制,有效地利用了网络资源,这 些优势使得口备受业界青睐,也使得口电话作为现有电话的强有力的竞争对 手,将在未来的发展中形成很大的市场。 1 2 选题背景和意义 p 广泛的应用前景和巨大的商业价值促使业界对其产生了浓厚的开发热 情,我国信息产业界正密切关注着这一领域的发展。v o i p 相关技术很多,目前 研究主要分布在以下几个方面:实现v 0 口的网络体系结构及其相关信令、管理、 媒体传送、安全协议,v o l p 的服务质量保证,即o o s ( q u a l i t yo fs e r v i c e ) 问题。 与传统电话相比,v o i p 有一个致命的缺点,就是语音服务质量无法得到保证。 这是由于口网最初设计的目的是为传输数据,采用的是面向无连接的“尽力而 北京邮电大学硕士学位论文 为 的传输体制;而实时语音数据和普通数据有着不一样的特性,实时语音数据 要求网络传输能保证较高的实时性和连续性。如何在一个无连接的网络上建立一 个提供综合业务的有质量保证的传输平台,如何提高v o i p 的语音质量成为近年 研究的热点。 影响v 0 坤语音质量的主要因素有编解码算法、时延、时延抖动、分组丢失、 带宽、网络状况等。在基于因特网的语音传输中,如何处理各种因素的相互制约, 尽可能降低分组丢失和时延抖动对通信的影响,以高质量的语音传输向用户提供 舒适满意的使用体验,已成为业界共同关注的一个焦点问题。清晰、连续、无间 断的通话会给用户带来良好的使用体验,可以使企业更加容易地推广v o 口业务, 从而吸引更多的用户。如果v o i p 系统的语音质量能够达到理想的水平,它将占 有更大的通信市场,进而取代现有的大部分传统电信业务,成为未来通信的一种 主流模式。因此,为了进一步提高我国在多媒体通信领域的国际地位,迅速展开 对提高语音质量的关键理论和技术的研究具有重要的战略意义。 1 3 本论文的研究内容 在无线多跳网络上传送实时的语音业务是一种日益增长的需求,但是网络拥 塞、传输路径不同等原因将会使得i p 数据包出现丢失、突发大时延的情况, 难以保证i p 的服务质量( q o s ) 。语音业务是对时延比较敏感的业务,较大的 时延会影响话音的交互性和舒适性。v 0 口使用u d p 协议发送固定速率的数据流, 由于缺乏拥塞控制策略,当出现网络处于饱和状态的时候,节点还将按照既定速 率向网络中注入数据包,引起某些节点的局部拥塞,进而造成网络时延和丢包率 上升,出现突发大时延( d e l a ys p i k e ) 现象,严重影响语音质量。本论文采用带 有网络状态感知的速率自适应策略能够有效地解决这个问题。 1 4 论文的组织结构 本课题主要研究如何提高无线网络中语音业务的语音质量。本课题对当前的 语音质量技术进行了深入的调研和总结,结合a dh o c 网络的特性,提出了一种 基于e m o d e l 的源端速率自适应算法。难点在于如何制订合理的速率自适应策 略,综合考虑时延、丢包等各种因素之间的制约影响,从而最优化系统性能。本 课题的主要工作如下: 1 、研究了v o i p 系统的架构,深入理解口的基本原理和关键技术。 2 、调研当前主流的语音质量增强技术,分析其各自的适用场景和优缺点,并对 其技术加以借鉴和学习。 2 北京邮电大学硕士学位论文 3 、根据测试平台的测试数据,分析a dh o c 网络的特点,并分析产生原因,提出 针对这种现象提出源端变速率算法。 4 、在o p n e t 仿真平台实现该算法,并进行了一系列的仿真,验证该算法的性 能。 全文共分为六章,第一章为引言,简要介绍了口的发展现状和应用前景, 并提出了研究方向。第二章阐述了v o 口系统的架构和口的基本原理以及背景 技术。第三章介绍了当前主流的v o i p 语音质量增强技术。第四章重点讲述了源 端变速率算法。第五章是仿真方法和仿真结果。第六章对全文进行了总结和展望。 3 技术 音通信的系统。它属 体为目标的网络综合 化两大驻留技术融合的结果。因此,v o i p 的内容并不仅仅是口网络承载语音的 技术,而是泛指口网络承载多媒体业务的所有相关技术。 2 1v o i p 基本原理和传输过程 传统的电话网是以电路交换方式传输语音的,要求的带宽为6 4 k b i t s 。v o i p 是以分组交换网络为传输平台,经过对模拟的语音信号进行压缩、分组等一系列 的特殊处理,使之可以采用无连接的u d p 进行传输。为了在一个i p 网络上传输 语音信号,要求包括几个元素和功能。最简单形式的网络由两个或多个具有v o i p 功能的设备组成,这些设备通过一个m 网络连接。v o i p 模型的基本结构图如图 2 1 。 图2 - 1v o i p 网络基本结构图 v o i p 是建立在口技术上的分组化、数字化传输技术。其工作基本原理1 1 l 是: 4 北京邮电大学硕士学位论文 通过语音压缩算法对语音数据进行压缩编码处理,然后把这些语音数据按口等 相关协议进行打包,经过口网络把数据包传输到接收方,再把这些语音数据包 串起来,经过解码解压处理后,恢复成原来的语音信号,从而达到由口网络传 送语音的目的。口电话系统把普通电话的模拟信号转换成可接入因特网传送的 i p 数据包,同时也将收到的口数据包转换成声音的模拟电信号。经过口电话系 统的转换及压缩处理,每个普通电话传输速率约占用8 - 1 1 k b i t s 带宽,因此在与 普通电信网同样使用传输速率为6 4 k b i t s 的带宽时,坤电话数是原来的5 8 倍。 v o i p 设备把语音信号转换成i p 数据流,并把这些数据流转发到口目的地,口 目的地把它们转换成语音信号。一般来讲,可以简单地将v o i p 的通信过程分为 下面几个阶段: ( 1 ) 语音一数据转换 语音信号是模拟波形,通过i p 方式来传输语音,不管是实时的应用业务, 还是非实时应用业务,都要求首先对语音信号进行模数转换。数字化后有利于采 用各种语音编码技术。发送端的语音编码器和接收端的语音解码器采用相对应的 算法,这样接收端的语音设备才可以还原发送端的语音信号。 ( 2 ) 数字化数据 i p 分组的转换在对语音信号进行了数字化后,首先,对语音分组以特定的帧 长进行压缩编码。然后,将压缩的帧组成语音包送入网络处理器。最后,网络处 理器为语音分组添加分组头、时间戳和其它信息后通过网络传送到另一个端点。 ( 3 ) 传送 在这个通道中,全部网络被看成一个整体,持续不断地从输入端接收语音分 组,然后在一定时间( t ) 内将语音分组传送到网络输出端。t 在一个范围内变 化,它反映网络传输中的抖动。在网络中的中间节点,检查每个口数据报附带的 寻址信息,并使用这个信息把该数据报转发到目的路径的下一节点。网络链路可 以是口数据流的任何拓扑结构或访问方法。 ( 4 ) i p 分组一数据转换 接收端口设备接收i p 数据并进行处理。接收端提供一个可变长度的缓冲 器,用来调节网络产生的抖动。用户可选择缓冲器的大小,小的缓冲器产生延迟 较小,但不能调节大的抖动。在数据报的处理过程中,去掉寻址和控制信息,保 留原始的语音数据,然后把这个语音数据提供给解码器。解码器模块将经编码的 语音数据解压缩后转换成数字化的语音。 ( 5 ) 数字化语音一模拟语音转换 播放驱动器将缓冲器中语音样点取出送入声卡,将数字信号转化成模拟信 号,通过扬声器按预定的频率播出。 5 北京邮电大学硕士学位论文 简而言之,语音信号在i p 网络上的传送要经过从模拟信号到数字信号的转 换、数字语音封装成口分组、m 分组通过网络的传送、p 分组的解包和数字语音 还原到模拟信号等过程。 整个过程如图2 2 所示: 图2 2 i p 基本传输过程 2 2 信令协议( s i p & h 3 2 3 ) 信令协议保证电话呼叫的顺利实现和话音质量,目前被广泛接受的v o l p 控 制信令协议包括国际电信联盟电信部兀u t 的h 3 2 3 协议和互联网工程攻坚组 i e t f 的会话初始协议( s i p :s e s s i o ni n i t i a t i o np r o t o c 0 1 ) 两套标准体系。 2 2 1h 3 2 3 协议 h 3 2 3 协议1 1 j 提供了在不提供服务质量保证的分组网络上的多媒体通信标 准,可用于在口网络上传输语音、视频和数据。h 3 2 3 并不依赖于具体的网络 结构,而是独立与操作系统和硬件平台之上,若与其它的i p 技术如i e t f 的资源 预留协议( r s v p ) 、r 皿瓜t c p 协议等结合,就可以实现坤网络上的实时多媒 体通信。由于能够提供设备与设备、应用与应用、供应商与供应商之问的互操作 能力,因此h 3 2 3 可提供现有分组网络和别的网络之间进行多媒体通信的互连互 通标准。 h 3 2 3 为基于网络的通信系统定义了四个主要的组件:终端( t e r m i n a l ) 、网 关( g a t e w a y ) 、网守( g a t e k e e p e r ) 、和多点控制单元( m c u ) 。 终端是h 3 2 3 定义的最基本组件,它是分组网络中能够提供实时、双向通信 的节点设备,也是一种终端用户设备,可以和网关、多点控制单元通信。在发送 端,从输入设备获取的视频和音频信号,经编码器压缩后,按照一定格式打包, 通过网络发送出去,在接收端,来自网络的数据包首先被解包,获得的视频、音 6 北京邮电大学硕士学位论文 频压缩数据经解码后送入输出设备,用户数据和控制数据也得到了相应的处理。 网关实现口网络与其它类型的网络之间的互通,它可以提供不同传输格式、 数据格式以及不同通信规程之间的互相切换,能分别提供分组网络和交换电路网 络之间的呼叫建立和清除。若没有必要与其他网络建立连接,而且终端直接与同 一分组网络上的其他终端进行通信,则无需网关。 网守主要为h 3 2 3 端点提供呼叫控制服务,是远程访问服务协议( 凡峪: r e m o t ea c c e s ss e r v i c e ) 的实现。它提供地址转换、接入许可控制、带宽控制和 域管理四种基本服务。 在三个或者三个以上终端一起参加同一会议时,多点控制单元用来控制多个 终端。 2 2 2s i p 协议 会话初始协议( s i p ) 1 2 】被描述用来生成、修改和终结一个或者多个参与者之 间的会话,是由i e t f 于1 9 9 9 年提出的一个基于口网络中实现实时通信应用的 一种信令控制协议。与h 3 2 3 不同,它只提供会话或者呼叫的建立和控制功能。 s i p 是一种应用层协议,基于文本格式,可以用s i p 规则资源定位语言来描述, 所以灵活性和扩展性好。此外,s i p 还有建立呼叫快,支持传送电话号码等特点。 s i p 系统采用了客户机服务器( c s ) 结构,由用户代理和服务器两大部分 组成。其中用户代理又分为用户代理客户( u a c :u s e ra g e n tc l i e n t ) 和用户代 理服务( u a s :u s e r a g e n ts e r v e r ) 两种。用户代理客户机u a c 用来发起会话请 求,用户代理服务器u a s 用来接受并响应会话请求。这两者是逻辑上的功能, 实际上网络终端应同时具备两者。服务器有四种基本类型:( 1 ) 用户代理服务器: 当接到s i p 请求时它联系用户,并代表用户返回响应。( 2 ) 代理服务器:代表其 它客户机发起请求,既充当服务器又充当客户机的媒介程序。在转发请求之前, 它可以改写原请求消息中的内容。( 3 ) 重定向服务器:它接收s i p 请求,并把请 求中的原地址映射成零个或多个新地址,返回给客户机。( 4 ) 注册服务器:它接 收客户机的注册请求,完成用户地址的注册。代理服务器、重定向服务器和注册 服务器可以看出是公众性的网络服务器。在s i p 中还经常提到定位服务器的概 念,但是定位服务器不属于s i p 服务。 s i p 共规定了六个信令消息;会话邀请消息i n v i t e 、会话响应消息a c k 、 会话删除消息c a n c e l 、会话选择消息o p t i o n s 、会话结束消息b y e 、会话注 册消息r e g i s t e r 。其中会话邀请消息i n v i t e 和会话响应消息a c k 用于建立 呼叫,完成三次握手,或者用于建立以后改变会话属性;会话结束消息b y e 用 以结束会话;会话选择消息o p t i o n s 用于查询服务器能力;会话删除消息 c a n c e l 用于取消已经发出但未最终结束的请求;会话注册消息r e g i s t e r 用 7 北京邮电大学硕士学位论文 于客户出向注册服务器注册用户位置等消息。s i p 协议支持三种呼叫方式:由用 户代理客户机( u a c ) 向用户代理服务器( u 蝎) 直接呼叫,由用户代理客户 机( u a c ) 在重定向服务器的辅助下进行重定向呼叫和由代理服务器代表用户 代理客户机( u a c ) 向被叫发起呼叫。 2 3实时传输协议( r 1 哪c p ) 实时传输协议( r e a l t i m et r a n s p o r tp r o t o c o l ,r t p ) 1 3 j 是在因特网上处理多媒 体数据流的一种网络协议,利用它能够在一对一( 单播) 或者一对多( 多播) 的 网络环境中实现流媒体数据的实时传输。r t p 通常使用u d p 来进行多媒体数据 的传输,但如果需要的话可以使用t c p 或者a t m 等其它协议,整个r t p 协议 由两个密切相关的部分组成:r t p 数据协议和r t p 控制协议( r t c p ) 。当应用 程序开始一个r t p 会话时将使用两个端口,分别给r t p 和r t c p ,r t p 使用偶 数端口号,相应的r t c p 使用其后的奇数端口号。r t p 本身并不能为按顺序传送 数据包提供可靠的传送机制,也不提供流量控制或拥塞控制,它依靠r t c p 提供 这些服务。r t p 瓜t c p 的协议栈结构如图2 3 所示: 应用程序 r t p r t c p u d p t c p i p v 4 i p v 6 图2 3u d p i p 封装的r t p 数据 2 3 1r t p 协议 r t p 数据协议负责对流媒体数据进行封包并实现媒体流的实时传输,每一个 r t p 数据报都由头部( h e a d e r ) 和负载( p a y l o a d ) 两个部分组成,其中头部前 1 2 个字节的含义是固定的,而负载则可以是音频或者视频数据。r t p 数据报的 头部格式如图2 4 所示: 8 北京邮电大学硕士学位论文 版本 补扩 c s r c标 号 齐展 负载类型序列号 位位 数目记 ,1 1 6 241 ll 时间戳 3 2 s s r c 标识符 3 2 c s r c 标识符0 3 2 c s r c 表不符1 图2 4r t p 包头格式 其中比较重要的几个域及其意义如下: 补齐位( p ) :用于标识被传输的有效载荷末尾中是否含有填充字符。用于数 据报的加密算法通常需要数据的块是大小固定的。例如,如果加密只能在4 个字 节的块上完成。而有效载荷中的数据块大小不足4 个字节,那么它就需要添加一 些额外的空间以补足4 个字节。 扩展位( x ) :标识r t p 数据包中是否有附加的头部信息。 c s r c 记数( c c ) :表示r t p 报文中c s r c 标识符的数目。c s r c 标识紧跟 在r t p 固定头部之后,用来表示r t p 数据报的来源,r t p 协议允许在同一个会 话中存在多个数据源,它们可以通过r t p 混合器合并为一个数据源。例如,可 以产生一个c s r c 列表来表示一个电话会议,该会议通过一个r t p 混合器将所 有讲话者的语音数据组合为一个r t p 数据源。 标记位( m ) :用作i 帧的标识( 或者被拆分的帧的标识) 。该位被置1 ,表 明是不完整的帧,后续的数据包还有其拆分部分。 负载类型( p t ) :标明r t p 负载的格式,包括所采用的编码算法、采样频率、 承载通道等。常见的负载类型有:p c m 、m p e g i m p e g 2 、j p e g 视频、h 2 6 1 视频流等,这样。可以避免每次连接的重新初始化。这个标识可以允许系统扩展 使用,根据网络情况和需求选择编码标准。例如,类型2 表明该r t p 数据包中 承载的是用i t u g 7 2 1 算法编码的语音数据,采样频率为8 0 0 0 h z ,并且采用单声 道。 一 9 北京邮电大学硕士学位论文 序列号:用来为接收方提供检测数据丢失、错序情况的方法。 时间戳:是实时数据传输的重要信息,用于同步和包到达间隔抖动计算,它 记录了负载中首字节的采样时间。其频率由所承载的数据类型所决定,视频流常 用频率为6 6 5 3 6 h z 时间戳,而音频流则按采样速率打上时间戳,对固定速率 的音频来说,每次取样时戳时钟增1 。和包序列号一样,时戳的开始值也是随机 的。接收方根据时间戳能够确定数据的到达是否受到了延迟抖动的影响,实现数 据流的同步并完成数据包的重组和控制数据回放速率。时间戳只是一个相对的概 念,并不需要将接收方和发送方的时钟校准一致。 从r t p 数据报的格式不难看出,它包含了传输媒体的类型、格式、序列号、 时间戳以及是否有附加数据等信息,这些都为实时的流媒体传输提供了相应的基 础。r t p 协议的目的是提供实时数据( 如交互式的音频和视频) 的端到端传输服 务,因此在r t p 中没有连接的概念,它可以建立在底层的面向连接或面向非连 接的传输协议之上;r t p 也不依赖于特别的网络地址格式,而仅仅只需要底层传 输协议支持组帧( f r a m i n g ) 和分段( s e g m e n t a t i o n ) 就足够了。 r t p 的工作流程如下: 首先发送方应为每一个源定义一个s s r c ( s y n c h r o n i z a t i o ns o u r c ei d e n t i f i e r , 同步源标识符) 。在采样形成每一个有效荷载之后,依据第一个包的序号和己发 包的数目产生序号。并根据第一个包的时间戳和时间戳的频率产生本次的时间 戳,产生正确的r t p 包后经由下层协议发出。接收方应维持一个抖动缓存,并 根据传输延迟的大小确定回放点( p a y l o a dp o i n t ) 。当到达回放点之后,开始回放。 回放点的选择应兼顾时延的大小和播放的稳定程度,采取折衷的方案。同时,r t p 为每个会话分配一个端口( 而不是使用保留的端口号) ,通常使用偶数u d p 端口 号对时间戳的处理,有显式时间管理( e x p l i c i tt i m em a n a g e m e n t ) 和隐式时间 管理,、( i m p l i c i tt i m em a n a g e m e n t ) 两种。前者由r t p 协议向应用程序提供时间 戳,由应用程序处理。后者由r t p 协议处理时间戳,并把到达回放时间的r t p 包交给应用程序。 2 3 2r t c p 协议 r t p 本身没有流量控制、拥塞监测等传输控制的功能,必须依赖传输控制协 议r t c p 进行控制交互。r t c p 定义了s r 、r r 、s d e s 、c n a m e 、b y e 等5 类 控制报文,在r t p 传输过程中,周期性地发送r t c p 报文,反馈数据传输质量 及收发双方的相关信息。通常r t c p 会采用与r t p 相同的分发机制,向会话中 的所有成员周期性地发送控制信息,应用程序通过接收这些数据,从中获取会话 参与者的相关资料,以及网络状况、分组丢失概率等反馈信息,从而能够对服务 1 0 北京邮电大学硕士学位论文 质量进行控制或者对网络状况进行诊断。 类似于r t p 数据包,每个r t c p 包以固定部分开始,然后是变长结构的选项, 但均以一个3 2 位边界结束。 s r :发送端报告,所谓发送端是指发出r t p 数据报的应用程序或者终端, 发送端同时也可以是接收端。 r r :接收端报告,所谓接收端是指仅接收但不发送r t p 数据报的应用程序 或者终端。 s d e s :源描述,主要功能是作为会话成员有关标识信息的载体,如用户名、 邮件地址、电话号码等,此外还具有向会话成员传达会话控制信息的功能。 b y e :通知离开,主要功能是指示某一个或者几个源不再有效,即通知会话 中的其他成员自己将退出会话。 a p p :由应用程序自己定义,解决了r t c p 的扩展性问题,并且为协议的实 现者提供了很大的灵活性。 在传输过程中,一般将上述几种包组合成一个组合包捆绑发送。r t c p 规定, 在每次发送的r t c p 分组中必须包含报告( i 汛或者s r ) 和s d e s 。 r t c p 数据报携带有服务质量监控的必要信息,能够对服务质量进行动态的 调整,并能够对网络拥塞进行有效的控制。由于r t c p 数据报采用的是多播方式, 因此会话中的所有成员都可以通过r t c p 数据报返回的控制信息,来了解其他参 与者的当前情况。 在一个典型的应用场合下,发送媒体流的应用程序将周期性地产生发送端报 告s r ,该r t c p 数据报含有不同媒体流间的同步信息,以及已经发送的数据报 和字节的计数,接收端根据这些信息可以估计出实际的数据传输速率。另一方面, 接收端会向所有已知的发送端发送接收端报告r r ,该r t c p 数据报含有已接收 数据报的最大序列号、丢失的数据报数目、延时抖动和时间戳等重要信息,发送 端应用根据这些信息可以估计出往返时延,并且可以根据数据报丢失概率和时延 抖动情况动态调整发送速率,以改善网络拥塞状况,或者根据网络状况平滑地调 整应用程序的服务质量。 r t c p 协议的工作流程:首先,要为r t c p 报文划定带宽。原则是全部控制 信息的通信量不应超过全部实时数据通信量的5 。而接收方报告不应超过控制 通信总量的7 5 。然后应选择比r t p 端口号大一的端口给r t c p 。在开始发送 与接收r t p 报文之后,根据带宽分配的原则,以固定的间隔,发送方发送s r 报 文与s d e s 报文而接收方应根据接收r t p 和s r 报文的情况产生r r 报文并发 送。在发送方停止发送后,发出b y e 报文,接收方停止接收。 北京邮电大学硕士学位论文 2 4 编解码器 为使v o 口能够可靠的进行语音通信,必须保证在一定话音质量的前提下尽 可能地降低编码速率,这主要是依赖语音编码技术。在目前口中常用的语音 编码算法主要有以下几类:基于波形编码的算法;基于c e l p 模型的混合编码算 法;以及g i p s 公司自己提出的4 种语音编码算法。 2 4 1 采用波形编码的编码器 波形编解码器基本上不考虑信号是如何产生的,而直接将输入的模拟信号抽 样编码,然后将量化后的样值传送到终端,在终端原始信号被重组到与原信号大 致接近的程度。因此波形编码方式是能够忠实地表现波形的编码方式。由于这类 编码器通常将语音信号作为一般的波形信号来处理,所以它具有适应能力强、话 音质量好、抗噪抗误码的能力强等特点。它最大的缺点是同其他的编解码器相比, 它要使用大量的带宽,当波形编解码器用于低带宽时,话音质量下降得非常快。 脉冲编码调制( p c m ) 、自适应增量调制( a d m 或a m 编码) 、自适应差分 编码( a d p c m ) 、自适应预测编码( a p c ) 、自适应子带编码( a s b c ) 、自适应 变换编码( 御陀) 等都属于波形编码。 2 4 1 1 g 7 1 1 协议【4 l g 7 1 1 是在电路交换电话网中普遍使用的一种波形编解码算法。g 7 1 1 以8 k h z 作为抽样频率,如果使用统一量化方式,话音中通用的信号层次的每一个样本就 要1 2 比特来表示,这就产生了9 6 k b s 的比特速率,如果使用不统一的量化方式, 表示一个样本只需要8 比特。g 7 1 1 通常被称为脉冲编码调制( p c m ) 。g 7 1 1 提 供了良好的语音质量,其m o s 值都在4 3 左右。 2 4 1 2 g 7 2 6 协议【4 】 g 7 2 6 协议采用的是a d p c m 语音编码算法,提供了6 4 k b s p c m 码流至低 速率a d p c m 码流的转换。协议给出4 0 k b s ,3 2 k b s ,2 4 k b s 和1 6 k b s 四种比特 率。其中,4 0 k b s 信道主要用于在数字电路倍增设备( d c m e ) 上传送数据调制 解调器信号,特别用于4 8 k b s 以上速率的调制解调器;2 4 k b s 和1 6 k b s 信道主 要用作d e m e 语音传送的过载信道。g 7 2 6 设计的主要用途仍然是传统的电路交 换网,但是其低比特率方案也可用于v o i p 。 1 2 北京邮电大学硕士学位论文 2 4 2 采用c e l p 模型编码的编码器 由于波形编码速率过高,占用较多的带宽资源,1 9 8 5 年提出了码激励线性预 测( c e l p ) 。它在保留参数模型技术精华的基础上,应用波形编码准则优化激励 信号,使其与输入语音波形匹配,同时还利用了矢量量化和感知加权技术,从而 在较低的数码率上获得了较高的合成语音质量。基于c e l p 的语音编解码算法已 经成为目前主流语音编码算法。较成功的语音编码方案都是基于c e l p 技术的, 如g 7 2 3 、g 7 2 8 、g 7 2 9 等【5 1 。 2 4 2 1 g 7 2 3 协议 g 7 2 3 协议是一个双速率语音编码协议,其两种速率分别是5 3 k b s 和6 3 k b s , 较高比特率的输出基于m l m l q 技术,提供某种程度上较高质量的音质;较低 速率的输出基于c e l p 为系统设计人员提供了更大的灵活性。g 7 2 3 1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论