(计算机软件与理论专业论文)音频通信系统关键技术的研究与实现.pdf_第1页
(计算机软件与理论专业论文)音频通信系统关键技术的研究与实现.pdf_第2页
(计算机软件与理论专业论文)音频通信系统关键技术的研究与实现.pdf_第3页
(计算机软件与理论专业论文)音频通信系统关键技术的研究与实现.pdf_第4页
(计算机软件与理论专业论文)音频通信系统关键技术的研究与实现.pdf_第5页
已阅读5页,还剩53页未读 继续免费阅读

(计算机软件与理论专业论文)音频通信系统关键技术的研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 计算机、网络以及多媒体技术的发展带动了越来越多的多媒体通信应用的快 速发展,如视频会议、远程教学和视频点播等。音频通信是多媒体通信中的一项 关键目标,在音频业务中占有重要地位。本文的研究工作基于“n e t t a l k 视频会 议系统”的研制,论文就多种编码技术和自适应技术进行了研究、分析和探讨。 影响音频通信的因素主要有编码质量和网络传输。 在音频通信系统中,用于传输的数据主要有电话质量的标准语音信号和高保 真立体声的流媒体音频信号。目前,传输语音信号提供聊天功能的音频通信系统, 多采用单一的编码技术;传输高保真立体声流媒体信号提供在线点播功能的音频 通信系统,多采用流媒体文件传输或先传输媒体流、后根据其格式自适应解码、 回放的方式。 由于不同编码方式的复杂度、传输和适用条件不同,为了得到更好的网络服 务和音频质量,本文在对多种音频编码技术进行详细比较的基础上,提出了音频 编码自适应策略。其中包括基于需求的自适应策略、基于标准语音的自适应策略 和基于高保真音频流的自适应策略。基于需求的自适应策略是指根据用户需求选 择语音编码或高保真流媒体编码的自适应策略:基于标准语音的自适应策略是指 根据网络状况调整语音编码方式的自适应策略;基于高保真音频流的自适应策略 是指将流媒体数据进行音频分离、格式归一、最优压缩以提高其统一性、可靠性 和兼容性的自适应策略。 由于因特网是为了传输数据而设计的,并不适合传输连续的媒体数据流,不 可避免地会出现网络拥塞,引起抖动和分组丢包。对此问题,本文采用了一些可 行的拥塞控制方法和自适应技术。 结合现有的自适应传输控制方案,论文设计实现了一个基于多种编码技术的 自适应音频通信系统的原型系统。 在设计与实现中由于采用了当前先进的混音技术和自适应回放技术,使系统 获得了良好的服务质量。 关键词音频技术;编码技术;自适应技术 a b s t r a c t a b s t r a c t w i t ht h ed e v e l o p m e n to fc o m p u t e r , n e t w o r ka n dm u l t i m e d i at e c h n o l o g i e s ,t h e y h a v ed r i v e nar a p i dd e v e l o p m e n to fm o r ea n dm o r em u l t i m e d i ac o m m u n i c a t i o n s a p p l i c a t i o n s ,s u c ha sv i d e oc o n f e r e n c i n g ,d i s t a n c el e a r n i n ga n dv i d e o o n d e m a n de t c a u d i oc o m m u n i c a t i o ni sak e ys u b j e c to fm u l t i m e d i ac o m m u n i c a t i o n s a n di t p l a y s a ni m p o r t a n tr o l ei na u d i ob u s i n e s s 。t h er e s e a r c hc o m e sf r o mn e t t a l kv i d e o c o n f e r e n c es y s t e m 。i tg i v e sad e e pr e s e a r c h ,a n a l y s i sa n dd i s c u s s i o no nav a r i e t yo f c o m p r e s s i o nt e c h n o l o g i e sa n da d a p t i v et e c h n o l o g i e s t h ef a c t o r so fa f f e c t i n ga u d i oc o m m u n i c a t i o n sa r em a i n l yc o m p r e s s i o nc o d i n g q u a l i t ya n dn e t w o r kt r a n s m i s s i o n 。 i na u d i oc o m m u n i c a t i o ns y s t e m ,m o s td a t aa r es t a n d a r dv o i c es i g n a lw i t h t e l e p h o n eq u a l i t yo rs t r e a m i n gm e d i aa u d i os i g n a lw i t hh i g h f i d e l i t ys t e r e oq u a l i t y a t p r e s e n t ,t h ea u d i oc o m m u n i c a t i o ns y s t e mt h a tp r o v i d e sc h a tf u n c t i o nb yt r a n s m i t t i n g v o i c e s i g n a l o f t e nu s e s s i n g l ec o m p r e s s i o nt e c h n o l o g y 。a n d t h ea u d i o c o m m u n i c a t i o n ss y s t e mt h a tt h a tp r o v i d e so n l i n ep l a y i n gf u n c t i o no f s t r e a m i n gm e d i a b yt r a n s m i t t i n gh i g h f i d e l i t ys t e r e oa u d i os i g n a l ,o f t e nu s e st h ew a yo ft r a n s f e r r i n g s t r e a m i n gm e d i af i l eo rt h ew a yo fs t r e a m i n gm e d i ad a t at r a n s f e r ,a d a p t i v ed e c o d i n g a n dp l a y b a c ka c c o r d i n gt oi t sf o r m a t d i f f e r e n t c o m p r e s s i o nt e c h n o l o g yh a sd i f f e r e n tc o m p l e x i t y ,t r a n s m i s s i o n c o n d i t i o na n da p p l i c a t i o nc o n d i t i o n 。i no r d e rt og e tb e t t e rn e t w o r ks e r v i c ea n da u d i o q u a l i t y ,t h ed i s s e r t a t i o ne x p r e s s e sak i n do fa u d i oc o m p r e s s i o na d a p t i v es t r a t e g yb a s e d o nad e t a i l e dc o m p a r i s o no fav a r i e t yo fa u d i oc o m p r e s s i o nt e c h n o l o g i e s t h es t r a t e g y i n c l u d e st h ea d a p t i v es t r a t e g yb a s e do nd e m a n d ,t h ea d a p t i v es t r a t e g yb a s e do n s t a n d a r dv o i c ea n dt h ea d a p t i v es t r a t e g yb a s e do nh i g h f i d e l i t ya u d i os t r e a m 。t h e a d a p t i v es t r a t e g yb a s e do nd e m a n di sak i n do fa d a p t i v es t r a t e g yt h a tc h o o s e sv o i c e c o m p r e s s i o nt e c h n o l o g y o r h i g h f i d e l i t y a u d i os t r e a mc o m p r e s s i o n t e c h n o l o g y a c c o r d i n gt ou s e rd e m a n d t h ea d a p t i v es t r a t e g yb a s e do ns t a n d a r dv o i c ei sak i n do f a d a p t i v es t r a t e g yt h a ta d j u s t sc o m p r e s s i o nt e c h n o l o g ya c c o r d i n gt on e t w o r kc o n d i t i o n t h ea d a p t i v e s t r a t e g yb a s e do nh i g h f i d e l i t ya u d i os t r e a mi sak i n do fa d a p t i v e s t r a t e g yt h a tm a k e sap r o c e s so fa u d i os e p a r a t i o n ,n o r m a l i z e df o r m a ta n do p t i m a l c o m p r e s s i o no ns t r e a mm e d i ad a t as oa st oi m p r o v ei t so n e n e s s ,r e l i a b i l i t y , c o m p a t i b i l i t y 。 i n t e r a c ti sd e s i g n e dt ot r a n s m i td a t a , n o ti ss u i t a b l ef o rc o n t i n u o u st r a n s m i s s i o n i i i 北京_ 业大学工学硕士学位论文 o fs t r e a m i n gm e d i ad a t a i n e v i t a b l y ,i tc o u l dc o m ef b n l ln e t w o r kc o n g e s t i o ns oa st o b r i n gl o s ep a c k e ta n da u d i oj i t t e r t or e s o l v et h i si s s u e ,t h ed i s s e r t a t i o na d o p t ss o m e f e a s i b l ec o n g e s t i o nc o n t r o lm e t h o d s a n da d a p t i v et e c h n o l o g y c o m b i n i n gw i t he x i s t i n ga d a p t i v et r a n s m i s s i o nc o n t r o lm e t h o d s ,t h ed i s s e r t a t i o n d e s i g n sa n da c h i e v e sap r o t o t y p es y s t e mo fa d a p t i v ea u d i oc o m m u n i c a t i o ns y s t e m b a s e do n av a r i e t yo fa u d i oc o m p r e s s i o nt e c h n o l o g i e s i ns y s t e md e s i g na n di m p l e m e n t a t i o n ,t h ed i s s e r t a t i o nu s e st h ec u r r e n ta d v a n c e d m i x a u d i ot e c h n o l o g ya n da d a p t i v ep l a y b a c kt e c h n o l o g yt o o t h e ym a k es y s t e mg e t b e t t e rs e r v i c eq u a l i t y k e y w o r d s a u d i o7 f e c h n o l o g y ;c o m p r e s s i o nt e c h n o l o g y ;a d a p t i v et e c h n o l o g y i v 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 己在论文中作了明确的说明并表示了谢意。 签名: 华 日期:西幺阜 关于论文使用授权的说明 本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权 保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部 分内容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 签名: 导师签名:燃日期:丝巫l 牛 第1 章绪论 1 1 多媒体通信技术概述 第1 章绪论 多媒体通信是多媒体终端与多媒体宽带通信网的有机结合,是集多种媒体信 息( 诸如数据、文本、语音、图形、图像、音响和影像等) 于一体,实现传输、显 示、存储和重现等功能的综合通信【i l 。因此,多媒体通信系统的特点可以用计算 机的交互性,通信的分布性和画面的真实性来描述。国际电联( i t u ) 在t i f o 建议 中对多媒体通信的特点归纳为以下三点: l 、信息的集成性和综合性 这里是指各种表示媒体信息( 诸如数据、文本、语音、图形、图像、音响和 影像等) 以一定的数据格式或一定的帧结构方式集成后传输,并且对于传输信道 来说是透明的。 2 、多种信息媒体控制的交互性 其表现为在呼叫过程中可按需要增加或减少选用的信息类型;可以灵活地将 用户的多媒体信息分量的多个码流对应到单个码流,也可以将单个媒体的信息码 流对应到多个码流:还可以根据不同媒体信息分量所需要的不同带宽提供动态分 配带宽的能力。 3 、各种信息媒体运行的同步性 如在活动图像传输中媒体的同步性表现为唇音的实时同步;在编码媒体上表 现为帧结构同步或具有定时定位功能的编码同步。 多媒体通信从概念形成到开发研制虽然只有十多年的时间,目前已有相当多 的多媒体通信系统进入商业应用,而且还有一些新兴的通信系统正处在研究和试 验阶段。以日本为例,研究多媒体通信可分为三个阶段: 第一阶段( 1 9 9 1 1 9 9 3 ) ,利用已有的通信网络进行窄带i s d n 业务试验: 第二阶段( 1 9 9 3 1 9 9 5 ) ,采用光纤通信和a t m 技术进行宽带i s d nx l k 务试验; 第三阶段( 1 9 9 5 一现在) ,采用个人通信技术和卫星通信网进行无线多媒体通 信试验。 其应用领域首先是大学联网、远程教育和远程医疗,并在1 9 9 6 年开始提供 视频点播业务。德国从1 9 9 5 年开始实施多媒体计划,以c a t v 用户为对象,提 供视频点播、远程教学等业务。其它如澳大利亚、马来西亚、新加坡、韩国、香 港地区等都有不同规模的多媒体通信业务试验和应用。我国起步较晚,从1 9 9 4 年开始引入多媒体通信概念,立即引起学术界和企业界的重视,曾连续多次召开 研讨会制定我国发展多媒体技术的战略方针和规划目标。目前已经进入实用化的 北京 业大学工学硕二f j 学位论文 多媒体通信系统大致可分为三类:多媒体会议系统、远程信息服务系统和多媒体 数据库系统。多媒体会议系统包括可视电话、会议电视、桌面声像会议、个人会 晤系统等;远程信息服务系统包括远程教育、远程医疗、声像信息服务、多媒体 邮件、多媒体检索、多媒体写作和编辑出版系统等;多媒体数据库系统包括多媒 体图书馆、博物馆、展览、多媒体商业广告购物、多媒体查询和检索系统等。 1 2 网络技术概述 多媒体通信系统是建立在网络技术基础之上的,所以要实现一个好的多媒体 通信系统,对底层网络平台的相关技术的研究是必不可少的。网络带宽的分配技 术足随着计算机网络的产生而产生的,从2 0 世纪8 0 年代开始,网络负载的急剧 增加推动了带宽技术的迅速发展。到目前为止,计算机网络上传输的负载不再只 是简单的,非实时的单一数据流,它包括了各种各样复杂的,数掘量大的,实时 的多媒体数据流。因此,怎样分配有限的网络带宽给多样复杂的网络负载,以达 到最优的服务质量q o s 和最大的网络带宽利用率成为网络带宽分配技术不可多 得的发展契机。近二、三卜年以来,对于网络带宽分配技术的研究主要分为两个 部分:网络状况的评估和网络带宽分配方案,前者是后者的基础和出发点,只有 对网络状况的分析得出了j 下确的网络状况7 j 能得出合理的网络带宽分配方案:同 时,由于网络状况的复杂性和不可预测性,对网络状况的分析得出网络状况的正 确估计成为了网络带宽分配技术中的热点问题。基于这一热点,出现了拥塞控制、 差错控制、r t p r t c p 协议等一系列的研究成果。 1 3 音频编码技术概述 音频信号是多媒体信息的重要组成部分,它可以分成电话质量的语音信号、 调频广播质量的音频信号和高保真立体声信号。语音信号的频率范围足 3 0 0 h z 3 4 k h z 。随着带宽的增加,信号的自然度将逐步得到改善,高保真度音 频信号的频率范围是2 0 h z 2 0 l 出z 1 1 1 。 音频编解码技术是随着音频信号数字化而产生的,目前主要应用在数字音频 通信和数字音频存储两个领域。由于简单地由连续音频信号抽样量化得到的数字 音频信号,在传输和存储时要占用较多的信道资源和存储空间,因此,如何在尽 量减少失真的情况下,高效率地对模拟语音信号进行数字表达,即压缩编码,就 成为音频编码技术的主要内容。 音频信号的压缩方法有很多种,如图1 1 所示。 、 无损压缩方法包括不引入任何数据失真的各种熵编码;有损压缩又可分为波 形编码、参数编码和同时利用这两种技术的混和编码方法。 2 第l 章绪论 波形编码是将时间域信号直接变换为数字代码,力图使重建语音波形保持原 语音信号的波形形状。这种压缩编码具有适应能力强、声音质量好、编码算法简 单等优点,但其编码速率较高,比如p c m 编码,速率为6 4 k b s 。a d p c m 编码算法( g 7 2 1 ) ,在l 路6 4 k b s p c m 话路中传输2 路话音信号,即将输入的p c m 数字话音信号经过差分后对差值进行4 b i t 编码,因此编码速率降为3 2 k b s ,其语 音质量也可达到与p c m 相当的语音质量。但是3 2 k b s 的a d p c m 如果在1 6 k b s 数编码速率以下继续进行波形编码,其话音质量将迅速下降。因此,如果要在更 低的速率下进行语音压缩编码,必然要寻求新的编码算法。此时提出了参数编码。 音频压缩方法 无损压缩 有损压缩 h u f f m 锄编码 行程编码 i 全频带编码( p c m 、 d p a c m 、a c p c m ) i 波形编码卜_ 一予带编码( 自适应变 l 换编码、心理学模 i犁) il - 矢量量化 参数编码线形预测l p c 矢量和激励线形预测 厂v s e l p 混合编码l 一多脉冲线形预测 l l 一码_ = 牟:激励线形预测 图卜1 音频信号压缩方法 f i g u r e 卜1a u d i o s i g n a lc o m p r e s s i n gt e c h n i q u e 参数编码又称为声源编码,是把音频信号表示成某种模型的输出,利用特征 提取的方法抽取必要的模型参数和激励信号的信息,并对这些信息编码,最后在 输出端合成原始信号。线性预测编码( l p c ) 及其各种改进型都属于参数编码。这 种编码方式的编码速率可达到2 - - , 4 8 k b s ,甚至更低。所付出的代价是计算量大 以及语音质量的下降:语音的清晰度尚可,但自然度不好,且对背景噪声相当敏 感。但它的保密性能非常好,因此这种编码在军事上获得了广泛应用。 随着一些复杂的算法得以硬件实现,突破了波形编码与参数编码的界线,提 出了混合编码。混合编码将波形编码和参数编码两者结合起来,很好地解决了两 者的缺点,尽量保留了两者的优点。混合编码可将编码速率压缩到4 - - 8 k b s ,在 3 北京工q 址大学工学硕j :学位论文 8 - - 1 6 k b s 范围内能达到良好的语音质量。得到广泛研究的混和编码算法是基于 线性预测技术的分析合成编码方法,简称l p a s 。最早实用的l p a s 方案的是由 a t a l 和r e m e d e 提出的多脉冲线性预测编码( m p l p c ) ,另外较典型的方案还有规 则脉冲激励线性预测编码( r p e l p c ) 。但最重要的一种l p a s 算法是由a t a l 和 s c h r o e d e r 提出的码激励线性预测编码( c e l p ) ,也称随机编码、矢量激励编码 c v x c ) 或随机激励线性预测编码( s e l p ) 。现在一般把以l p a s 为基础的采用v q 技术对激励信号进行量化编码的算法统称为c e l p ,它不再单指一项特定的编码 技术,而是一类重要的编码技术。它在4 1 6 k b s 可以得到比其它算法更高的重 建语音质量,而且以c e l p 为基础的多种算法已成为国际标准,其中包括c t 7 2 8 建议的l d c e l p 和g - 7 2 9 建议的c s a c e i p 算法。 1 4 国内外研究现状 音频通信作为多媒体服务的主要业务,已经成为人们研究的热点问题。随着 多媒体技术的不断发展,音频通信被广泛应用于视频会议、音频广播、网络游戏、 在线点播等领域中。 影响音频通信的因素主要有网络传输和编码质量等。由于因特网足为了传输 数据胁设计的,并不适合传输连续的媒体数拟t 流,不可避免地会出现网络拥塞, 引起延时抖动和分组丢包。对此问题,目前已有很多可行的拥塞控制方法和自适 应技术。 在音频通信系统中,用于传输的数据主要有电话质量的标准语音信号和高保 真立体声的流媒体音频信号。目前,传输语音信号提供聊天功能的音频通信系统, 多采用单一的编码技术;传输高保真立体声流媒体信号提供在线点播功能的音频 通信系统,多采用流媒体文件传输或先传输流媒体、后根据其格式自适应解码、 回放的方式。 由于不同编码方式的复杂度、传输和适用条件不同。为了更好地提高网络服 务和音频质量,从研究上讲,现有的音频通信系统需要在以下几个方面给予关注: 1 、提高系统通信质量,解决实时音频数据在互联网上的传输、抖动、丢 包等问题。 2 、提高系统自适应性,使得系统在不同需求、语速、带宽的语音信号和 不同信噪比条件下具有良好的效果。 3 、提高系统的混音质量,保证多人同时语音通话时的清晰度。 4 、提高系统的灵活性,包括研究解决与其它相关技术( 如视频等) 的集 成问题。 从开发上讲,特别是从桌面型应用方面来看,需要在以下几个方面继续努 力: 4 第1 章绪论 1 、进一步规范和建设音频输入的硬件通道、软件基本引擎和平台,使得把 音频技术集成到需要音频功能的大量软件中去。 2 、需要更加开放的环境,使得有这个兴趣和实力的企业都能加入这方面 的研究和开发中,创造出多姿多彩的应用来。 3 、在软件界面上不断创新,在现有技术基础上使得产生动人心魄的效果, 逐步改变人们用鼠标、键盘的习惯,当然这需要一个漫长的过程。 1 5 课题来源、研究内容及意义 本课题来源于“n e t t a l k 视频会议系统的研制。针对不同的用户需求要求 有不同的编码质量,不同的编码质量引起的网络和回放质量不同的特点,本文的 研究内容为:在对多种编解码技术进行详细比较的基础上,结合已有的网络自适 应控制策略,制定一个广域网中基于多种编解码技术的自适应音频通信系统传输 方案。 对本课题及其关键技术的深入研究具有多方面的意义: l 、对系统自适应传输方案的深入研究,能够促进音频系统的自适应度,提 高用户可用性。 2 、对网络中的音频实时传输技术进行研究,分析比较视频实时技术,能够 提高多媒体技术融合,增强网络服务的功能。 3 、对音频传输技术进行研究,能够了解和拓展同类协作软件的开发和创新。 1 6 论文结构 第1 章本章从多媒体通信技术、网络技术及音频编解码技术的发展历程m 发,阐述了当前音频通信系统在国内外的研究现状及存在的不足,针对项目的具 体应用指明了本文研究的内容及其意义。 第2 章详细分析了基于多种编解码技术的音频通讯系统需解决的关键问 题。研究重点集中在音频编码技术、网络传输技术。在综合分析系统的实际需求 后,提出了可行的网络传输方案。 第3 章在对多种音频编码技术进行详细比较的基础上,提出了音频编码自 适应策略。其中包括基于需求的自适应策略、基于标准语音的自适应策略和基于 高保真音频流的自适应策略。基于需求的自适应策略是指根据用户需求选择语音 编码或高保真流媒体编码的自适应策略;基于标准语音的自适应策略是指根据网 络状况调整语音编码方式的自适应策略;基于高保真音频流的自适应策略是指将 流媒体数据进行音频分离、格式归一、最优压缩以提高其统一性、可靠性和兼容 性的自适应策略。另外,文中还引入了拥塞控制自适应策略和自适应回放技术。 北京t = 业大学t 学硕士学位论文 第4 章设计实现了基于多种编解码的实时音频通信系统。并就本系统的系 统结构、功能结构以及各子模块的实现过程等进行了详细描述。 结论论文对本课题取得的主要成果进行了概括和总结。同时,也对进一 步的研究进行了展望。 6 第2 章音频通信系统的关键问题 第2 章音频通信系统的关键问题 推动音频通信应用的关键是音频编码和传输技术。一方面,实时音频的传输 有一定的q o s 需求,这些q o s 包括:最大许可延迟、抖动、吞吐量、差错率等。 而目前的i n t e r n e t 捉供的是尽力而为( b e s t - e f f o r t ) 的服务,带宽、延迟等是随 着时间变化的,不能够为音频数据的实时传输提供服务质量保证,带来网络拥塞 和带宽不足的传输问题;另一方面,网络和用户需求的异构性,要求在音频传输 中采用高效的编码技术获得更好的服务质量。因此,为了适应这些异构性,提高 传输服务质量,需要集中研究这些关键问题,以设计合适的自适应选择策略。 2 1 音频编码技术 2 1 1 电话质量的语音编码标准 在音频编码标准中,电话质量的语音编码标准的语音信号的频率范围是 3 0 0 h z , - 一3 4 k h z 。1 9 7 2 年c c i t t 确定6 4 k b s p c m 语音编码g 7 1 1 ,采样频率为 8 k h z ,量化位数为8 b i t ,使用了非线性量化技术,质量大约相当于1 2 b i t 的线性 量化。1 9 8 4 年c c i t t 公布使用3 2 k b s a d p c m 语音编码标准g 7 2 1 ,它不仅与 p c m 有相同的重建语音质量,而且具有比p c m 更优良的抗误码性能,在1 6 k b s 到6 4 k b s 的速率范围内重建语音质量平坦,很适用于可变速率的应用。19 9 2 年 c c i t t 采纳了由a t & t 公司提出的一科- 称为低迟延码激励线性预测( l d c e l p ) 语音编码方案,作为1 6 k b s 速率的国际标准,并定为g 7 2 8 。1 9 9 5 年1 1 月 i t u t s g l5 全会通过“共轭结构代数码激励线性预测的8 k b s 语音编码”( 简称 c s a c e l p ) 建议g 7 2 9 。1 9 9 6 年6 月还通过了g 7 2 9 建议作为g 7 2 9 的附件。1 9 9 6 年i t u - t 通过了g 7 2 3 1 标准,用于多媒体传输的5 3 k b s 或6 3 k b s 双速率语音 编码。此标准已经广泛应用于可视电话以及i p 电话等系统中i 引。 2 1 2 调幅广播质量的音频编码标准 调幅广播质量的音频编码标准的音频信号的频率范围是5 0 h z v 7 k h z ,又称 “7 k h z 音频信号”,当采用1 6 k h z 抽样频率和1 4 b i t 的量化位数时,信号速率为 2 2 4 k b s 。1 9 8 8 年c c i t t 制定g 7 2 2 标准,可把信号速率压缩成6 4 k b s 。 g 7 2 2 标准采用子带编码的方法,输入信号进入滤波器组分成高子带信号和 低子带信号,然后分别进行a d p c m 编码,最后进入混和器形成输出码流。这种 压缩方法能在每秒6 4 k b 的存储量下给出相当好的音乐信号,适用于需要存储大 7 北京工业大学工学硕十学位论文 量高质量音频信号的多媒体系统。 2 1 3 高保真立体声音频编码标准 高保真立体声音频编码标准的音频信号的频率范围是2 0 i t z - - 一2 0 k l l z ,在 4 4 1 k h z 抽样频率下用1 6 比特量化,信号速率为每声道7 0 5 k b s 。目前国际上比 较成熟的高保真立体声音频压缩标准为m p e g 系列音频压缩标准。 m p e g 一1 音频编码标准【2 j 有三部分,分别对应于第1 、2 、3 层,层次越高,其 性能和复杂度越高。层1 和层2 有大致相同的算法,输入音频信号的采样频率为 4 8 k h z 、4 4 1 k h z 或3 2 k h z ,经过滤波器组分成3 2 个子带。同时编码器利用人耳的 屏蔽效应,根据音频信号的性质计算各个频率分量的屏蔽门限,以控制 唾一个子 带的量化参数,达到数据压缩的目的。而层3 进一步引入了辅助子带、非均匀量 化和熵编码等技术,进一步压缩码率,在对双声道立体声编码时,在1 2 8 k b s 对 绝人多数哥乐编码可达到接近c d 的j 爵质效果,成为网络音乐和便携电予设备的 首选标准。 m p e g 4 标准的自然音频编码1 ) i 将码率范围规定为每声道2 , - - - 6 4 k b s 。在如此 宽的范围内定义了三种类型的编码工具。在最低的码率范围2 , 6 k b s 之间使用的 是参数编码,最适合于采样率为8 k h z 的语音信号;在6 2 4 k b s 的码率范围内使 片j 的是编码激励的线性预测编码,支持采样率为8 l ( h z 和1 6 k h z 的语音和音频信 号;在最高的1 6 6 4 k b s 的码率范围内使用的是时间频率编码技术,比如 m p e g 2a a c 标准,支持采样率为8 9 6 k h z 的任意音频信号。 2 1 4 编码速率与声音质量 声音质量,作为音频编码器最重要的一项指标,需要对解码器生成的音频进 行质量测量。 在编码速率和输出语音质量这二者之间,速率是一个非常定量的概念,而音 质则易受主观因素的影响,然而在对编码器进行性能评价的时候,的确需要一种 可重复的、意义明确的、可靠的方法对输出声音质量进行量化。主观质量度量是 声音质量度量的基本评价方法。主观评价是基于一组评听者对原始声音和失真声 音( 指经过编解码器回放出来的声音) 进行对比试听的基础上,根据其中预先约定 的尺度对失真声音划分质量等级,它反映了昕者对声音质量好坏程度的一种主观 印象。 主观质量度量的方法有平均意见得分m o s ( m e a no p i n i o ns c o r e ) 、诊断压韵测 试d r t ( d i a g n o s t i cr h y m et e s t ) 和判断满意度测量d 舢v i ( d i a g n o s t i ca c c e p t a b i l i t y m e a s u r e ) ,而平均意见得分最为常用,它采用五级评分标准如表2 1 。 8 第2 章齐频通信系统的关键问题 表2 1m o s 的5 级标准 t a b l e2 1m o sf i v eg r a d es t a n d a r d 得分质量级别 失真级别 5优无察觉 4良刚有察觉但不讨厌 3 中 有察觉日稍觉可厌 2差咧 察觉且可厌但可忍受 1劣不可忍受 在数字语音通信中,不同语音质量、速率与m o s 得分之间的关系如表2 2 : 表2 - 2 语音编码标准和质量评价 t a b l e2 - 2c o d i n gs t a n d a r da n dq u a li t ya s s e s s m e n to fs p e e c h 描述比特率 m o s p c m 6 4 4 4 l p c - 1 0 ( x - - 国联邦标准1 0 1 5 ) 2 42 7 g 7 2 la d p c m3 24 1 g s m ( 欧洲蜂窝通信系统) 1 33 6 c e l p ( 美国联邦标准1 0 1 6 ) 4 83 2 g 7 2 81 64 o v s e l p ( 北美蜂窝通信系统1 83 5 q c e i 。p ( :i l 美c d m a ) 1 83 4 g 7 2 9 84 2 g 7 2 3 16 3 5 3 3 9 8 半速g s m 5 63 4 m e l p ( 新的低速率美国联邦标准) 2 43 3 2 1 5 分析结果 由于低速率的语音编码技术在大大节省信道带宽的同时,还保证了话音质 量。从用户需求、信道带宽、音频质量、算法复杂度等诸多方面考虑,在语音信 号的编码标准中,比较合适采用的有g 7 2 3 1 、g 7 2 9 、g 7 2 9 a ;在高保真立体声 流媒体信号的编码标准中,比较合适采用的是m p e g l - l a y 3 ( m p 3 ) 编码技术。 2 2 网络传输技术 2 2 1 网络传输问题 音频通信系统的实时交互性对网络提出了q o s 的要求,包括基本带宽、丢 包率、及抖动等。没有这些量化的q o s 指标的保障,实时交流就会出现连接丢 9 北京了业大学f t 学硕一:学位论文 i _i i i i i i i i i i i i i i t i i _i i i i i 失、声音中断、信号明显滞后等现象。影响实时音频传输质量的因素有很多,其 中最主要的是分组丢包和延时抖动。 1 、分组丢包 分组丢包是造成实时音频传输质筮下降的重要因素,它产生的原因主要有: 路由和网关的拥塞,造成一些数据包的丢失;数据包传输过大,超时而引起的丢 包;终端设备超负荷运行,导致操作系统难于调度。实时音频传输的差错控制的 目的是通过提供丢失恢复( l o s sr e c o v e r y ) 来减少包丢失、比特误码对接收端音频 演量的影响。 在音频通信系统中,数据包传输过大会引起丢包问题。在端到端传输时,延 时并不能够保持恒定,而这种时间的变化就是抖动。如果在实时音频传输巾,这 种抖动变化非常蒯燕的话,遂话质量将急劂下降。对予抖动的容忍程度依赖于在 接收端所采用的抖动缓冲区的大小,提供的抖动缓冲区越大,那么由网络抖动造 成的影响就越小。一个实时连续的音频流,如果每帧数据在传输时的是恒定的, 那么下一个数据1 跌会在固定的时间到达;但是,当延时是变化的,帧的到达就没 有规律,那么有可能凡帧数据会连续到达( 如这几帧同在路函器摊队等候,并接 连分发出去1 ,如果处理器的处理能力羽l 缓冲区是有限的,就有可能造成分组丢 包。 2 、抖动 由抖动所引起的问题就是造成音频不能够“平滑拌回放。理论上,连续的媒 体数据应该连续圆放;但是,如果每帧数据所经历的延时是可变的,连续回放就 几乎不可能了。例如,一帧数据引入了相当长的端到端延时,当先前的一帧已经 回放完毕,这一帧还不能提供给应用程序来回放,那么就会出现音频断断续续回 敖的情况。 在音频通信系统中,抖动导致回放问题。假设没有丢包的存在,每帧数据以 产生该帧的速率到达网放队列,但是,因为延时的变化,那么到达回放队列的时 闻也是变化的,所以到达回放队列满足帧速率的平均分布。另一方面,从回放队 列取出用于回放的速率是固定的。所以回放队列的处理过程出帧速率的平均值来 决定。由排队论得知:除非到达过程是确定性的,否则这个队列是不稳定的。也 就是说,如果端到端的延时是变化的,并且如果所有帧假定都能够到达接收端, 那么这个队列的长度将会无限割的增长。如果帧都可靠地被传输,无限制的延时 抖动的存在会导致队列越来越长。那么数据会在队列中等候越长,等待回放的延 时也就会不断的增长。 总之,延时抖动会产生三个潜在的问题: f 1 ) 包鲍突然大量到达会造成包的丢失; 1 0 第2 章音频通信系统的关键问题 ( 2 ) 端到端延时较大的变化会导致回放间断; ( 3 ) 不断增长的回放队列会产生较大的回放延时。 2 2 2 传输协议介绍 音频系统发展到今天,其底层支撑网络主要是i p 网络。然而,传统的i p 网 络并没有提供q o s 保障。它最初是为简单数据通信而设计的,是开放、共享的, 它的特点就是“尽力而为”。要在这样的网络环境上提供大量的实时流通信服务, 必须要有一些附加的措施。目前已经有了一些比较成熟的解决方案。它的基本思 想是通过t c p 、u d p 、r t p p t c p ( 实时传输协议实时传输控制协议) 网络协 议为传输控制提供服务保证。 1 、t c p u d p 协议 t c p 是一种可靠的、但较为复杂的传输协议。它是面向连接的,需要通信双 方通过握手信号,建立通信链路,通信过程中将始终占用这个链路,并通过它来 传递数据,通信结束后还要将链路拆除,以便将来继续使用。它能保证数据可靠 地传输,通信双方彼此应答后才继续传输下一批数据。它支持数据重发、连续传 输和流量控制。由于数据传输需要建立连接、数据确认以及拆除连接,所以数据 传输的额外开销较大,数据传输较大,但使得应用层的实现变得简单。 在传输层的另一个协议u d p 是一种简单的传输协议,它是面向无连接的, 传输时无需先建立连接,用户直接将所要传输的数据通过u d p 端口发往另一台 主机,也不必等待对方的应答,因而u d p 传输不独占信道,而且传输小。此外, u d p 是面向记录的,即数据按一个个记录形式传输,记录之间自然分隔。然而, u d p 也有缺点,它不提供数据传输的可靠性,不能保证各个数据块按顺序接收, 不能实现双向通信,而且数据块越大,数据报越容易丢失,反而会增加传输的。 它只提供了一种复用机制,以保证进程之间的通信。所以u d p 主要适用于短报 文的实时传输【训。 总之,t c p 协议在可靠性方面优于u d p 协议,而u d p 在传输的实时性方面 比t c p 更具有优势。此外,u d p 协议支持多播,而t c p 协议不支持。 由于u d p 协议毕竟是一个不可靠的传输层协议来提供应用程序进程间的通 讯,它缺乏流量控制和足够的差错控制能力,使程序有可能出现问题,所以, u d p 协议可靠性问题,需要由应用层协议提供相应的差错控制机制给予解决。 实时传输协议r t p r t c p 就是为辅助u d p 协议进行实时数据传输而制定的【引。 2 、r t p r t c p 协议 实时传输协议r t p ( r e a l t i m et r a n s p o r tp r o t o c 0 1 ) 和实时传输控制协议 r t c p ( r e a l t i m et r a n s p o r tc o n t r o lp r o t o c 0 1 ) t 6 j 是针对i n t e r n e t 上多媒体数据流的一 北京t 、l k 人学工号:硕十学位论文 种传输协议。r t p 被定义为在一对一或一对多的传输情况下工作,其目的是提供 时问信息和实现流同步。r t p 提供具有实时特征的、端到端的数据传输业务,可 以用来传送声音和视频。r t p 协议不具备纠错、流量机制或拥塞控制,它依靠 r t c p 协议提供这些服务。r t c p 协议和r t p 协议一起提供流量控制和拥塞控制 服务。 ( 1 ) r t p 协议介绍 r t p 是一种提供端对端传输服务的实时传输坍议,用来支持在单目标和多目 标网络服务中实时传输数据。它没有规定采用何种传输层协议,可以基于u d p 、 t c p 和a t m 等其它协议上实现。 r r i 、p 协议作为一利一新型协议,遵循了应用层分帧a l f ( a p p l i c a t i o nl e v e l f r a m i n g ) 和集成层次处理i l p ( i n t e g r a t e dl a y e rp r o c e s s i n g ) 1 6 1 原则。r t p 坍议对媒 体数据要进行包的封装,每个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论