




已阅读5页,还剩74页未读, 继续免费阅读
(信号与信息处理专业论文)基于mcf5249的voip语音处理模块设计与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 v o l p ,是v o i c eo v e ri p 的简称,也就是i p 语音技术,其基本思想是通过i p 包 的传送来实现语音业务。其最大的优势是能广泛地采用i n t e m e t 和全球i p 互连的 环境,提供比传统业务更多、更好的服务。 目前,v o i p 己经在全球范围内得到了迅速的发展,并能够实现传统的p s t n 的绝大部分功能,在这基础上人们对v o l p 的语音通话质量提出了进一步的要求。 但是,由于网络存在时延抖动、带宽有限等固有特点,导致v o l p 语音质量还不尽 如人意,一度成为了制约v o l p 发展的瓶颈。为了提高语音质量,需要采取一系列 的语音处理技术,主要包括语音压缩技术、静音处理技术、回声消除技术、抖动 缓冲技术等。 本文基于“c o l d f i r e 平台的i p 电话设计”项目,目的在于设计语音处理模块, 并在目标平台m 5 2 4 9 c 3 开发板上实现。该语音处理模块由两部分组成,一方面是 对语音的处理,包括语音压缩模块、静音处理模块和回声消除模块,主要为了提 高v o l p 的语音质量;另一方面是对电话通信的控制和处理,包括双音多频模块和 呼叫进程音模块,主要为了产生和检测i p 电话通信中一些必须的电话信号。 本文首先介绍了v o i p 语音处理模块的主要技术,针对项目中需要设计实现模 块的相关算法进行了分析,找到了适合的算法。接着介绍了基于m c f 5 2 4 9c o l d f i r e 芯片的语音模块具体设计方法与实现过程。其中对语音编解码器的设计采用优化 g 7 2 9 a 代码达到设计要求,并在此基础上加入g 7 2 9 b 的静音检测模块,以进一步 降低网络传输带宽;对回声消除器的设计采用n l m s 算法,通过设计自适应f i r 滤波器和语音检测器达到回声消除目的;对双音多频设计,信号发生端采用构造 静态参数表并通过二阶正弦振荡器产生信号,信号检测端提取频率信息以检测信 号;对呼叫进程音设计,除了类似双音多频的信号发生及频率检测设计外,还需 要检测信号持续时间,作者设计了一种基于匹配状态表的方法以检测信号持续时 间。最后介绍了语音处理模块在硬件平台上的测试方法,并分析了测试结果。 作者已经在f r e e s c a l e 的m c f 5 2 4 9 芯片上实现了v o l p 语音处理模块的设计, 该模块工作正常,主要指标满足相关技术标准,达到了期望目标。 关键词:v o l p ,语音压缩,回声消除,双音多频,n 乎n t t 进程音 a b s t r a c t a b s t r a c t v o l p , w h i c hs t a n d sf o rv o i c eo v e ri n t e r n e tp r o t o c o l ,i st h ei pv o i c ea n ds p e e c h t e c h n o l o g y i t sb a s i ci d e ai st or e a l i z ev o i c ea n ds p e e c hb u s i n e s st h o u g ht r a n s m i t t i n gi p p a c k e t t h em o s to u t s t a n d i n ga d v a n t a g eo fv o l pi sc a p a b l eo fu t i l i z i n gt h ew o r l d i n t e r n e tn e t w o r k i n gt op r o v i d ei pt e l e p h o n es e r v i c e ,w h i c hp r o v i d e sm o r ea n db e t t e r v a l u e a d d e ds e r v i c e st h a nt r a d i t i o n a lt e l e p h o n eb u s i n e s s u pt on o 、 - v o l ph a sd e v e l o p e dr a p i d l ya l l o v e rt h ew o r l da n di m p l e m e n t e da m a j o r i t yp a r to ft r a d i t i o n a lp s t nf u n c t i o n s ,b a s e do nw h i c hp e o p l er a i s e da d d i t i o n a l r e q u i r e m e n to ns p e e c hq u a l i t yt h a ti sn o ts a t i s f i e di nv o l pn o w b u t ,a st h ei n h e r e n tt r a i t o fd e l a ya n dl a c ko fb a n d w i d t ho nt h ei n t e m e t ,t h es p e e c hq u a l i t yo fv o l pi sn o ta sg o o d a sd e s i r e d w h i c ho n c ep r e v e n tt h ed e v e l o p m e n to fv o i p _ t oi m p r o v et h es p e e c hq u a l i t y , i ti sn e c e s s a r yt oa d o p ts u c hs p e e c hp r o c e s s i n gt e c h n i q u e sl i k es p e e c hc o m p r e s s i o n , v o i c ea c t i v i t yd e t e c t i o n ,e c h oc a n c e l l a t i o n ,j i t t e rb u f f e ra n ds oo n b u i l tu p o nt h ep r o j e c td e s i g n i n g 珀上pt e r m i n a lb a s e do nc o l d f i r ep l a t f o r m t h i s p a p e rd e s i g n ss p e e c hp r o c e s s i n gm o d u l ea n ds u c c e s s f u l l ya p p l i e dt h i ss o l u t i o no nt a r g e t p l a t f o r m t h es p e e c hp r o c e s s i n gm o d u l ec a nb ed i v i d e di n t ot w op a r t s ,t h ef i r s tp a r t i n c l u d e ss p e e c hc o m p r e s s i o n ,v o i c ea c t i v i t yd e t e c t i o na n de c h oc a n c e l l a t i o nm o d u l e , w h i c hi m p r o v es p e e c hq u a l i t y ;t h eo t h e rp a r ti n c l u d e sd t m fa n dc p tm o d u l e ,w h i c h g e n e r a t ea n dd e t e c ts o m en e c e s s a r yt e l e p h o n ys i g n a li nt h ec o m m u n i c a t i o n t h i st h e s i si so r g a n i z e da sf o l l o w s s e c t i o nii n t r o d u c e st h em a i nt e c h n i q u e si nt h e v o l ps p e e c hm o d u l ea n da n a l y z et h er e l a t i v ea l g o r i t h m s e c t i o ni id e s c r i b e st h ed e s i g n a p p r o a c ha n di m p l e m e n t a t i o no fs p e e c hm o d u l eo nm c f 5 2 4 9c o l d f i r ec o r e t h e s p e e c hc o d e co p t i m i z e sg 7 2 9 a c o d e sa n da d d e dv o i c ea c t i v i t yd e t e c t i o no fg 7 2 9 bt o s a v e b a n d w i d t h ;t h ei m p l e m e n t a t i o n o fa c o u s t i ce c h oc a n c e l l a t i o nu s e sn l m s a l g o r i t h ma n di t c a nr e d u c ee c h ot h o u g hd e s i g n i n ga d a p t i v ef i rf i l t e ra n ds p e e c h d e t e c t o r ;t h ed t m fa n dc p tg e n e r a t es i g n a lu s i n gt w os e c o n do r d e rd i g i t a ls i n u s o i d a l o s c i l l a t o r sa n dd e t e c ts i g n a lb yp i c k i n gu pt h ef r e q u e n c yi n f o r m a t i o n b u to n l yg e tt h e f r e q u e n c yi n f o r m a t i o ni sn o te n o u g hi nc p td e t e c t o r , t h i st h e s i si n t r o d u c e sam e t h o d i i b a s i n go nm a t c h i n gs t a t et od e t e c ts i g n a ld u r a t i o no fc p ts i g n a l s l a s ts e c t i o np r o v i d e s t e s tm e t h o d sa n dr e s u l ta n a l y s i so fs p e e c hp r o c e s s i n gm o d u l ei nt a r g e tp l a t f o r m t h ea u t h o rh a sf i n i s h e dt h ei m p l e m e n t a t i o no fv o l ps p e e c hp r o c e s s i n gm o d u l eo n f r e e s c a l em c f 5 2 4 9c h i pw i t hq u a l i f i e dp a r a m e t e r sa n dt h i sm o d u l ew o r k sw e l l k e y w o r d s :v o l p , s p e e c hc o m p r e s s i o n ,e c h oc a n c e l l a t i o n ,d t m f , c p t 1 i i 图表目录 图表目录 图2 - 1v o l p 的模型结构4 图2 - 2v o i p 传输的基本过程6 图2 3v o l p 涉及的主要协议6 图2 4r t p 的层次9 图3 - 1c e l p 合成模型的原理方框图1 4 图3 - 2g 7 2 9 a 编码器框图1 5 图3 3g ;7 2 9 a 解码器框图1 6 图3 4g 7 2 9 b 静音压缩语音通信系统框图1 7 图3 5 声学回声消除器工作原理1 8 图3 - 6d t m f 频率键值对应图2 1 图3 - 7 二阶数字正弦波振荡器对结构2 3 图3 - 8g o e r t z e l 算法框图2 3 图4 - 1g 7 2 9 a 编解码器设计步骤2 5 图4 - 2v a d 判决流程图3 1 图4 - 3 声学回声消除器的设计模块图3 4 图4 4g e i g l e 双端语音判决模块流程图3 5 图4 5n l m s 系数更新模块流程图3 6 图4 - 6 语音状态控制模块流程图3 7 图5 1 d t m f 发生器主流程3 9 图5 2d t m f 信号发生子程序流程图4 2 图5 3d t m f 信号检测器设计流程图4 3 v i i i 图表目录 图5 - 4 图5 5 图5 - 6 图5 7 图5 8 图5 9 图6 1 图6 2 图6 3 图6 4 图6 5 图6 - 6 图6 7 图6 8 图6 - 9 图6 1 0 图6 1 1 图6 1 2 图6 1 3 基于状态表的持续时间检测示意图4 7 c p t 信号检测器的设计模块图4 8 c p t 信号输入就绪判决4 9 信号就绪检测模块流程图4 9 状态判决模块流程图5 0 持续时间及频率提取模块流程图5 1 m 5 2 4 9 c 3 开发板实物图5 3 实时语音测试示意图1 5 5 实时语音测试示意图2 5 5 实时语音测试环境示意图5 6 c z 7 2 9 a 编码器输入波形5 8 g 7 2 9 a 编码器输出波形5 8 回声消除器输入信号波形6 0 回声消除器输出残差信号波形6 1 回声及残差信号均方根示意图6 1 回声衰减示意图6 2 键值0 的频率信息6 3 输入幅度改变后f f t 幅度的变化6 4 拨号音频率信息6 5 表2 - 1s i p 协议的优势8 表2 - 2 语音编解码算法的性能比较1 0 表3 - 18 k b i t sc s a c e l p 算法的比特分配( 1 0 m s ) 1 4 表3 2 典型的几种c p t 信号要求2 2 i x 图表目录 表5 1 不同信号强度下正弦波的峰值表4 0 表5 2 不同频率下s i n w o 表4 1 表5 3 初始化静态参量表4 1 表5 - 4 基频的二次谐波c o s ( 2 k n ) 参数表4 4 表5 5c p t 信号的at a b 列表4 5 表5 - 6c p t 信号的s i nt a b 和t o n e st a b 列表4 6 表5 7 不同c p t 信号样点数列表4 6 表6 - 1g 7 2 9 a 测试向量功能描述5 7 表6 2g 7 2 9 a 编码器性能参数表5 9 表6 3g 7 2 9 b 静音检测模块性能参数表5 9 表6 - 4a e c 性能参数表一6 3 表6 5d t m f 性能参数表6 5 表6 - 6c p t 性能参数表6 6 x 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名: 丑叠 日期:年 月日 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:囵盎导师签名: 日期:压月毒年 第一章引言 1 1 研究背景 第一章 引言 通信技术的持续进步在很大程度上影响着我们信息交换方式的变革,这种影 响使得我们正处在一个新时代的开端。其主要特征就是互联网的迅速崛起所引发 的i p 通信技术的广泛应用,即第三次通信革命。i p 通信技术已丌始成为通信舞台 上的主角,并与语音通信、视频通信形成新的产业汇聚,使一个崭新的通信世界 日渐凸现出来【1 】av o l p 技术就是在这种情况下发展起来的。 v o i p ,是v o i c eo v e ri p 的简称,也就是i p 语音技术,其基本思想是通过l p 包 的传送来实现语音业务。在发送端对语音数据进行编码压缩,然后将数据封装在 i p 包内,通过i p 网或互联网发送到接收端,并进行解包解压缩,还原数据,实现 语音通信。v o l p 技术的出现,使语音业务在数据网上连续而高效的传输成为可能, 它提供了一种强大、经济、有效的新的通信手段。它能够促进网络资源利用,降 低语音业务成本。i p 电话与传统电话的主要区别在于使用的传输媒介和交换方式 不同。i p 电话使用的传输媒介为i n t e r n e t ,而传统电话使用的为p s t n ,i p 电话使 用分组交换技术,而传统电话使用电路交换技术。分组交换技术的使用,使得i p 电话有信息时才传送数据,无信息时不需要传送数据,使用压缩技术后,i p 电话 所需的网络带宽远低于传统电话所需的网络带宽。 到目前为止,v o l p 己经在全球范围内得到了迅速的发展,可以说是当今世界 上发展最快、普及最快的一门应用服务技术之一,也是计算机网络界关注的热点 之一。现在的v o l p 技术己经能够实现传统的p s t n 的绝大部分功能,在这基础上 人们对v o l p 的语音通话质量提出了进一步的要求,因此其语音处理技术一直是 v o i p 技术的核心组成部分之一。本论文设计的主要目的就是探讨v o l p 语音处理模 块的关键技术及其实现方法,有着较强的实际意义和工程价值。 1 2v o l p 语音处理技术的发展现状 目前v o l p 的语音质量已成为v o l p 业务进一步发展的主要障碍,也是v o l p 电 话技术需要解决的重大难题之一。语音质量不理想,主要表现在以下几个方面: 电子科技大学硕士学位论文 1 ) 语音编解码:由于带宽的限制,v o l p 和语音编码技术是分不开的。目前 的各种成熟的语音编码技术,由于其量化、压缩的原因会对语音造成一定影响。 如何在节省网络带宽的情况下取得较好的语音压缩质量,一直是国内外相关组织 研究的重点。 2 ) 时延丢包:在交互式语音对话中时延过大或抖动会造成间隔感。这主要 是由于各种结构互联而成的i n t e m e t 时刻处于不断变化之中,因而在i n t e m e t 中点 到点的每一个数据包在网络中经历的延时会由于网络的变化而不相同。数据包在 网络中传输时一旦遇到网络阻塞,就会被堵在各个网络节点,如果堵在各个网络 节点的分组数量超过节点的缓冲极限,就会有部分数据丢失,即丢包。此外,由 于实时话音业务有严格的延时限制,长时间的延迟是不能承受的。 3 ) 回声:回声现象实际上也存在于p s t n 电话网络,但是由于在i p 网络中 存在语音压缩算法延时和固有的网络时延,回声现象在p 中更加明显,是影响 语音质量的主要原因之一。 为了提高语音质量,当前的v o l p 语音处理技术领域包括以下一些主要技术【2 1 : 1 ) 语音压缩编码技术 2 ) 静噪抑制技术 3 ) 回声消除技术 4 ) 抖动缓冲技术 5 ) 语音优先技术( 资源预留协议r s v p ) 6 ) 前向纠错技术( f o r w a r de r r o rc o r r e c t i o n ,f e c ) 7 ) 对电话通信的控制和处理技术,包括双音多频及拨号进程音技术 其中语音压缩编码技术一直是v o l p 技术的核心,采取的编解码算法和压缩技 术直接影响到v o l p 业务的语音质量。在国际电信联盟( i t u ) 的不断推动下,目 前几种较成熟的语音编码算法所能够获得的语音质量,比如h 3 2 3 协议栈所推荐 的诸如g 7 2 3 、g 7 2 9 等算法,在语音效果上面能够达到4 0 左右的m o s ( m e a n o p i n i o ns c o r e ) 主观得分,基本上能够和p s t n 的效果相比。 语音的编码及压缩过程在网关中完成,这个过程需要先进行数字编码,转换 为p c m 码,然后经过专门的d s p 芯片进行数据压缩,最后再形成i p 包数据的形 式,以适合i p 网络上的传输带宽。出于语音压缩算法的性能与其复杂度密不可分, 要想取得较好的语音压缩效果则势必付出巨大的运算代价,这在以前一直是制约 语音编解码算法发展的瓶颈之一。但是由于近年来d s p 的处理能力不断提高,一 些复杂程度较高的语音编解码器可以得到良好的实时应用,大大提高了语音压缩 2 第一章引言 性能,从而提高了v o l p 的语音质量。 1 3 论文选题及结构 本课题来源于我校的横向合作项目,旨在开发出基于嵌入式操作系统e c o s 和 s i p 协议的v o l p 终端系统,硬件平台采用m 5 2 x x 系列开发板。e c o s 系统的最大特 点【3 】【4 】是可裁剪,可配置和可移植性,极有利于运用于小规模的嵌入式应用中;s i p 协议和传统的h 3 2 3 相比,其以文本形式表示的消息的词法和语法分析比较简单, 且呼叫建立时间短,目前运用广泛。 作者在课题中主要负责v o l p 语音处理模块的设计,包括语音编解码器、静音 抑制、声学回声消除器、双音多频以及拨号进程音的设计。具体论文的结构安排 如下: 第一章介绍了本课题的背景和来源,以及课题相关的国内外发展现状。 第二章对v o l p 技术原理及系统协议框架进行阐述,并在此基础上介绍了v o l p 语音处理模块的主要技术。 第三章介绍了本设计中语音处理各个模块的相关算法,并对算法进行分析, 选取了适合本设计的算法。 第四章和第五章是具体的设计实现部分。分别阐述了基于m 5 2 4 9 c 3 开发板的 语音编解码器、回声消除器、双音多频及拨号进程音信号的设计思想和实现方法。 第六章是对语音处理各个模块的测试。介绍了系统的设计及测试的软硬件平 台,提出了各模块的测试方法,并对测试结构进行了分析。 第七章对全文进行总结,并提出下一步工作的目标和建议。 电子科技大学硕士学位论文 第二章v o l p 系统概述 本章主要介绍v o i p 的工作原理以及系统协议框架,并在此基础上简要介绍了 与本设计相关的v o i p 语音处理模块主要技术。 2 1v o l p 工作原理 传统的电话网是以电路交换方式传输语音,所要求的传输宽带为6 4 k b i t s 。而 所谓的v o l p 是以i p 分组交换网络为传输平台,对模拟的语音信号进行压缩、打包 等一系列的特殊处理,使之可以采用无连接的u d p 协议进行传输。 语音代理语音代理 图2 - 】v o i p 的模型结构 为了能在个i p 网络上传输语音信号,要求几个元素和功能。最简单形式的 网络由两个或多个具有v o i p 功能的设备组成,这一设备通过一个i p 网络连接。其 模型基本结构如图2 - 1 所示。从图中可以发现v o l p 设备是如何把语音信号转换为 i p 数据流,并把这些数据流转发到i p 目的地,i p 目的地又把它们转换回到语音信 号。两者之间的网络必须支持i p 传输,而且可以是i p 路由器和网络链路的任意组 合。 因此可以简单地将v o l p 的传输过程分为下列几个阶段: 1 ) 语音一数据转换:语音信号是模拟波形,通过i p 方式来传输语音,不管是 实时还是非实时应用业务,首先要对语音信号进行模拟数据转换,也就是对模拟 4 第二章v o i p 相关标准及关键技术 语音信号进行8 位或6 位的量化,然后送入到缓冲存储区中,缓冲器的大小可以 根据延迟和编码的要求选择。许多低比特率的编码器是采取以l 帧为单位进行编码。 典型帧长为1 0 3 0 m s 。考虑传输过程中的代价,语音包通常由6 0 、1 2 0 或2 4 0 m s 的语音数据组成。源和目的地的语音编码器必须实现相同的算法,这样目的地的 语音设备可以还原模拟语音信号。 2 ) 原数据到i p 转换:一旦语音信号进行数字编码,下一步就是对语音包以 特定的帧长进行压缩编码。大部份的编码器都有特定的帧长,若一个编码器使用 1 5 m s 的帧,则把收到的6 0 m s 的包分成4 帧,并按顺序进行编码。每个帧各1 2 0 个语音样点( 抽样率为8 k h z ) 。编码后,将4 个压缩的帧合成一个压缩的语音包送 入网络处理器。网络处理器为语音添加包头、时标和其它信息后通过网络传送到 另一端点。语音网络简单地建立通信端点之间的物理连接( 一条线路) ,并在端点 之间传输编码的信号。i p 网络不像电路交换网络,它不形成连接,它要求把数据 放在可变长的数据报或分组中,然后给每个数据报附带寻址和控制信息,并通过 网络发送,一站一站地转发到目的地。 3 ) 传送:在这个通道中,全部网络被看成一个从输入端接收语音包,然后 在一定时间( t ) 内将其传送到网络输出端。t 可以在一定范围内变化,反映了网络 传输中的抖动。网络中的同间节点检查每个i p 数据附带的寻址信息,并使用这个 信息把该数据报转发到目的地路径上的下一站。网络链路可以是支持i p 数据流的 任何拓扑结构或访问方法。 4 ) i p 包一数据的转换:目的地v o l p 设备接收这个i p 数据并开始处理。通过 提供一个可变长度的缓冲器,用来调节网络产生的抖动。该缓冲器可容纳许多语 音包,用户可以选择缓冲器的大小。小的缓冲器产生延迟较小,但不能调节大的 抖动。其次,解码器将经编码的语音包解压缩后产生新的语音包,这个模块也可 以按帧进行操作,完全和解码器的长度相同。若帧长度为1 5 m s ,是6 0 m s 的语音 包被分成4 帧,然后它们被解码还原成6 0 m s 的语音数据流送入解码缓冲器。在数 据报的处理过程中,去掉寻址和控制信息,保留原始的原数据,然后把这个原数 据提供给解码器。 5 ) 数字语音转换为模拟语音:播放驱动器将缓冲器中的语音样点取出送入 声卡,通过预定的频率播出。可见,语音信号在i p 网络上的传送要经过从模拟到 数字信号的转换、数字语音封装成i p 分组、i p 分组通过网络的传送、i p 分组的解 包和数字还原到模拟信号等过程。整个过程如图2 2 所示。 5 电子科技大学硕士学位论文 2 2v o i p 系统协议框架 图2 - 2v o l p 传输的基本过程 随着互联网的高速发展,v o l p 等各种网上增值业务展现出巨大的应用前景。 在各厂商的积极推动下,各国际组织积极推进了i p 电话的标准化进程。目前涉及 v 0 i p 技术的主要协议如图2 - 3 所示。 图2 3v o i p 涉及的主要协议 根据目前制订协议的情况和各标准化组织的工作重点,各组织在i p 网络上承 载实时业务( 如语音、视频等) 的方式大体相同,均是利用了源自i e t f 的i 盯p , 但是在呼叫建立和控制方面则有着不同的方案,其代表即为h 3 2 3 和s i p 。 h 3 2 3 标准协议簇是i t u 的一个标准协议栈,该协议栈是一个有机的整体,根 据功能可以将其分为四类协议,也就是说该协议从系统的总体框架( h 3 2 3 ) 、视 频编解码( h 2 6 x ) 、音频编解码( g 7 x x ) 、系统控制( h 2 4 5 ) 、数据流的复用( h 2 2 5 ) 6 第二章v o i p 相关标准及关键技术 等各方面。 本节将主要介绍项目设计中采用的s i p 协议和r t p 协议。 2 2 1 会话发起协议s i p s i p ( s e s s i o ni n i t i a t i o np r o t o c 0 1 ) 1 5 j 是由国际互联网标准制定组织( i e t f ) 制 定的面向i n t e m e t 会议和电话的信令协议。s i p 是一个应用层的协议,可以建立, 修改或者中止多媒体会话或者呼叫。它是一令基于a s c i i 的端到端的协议,它实 际上是在因特网上提供“约会”服务。s i p 协议是i e t f 制订的会话控制协议,负 责建立和管理两个或多个用户间的会话连接,它主要用于对等模式( p e e r t o p e e r ) 的实时业务,如v o l p 、视频会议等应用,其功能类似于当前v o l p 主要采用的信令 协议h 3 2 3 。s i p 充分借鉴了h t y p 、s m t p ( 简单邮件传送协议) 这两个互联网上 最成功的应用层协议,其编码是文本方式的,继承了互联网协议简单、开放、灵 活的特点。 s i p 是一个信令协议,它的作用在于建立、修改、释放多媒体会话。当会话的 一端向会话的另一端发出建立多媒体会话的请求时,必须在s i p 的请求消息中给 出描述会话特征的信息。对于s i p 而言,可以用任何传输协议来完成多媒体会话 所指定的多媒体信息流的传输,但在通常情况下,它用r t p 作为多媒体信息流的 传输协议。s i p 也可以邀请已经在会话的参与者,如多播会议。媒体也可以加入已 经存在的会话,s i p 也可以支持映射和重定向服务。 s i p 支持五个方面来建立和终止多媒体通信: 1 ) 用户定位:确定参与通信的终端用户。 2 ) 用户通信能力的协商:确定通信的媒体类型和参数。 3 ) 用户意愿的交互:确定被叫是否愿意参与通信。 4 ) 建立呼叫:包括向被叫“振铃”,确定主叫和被叫的呼叫参数。 5 ) 呼叫处理和控制:包括呼叫重定向、呼叫转移、中止呼叫等等。 s i p 不是一个独立的通信系统,而是利用了其他的i e t f 协议来建立一个完整 的多媒体体系框架结构。如利用了r t p 协议,r t s p 协议来控制媒体传输,媒体网 关控制( m e d i ag a t e w a yc o n t r 0 1 ) 协议来控制p s t n 的网关,s d p 协议来描述多媒 体会话。然而,s i p 的基本功能和操作不依赖任何其他协议。s i p 提供些安全服 务,包括拒绝服务保护,认证,完整性保护,加密和保密服务等。 s i p 中有客户机和服务器之分。客户机是指为了向服务器发送请求而与服务器 建立连接的应用程序。s i p 的端系统称为用户代理( u s e ra g e n t ) ,简称u a 。因为 7 电子科技大学硕士学位论文 u a 既要能发出呼叫又要能接收呼叫,所以一个u a 包含一个用户代理客户端 ( u a c ) 和一个用户代理服务器( u a s ) 。u a c 负责呼叫的发出,而u a s 负责呼 叫的接收。服务器是用于向客户机发出的请求提供服务并回送应答的应用程序。 共有四类基本服务器,包括代理服务器、重定向服务器、注册服务器和定位服务 器。 s i p 协议是专门为i p 电话,尤其是结合i n t e r n e t 设计的协议,同传统的h 3 2 3 协议相比,s i p 拥有明显的优越性,优异的可扩展性,提高了系统的处理能力;与 n t e m e t 紧密结合,使通讯更加轻松便捷的;卓越的开放性,不仅能够对手机、p d a 等移动设备提供良好的支持,对于在线即时交流、语音和视频数据传输等多媒体 应用也能够很好地完成。其特性和优势如表2 - 1 所示。 表2 - 1s i p 协议的优势 特性优势 s i p 的协议栈比其它的v o i p 协议都要小。s i p 可以看作是一个简单 简洁性 的工具箱,利用它便于实现智能终端、网关、进程和客户端软件。 端到端( 点到点) 的结构,使得它比较容易扩展。当要增加新的用 可扩展性 户到基于s i p 协议的系统中时,与其它的v o l p 协议相比,需要增 加的软件和硬件要少得多。 非集中式的智能,这样可以在每个组件中实现更多功能。而要修改 某个组件时,对系统其余部分的影响很小。在以太网上,两个s p 分布式的功能 电话可以直接互相呼叫,而不需要系统任何其它服务模块的帮助。 当网络中有多于二个电话机时,系统中的其它模块就发挥作用了。 基于s i p 的系统,可以利用因特网不断增长的优势。转换网关可以 支持因特网 将基于s i p 的系统连接到公众电话网( p s t n ) 上去,而不用被历 史遗留的标准所阻碍。 2 2 2 实时传输协议r t p r t p l 6 1 在协议结构中的位置如图2 - 4 所示,它位于u d p 之上,应用层之下。应 用层产生的实时数据首先被封装成r t p 报文格式,然后再将r t p 报文封装成u d p 报文格式,通过传输层协议进行传送。实时应用采用u d p 而非t c p 作为传输层协 议的理由是显而易见的,因为t c p 等待确认应答及重新传输丢失的数据报文的机 制使得实时数据的传输时延变得很长,而且不可预测。 确定r t p 在协议结构中哪一层( 应用层或传输层) 比较困难。如果单从r t p 提供的功能看,它应该属于传输层的一部分,和u d p 一起支持传输多媒体数据所 8 第二章v o i p 相关标准及关键技术 需要的时间戳、序号等功能。但如果从应用程序开发者的角度看,它又应该属于 应用层的一部分,因为应用程序开发者必须把r t p 综合到应用程序中,成为应用 程序的一部分。发送端的应用程序必须将采样到的多媒体数据封装成r t p 报文格 式,然后才能通过s o c k e t 调用u d p a p i ,而接受端应用程序通过调用u d p a p i 接 收到的只是r t p 报文,必须从r t p 报文中分离出多媒体数据后,爿能进行播放, 如图2 4 所示用。 应用层 r t p u d p 1p 链路层 物理层 应用层 r t p i $ o c k 。tt u d p ip 链路层 物理层 r t p 在协议中的位置r t p 作为应用层的一部分 图2 4r t p 的层次 必须指出的是,r t p 只提供同步播放多媒体数据所需要的时间戳和序号,并 不实现实时传输中的延迟播放和丢失的分组补偿,这些实现由应用程序去完成。 2 3v o i p 语音处理模块的主要技术 目前v o i p 的语音质量已成为v o l p 业务进一步发展的主要障碍,也是v o i p 电 话技术需要解决的重大难题之一。语音质量不理想,主要表现在语音时延较大、 声音抖动不可辨认及回音明显等方面。为了提高语音质量,当前的v o i p 语音处理 技术领域包括以下一些主要技术f 8 】。 2 3 1 语音编码及压缩技术 v o i p 技术的核心就是语音编码及压缩技术,采取的编解码算法和压缩技术直 接影响到v o i p 业务的语音质量。语音的编码及压缩过程在网关中完成,这个过程 需要先进行数字编码,转换为p c m 码,然后经过专门的d s p 芯片进行数据压缩, 最后再形成i p 包数据的形式,以适合i p 网络上的传输带宽。 9 电子科技大学硕士学位论文 语音编码大致可以分为三类:波形、参数和混合编码。波形编码针对语音波 形,尽量保持输入波形不变,恢复的信号基本上与输入信号波形相同。参数编码 对语音信号进行分析,提取参数并编码,解码后由这些参数重新合成出重构的语 音信号。在v o l p 中常用的语音编码技术则是二者结合的混合编码技术,它融合了 波形编码和参数编码的长处,可以在非常低的比特率提供较好的语音质量。 t u t 在g 系列建议中对语音编码技术进行了标准化,已经公布了一系列语 音编码协议,采用波形编码的方式主要有g 7 1 1 、g 7 2 1 、g 7 2 2 、g 7 2 3 、g 7 2 6 、 g 7 2 7 ,采用参数及混合编码方式的主要有g 7 2 8 、g 7 2 9 、g 7 2 9 a 、g 7 2 3 1 。这些 协议采用不同的算法,具有不同的速率。较高速率的编码协议对话音质量较易保 证,但占用网络资源较大;较低速率的编码协议对话音质量较难保证,但占用网 络资源小。这些语音压缩方式的比较如表2 2 所示p j 。 表2 - 2 语音编解码算法的性能比较 速率 复杂度 协议 时延话音质编码器 ( k b p s ) m i p sr a m ( m s ) 量评分类型 g 7 1 16 4 1 10 1 2 5 4 1 g 7 1 1 g 7 2 6 ( g 7 2 1 1 6 2 4 3 21 2 5 5 0o 1 2 53 8 5 g 7 2 6 ( g 7 2 1 , g 7 2 3 )g 7 2 3 ) g 7 2 71 6 肼3 21 2 5 5 00 1 2 5g 7 2 7 g 7 2 24 8 5 6 6 41 01 k1 5g 7 2 2 g - 7 2 81 63 02 k0 6 2 53 6 1q 7 2 8 g 7 2 982 03 k1 53 9 2g 7 2 9 g 7 2 9 a81 0 5 2 k 1 5 3 7 g 7 2 9 a g 7 2 3 1 5 3 6 3 1 62 2 k3 7 53 9 3 6 5g 7 2 3 1 编码压缩方法由i t u t 统一制定并标准化,它的压缩能力由d s p 的处理能力 决定,即复杂度决定了编解码器硬件的成本和功耗,也影响到编解码器的实时性。 复杂度的衡量指标是定点d s p 实现编解码所需的处理器能力,以百万指令秒 ( m i p s ) 为单位。 在实际选择压缩算法时,要综合考虑各种因素。例如,高比特率可以保证息 好的话音品质,但要占用大量的存储空间,耗费更多的系统资源;而过低的比特 率又会影响话音的品质和增加延迟。所以,在较低比特率的前提下,保持较好的 1 0 第二章v o i p 相关标准及关键技术 话音质量,是选择压缩算法的原则。 从互通性角度考虑,i p 电话网关对其它编码协议亦应全部支持或部分支持。 特别是对于g 7 2 9 g 7 2 9 a ,由于其编码速率较低。而且其编码时延较g 7 2 3 1 小, 因此建议i p 电话网中给予支持。 2 3 2 静噪抑制技术 静音抑制,又称语音活动侦测( d ) 。静音抑制的目的是从声音信号流星识 别和消除长时间的静音期,以达到在不降低业务质量的情况下节省话路资源的作 用,它是i p 电话应用的重要组成部分。静音抑制可以节省宝贵的带宽资源,可以 有利于减少用户感觉到的端到端的时延。 在进行静音检测时有两个问题需要注意:一是背景噪声问题,即如何在较大 的背景噪声中检测静音;二是前后沿剪切问题。所谓前后沿剪切就是还原语音时, 由于从实际讲话开始到检测到语音之间有一定的判断门限和时延,有时语音波形 的开始和结束部分会作为静音被丢掉,还原的语音会出现变化,因此需要在突发 语音分组前面或后面增加一个语音分组进行平滑以解决这一问题。 在实际使用中,如果出现长时间的静默,会使用户感到很不自然。因此实际 上接收端常常会在静音期间发送一些分组,从而生成使用户感觉舒服一些的背景 噪声,即所谓的舒适噪声。 2 3 3 回声消除技术 回声是信号通过网络时的反射。本地扬声器输出的模拟语音信号可能又被话 筒接收,当信号
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业互联网平台异构数据库融合技术在2025年的边缘计算与大数据应用案例分析报告
- 城市轨道交通换乘枢纽建设社会稳定风险评估报告-2025年规划与土地规划协调
- 全面复习工程项目管理考试的备考资料及试题及答案
- 理解与应用市政学试题及答案
- 2025年开放银行生态构建中的金融科技在新能源领域的应用报告
- 2025年农村电商服务站农村电商政策法规解读报告
- 2025年冰雪运动培训基地体育赛事运营与管理建议
- 2025年城市轨道交通智慧运维系统在地铁车辆维护中的应用报告
- 年产2万台机箱机柜项目可行性研究报告(模板)
- 行政管理的有效沟通技巧及试题及答案
- 酒店用电安全知识培训
- 2024年短剧拍摄及制作协议版
- 《福建省城镇道路清扫保洁作业指导价》
- 初级社会工作实务考试历年考试真题(含答案)
- 新能源高效节能家电开发
- 学校食堂用餐信息公开制度
- GB/T 23444-2024金属及金属复合材料吊顶板
- 《人格权法》课程教学大纲
- 【语文课件】徐霞客徐霞客和《徐霞客游记》课件
- 奇异的仿生学学习通超星期末考试答案章节答案2024年
- 代理招商合作合同样本
评论
0/150
提交评论