




已阅读5页,还剩52页未读, 继续免费阅读
(信号与信息处理专业论文)应用于voip的g729语音编解码算法在dsp上的实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 c t 7 2 9 是国际电信联盟i t u - t 于1 9 9 6 年提出的基于c s a c e l p 算法( 共轭 结构代数码本激励线性预测) 传输速率为8 k b p s 的协议。该算法编码延迟1 5 m s , 具有较低的传输速率和良好的合成语音质量,能够满足多媒体通信的要求。 近年来,数字信号处理器的高速发展使得以信号处理器为平台实现高复杂 度的语音编码成为可能。1 1 公司的t m s 3 2 0 c 6 4 xd s p 采用先进的超常指令字指 令集、两级程序及数据缓存、交叉数据通路和八级流水线结构,具有强大的数据 运算能力,在相应开发工具的配合下可以高效率的开发。 本论文在介绍g 7 2 9 编解码技术的背景之后,将系统说明c s a c e l p 算法 并从原理上研究算法的关键技术,然后介绍t m s 3 2 0 c 6 4 1 6d s p 器件的功能,及 根据其具体的优点对1 1 u t 提供的源代码进行优化。用i j t 提供的g :7 2 9 语音 编码测试序列进行测试,最后在应用c c s 集成开发软件对g 7 2 9 进行实时仿真。 关键词:g 7 2 9c s - a c e l pt m s 3 2 0 c 6 4 16c o s a b s t r a c t g 7 2 9w a st h ei n t e r n a t i o n a l t e l e c o m m u n i c a t i o nu n i o nb r o u g h to u tt h e r e c o m m e n d a t i o nb a s e do nt h e c o n j u g a t e - s t r u c t u r ea l g e b r a i c - c o d e r - e x c i t e d l i n e a r - p r e d i c t i o n ( c s o a c e l p ) a l g o r i t h n li n1 9 9 6 t h i sa l g o r i t h mh a s8 k b i f f se n c o d i n g r a t ea n d15 m sa l g o r i t h m i cd e l a y o t h e r w i s ei th a sl o w e re n c o d i n gr a t ew h i l ec a l lg i v e h i 曲s y n t h e t i cs p e e c hq u a l i t y a n ds a t i s f yt h e r e q u i r e m e n t o fm u l t i m e d i a c o m m u n i c a t i o n i nr e c e n t y e a r s ,a l o n g w i t ht h ef a s td e v e l o p m e n to fd i g i t a l p r o c e s s o r , t h e i m p l e m e n t a t i o no fh i l g hc o m p l e xs p e e c hc o d e cc o m e st r u e t m s 3 2 0 c 6 4 xd s p p r o d u c e db yt ii sp r o v i d e dw i t hv l i w i n s t r u c t i o n ,t w ol e v e ld a t ec a c h e ,c r o s st h r o u g h r o a d , e i g h tl e v e lp i p el i n ea n dh a sh i g hc a l c u l a t ec a p a b i l i t y , w h i c hc a l lm a k eae f f i c i e n t d e v e l p o m e n tb a s e do ns u i t a b l ed e v e l p o m e n tt o o l s t h i sp a p e ri n t r o d u c et h eb a c k g r o u n do f 2 7 2 9s p e e c hc o d e ct e c h n o l o g y ,t h e n e x p l a i nt h ec s a c e l pa l g o r i t h ms y s t e m a t i c a l l ya n ds t u d yt h ek e yt e c h n o l o g yo ft h e a l g o r i t h mf r o mt h ep r i n c i p l e ,t h e ni n t r o d u c et h ef u n c t i o no ft m s 3 2 0 c 6 4 1 6d s p d e v i c e a n do p t i m i z et h eo r i g i n a lc o d eo fi t u - ta c c o r d i n gt oi t sc o n c r e t em e r i t u s e c c si n t e g r a t e dd e v e l o p i n gs o f t w a r et os i m u l a t eg 7 2 9o nr e a lt i m e k e yw o r d s :g 7 2 9c s - c e l p t m s 3 2 0 c 6 4 16c o s 长春理工大学硕士学位论文原创性声明 本人郑重声明:所呈交的硕士学位论文,应用于v o i p 的g 7 2 9 语音编 解码算法在d s p 上的实现是本人在指导教师的指导下,独立进行研究工作所 取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体 已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均己 在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。 作者签名:刁物理星年互月_ = 匠日 长春理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解“长春理工大学硕士、博士学位论文版 权使用规定”,同意长春理工大学保留并向国家有关部门或机构送交学位论文的 复印件和电子版,允许论文被查阅和借阅。本人授权长春理工大学可以将本学位 论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫描等 复制手段保存和汇编学位论文。 作者签名: 碰罕 丝星年扣笸日 指导导师签名:盔塾羔缓1 塑星年l 月2 鱼日 1 1 引言 第一章绪论 v o i p 是通过i n t e r n e t 进行语音通信最主要的技术。传统的电话网是以电路交换方 式传输语音,而v o i p 是以m 分组交换网络为传输平台,对模拟的语音信号进行压缩、 打包等一系列的特殊处理,使之可以采用无连接的u d p 协议进行传输,用v o i p 技术 进行语音传输的数据较大,并且有实时性的要求,目前,i n t e m e t 不能满足实时语音通 信的要求,解决这一问题主要的途径是采用高效的压缩编码。i t u tg 7 2 9 可以将经过 采样的6 4 k b p s 话音几乎不失真的压缩至8 k b p s ,并且能够保证很高的语音质量。 i t u t g 7 2 9 语音编码压缩标准以线性预测和矢量量化算法为基础,根据该标准的 算法得到的语音编码能在降低语音误码率的同时获得较好的语音质量。g ;7 2 9 是对电话 宽带的语音信号编码的标准,也是目前应用广泛的v o i p 语音数字信号处理标准。 1 2v 0 l p 1 2 1v 0 1 p 的发展现状与前景1 2 3 随着网络技术的不断发展,i p ( i n t e r n e tp r o t o c 0 1 ) 已经无处不在,而且正朝着更高 的阶段发展。现在p 正在改变我们的生活方式,使我们的生活更加的丰富多彩,使人 们的活动变得更加灵活。i p 技术的发展使v o i p ( v o i c eo v e ri p ) 即i p 语音技术脱颖而 出。近几年得到了广泛的应用,并越来越受到人们的青睐。i p 电话是一种数字电话, 是技术创新的一种通信服务业务。它把语音进行压缩编码、打包分组、分配路由、解 包解压等交换处理,并且在d 网络或者互联网上实现语音通信。 v o i p 是一种以i p 电话为主并推出相应的增值业务的技术。它是建立在i p 技术上 的分组化、数字化的传输技术。最大的优势是能广泛的采用i n t e m e t 和全球i p 互连环 境。提供比传统业务更多、更好的服务。可以在i p 网络上传送语音、传真、视频、数 据等业务。如虚拟电话、虚拟语音、传真邮箱、查号业务、i n t e r n e t 呼叫中心、i n t e r n e t 呼叫管理、电话会议、电子商务、传真存储转发和各种信息的存储转发等。 v o i p 技术最初只是一种互联网上的增值应用,形式比较简单。但是随着互联网的 普及,其在商业运营中的应用价值被人们发现,很多新兴的电信产业运营商将v o i p 技术引入到电信运营中来,并在近几年内取得的迅猛的增长。目前国内已有的v o i p 技术虽然实现方式各有不同,但是都采用统一的t c p i p 协议作为传输层协议,并且依 据的通信协议也是一致的。现在国内可以支持v o i p 业务开展的主要实现形式有三种: 基于h 3 2 3 协议的i p 电话网络、基于会话启动协议( s i p 协议) 的i p 电话网络、基于 软交换的网络。 随着v o i p 技术的不断发展,特别是承载业务的不断增加,这也给v o i p 带来了一 些问题。如合理利用带宽的问题,网络、流媒体安全问题、设备标准化问题等。但是 同样令人欣喜的是科学技术已经使v o i p 有了坚实的技术基础和广阔的发展空间。数 字信号处理器的不断发展,使信源的处理和路由的控制变得相对容易些。高集成度专 用集成电路的发展,将会不断满足对服务质量和多媒体承载业务要求。n g n 软交换将 带来更低的商业成本,带来更好的服务质量和人们不断追求的更高的灵活性。v o i p 技 术正向着更加完善、灵活、敏捷的方向发展。 i 2 2 v o i p 的相关技术 ( 1 ) 信令技术,包括i t u th 3 2 3 和i e t f 会话初始化协议s i p ( s e s s i o ni n i t i a t i o np r o t o c 0 1 ) 两套标准体系,还涉及到进行实时同步连续媒体流传输控制的实时流协议t r s p 。 ( 2 ) 媒体编码技术,包括流行的g 7 2 3 1 、g 7 2 9 、g 7 2 9 a 话音压缩编码算法和m p e g i i 多媒体压缩技术。 ( 3 ) 媒体实时传输技术,主要采用实时传输协议r t p 。 ( 4 ) 业务质量保障技术,采用资源预留协议r s v p 和用于业务质量监控的实时传输控 制协议r t c p 来避免网络拥塞,保障通话质量。 ( 5 ) 网络传输技术,主要是t c p 和u d p 。 此外还有分组重建技术和时延抖动平滑技术、动态路由平衡传输技术、网关互联技 术、网络管理技术以及安全认证和计费技术等等。 1 2 3 推动v o i p 发展的动力 由于相关的硬件、软件、协议和标准中许多发展和技术突破,使得v o i p 的广泛 使用很快就能变成现实。这些领域中的技术进步和发展为创建一个更有效、功能和互 操作性更强的v o i p 网络起着推波助澜的作用。推动v o i p 飞速发展乃至广泛应用的技 术因素可以归纳如下几个方面: ( 1 ) 数字信号处理器。先进的数字信号处理器执行语音和数据集成所要求的计 算密集的任务。d s p 处理数字信号主要用于执行复杂的计算,否则这些计算可能必须 由通用c p u 执行。它们的专门化处理能力与低成本的结合使d s p 更好的适应执行v o i p 系统中的信号处理功能。 ( 2 ) 高级专用集成电路。 ( 3 ) i p 传输技术。 ( 4 ) 宽带接入技术。 ( 5 ) 中央处理单元技术。中央处理单元在功能、功率和速度方面继续发展。这样 使多媒体p c 能够广泛应用并提高了受c p u 功率限制的系统功能的性能。推动v o i p 进展的主要技术如下表所示: 表i - i 推动v o i p 的主要技术 协议和标准软件硬件 h 3 2 3 加权公平排队法 d s p m p l s 标记交换 加权随机早期检测高级a s i c r t p , r t c p双漏斗通用信元速 d w d m 率算法 r s v p 额定访问速成率 s o n e t d i f f s e r v , c a r c i s c o 快速转发c p u 处理功率 ( 2 7 2 9 ,扩展访问表a d s l ,r a d s l , g 7 2 9 a :c s a c e l p s d s l f r f 1 l f i t f 1 2 令牌桶算法 m u l t i l i n kp p p 帧中继数据整流形 s i p 基于优先级的c o s p a c k e to v e rs o n e t i p 和a t m q o s c o s 的集成 1 3 语音编解码技术研究 从上边的叙述中,我们可以看出,语音编码是v o i p 的关键技术之一。v o i p 的初衷就是要利用i p 资源为人q g , j 造一个低投入、高质量的语音沟通环境。所以 语音的处理、传输、接收就成为了v o i p 的核心。信道有限的带宽和传输特性的 不理想是获得好的语音质量的瓶颈之一,而好的编码方式将会使声音在信道中传 输时的损失降低到最小。 语音编码在电路交换方式的电话中就已有应用,在分组交换中它的地位就更 加突出。因为i p 电话是数字化的电话,传输的是数字信号,而且是打成一个个坤 数据包的数字信号,所以传统的p c m 编码方式从根本上已经不完全适合i p 电话。 在这种情况下,适合v o i p 的语音编码方式应运而生。 ( 3 7 2 9 语音编码算法叫做对结构代数码激励线性预测语音压缩编码,它的核 心原理是线性预测和矢量量化。这种编码标准已经在1 9 9 5 年1 1 月i t u - ts g l 5 全会上通过,并且在1 9 9 6 年6 月的i t u ts g l 5 末次会议上通过了( 3 7 2 9 的附件 a “减少复杂度的8 k b i t sc s a c e l p 语音编码器”正式成为国际电信标准。g 7 2 9 是为低时延应用设计的,它的帧长只有1 0 m s ,处理时延也是1 0 m s ,再加上5 m s 的前视,就是使得其产生点到点的时延为2 5 m s ,比特率为8 k b p s 。并且它提供了对 帧丢失和分组丢失的隐藏处理机制,因此在因特网上传输语音时,( 3 7 2 9 编码方 式是很好的选择。下表给出了8 k b p s 语音编码的主要技术指标。 4 表l 一2 语音编码的主要技术指标 参数 要求目标 无误码时的语音质量 不低于3 2 k b p s 的g 7 2 6 同样条件下的语音质 量 对相对于过载点的 2 6 d b 标称电平的输入 信号,比特误码对误音 性能的影响 b e r 1 0 。随机误码 不差于3 2 k b p sg :7 2 6 在 等价于g 7 2 6 类似条件下的性能 可检测的帧丢失 随机( 3 帧丢失) 相对于3 2 k b p sg 7 2 6 无 尽可能低 误码,不高于o 5 m o s 分的降低 突发( 3 帧丢失) 尽可能低 相对于3 2 k b p sg 7 2 6 无 误码,不高于o 5 m o s 分的降低 单方向编码解码延迟 算法延迟 1 6 m s5 m s 总编解码延迟 3 2 m sl o m s 编解码器同步外部提供 传送话带数据能力不要求 传送信令和信息音能d t m f ,c c i t tn 0 5以尽可能的低的失真 力 c c i t tn 0 6 传送信令和信息音 c c i t tr 2 ,q 3 5 q 2 3 ,v 2 5 语音级联能力2 级异步级联总失真 s 4 级3 2 k b p s 的g 7 2 6 异步级联总失真 实现定点实现 1 4 小结 v o i p 的发展使世界电信面貌焕然一新,人们终于可以以很低的价钱联系到大洋彼 岸的朋友。并且商业、商家也从i p 电话业务中获益匪浅。i p 电话的出现可以说是资源 的合理利用,同时也是无缝沟通美好愿望驱动下的必然结果。而它的发展也将越来越 好,直到有更好的方式出现。 语音编码的优劣,决定着上述沟通的质量。r r u t g 7 2 9 是本文的核心,将在下文 中逐层展开论述。g 7 2 9 算法采用“共轭结构代数码本激励线性预测编码方案” ( c s a c e l p ) 算法。这种算法综合了波形编码和参数编码的优点,以自适应预测编码 技术为基础,采用了矢量量化、合成分析和感觉加权等技术,提供了对帧丢失和分组 丢失的隐藏处理机制。 6 第二章c s - a c e l p 算法的主要技术研究 2 1 线性预测( l p ) 分析 线性预测是语音信号处理核心技术,一个语音的抽样能用若干个过去语音抽样的 线性组合来逼近。通过实际语音抽样和线性预测抽样之间差值的平方和达到最小值, 来决定唯的一组预测系数。 根据语音信号产生的模型,语音信号s ( n ) 是该系统的单位取样响应h ( n ) 和激励信号 n ) 的卷积。为了求得声道参数,需要对已经输出的语音信号分析并且求出参与卷积的 各个信号。而解决此任务的算法成为解卷积算法。线性预测解码算法正是使用最为广 泛的一种参数卷积算法。 下图2 1 为信号s ( n ) 的模型框图。其中u ( n ) 代表模型的输入,s ( n ) 表示模型输出,h ( z ) 表示模型的系统参数。当s ( n ) 为确定信号时,u ( n ) 为单位冲激响应;当s ( n ) 为随机 信号时,u ( n ) 为白噪声。 图2 1 信号s ( n ) 的模型 模型的系统函数h ( z ) 可以表示成: 妻6 ,z c + 1 h ( z ) = g 生l - 一 ( 2 1 ) 1 - 羔q f l l 其中q ,岛及增益因子g 就是模型的参数,而p 和q 是选定的模型阶数。因此信号可 以用有限数目构成的参数构成的模型来表示。 在语音处理中采用线性预测技术,不仅仅只利用它的预测能力,而且还要它提供 一个较好的声道模型。系统函数h ( z ) 有三种情况:( 1 ) 只有零点没有极点,称为滑动 平滑模型,即m a 模型;( 2 ) 只有极点没有零点成为自回归模型,即a r 模型;( 3 ) 既有极点又有零点,称为自回归滑动平均模型,即a r m a 模型。 a r 模型是常见的模型,线性预测就是基于全极点模型假定的,当岛= o 时,h ( z ) 为全极点模型,此时模型的输出只取决于过去的信号值。全极点模型计算简单,对a r 模型作参数估计是对线性方程组求解的过程,相对容易一些。如果模型中含有有限个 零点就需要求解非线性方程,实现起来就非常困难。此外如果不考虑鼻音和摩擦音, 语音的声道传递函数就是一个全极点模型。对于鼻音和摩擦音,语音的声道传递函数 7 既有极点也有零点,由于一个零点可以用多个极点来近似,所以如果线性预测的阶数p 足够高时,可以用全极点模型来逼近零点模型: 1 一a z 一= 1 ( i + n z 一+ 口2 z - 2 + a 3 z - 3 + 、 ( 2 2 ) 采用最小均方误差准则( l m s 误差) 准则对a r 模型参数进行估计,就能得到线 性预测编码算法。误差函数为: 艿2 = s ( 珂) 一矿( 行) 】2 ( 2 3 ) 一 其中,( n ) 为估计的语音信号。( p = 1 0 ) 使上式最小可推得l p c 正则方程组: 1 0 o l r 匍i - k i ) = 一i t ( _ j ) ,k = 1 ,2 ,1 0 ( 2 4 ) 百 把它写成矩阵形式时,它的系数矩阵是一个对称阵,而且为h o e p l i t z 矩阵。目前已经 有一些高效、适合计算机来实现求解l p c 正则方程的算法,例如自相关解法中的 l e v i n s o n d u r b i n 递推算法、协方差算法、格形算法和s c h u r 递推算法等等。协方差算 法和自相关算法是常用的算法,而且自相关算法的计算简单一些,利用l e v i n s o n d u r b i n 的递推算法能够有效的求解自相关方程,而协方差方程要使用c h o l e s k y 分解来求解。 当p = - 1 0 时,二者的计算量相差3 倍。协方差算法优点是不需要加窗,计算精度高,其 缺点是不像自相关算法一样具有保持系统的稳定性。由于自相关算法中加窗的窗长l 远远大于p 时,自相关算法所带来的误差是可以忽略的,另外使用海明窗这样的平滑 窗能进一步减少误差,所以在实际运用中采用的是自相关算法。 2 2l e v is i o n - d u r h in 递推算法研究 将l p c 正则方程写成矩阵形式,有: ,( o ),( 1 ),( 2 )r ( p 一1 ) r o ) ,( o ),( 1 )r ( p 一2 ) r ( p 1 ) r ( p 一2 ) r ( p 一3 ) r ( o ) q 哆 q 吼 吼 r ( 1 ) ,( 2 ) ,( p ) ( 2 5 ) l p c 正则方程组可以用递推方法求解。首先假设在某一步已经有了一个解,它是一个 ( i 1 ) 阶预测器的系数,然后利用( i 1 ) 阶预测器的系数计算i 阶预测器的系数,即i 阶方程组的解可以用( i - 1 ) 阶方程组的解来表示,( i - 1 ) 阶方程组的解又可以用( i - 2 ) 阶的方程组来表示,所以只要解出一阶方程组的解就可以通过递推解出任意阶的方程 组的解。l e v i s i o n - d u r h i n 递推算法是一种常见的实用算法。算法步骤如下: ( 1 ) 当i = 0 时,e o = r ( o ) ( 2 ) 对于第i 次递归时: 8 a ) 古r ( ,一f ) ( 1 f p ) ( 2 6 ) 一i dj 州 ”耐o = 岛 ( 2 7 ) c ) 对于j = 1 ,i 一1 有: 矽= 巧”一皇” ( 2 8 ) d ) 置= o 一砰) 与一。 ( 2 9 ) 步骤2 中各式可以对i _ 1 2 p 进行递推解,最终解为: 口,= 口:力( 1 ,p ) ( 2 1 0 ) 由递推过程可看出每一步递推的关键在于t ,这个系数具有十分特殊的意义,通常被 称为反射系数或偏相关系数。 2 3 线谱对( l s p ) 分析 线谱对是线性预测参数的另外一种表现形式,可以用来估计语音的基本特性,因 为它是频域参数,所以与语音信号谱包络的峰有更紧密的关系。 在线性预测分析中,语音被看成是个全极点滤波器h ( z ) = l a ( z ) 的传输。其中a ( z ) 为预测误差滤波器: a ( z ) = l + z a j z 一。 ( 2 1 1 ) p 为线性预测阶数,q 为线性预测系数。a ( z ) 具有如下递推关系: 一( z ) = a o - 1 ) ( z ) 一k , z 一1 a o - o ( z 。) ( 2 1 2 ) 分别将k p “= - 1 和 k p + t = 1 时的一川( z ) 用p ( z ) 和q ( z ) 表示,可得: 雌) - 钺引+ z - e + o a ( 2 一:( 2 1 3 ) q ( z ) = 一( z ) 一z 。”a ( z 1 ) p ( z ) 和q ( z ) 均为p + l 阶多项式,且a ( z ) = l 2 【p ( z ) + q ( z ) 】。当a ( z ) 的零点在z 平 面单位圆内时,并且p ( z ) 和q ( z ) 的零点沿着单位圆随刃的增加交替出现。设p ( z ) 的 零点为e “,q ( z ) 的零点为e 婀,那么p ( z ) 和q ( z ) 可以写成以下因式分解形式: p ( z ) = ( 1 + :1 ) 兀( 1 2 c o s m , z _ 1 + z - 2 ) ( 2 1 4 ) q ( z ) = ( 1 - z 一1 ) ii ( 1 2 e o s6 :z 一1 + z 。2 ) ( 2 1 5 ) 其中q 和只按照下列关系排列:o q 6 ; 甜,2 铊,: 万,在因式分解中q 和舅是成 对出现的,反映了谱的特性,称为“线谱对”,它们就是线谱对分析所要求解的参数。 上面的分析可以看出线谱对分析是通过两个z 变换p ( z ) 和q ( z ) ,将a ( z ) 的p 9 个零点映射到单位圆上,这样使这些零点可以直接用频率刃来反映,而p ( z ) 和q ( z ) 各自提供了p 2 个零点频率。 线谱对参数与语音信号的谱特性有密切关系,共振峰与l s p 线谱对的密集区相应。 如果在某个特定的【q ,m 2 ,刃。】中,只移动其中任意一个线谱频率q 的位置,模拟计 算结果表明:它所对应的平滑谱只在矾附近与原平滑谱有差异,而在其它频域变化很 小。这个性质是十分重要的,如在l s p 进行矢量量化时,就可以把这个p 维特征矢量 分成两个p 2 维矢量来进行量化。这样既不影响总的量化效果,还可以大大减少计算 量。 2 4 语音信号的矢量量化分析 量化分成两类:标量量化和矢量量化。标量量化是对语音信号波形每一个取样值 或语音信号每个参数值分别独立地进行量化;而矢量量化是将语音信号波形的取样值 或语音信号的参数值分成一些组,每组构成一个矢量,然后对此矢量进行量化。矢量 量化是信息论在信源编码理论方面的新发展,其研究的基础是信息论的一个分支。该 理论提出:矢量量化总是优于标量量化,而且矢量维数越大性能越优越。这是因为矢 量量化有效地应用了矢量中各种相互关联的性质。 在g 7 2 9 中用到了四个矢量量化:固定码本矢量量化、自适应码本矢量量化、线 谱对的两级矢量量化和两阶共轭结构增益矢量量化。 ( 1 ) 矢量量化的基本原理 矢量量化的过程为:将语音信号波形的k 个样点的每一帧或者k 个参数的每一参 数帧构成k 维空问的一个矢量,然后对这个矢量进行量化。而要对每一个矢量进行量 化,首先需要选择一个合适的失真测度,然后用最小失真原理,分别计算用量化矢量r 替代x 所带来的失真。其中最小失真所对应的那个量化矢量,就是矢量x 的重构矢量。 通常把所有n 个量化矢量构成的集合 r ) 称为码书或者码本,把每个量化矢量j :称为 码字或者码矢,n 称为码本的大小。 矢量输入y 1 0 输出矢量k 图2 2 矢量量化器的原理 矢量量化器工作过程如下:在编码端将输入矢量置与码本中的每一个码字进行 比较,分别计算出它们的失真。搜索到失真最小的码字y ,。的序号j ,将此序号进行编 码传输;在译码端,将编码译为序号j ,再根据此序号从码本中找到相应的码字y ,。, 并将此码字作为y 输出。由于两个码本完全一样,所以此时的失真最小。 ( 2 ) 矢量量化的失真测度 在设计矢量量化器时,失真测度的选择是十分重要的。失真是将输入信号矢量用 码本的重构矢量来表示时的误差或者所付出的代价,这种代价的统计平均值描述了矢 量量化器的工作特性。失真测度选用的恰当与否将直接影响系统的性能。理想的失真 测度必须要具备以下几个特征:a 在主观评价上有意义,即小的失真要对应优的主观语 音质量 b 必须要易于处理,即在数学上是容易实现的,这样可以用于实际的矢量量化器的设 计 、 c 平均失真要求是存在并且可以计算的 失真测度的分类有以下几种:均方误差( 欧氏距离) 、加权的均方误差、i t a k u r a s a t i t o 距离以及似然比失真测度。常用的似二阶的均方误差( 平均误差) 公式: 1 一 吐( x ,) ,) = ( x y ) 1 ( x j ,) , ( 2 1 6 ) k 其中破( x ,y ) 的下标2 表示平方误差,k 是矢量的维数,x ,y 分别表示输入信号和码 本中的矢量,t ,y ,分别表示x 和y 的元素。 ( 3 ) 最佳矢量量化器设计的条件: 最佳矢量量化器是使得到的失真最小的量化器。设计最佳矢量量化器的过程也是 码本的设计过程。在矢量量化器的最佳设计中,最主要的问题是怎样确定量化矢量和 划分量化区间,即如何寻找最佳划分和最佳码本。 最佳划分:对给定的码本( n 是码本大小) ,找出所有码本矢量的最佳区域边界 墨( 1 f n ) ,使平均失真最小。由于码本已经给定,可以使用最近邻近原则n n r 来 得到最佳划分,即:对于任意一个矢量x ,如果它与矢量只的失真小于它和其他码字 之间的失真,则x 应该属于某区域边界s ,墨就是最佳划分。因为给定码本共有n 个 码字,所以可以把矢量区间划分为n 个区间墨( i = l 2 ,n ) 。这些区间s 称为v o r o n o i 胞腔( c e l l ) 。 最佳码本:对于给定的区域边界s ,为了使码本的平均失真最小,码字只必须为 相应划分的形心( 该区域空间的几何中心) ,即: m 2m i n - 1 e u ( x ,y ) lx 墨】 ( 2 1 7 ) v e 胪 式中m i n - 1 表示选取的y 是使平均失真为最小的y 。 ( 4 ) l b g 算法 l g b 算法是在1 9 8 0 年首次提出的。算法是上述两个条件的反复迭代过程,即由初 始码本寻找最佳码本迭代过程。它由对初始码本进行迭代优化开始,直到系统性能满 足要求或不在有明显的改进为止。由于语音信号概率分布的不确定性,一般用来训练 序列来设计码本而后矢量量化器。 当训练序列已知时,矢量量化器和码本的最佳设计迭代算法如下: a ) 给定初始码本瑶,包括码本大小n 和码字 片,y o ,y o ) ,取n = o ,假设起始平均失 真j d 。寸0 0 ,给定失真闽即停止门限e ( o s 1 ) 。 b ) 用码本瑶为已知形心,根据最佳划分原则把训练序列t s 划分为n 个胞腔,即: s :帕= x d ( x ,y ,) ,i _ ,y ,r p ,x t s ( i = 1 ,2 ,n ) ( 2 1 8 ) c ) 计算平均失真与相对失真 平均失真表示为: = 1 肌百岁m 坩i n d ( x , ,y ) ,式中俺;产1 ,2 ,m 。 2 1 9 相对失真表示为: d = l ( d “一d ”) d ”l , 如果ds 则要停止计算,当前的码本瑶就是设计好的码本, d ) 利用下式计算当前划分的各个胞腔的形心: 儿2 南荟x ( 2 2 0 ) 否则,进行第四个步骤。 ( 2 2 1 ) 由这n5 g g 形心 “”,力“,船“ 构成新的码本搿“,并置n = n + l ,返回第2 步再迸 阳) 行计算,直至d f ,得到所要求的码本搿“为止。 在上述设计过程中,有一个问题需要解决:如何选取初始码本。初始码本的生成 有以下几种方法:随机选取法、分裂法、乘积码本法等。在q 7 2 9 中,就是利用的分 裂法来确定初始码本的。 2 5 感觉加权滤波器研究 基于线性预测的分析与综合编码方法的关键就是在于选择激励信号时对误差信号 进行感觉加权处理。感觉加权滤波器的依据是人耳听觉的掩蔽效应。在语音频谱中能 量较高的频段即共振峰处的噪声相对于能量较弱频段的噪声而言不易被感知。合成语 音信号和原始语音信号之间的误差通过感觉加权滤波器,使合成语音信号频谱中的共 振峰处误差增大,而使波谷处的误差减小,就是增加了共振峰处的量化噪声,减少了 波谷处的量化噪声。 引入一个频域感知加权滤波器w ( f ) ,它在z 域的表达式w ( z ) 为: 晔) :婴:堡二 ( 2 2 2 ) 、7 a ( z n 1 + a , r z 1 一 感知加权滤波器的特性由预测系数 口。 和加权因子r 来确定。r 的取值在肚1 之问, 由它来控制共振峰区域误差的增加。 g 7 2 9 中的感知加权滤波器的传递函数为: 肜:丛丛生( 2 2 3 ) a ( z 吒) 由和, 调整传递函数的零点和极点。当和巧增大时,零点和极点靠近单位圆, 反之,则远离单位圆。反映在频谱上是共振峰的升高和降低。 第三章it u - t g 7 2 9 语音编解码算法 3 1g 7 2 9 语音编解码算法的概述 g 7 2 9 算法以码本激励线性预测编码技术( c e l p ) 为基础综合采用了矢量量化、合 成分析和感觉加权技术等。每8 0 个样点为一个语音帧,帧长1 0 m s ,每帧由两个5m s 的子帧组成,加上5m s 的前视,因此在编码端共有1 5m s 的计算时延。在编解码器内 部流程中处理的是数字信号,此信号是通过输入的模拟信号先进行电话带宽的滤波, 然后进行8 0 0 0 h z 抽样,再转换为1 6 b i t 线性p c m ,得到1 2 8 k b p s 的数字信号。同样对 于输出信号也采用相同的方式转换回模拟信号。 c s a c e l p 对每一个语音帧进行分析并且提取各种参数,再把这些参数编码以比 特流的方式发送多译码器端。 1 s l 表3 - 1 参数编码的比特分配 参数码字子帧1子帧2每帧总数 线谱对 厶,厶,厶,厶 1 8 自适应码本时延 墨,昱 851 3 基音时延奇偶校 昂 ll 验 固定码本序号 c l ,g 1 31 32 6 固定码本序号s ,s 4 4 8 码本增益( 阶段1 )6 r 4 ,g 4 336 码本增益( 阶段2 ) g b , ,g b 2 448 总计 8 0 在解码端,用这些参数来恢复激励信号和合成滤波器,如图3 1 2c e l p 合成模块 原理图所示。其中合成滤波器基于个1 0 阶线性预测滤波器,长时或基音滤波器采用 所谓的自适应码本方法来实施。计算重构语音之后,该语音通过后置滤波器进一步增 强。 图3 1c e l p 合成模块 ( 2 7 2 9 采用的是前馈型自适应技术,除了传输激励信号( 包括波形和增益) 外,也 需要传送预测滤波器系数,分析窗采用混合窗。为了要降低比特率,线性预测系数、 激励信号波形、激励增益均采用了矢量量化,并且利用了多级量化和分割量化技术, l s p 参数采用二级矢量量化,激励信号码本采用的是高效的共轭结构代数码本,以子 帧为单位的码本搜索分为自适应码本搜索和代数( 固定) 码本搜索,代数码本算法简 单,不需要存储码本,恢复音质很清晰;基音分析采用开环基音分析和自适应码本搜 索相结合,从而降低了运算量,减少了基音的量化比特数,提高了基音预测的准确度。 3 2g 7 2 9 语音编码算法 图3 2c s a c e l p 编码原理图 3 2 1 预处理研究 g 7 2 9 语音编码器的输入必须是1 6 b i t 的线性p c m 信号在进行编码前,预处理模块 要对输入信号进行信号定标和高通滤波两项处理。 信号定标就是将输入信号幅度除以2 ,来减少定点实现时溢出的可能性;高通滤波 的作用主要是为了滤除不必要的低频分量,其截止频率是1 4 0 h z 。将这两者结合起来, 用一个滤波器可以表示为: 日。( z ) :0 4 6 3 6 3 7 1 8 - 0 9 2 7 2 4 _ 7 0 5 z - 1 + 0 4 6 3 j 6 7 1 8 z - 2 ( 3 1 ) 爿m 2 j 。f 两獗磊孬而再面石r u j 输入信号通过乒k ( z ) 后记为s ( n ) 。算法在编码前,采取了预处理的方法,这主要由于 以下两个方面: ( 1 ) 抑制输入信号各个领域含量中频率超出,:2 的所有分量,以防混叠。 ( 2 ) 抑制5 0 h z 电源干扰。 3 2 2 线性分析和量化 短时分析与合成滤波器是基于1 0 阶线性预测( l p ) 滤波器的。这个合成滤波器定 义为: 凇小芝 i = 1 其中盯( i = 1 2 1 0 ) 是量化后的l p 系数。 ( 1 ) 加窗与自相关系数计算 ( 3 2 ) 线性预测分析及量化由以下5 个步骤组成: 每帧语音( 8 0 个样值) 要计算一次加窗语音的自相关系数。l p 分析窗函数是3 0 m s 的非对称窗,由两部分组成:1 2 个哈明窗和1 4 余弦函数,数学表达式如下: w :j 。5 4 一。4 6 e o ;:2 z n x 聆= 。j ”1 9 9 。3 , ”9 l c 。s ( - ;! :! 丛! ;j ;型) ,胛= 2 0 。,2 3 9 l p 分析时需要5 r n s 前视,即从下一帧中读取4 0 个样值,加上当f j 帧的8 0 个样值, 过去帧的1 2 0 个样值,共用2 4 0 个样值数据。 加窗后的语音表达式为: s w ( 坊= w t e ( n ) s ( n ) ,聆= 0 ,2 3 9 ( 3 4 ) 对应的自相关系数表达式为: ,( _ i ) = ( 押) j 。( n - k ) ,k = o 1 0 ( 3 5 ) 求出自相关系数后,应用l e v i n s o n d u r b i n 算法进而求出l p 滤波器系数。 ( 2 ) l p 到l s p 的转换 6 计算出l p 系数后,还要进一步转化为线谱对( l i n es p e c t r a lp a i r , l s p ) 系数,主 要是由于线谱对具有下面的特性:对于某个特定的l s p 矢量【z ,石,z 。】中只移动其中 任意一个线谱频率,的位置,它所对应的平滑只在,附近与原平滑有差异,而在其他 频域则变化很小,所以增强了解码端合成滤波器的稳定性。 l p 滤波器系数口,i = o 1 1 0 转换成为l s p 系数的过程如下。l s p 系数定义为下 面两个和、差多项式的根,表达式为: 鼻k z ) = a ( z ) + z - 1 1 a ( z 。1 ) 和e ( z ) = 一( z ) 一z - l l a ( z - 1 ) ( 3 6 ) 可以证明这两个多项式的根都落在单位圆上,并且交替排列。为删除两个根z = 1 和 z = - 0 ,定义两个新的多项式: 驰) = 等嗍加掣 ( 3 7 ) 每个多项式在单位圆上均有5 对共轭根,他们的表达式为: 最( z ) = 兀( 1 2 q , z 1 + 严) 和e ( z ) = 兀( 1 2 q ,z “+ z 2 ) ( 3 8 ) 其中,q j = c o s ( 奶) ,系数q 被称为线谱频l s p ( l i n ep a i rf r e q u e n c y ) ,它们满足 如下特性:0 研 吼 q o 万。q ,是余弦域的线谱对。因为( 3 2 2 7 ) 两个多 项式的系数是对称的,所以只需要计算前五个系数,多项式可以通过下列迭代关系来 求得: 石( f + 1 ) 2 a i + l + a i o 一彳( f ) ,f = 0 ,4 ( 3 9 ) 五( f + 2 ) = c k l q o - 。+ z ( f ) ,i = 0 ,4 其中石( o ) = a ( o ) = 1 0 。l s p 系数的求解方法是:先将x e f 自 o ,万】平均分成6 0 等份, 然后计算各点处置( z ) 和e ( z ) 多项式的值,检查符号的变化。如果符号发生变化,则 表明有一个根存在。为了得到更加精确的解,还需要将符号变化区间再细分四次。在 估算多项式曩( z ) 和e ( z ) 时要用到切比雪夫多项式,这样就能直接计算出余弦域内的 根。多项式只( z ) 和f a z ) 在z = p 归处的值可以表示为: f ( 玎) = 2 e - j s m c ( x ) ( 3 1 0 ) 其中有: c ( 工) ;互( 上) + f ( 1 ) t 4 ( x ) + f ( 2 ) t 3 ( x ) + f ( 3 ) t 2 ( x ) + 厂( 4 ) 互( x ) + 二霎立,并r t m ( x ) :c o s ( m m ) 是m 阶切比雪夫多项式,( 耽i = l ,5 是计算出的e ( z ) 或e ( z ) 系数。 ( 3 ) l s p 系数的量化 l s p 系数吼的量化是以规范化频域【0 ,万 中线谱频形式的q : q = a r c c o s ( q , ) ,i = 1 ,1 0 ,q o ,7 】 ( 3 1 1 ) 一个可以切换的4 阶移动平均( m a ) 预测器用来预测当前帧的l s p 系数。预测值 1 7 与计算值的差用一个两级矢量量化器量化。第一级使用的码本厶是一个有1 2 8 个码字 ( 编码为t o i t ) 的1 0 维矢量量化;第二级使用分裂码本矢量量化,使用的两个码本厶 和厶是分别包含3 2 个码字( 编码为5b i t ) 的5 维码本。 为了更好的说明量化过程,首先描述一下译码的过程。每个量化系数,i = l ,1 0 分别由两个码本的和求得到表达式: ?
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 入门白酒品鉴师培训课件
- 供销工作课件教学
- 2025年江西省临川区第一中学物理高三上期末达标检测试题
- 2025年河南省漯河实验高中高三物理第一学期期末考试试题
- 银联卡技术管理办法
- 非工作时间管理办法
- 第25章 随机事件的概率(章节复习)(重点练)解析版
- 高端客户家庭财富资产保全产说会高端版理念
- 知识总结-《人民解放战争的胜利》
- 视频监控摊贩管理办法
- 印章U盾管理办法
- 2025年重庆市永川区社区工作者招聘考试笔试试题(含答案)
- 电气自动化基础知识课件
- 家畜繁殖员上岗证考试题库及答案
- DG-TJ08-2097-2025 地下管线探测技术标准
- 数学鲁教版九年级上学期分层计划
- 新解读《建筑工程消防施工质量验收规范 DBJ-T 15-248-2022》
- 女生的青春期健康教育
- 以《论语》为翼:高中生价值观构建的教学实践与探索
- 妇产科电子护理文书书写规范
- DB42 1537-2019 农村生活污水处理设施水污染物排放标准
评论
0/150
提交评论