(通信与信息系统专业论文)基于arm的amrwb宽带语音编码算法的优化与实现.pdf_第1页
(通信与信息系统专业论文)基于arm的amrwb宽带语音编码算法的优化与实现.pdf_第2页
(通信与信息系统专业论文)基于arm的amrwb宽带语音编码算法的优化与实现.pdf_第3页
(通信与信息系统专业论文)基于arm的amrwb宽带语音编码算法的优化与实现.pdf_第4页
(通信与信息系统专业论文)基于arm的amrwb宽带语音编码算法的优化与实现.pdf_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 自适应多速率语音编码a m r w b 是由3 g p p 组织制定的应用于第三代移动 通信系统中的一种语音编码算法。它采用了代数码本激励线性预测技术和自适应 技术,并支持九种编码速率,很好地解决了信源和信道编码的速率分配问题,使 得网络资源的配置和利用更加灵活和高效。 由于a m r w b 的计算复杂度较高,从而限制了它在硬件资源有限的嵌入式 系统中的应用。a r m 处理器不仅在控制方面具有优势,在信号处理方面的能力 也越来越强,因而广泛应用于嵌入式系统中。本文的研究目的是在保持较高的合 成语音质量的前提下,降低a m r w b 的整体复杂度,并在a e s o p m p 2 5 3 0 f a r m 平台上实现a m r w b 语音编码的双路处理,优化后的a m r w b 算法可以用于 嵌入式系统中v o i p 语音前端处理。 本文详细分析了a m r w b 算法的原理和特点,评估了其性能和复杂度。结 果表明,自适应码本搜索模块和固定码本搜索模块的计算量约占整体算法的4 3 , 本文重点对这两个模块进行了优化,具体方法是先对a c e l p 语音合成模型作了 改进,避免了不必要的卷积运算,从而实现了快速自适应码本搜索算法,使整体 计算量减少了8 ;同时,提出并实现了一种基于码本矢量分段优化的快速固定 码本搜索算法,在保持较高的合成语音质量的同时,使整体计算量进一步减少了 2 1 ;最后,对a m r w b 算法进行代码优化。经以上优化流程,平均计算复杂 度由1 1 4 9 m i p s 降至9 7 2 m i p s 。在m p 2 5 3 0 fa r m 平台上运行优化后的a m r w b 算法,实验结果表明,完全满足双路处理的要求。 关键词:语音编码;a m r w b 标准;算法优化;自适应码本搜索;固定码本搜 索 a b s t r a c t a b s t r a c t a m r w bw a sa p p r o v e db y3 g p pa sas p e e c hc o d ea l g o r i t h md e v e l o p e di nt h e t h i r dg e n e r m i o nm o b i l ec o m m u n i c a t i o ns y s t e m i ta d o p t sa l g e b r a i cc o d e b o o ke x c i t e d l i n e a rp r e d i c t i o na n da d a p t i v et e c h n o l o g yw i t hn i n es o u r c er a t e s ,a n di td o e sw e l li n s o l v i n gt h es o u r c ea n d c h a n n e lc o d i n gr a t ea l l o c a t i o np r o b l e m ,w h i c hm a k ea l l o c a t i o n a n du s eo fn e t w o r kr e s o u r c em o r ef l e x i b l ea n de f f i c i e n t h o w e v e r , t h eh i g hc o m p u t a t i o n a lc o m p l e x i t yl i m i t si t sa p p l i c a t i o ni ne m b e d d e d s y s t e m sw h o s eh a r d w a r er e s o u r c e sa r ec r i t i c a l i ti s k n o w nt h a ta r m 9p r o c e s s o ri s g o o da tc o n t r o l ,a n dt h ep e r f o r m a n c eo fs p e e c hs i g n a lp r o c e s s i n ga l s ob e c o m e s s t r o n g e r t h e r e f o r e ,i th a sb e e nw i d e l yu s e di ne m b e d d e ds y s t e m s t h ep u r p o s e o ft h i s t h e s i si st ol o w e rt h eo v e r a l lc o m p l e x i t yo fa m r w ba n dd om u l t i p l e x i n gr e a lt i m e v o i c ep r o c e s s i n go na e s o p - m p 2 5 3 0 fa r mp l a t f o r m ,e n s u r i n gt h es y n t h e s i z e d s p e e c hq u a l i t y t h e nt h eo p t i m i z e da r m w ba l g o r i t h mc o u l db eu s e dt od 0v o i c e f r o n t e n dp r o c e s s i n gi ne m b e d d e ds y s t e m s t h i st h e s i sa n a l y z e sp r i n c i p l ea n dc h a r a c t e r i s t i c so fa m r - w bi nd e t a i l ,a n d e v a l u a t e si t sp e r f o r m a n c ea n dc o m p l e x i t y a st h er e s u l ts h o w s ,t h ec o m p u t a t i o n a l a m o u n to fa d a p t i v ec o d e b o o ks e a r c ha n df i x e dc o d e b o o ks e a r c ha l g o r i t h ma c c o u n t s f o r4 3p e r c e n t t h e r e f o r e ,t h i st h e s i sc o n c e n t r a t e so no p t i m i z a t i o nt ot h e s et w o m o d u l e s t h es p e c i f i cm e t h o di st h a t :f i r s t l y , t h i st h e s i si m p r o v e sa c e l ps p e e c h s y n t h e s i sm o d e lt o a v o i du n n e c e s s a r yc o n v o l u t i o n ,t h e naf a s ta d a p t i v ec o d e b o o k s e a r c ha l g o r i t h mi sr e a l i z e dw i t hc o m p u t a t i o n a la m o u n td e c r e a s e db y8 m e a n w h i l e , af a s tf i x e dc o d e b o o ks e a r c hm e t h o di s a p p r o v e da n dr e a l i z e dw h e r ec a n d i d a t e c o d e v e c t o ri sd i v i d e di n t ot w os u b - c o d e v e c t o r st oo p t i m i z e t h en e wa l g o r i t h mn o t o n l yc o u l de n s u r et h es p e e c hq u a l i t y , b u ta l s om a k e st h ew h o l ec o m p l e x i t yd e c r e a s e d t o9 7m i p s l a s t l y , t h i st h e s i sa l s oc o m p l e t e st h eo p t i m i z a t i o na tt h ecc o d el e v e l t h ee x p e r i m e n t a lr e s u l t so nm p 2 5 3 0 fa r m p l a t f o r ms h o w st h a tt h et w i n c h a n n e l i m p l e m e n t a t i o no ft h ea m r w bs p e e c hc o d i n ga l g o r i t h mc o u l db ea c h i e v e d 1 1 1 k e yw o r d s :s p e e c hc o d i n g ;a m r w bs t a n d a r d ;a l g o r i t h mo p t i m i z a t i o n ;a d a p t i v e c o d e b o o ks e a r c h ;f i x e dc o d e b o o ks e a r c h i v c o n t e n t s c o n t e n t s a b s t r a c ti nc h i n e s e i a b s t r a c ti ne n g l i s h i i c h a p t e r lp r e f a c e 1 1 1o v e r v i e wo fs p e e c hc o d i n g 1 2p u r p o s ea n dm e a n i n go fd i s s e r t a t i o n 1 3m a i nc o n t e n ta n dd i s s e r t a t i o ns t r u c t u r e 1 3 4 c h a p t e r 2s t u d yo fa l g o r i t h ma n de v a l u a t i o no f p e r f o r m a n c e 6 2 1s t r u c t u r eo fa m r - w bs p e e c hc o d e r 6 2 1 1p r e - p r o c e s s i n g 6 2 1 2l i n e a rp r e d i c t i o na n a l y s i sa n dq u a n t i z a t i o n 7 2 1 3o p e n - l o o pp i t c ha n a l y s i s 1 3 2 1 4a d a p t i v ec o d e b o o ks e a r c h 1 6 2 1 5f i x e dc o d e b o o ks e a r c h 1 8 2 1 6q u a n t i z a t i o no ft h ea d a p t i v ea n df i x e dc o d e b o o kg a i n s 2 1 2 2a d a p t i v et e c h n i q u e so fa m r - w b 2 2 1v o i c ea c t i v i t yd e t e c t i o n 2 3 2 2 2s o u r c ec o n t r o l l e dr a t eo p e r a t i o n 2 3 2 2 3c o m f o r tn o i s ei n s e r t i o n 2 4 2 2 4e r r o rc o n c e a l m e n to fl o s tf r a m e s 2 4 2 3p e r f o r m a n c eo fa m r - w bc o d e r 2 3 1t i m ec o m p l e x i t y 2 5 2 3 2s p a c ec o m p l e x i t y 2 8 2 3 3s y n t h e s i z e ds p e e c hq u a l i t ye v a l u a t i o n 2 9 2 4c h a p t e rs u m m a r y 3 3 c h a p t e r 3o p t i m i z a t i o no fa d a p t i v ec o d e b o o k s e a r c ha l g o r i t h m 3 4 3 1p r i n c i p l eo fa c e l p i x 3 4 ( = o n t e n t s 一一一_ _ _ _ 一 3 2t r a d i t i o n a la d a p t i c ec o d e b o o ks e a r c ha p p r o a c h 3 5 3 3af a s ta d a p t i v ec o d e b o o ks e a r c ha p p r o a c h 一”3 7 3 4e x p e r i m e n t a lr e s u l t s 。”一3 9 3 5c h a p t e rs u m m a r y 。4 0 c h a p t e r 4o p t i m i z a t i o no f f i x e dc o d e b o o ks e a r c ha l g o r i t h m 4 2 4 1p r i n c i p l eo fa c e l pf i x e dc o d e b o o ks e a r c ha l g o r i t h m 4 2s t u d yo nf a s tf i x e dc o d e b o o ks e a r c ha l g o r i t h m 4 2 1f o c u ss e a r c ha p p r o a c h 4 5 4 2 2d e p t h f i r s tt r e ea p p r o a c h :4 5 4 2 3p u l s er e p l a c e m e n ts e a r c hm e t h o d 4 6 4 3f i x e dc o d e b o o ks e a r c ha p p r o a c ha d o p t e di na m r - w b 4 4an e wf a s tf i x e dc o d e b o o ks e a r c ha p p r o a c h 4 7 4 4 1t h el e a s ti m p o r t a n tr e p l a c e m e n tm e t h o d 4 8 4 4 2p r i n c i p l eo ft h en e wa p p r o a c h 4 9 4 5e x p e r i m e n t a lr e s u l t s 。5 1 4 6c h a p t e rs u m m a r y 。5 5 c h a p t e r 5r e a l i z a t i o no f a m r - w bi na r mp l a t f o r m 5 6 5 1m p 2 5 3 0 fa p p l i c a t i o np r o c e s s o r 5 1 1a r mp r o c e s s o ro nm p 2 5 3 0 f 5 7 5 1 2i n t m c t i o n 1 e v e lo p t i m i z a t i o n 5 7 5 2o p t i m i z e dt e c h n i q u e sf o ra m r - w ba l g o r i t h mo na r m 5 8 5 2 1c o d eo p t i m i z a t i o n “5 9 5 2 2i n t m c t i o n 1 e v e lo p t i m i z a t i o n 6 1 5 3p e r f o r m a n c eo fi m p r o v e da m r - w bs p e e c hc o d e r 5 4c h a p t e rs u m m a r y c h a p t e r 6c o n c l u s i o na n dp r o s p e c t 6 4 6 6 6 1s u m m a r yo fm a i nw o r k 。”6 6 6 2d i s s e r t a t i o nc o n t r i b u t i o n x c o n t e n t s 一_ _ 一 6 3p r o s p e c t 。”一_ 6 7 r e f e r e n c e 。6 8 a c k n o w l e d g e m e n t 7 1 p u b l i s h e dp a p e ra n dr e s e a r c hd u r i n gp u r s u i n gm a s t e rd e g r e e 7 2 第1 章绪论 1 1 语音编码概述 第1 章绪论 目前,语音编码基本上可以分为三类:时域波形编码、参数编码与混合编码。 时域波形编码主要利用语音信号的时域波形采样值的分布规律和相邻采样点之 间的相关性进行压缩,并努力保证重建语音信号的波形与原语音信号的一致性。 波形编码的重建语音质量一般较高,算法复杂度低,但压缩效率不高。参数编码 算法是基于感知模型的语音编码算法j 通过分析、提取并传送表征语音信号的参 数,并在接收端利用这些参数重建语音信号。由于不要求重建后的语音信号的波 形与原语音信号保持一致,故合成后的语音质量较差,但编码速率很低。采用参 数编码的语音编解码器称为声码器,如线性预澳l j ( l i n e a rp r e d i c t i v ec o d i n g , l p c ) 声码器、通道声码器、共振峰声码器等。混合编码结合了波形编码与参数编码的 长处,在4 1 6 k b i t s 速率上能够得到高质量的合成语音。典型的混合编码有:规 则脉冲激励长时预测( r e g u l a rp u l s ee x c i t e d - l o n gt e r mp r e d i c t i o n ,r p e l t p ) 编 码、码激励线性预测( c o d ee x c i t e dl i n e a rp r e d i c t i o n ,c e i j p ) 编码。 目前,语音编码主要沿着两个方向发展:一是进一步降低编码速率,采用传 统的定速率编码,已经很难有更大的发展,可以有突破的是变速率语音编码,这 种变速率语音编码非常适合分组网络,是一种很有发展前景的语音编码技术。另 一个方向是语音不压缩,这是因为随着网络带宽的不断增长,且传输成本大幅度 下降,语音编码的费用与所节省的传输费用相比变得不合算,但在分组网络中, 特别是i p 网络环境下,丢包情形不可避免,语音必须作一定的处理才能适应这 种网络环境。因此,这两个研究方向都有很高的现实意义。2 0 世纪9 0 年代起, 变速率语音编码技术成为研究的热点,各种通信机构和组织相继推出了不同的变 速率语音编码技术标准,如q c e l p ( q u a l c o m mc o d ee x c i t e dl i n e a rp r e d i c t i o n ) 、 e v r c ( e n h a n c e d v a r i a b l er a t e c o d e r , ) 、a m r ( a d a p t i v em u l t i - r a t e ) 、 a m r - w b ( a d a p t i v em u l t i - r a t ew i d e b a n d ) 。 基于a r m 的a m r w b 宽带语音算法的优化与实现 ( 1 ) 8 k b i t s 的q c e l p 编码算法 1 9 9 5 年5 月美国通信工业协会f f i a ) 公布了q c e l p 编码算法,并作为过渡 语音编码标准i s 9 6 - a ,q c e l p 是最早应用于c d m a ( c o d ed i v i s i o nm u l t i p l e a c c e s s ) 系统的变速率语音编码算法,支持8 k b i t s 到0 8 k b i t s 的变速率编码,算 法相对简单,但复原语音质量不高,在实际应用中比较少使用q c e l p 。 ( 2 ) 增强型变速率编解码器( e v r c ) 1 9 9 5 年,t i a 在i s 一9 6 - a 的基础上颁布了一个称为i s 1 2 7 的增强型变速率 ( e n h a n c e dv a r i a b l er a t ec o d e r ,e 之c ) 语音编码标准,该标准在语音压缩模块 的前端引入了一个新颖的语音增强功能,在噪声背景条件下,依然可以获得较舒 适的语音质量【。 e v r c 增强型变速率语音编解码,建立在松散码激励线性预测( r c e l p ) 编码器的基础上,加入了语音激活检测,差错隐藏等技术,对语音信号进行变 速率编码从而达到节约带宽、保持语音质量的目的。e v r c 有三种编码速率: 全速率,1 2 速率和1 8 速率。对于噪声用1 8 速率编码,语音用全速率或者 1 2 速率。 ( 3 ) 1 3k b i t s 的q c e l p 编码算法 因为8 k b i t s 的q c e i j p 编码算法的复原语音质量并不好,所以美国通信工业 协会于1 9 9 8 年3 月又颁布了1 3k b i t s 的q c e l p 编码算法,它采用了两级编码 速率判决技术,对线谱频率进行矢量量化,使得复原语音质量得到改善,但算法 复杂度高且平均码率较高。 ( 4 ) a m r 语音编码算法 1 3k b i t s 的q c e l p 采用了1 3k b i t s 固定速率的编解码方式,码率较高,而 且不能灵活地根据语音环境调整编解码速率,不能高效地配置、利用网络资源。 因此,在1 9 9 9 年8 月,第三代合作伙伴组织( 3 r dg e n e r a t i o np a r t n e r s h i pp r o j e c t , 3 g p p ) 公布了a m r 语音编码算法,共支持8 种速率模式,根据信源编码和信道 编码问的最佳选择提供增强的语音质量。在高码率模式下,语音编码器的复原语 音自然、易懂,但抗噪性弱;而在低码率模式下,语音编码器合成的语音自然度 较差,但抗噪性强。 2 第1 章绪论 ( 5 ) a m r w b 编码算法 作为a m r 语音编码算法的扩展,3 g p p 于2 0 0 0 年1 2 月公布了自适应多速 率宽带语音编码标准( a m r w 8 ) 。a m r w b 具有广泛的应用,主要包括第三代 移动通信系统、i p ( i n t e m e tp r o t o c 0 1 ) 电话、综合业务数字网( i n t e g r a t e ds e r v i c e s d i g i t a ln e t w o r k ,i s d n ) 宽带电话、视频和音频电子会议等领域,这是第一次采 用相同的编码器作为无线和有线业务的通用标准。a m r w b 语音编码器采样率 为1 6 0 0 0h z ,语音带宽5 0 7 0 0 0 h z ,采用1 4b i t 量化,共包含6 6 0 k b i t s 、8 8 5 k b i t s 、 1 2 6 5 k b i t s 、1 4 2 5 k b i t s 、1 5 8 5 k b i t s 、1 8 2 5 k b i 临、1 9 2 5 k b i 怕、2 3 0 5 k b i 怕及 2 3 8 5 k b i t s 等9 种速率模式,复原语音质量比a m r 更加自然、舒适和易于分辨 【2 捌 。 语音编码在现在和未来都有广泛的应用前景,主要分为语音信号的数字传输 与数字压缩。目前,以c e l p 为基础的7 k h z 带宽的变比特率( 8 - 3 2 k b i t s ) 嵌入 式语音编码逐步成为研究的热剧1 1 。 1 1 2 研究目的及意义 随着片上系统( s o c ) 的飞速发展,语音压缩编码技术得到了越来越广泛的应 用,这对传统的语音通信业务提出了低码率、低延迟的要求。a m r w b 语音编 码标准是3 g p p 组织于2 0 0 1 年3 月制定的自适应变速率宽带语音编码标准,并 被国际电信联盟电信标准部盯u - t 选为1 6 k b i t s 的宽带语音编码标准,具有从 6 6 k b i t s 到2 3 8 5 k b i t s 的9 种不同码速率,其编码方法采用的是代数码本激励线 性预测技术( a l g e b r a i c c o d e e x c i t e dl i n e a r - p r e d i c t i o n ,a c e l p ) ,并且将传统的 2 0 0 3 4 0 0 h z 的带宽扩展到了5 0 7 0 0 0 h z ,在参数提取阶段运用闭环和开环相结合 的方法计算基音延时,运用自适应码本和固定码本结合的方式合成激励源,这些 都使合成的语音效果大大提高。 如图1 1 所示,在双路语音实时采集与压缩处理系统中,实现语音编码压缩 的硬件平台通常用d s p ,这会增加成本,增大系统面积。实际上,对于嵌入式设 备或手持终端来说,仅使用一块a r m 处理器就能做到双路语音信号编码,既能 节省成本,又减少了系统复杂度。但是,对a r m 处理器而言,由于a r m w b 3 基于a r m 的a m r w b 宽带语音算法的优化与实现 压缩算法的计算复杂度很高,难以达到实时处理的要求。为了同时处理2 路并行 实时语音流,需要对a m r w b 语音编码器进行优化以降低算法复杂度。 编 码 压 缩 2 路语音数字流 二二 图1 1 双路语音采集与压缩处理系统 1 3 研究内容及结构安排 本文的研究内容是如何在a r m 平台上优化、实现a m r w b 宽带语音编码 算法,主要包括:结合3 g p pa m r w b 标准说明文档与定点参考代码,详细分 析了a m r w b 编码算法的各个关键模块;对a c e l p 语音合成模型作了改进并 实现快速自适应码本搜索算法;重点对固定码本搜索进行了算法上的优化,提出 了一种新的固定码本搜索算法一码矢分段优化算法;最后,对a m r w b 定点 实现代码进行了代码优化与汇编优化,在基于a m r 9 的m p 2 5 3 0 平台上充分利 用a r m 优化技术实现了a m r w b 语音编码的双路处理。 围绕a m r w b 语音编码算法的优化与实现,论文分为以下六个部分: 第1 章为绪论,简要阐述了语音编码技术、介绍了几种常见的语音编码算法, 提出了本文的研究目的及意义,说明了论文的研究内容与结构安排。 第2 章分析了a m r w b 语音编码算法的各关键模块以及a m r w b 自适应 技术:语音激活检测、源速率控制、舒适背景噪声生成与错误隐藏机制;评估了 a m r w b 的算法复杂度,包括时间复杂度和空间复杂度,还对合成语音质量进 行了评估,明确了优化工作的重心。 第3 章对a c e l p 语音合成模型作了等效改进,提出了种新的快速自适应 码本搜索算法,避免了卷积运算,从而大大降低了计算复杂度。 第4 章在分析、比较了现有的a c e l p 固定码本搜索算法的基础上,提出了 4 第1 章绪论 一种新的基于码矢分段优化的快速搜索方法,通过仿真实验评估了优化后固定码 本搜索算法与整体a m r w b 算法的性能。 第5 章对a m r w b 改进算法进行代码优化和a r m 汇编优化,移植至 a e s o p m p 2 5 3 0 f 平台并进行调试和性能测试。 第6 章对a m r w b 整体算法的优化进行总结,归纳出本文的创新点,提出 下一步工作的设想。 基于a r m 的a m r - w b 宽带语音算法的优化与实现 第2 章a m r w b 算法研究及性能评估 a m r w b 是由第3 代合作伙伴计划( 3 g p p ) 提出的宽带语音编码标准,2 0 0 2 年1 月,i t u t 又将其纳为g 7 2 2 2 标准。a m r w b 语音编码器采样率为1 6 0 0 0 h z ,语音带宽5 0 一7 0 0 0 h z ,采用1 4b i t 量化,共包含6 6 0 k b i t s 、8 8 5 k b i t s 、1 2 6 5 k b i t s 、 1 4 2 5 k b i t s 、1 5 8 5 k b i t s 、1 8 2 5 k b i t s 、1 9 2 5 k b i t s 、2 3 0 5 k b i t s 及2 3 8 5 k b i t s 等9 种速率模式【4 1 。本章结合a m r w b 标准说明文档分别对a m r w b 编码算法的 各个数字语音信号处理模块进行分析。 2 1a m r w b 语音编码器结构 a m r w b 语音编码器采纳的编码方案是a c e l p ( a l g e b r a i cc o d e e x c i t e d l i n e a r - p r e d i c t i o n ) ,即自适应码本激励线性预测,根据实现功能,主要包括线性 预测分析、基音搜索以及固定码本搜索等三大模块。其中,经l p c 分析,a m r w b 获得1 6 阶l p c 滤波器系数,将它们转化为线谱对参数( i s p ) ,并对i s p 参数进 行量化;基音搜索分为开环基音搜索与闭环基音搜索两个步骤,以获得基音延迟 和基音增益这两个参数;固定码本搜索得到最优码本矢量和固定码本增益,并对 码本增益进行量化。a m r w b 语音编码器简化框图如图2 1 所示【5 1 。 2 1 1预处理 a m r w b 编码器进行线性预测编码、长时预测分析以及固定码本参数分析 时的采样率为1 2 8 k h z 。因此,须将输入信号频率从1 6 k h z 降至1 2 8 k h z 。具体 过程是:先进行4 倍升采样,再经截止频率为6 4 k h z 的低通滤波器h d e c i r n ( z ) 滤 波,得到的信号再进行5 倍降采样。滤波延迟通过在输入矢量进行加零补偿。 预处理还包括高通滤波、预加重与信号降幅。信号降幅将输入信号降至半 以防止在定点运算中发生溢出。 高通滤波器的截止频率为5 0 h z ,表达式为: 6 第2 章a m r - w b 语音编码器性能评价 刚加鼍等羔鬻簇 仁1 , 爿们z ) 4 了i 而蕊万丽丽函r 似l , 降幅及高通滤波通过将乩。( z ) 分子的系数除以因子2 同时实现。预加重使用一阶 高通滤波器加强信号的高频部分,其传输函数为: h 雕删( z ) - - 1 - 0 6 8 z 一1 ( 2 2 ) j 蓍燃瓢鏖 按子帧进行,基音搜索中的 框内为竺分析蒜黎嬲未蔫簇羹嘉买 = 二、= 二= 二二 二二。 原始输入语音 图2 1a m r - w b 语音编码器结构 2 1 2 线性预测分析及量化 每一语音帧利用长度为3 0 m s 的不对称窗以自相关的方式进行短时预测,或线 性预测。l p c 分析有5 m s 的提前量。l p c 分析窗有6 4 个样本点来自上一帧,2 5 6 个样本点来自当前帧,6 4 个样本点来自下一帧。帧结构如图2 2 所示。 线性预测分析每帧执行一次,使用3 0 m s 非对称窗的自相关方法得出自相关 系数,自相关系数通过莱文杜宾算法被转化为l p 参数。l p 参数进一步被转化 为i s p 参数用来量化与内插。 7 基于a r m 的a m r - w b 宽带语音算法的优化与实现 f r a = en ( 4 x sm s ) 图2 2l p 分析帧结构 2 1 2 1 窗处理与自相关计算 每一子帧均使用一非对称窗进行线性预测分析。窗函数主要集中于第四子帧, 包含两个部分:一部分是半个汉明窗,另一部分是四分之一的汉明余弦函数周期。 窗函数可以表示为: w c 厅,2t 0 5 4 - 0 4 6 c o s ( 2 p n ) , 其中,厶一2 5 6 ,l 2 - 1 2 8 经加窗处理的语音序列s 协) ,n = 0 ,3 8 3 的自相关系数由下式得到: ( 2 3 ) r ) 4 荟s 协弘协一七) , 七= 0 ,1 6 , ( 2 4 ) 自相关系数乘上滞后窗o ) ,得到6 0 h z 带宽的扩展。滞后窗的表达式为: 崎卟嘲】,i f f i l , , 1 6 , 其中,厶是扩展带宽,兀1 6 0 - z ;采样频率正- 1 2 8 0 0 h z 。另外,( 0 ) 被乘上 白噪声校正因子1 0 0 0 1 ,等同于加上一4 0d b 的背景噪声。 经修正后的自相关系数, ) 可表示成: 厂 ) = 1 0 0 0 1 r ( o ) :)冬。6( 2 6 ) 2 1 2 2l p 到i s p 的转化 l p 滤波器系数被转化为i s p 系数,用作量化与内插。由于直接量化时域的 第2 章a m r w b 语音编码器性能评价 l p 滤波器系数容易造成滤波器不稳定,在实际应用中,一般将它转化为其它域 的参数进行量化,a m r w b 语音编码器中采用线谱对参数i s p ,用i s p 表示具 有以下优点:i s p 分析以全极点模型为基础,i s p 能够反映语音的频谱特性,可 以保证由i s p 得到的声道滤波器是稳定的;可以进行分裂多阶矢量量化 ( s m s v c ) ;以平滑的频谱变化,适合用于帧之间的内插l 1 2 1 。 对于1 6 阶的凹滤波器,i s p 系数定义为下列和式( 2 7 ) 与差式( 2 8 ) 的根: 五( z ) ;彳( z ) + z 一1 6 a ( z 一1 ) ( 2 7 ) 以( z ) ;彳o ) 一z - 1 6 么( z 1 )( 2 8 ) 多项式五q ) 是对称的,而以0 ) 是反对称的。这两个多项式的所有根均在单位圆 上并且相互交替【1 3 】。厶0 ) 有两个根,z = 1 扣一o ) 与z = 一1 ;p ) 。 以下定义的多项式去除了这两个根: 五( z ) = f i ( z ) ( 2 9 ) a ( z ) = f e ( z ) ( 1 - z 。2 ) ( 2 1 0 ) 多项式 ( z ) ,2 ( z ) 在单位圆上上分别有8 对,7 对共轭根。因此,多项式可 以写作: e ( z ) = ( 1 + 口【1 6 】) 丌( 1 2 q , z 。1 + z 。2 ) ( 2 1 1 ) i - q :1 4 e ( z ) ( 1 一口 1 6 】) ;且,( 1 一z 以仃2 ) ( 2 1 2 ) 其中,呸指余弦域的i s p 系数,吼- c o s ( q ) ,o o i 是线谱频率,a 1 6 】是最后一个 预测参数。q 满足o o h c a 2 o h 6 。具体过程是: 通过公式( 2 1 1 ) 与( 2 1 2 ) 计算e q ) ,互q ) ,从而确定量化与内插的i s p 1 0 第2 章a m r - w b 语音编码器性能评价 呸,f 一0 9o o o ,m - 1 ,m = 1 6 。计算五( z ) 的递推关系式如下: f o r f 一2 t o m 2 f l ( i ) t - 2 q 盈一:五( f 一1 ) + 2 f l ( f 一2 ) f o rj i - 1 d o w n t o2 五( j ) = f 。( j ) - 2 q 甜一:矗( ,一1 ) + 五( j - 2 ) e n d 月( 1 ) = 五( 1 ) - 2 q :m e n d 初始值五( 0 ) 一1 ,五( 1 ) t 一2 吼。系数厶g ) 的计算方法类似,用q n 4 替换一:, 用m 2 - 1 替换m 2 ,初始值设为厶( 0 ) - i , a ( 1 ) 一一2 儡。 一旦计算得到系数五( z ) ,a ( z ) ,将e ( z ) 乘上1 一z 。2z 。i : ( z ) ,即: 厂2 0 ? 2 厂2 ( f ) 一厂2 0 一2 ) , = 2 ,”2 1 ( 2 1 6 ) o ) = 五o ) f = 0 ,m 2 、。 接着,e ( z ) 与砭( z ) 分别乘上1 + - l 、1 一吼- l ,即: 正“) ,( 1 - 一,) 丘( f ) , i 一0 ,m 2 1 , o ) 一( 1 + 一。) 。u ) i 一0 ,m 2 最后,根据公式( 2 1 7 ) 计算得到l p 系数: a f o 5 。o ) + o 5 疋u ) , i 一1 ,m 2 - 1 , 0 5 f 1 ( i ) - 0 5 ,2 0 ) ,f = 肌2 + 1 ,肌一1 ( 2 1 7 ) 0 5 f , 。佃2 ) , i ;m 2 , 1 f m 以上

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论