(通信与信息系统专业论文)自适应多速率语音编码在tdscdma系统中应用的研究.pdf_第1页
(通信与信息系统专业论文)自适应多速率语音编码在tdscdma系统中应用的研究.pdf_第2页
(通信与信息系统专业论文)自适应多速率语音编码在tdscdma系统中应用的研究.pdf_第3页
(通信与信息系统专业论文)自适应多速率语音编码在tdscdma系统中应用的研究.pdf_第4页
(通信与信息系统专业论文)自适应多速率语音编码在tdscdma系统中应用的研究.pdf_第5页
已阅读5页,还剩49页未读 继续免费阅读

(通信与信息系统专业论文)自适应多速率语音编码在tdscdma系统中应用的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

自适应多速率语音编码 在t d s c d m a 系统中应用的研究 摘要 自适应多速率( a m ra d a p t i v em u l t ir a t e ) 语音编码是由3 g p p ( 3 州 g e n e r a t i o np a r t n e r s h i pp r o j e c t ) 制定的应用于第三代移动通信w c d m a 系统中的语音压缩编码。t d s c d m a ( t i m ed i v i s i o n s y n c h r o n o u sc o d e d i v i s i o nm u l t i p l ea c c e s s ,时分同步的码分多址技术) ,是由中国无线通 信标准化组织( c w t s ) 提出,并得到国际电信联盟( i t u ) 通过的3 g 无线通信标准。 自适应多速率语音编码能以更加智能的方式解决信源和信道编码的 速率分配问题,使得无线资源的配置和利用更加灵活和高效。将自适应 多速率语音编码应用到t d s c d m a 系统中,不仅可以提供更高语音质 量语音服务而且可以更好的利用t d s c d m a 系统的资源。本文主要对 自适应多速率的系统应用方案进行研究。我们采用测量m e l 倒谱间距 ( m e l c e p s t r a ld i s t a n c e ) 的方法对自适应多速率语音编码各速率语音 编码的性能进行了分析。为了制定速率切换策略,我们以载干比为门限 对这八种速率进行了分类。最后我们根据t d s c d m a 系统的特点提出 了在t d s c d m a 中应用自适应多速率语音编码的系统结构,与 w c d m a 中的自适应多速率语音编码结构相比较,该结构简化了移动终 端的速率选择模块,降低了移动终端的计算复杂度,减小了语音的传输 时延,具有很高的实用价值。 关键字:自适应多速率语音编码时分同步的码分多址技术m e l 倒 谱间距源速率控制 t h er e s e a r c ho fu s i n ga d a p t i v em u l 月i r a t e s p e e c hc o d e ci nt d s c d m as y s t e m a b s t r a c t a d a p t i v em u l t ir a t e ( a m r ) s p e e c hc o d e c ,w h i c hi sp u b l i s h e db y 3 g p p ( 3 阳g e n e r a t i o np a r t n e r s h i pp r o j e c t ) ,i su s e df o rs p e e c hc o m p r e s s i n g c o d i n gi nt h ew - c d m as y s t e mo ft h e3 加g e n e r a t i o nm o b i l ec o m m u n i c a t i o n t d s c d m a ( t i m ed i v i s i o n s y n c h r o n o u sc o d ed i v i s i o nm u l t i p l ea c c e s s ) , w h i c hi s p r o p o s e db yc 、r r s h a s b e e np a s s e da st h e3 gw i r e l e s s c o m m u n i c a t i o ns t a n d a r db yi t u a m r s p e e c hc o d e cc a ng i v eap o w e r f u la s s i g n m e n ts t r a t e g yf o rt h e s i g n a la n dc h a n n e lc o d e cs p e e ds e r v i c e s , w h i c hc a nu s et h ew i r e l e s sr e s o u r c e m o r ef l e x i b l ya n de f f e c t i v e l y u s i n ga m rs p e e c hc o d e ci nt d s c d m a s y s t e mw i l lg i v et h e b e t t e rs p e e c hs e r v i c ea n dm o r ee f f e c t i v e l yt ou s et h e t d s c d m ar e s o u r c e t h i sp a p e rw i l lf o c u so nh o wt ou s ea m ri n t d s c d m as y s t e m w ef i r s tu s em c d ( m e l c e p s t r a ld i s t a n c e ) a n a l y s e e a c hm o d eo fa m r s p e e c hc o d e c t od e s i g nt h es p e e ds w i t c h i n gs t r a t e g y , w ec l a s s i f i e dt h ee i g h ts p e e c hm o d e sa st h r e ec l a s s e s a tl a s tw ep r o p o s e d t h ea m rs t m c t u r ea c c o r d i n gt ot h ef e a t u r e so ft d s c d m as y s t e m c o m p a r et ot h ea m ri nw c d m as y s t e m ,t h i ss t r u c t u r es i m p l i f i e dt h e t e r m i n i a l ss p e e d - s e l e c t i n gm o d u l e ,w h i c hw i l lr e d u c et h ec o m p l e x i t yo ft h e a l g o r i t h ma n dt h et i m ed e l a yo ft h es p e e c h k e yw o r d s :a m r s p e e c h c o d e c m e l - c e p s t r a l d i s t a n c e t d s c d m as c r 6 5 总结z 炻 参考文献一4 7 附j 灵4 9 缩略语一4 9 致谢! ;( ) 发表的学术论文目录错误! 未定义书签。 a 口 口 a 一1 a r a 仃 t r a c e ( a ) i 1 1 i i i i e 符号说明 文中没有特别说明,粗体字母表示矩阵 带横箭头的字母表示行向量 带尖帽的字母表示估计值 表示矩阵a 的逆矩阵 表示矩阵a 的转置 表示矩阵a 的共轭转置 矩阵a 的迹 n 阶单位矩阵 矩阵的行列式、实数的绝对值、复数的模 向量或矩阵的2 范数 随即变量的数学期望 独创性( 或创新性) 声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成 果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机 构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 中请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名:区叠基 日期:z 宝:堡壶 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研 究牛在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并 向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学 校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制于段 保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论文 注释:本学位论文不属于保密范围,适用本授权书。 本人签名:墨筮挞 日期:玉逝:丝芝 导师签名:囊与咨乌卜 日期:坌q 垒& 二望二鱼一 1 1 概述 第一章语音编码概述 语言是人类进行交流的重要手段,通信系统中最常见的数据形式就是语音,语 音通信是人类通信最基本、最重要的方式之一。随着移动通信与互联网的飞速发展, 语音通信技术也在不断地进行更新并与之相融合。语音信号的数字化传输和存储, 在可靠性、抗干扰能力、快速交换等方面远胜于模拟化,且灵活方便,易于保密, 价格低廉,所以从2 0 世纪5 0 年代以来,数字化语音在通信系统中所占的比重越来 越大。数字语音通信是当前信息产业中发展最快、普及面最广的业务。i p 电话的持 续发展,使国内长途电话和国际长途电话大l 陌度下降,广大人民受益。移动通信数 字化,扩展了信道容量,改善了服务质量,促进了这一产业的发展。 通信系统都是围绕着通信传输的数量与质量两个类型的三种指标( 有效性、可靠 性和安全性) 进行不断优化的。有效性是指占用尽可能少的信道资源( 如频段、时隙 和功率) 传送尽可能多的信源信息,它是通信的数量指标;可靠性主要是指在传输中 抵抗各类客观自然干扰的能力,但是在军事通信中它也包含电子对抗;安全性则指 的是传输中的安全保密性能,即收端防窃听、发端防伪造和篡改的能力等。移动通 信中的各类新技术,都是以解决移动通信中的有效性、可靠性和安全性为目标而设 计的。 在无线通信中有效性的要求显得非常突出,这是由于无线信道的频率资源是有 限的。提高移动通信的有效性主要通过改进信源( 语音) 编码技术来完成。近年来, 通信系统发展迅速,随着移动通信的发展,尤其是第三代移动通信的发展,对语音 压缩编码算法提出了更高的要求,不但要求编码码率较低以增加系统容量,而且要 求合成音质较高以保证通话质量。用传统的编码方式,很难同时满足这两个要求。 在这种形势下,人们提出了变速率语音压缩编码的方法。在移动通信系统中采用变 速率语音压缩编码,可以根据需要动态调整编码速率,在合成语音质量和系统容量 中取得灵活的折衷,最大限度地发挥系统的效能。 在当前应用广泛、前景广阔的码分多址( c d m a ) 移动通信系统中,采用的变速率 语音编码算法对于系统的容量和通话质量有非常重要的影响。由于移动通信市场竞 争异常激烈,因此对变速率语音编码的研究成为一个热点。近几年来,变速率语音 编码技术发展得很迅速,并不断有新的国家标准和国际标准公布。随着技术的成熟, 它的应用领域也越来越广阔,不仅限于移动通信系统,在i p 电话、互联网等方面也 有很好的应用前景。 1 2 变速率语音编码的发展现状 移动通信系统从第一代发展到第二代,包含了从模拟语音信道到数字语音信道 的转变,用数字化方法研究语音处理技术,使人们能更加有效地产牛、传输、存储 和获取语言信息,这对于促进社会的发展具有十分重要的意义。作为语音数字化处 理的一个重要分支,数字语音编码技术得到了长足发展。随着通信技术的高速发展, 频率资源变得更加宝贵,语音编码技术可以压缩语音信号的传输带宽,增加通信系 统的容量。 实际上,语音信号存在着大量冗余,如信息兀余、时问兀余、谱间冗余、听觉 冗余和知识r 几余等,采用各种语音编码技术的目的就是为了去除语音信号的冗余度, 压缩原始语音数据,合成出可懂度和自然度较好的语音。 第二代移动通信系统的特点之一就是采用变速葺爱语音编码技术。变速率编码算 法的过一步研究,其算法符合声音的特性,适配分组交换网络,在第三代移动通信 系统中具有很好的发展前景。当然,变速率语音编码的传统应用还包括语音存储、 分组应用和用于数字电路倍增设备( d c m e ) 的数字话音插空( d s l ) 。近年来,它在无 线通信的多址系统中应屏得越来越广泛。例如,在e - - t d m a ( e x t e n d e d - - t i m e d i v i s i o nm u l t i p l ea c c e s s ) 、p r m a ( p a c k e tr e s e r v a t i o nm u l t i p l ea c c e s s ) 和 c d m a ( c o d ed i v i s i o nm u l t i p l ea c c e s s ) 中都用到了变速率语音编码。 语音编码技术在国际标准化工作中可称为最活跃的领域之一。2 0 世纪9 0 年代,c d m a 移动通信系统的飞速发展,及其对语音编码技术的进一步要求,把变 速率语音编码技术推上了前台。各种通信组织相继推出了不同的变速率语音编码技 术标准,主要包括q c e l p 、e v r c 、a m r 、 m i 卜- w b 和s m v 五种算法标准。 1 3 变速率语音编码的速率控制方式 变速率语音编码通常采用的速率控制丰要有三种方式:源控制、信道控制和网 络控制。 源控制变速牢语音编码就是根据语音源的卢道( 短时) 特性,以一定形式动态分 配比特数。典型的源控制变速率编码器采用了话音激活技术。在一般的电话通信中, 每帧信号中的信息量是不同的。当通话一方没有说话时,信号帧就只包含背景噪声, 当他说话时,也会有些帧只发清音,这就只需用较低的速率来进行编码,而对激活 话音部分用较高的速率进行编码。 根据信道的质量来改变每帧语音信号的编码速率,叫做信道控制。在坏的信道 条件( 深衰落) 下,信道编码中的冗余比特数不足以纠正传输错误,这时应提高信道 编码速率( 增加冗余比特数) 而减小语音编码速率来保障通话质量;相反,在好的信 道条件下,应增加语音编码速率来提高语音质量。 变速率语音编码还可用于解决蜂窝移动系统中的网络拥塞问题,即网络控制。 通过改变每个用户可用的平均比特率,网络可以在容量和通话质量中取得较好的折 衷。这样的网络可以在大部分时间提供很好的语音质量,在高峰时段又可为大量的 用户提供可以接受的通话质量。 在现有的变速率语音编码算法中,q c e l p 和e v r c 两种算法属于源控制变速率语 音编码,而a m r 和s m v 两种算法则属于源控制和信道控制相结合的变速率语音编码。 1 4 语音编码的性能评价方法 语音编码的根本目标就是在尽可能低的编码速率条件下,重建得到尽可能高的 语音合成质量,同时还应尽量减小编解码延时和算法复杂度。一因此编码速率、合成 语音质量、编解码延时以及算法复杂度这四个因素自然就成了评价之个语音编码算 法性能的基本指标,这四个因素之间有着密切的联系,在具体评价一种语音编码算 法的优劣时,需要根据具体的实际情况,综合考虑四个因素进行性能评价。 编码速率直接反映了语音编码对语音信息的压缩程度。编码速率可以用“比特 秒”( b s ) 来度量,它代表编码的总速率;也可以用“比特样点”( b p ) 来度量,它 代表平均每个语音样点编码时所用的比特数。 在变速率语音编码中,一般采用平均编码速率( a d r ,a v e r a g ed a t ar a t e ) 来评 价语音编码的速牢( 理论依据是t i a e i a i s 一7 1 8 协议) 。 合成语音质量可以说是语音编码性能的最根本指标。评价合成语音质量的方法 很多,多年来人们提出的许多方法归纳起来可以分为两类:主观评价方法和客观评 价方法。 1 ) 主观评价方法 主观评价方法是在一组测试者对原始语音和合成语音进行对比试听的基础上, 根据,某种预先约定的尺度来对失真语音划分质量等级,它比较全面地反映了人们 听音时对合成语音质量的感觉。常用的丰观评价方法有二种:平均意见得分( m o s , m e a no p i n i o ns c o r e ) 、判断韵字测试( d r t ,d i a g n o s t i cr h y m et e s t ) 和判断满意度 测量( d a m ,d i a g n o s t i ca c c e p t a b i l i t ym e a s u r e ) 。目前,国际上最通用的丰观评价 方法是m o s 评分,它采用五级评分标准,由数十名试听者在相同信道环境中试听合 成语音并给予评分,然后对评分进行统计处理,求出平均得分。m o s 评分等级如表1 所示。 在数字语音通信中,通常认为m o s 评分在4 0 _ 4 5 分时为高质量数字化语音, 达到长途电话网的质量要求,接近于透明信道编码,也常称之为网络质量。m o s 评 分在3 5 分左右时称作通信质量,这时能感到重建话音质量有所下降,但不妨碍正 常通话,可以满足多数话音系统的使用要求。m o s 评分在3 0 分以下时常称作合成 语音质量,这是指一些声码器合成的语音所能达到的质量,它一般具有足够高的可 懂度,但自然度及讲话人的确认等方面不够好。 虽然丰观评价方法符合人类听话时对语音质量的感觉,但由于其测试结果的获 得依赖于测听者个人的丰观感受,因此为了减少个人反应的随意性和不可重复性, 一般对测试所用的设备、数据、测试条件及测试人员都有严格的要求,并有繁琐的 测听程序规定,非常消耗时间、人力和费用,而且即便如此,测试结果仍然存在着 一定的不可重复性,完全相同测试条件下重复测试结果也会有一定的随机波动。所 以主观评价方法一般由较大的通信组织来完成,个人很少采用。 表1m o s 评分等级 m o s 评分质量等级 收听注意力等级 5 优可完全放松,不需要注意力 4 良需要注意,但不需明显集中注意力 3 满意( 正常)中等程度的注意力 2差需要集中注意力 l 劣 即使努力玄听,也很难听懂 2 ) 客观评价方法 客观评价方法建立在原始语音和合成语音的数学对比之上,常用的方法可分为 时域客观评价和频域客观评价两大类。时域客观评价常用的方法有信噪比、加权信 噪比和平均分段信噪比等;频域客观评价常用的方法有巴克谱失真测度( b s d ,b a r k s p e c t r a ld i s t o r t i o n ) 和m e l 谱测度等。这些评价方法的特点是计算简单、结果客 - 4 - 观、不受个人主观因素的影响,但其缺陷也很明显,就是不能完全反映人类对语音 的听觉效果。虽然如平均分段信噪比、巴克谱失真测度等考虑了人耳的多种听觉特 性,并做了相应的加权校正,在评价速率较高的波形编码算法时和入的丰观感觉比 较符合,t u 在参数编码算法和混合编码算法的评价中仍然存在着上述问题。因此人 们提出了改进的巴克谱失真测度( 衄s d ,m o d i f i e db a r ks p e c t r a ld i s t o r t i o n ) 来对 合成语音质量进行客观评价。m b s d 基于入耳的听觉掩蔽效应,更好地表征了人耳对 语音的感知,它与m o s 评分有很高程度的相关性,因此得到了广泛应用。 1 5 变速率语音编码的发展方向 随着移动通信的飞速发展,用变速率语音编码来提高频带的有效利用程度,将 是未来数字蜂窝和微蜂窝网的必然发展趋势,为了获得更加实用的变速率算法,在 将来的通信系统中,除了前面介绍的三种方式以外,由用户控制也是可能的,也就 是说,用户可能选择平均比特率来控制通话的质量。这样的控制允许用户限制移动 传输的功率,这会增加误码率和所需的前向纠错的程度,因此就必须减少用作语音 编码的比特数。当然,将来的通信系统也可能综合考虑几种控制方式的有机结合, 使系统更好地发挥作用,用户更加满意,从而增强竞争力。但由于通信系统的复杂 性,这不是一个简单的问题,需要从多方面进行考虑。 未来变速率语音压缩技术的研究也将在所采用的基础语音编码技术上做更多的 工作,主要体现在以下两个方面: 1 ) 对速率判决和控制的进一步改进 通过对速率判决算法的改进提高编码的效率。把更精确的话音检测技术应用到 速率判决算法中来,使速率判决更符合语音信号的特性,从而进一步降低编码速率 或者提高合成语音质量。对通信系统本身也可以做进一步研究,速率控制机制也可 以进一步改进,更多地考虑用户的需要和信道的实际情况,使速率控制更加灵活、 有效。 2 ) 与新的低速率语音编码技术的结合 近年来又出现了很多新的低速率语音编码方案。人们可以对低速率语音编码作 进一步研究,并与变速率语音编码相结合,以获得更低的平均编码速率,或者采用 其中的一些技术,用来提高合成语音的质量。 2 1 概述 第二章a m r 编解码算法原理 自适应多速率( a m r ,a d a p t i r em u l t ir a t e ) 语音编码是由3 g p p ( 3 r dg e n e r a t i o n p a r t n e r s h i pp r o j e c t ) 制定的应用于第三代移动通信w c d 姒系统中的语音压缩编 码 1 ,2 。它以更加智能的方式解决信源和信道编码的速率分配问题,使得无线资 源的配置和利用更加灵活和高效。它支持八种速率:1 2 2 k b s ,1 0 2k b s ,7 9 5 k b s ,7 4k b s ,6 7 0k b s ,5 9 0k b s ,5 1 5k b s 和4 7 5k b s ,此外,它还包括低 速率的( 1 8 0k b s ) 背景噪声编码模式,如表2 : 表2a m r 语音编码器的信源编码速卒表 编码模式信源编码速率 a m r4 7 54 7 5k b s a m r5 1 55 1 5k b s a m r5 9 05 9 0k b s a m r6 7 06 7 0k b s a m r7 4 07 4 0k b s a m r7 9 57 9 5k b s a m r1 0 21 0 2k b s a i r 一1 2 。2 1 2 2k b s a m rs i d1 8 0k b s 实际的语音编码的速率取决于信道的条件,与现在的g s m 语音编码采用固定的 编码速率相比,a m r 语音编码则可根据无线信道和传输状况来自适应地选择一种最 佳信道模式( 全速率或半速率) 和编码模式( 以比特率来区分) 进行编码传输。 在上下行链路中,语音数据帧都是和语音编码模式以及建议( 或命令) 的下一 帧语音编码模式指示一起传送的。在基站( b s ) 端,语音编码模式指示必须传送给 代码转换单元( t r a u ) ,以便选择正确的信源译码。为了得到上行语音编码模式的命 令,基站必须估计当前信道的质量,指示在当前传播环境中应采用的最佳语音编码 模式,并通过空中接口将此命令传送给移动台( m s ) ;为了得到下行语音编码模式命 令,移动台需要估计下行链路信道质量,并将此质量信息传送给基站,基站就会发 出“建议”下行语音编码模式指示。 g s i 蚺0 6 8 2 a m rg s 拟。8 1 m r 基站子系统g s m0 6 加a m r 草 厂、 v r nj 网t o v a d 不连 厂、l 擦 _ _ 一 v 7 刨 u n ;咖i 土 续发 送控 丫 7 千譬 - d 制和 一攮作 j 才惝6 2 圳r 发送端 嘬声h 5 卜一 _ 发射函鼓l s l d 唆 c a ) h m r 语音编码器发送端框图 g s m 0 5 8 1 一 恨g s 6 1a m r i 语音帧l 警擅i 一 l 指示 i 卧 7 k 型u 不蓬 il 1 一e 心 r 簟爱 送控 一厂:、j 。i 、 制和 语音帧l , 撮作 g s m0 6 6 2 a m r i。 噜莅 接收曩 s 1 0 ( b ) 棚r 语音编码器接收端框图 图la m r 语音编译码部分的对外接口和原理框图 ( a ) ( b ) 在图中,是8 比特a 率或u 律p c m ( i t u t g 7 1 1 ) ,采样率为8 k h z ;是1 3 比特均匀p c m ,采样率为8 k l t z ;是话音激活检测( v a d ) 标志;是编码后的语音 帧,帧长为2 0 m s ,每帧中的比特数取决于a m r 编码的模式;是静音描述( s i d ) 帧;是发送指示,用2 比特来表示发送的是语音还是静音信息,指示如果是语音, 则信息比特有效,否则是静音信息;是传给3 g 输入网( a n ) 的信息比特;是从 3 g 接入网接收的信息比特;是接收帧类型指示,用3 比特来表示相应接收到的帧 的编码速率;是接收的静音描述;1l 是终端自适应函数。 编码器输入端的8 比特a 律或p 律的压缩数据需要转换成1 3 比特( 只取1 6 比 特的高1 3 比特,后3 比特补o 以便成为一个整字) 线性数据。i t u t g 7 1 1 给出了 如何进行a 律或p 律的压缩数据到线性数据的转换过程。 信源控制速率( s c r ,s o u r c ec o n t r o l l e dr a t e ) 操作考虑到语音信号不激活的 情况,允许以较低的速率对输入的语音信号进行编码,这样可以节省移动台的功率, 降低整个网络的干扰和负载 7 3 。s c r 的功能包括在发送端进行话音激活检测,在发 射端对背景噪声进行估计,并将有关特征参数传送给接收机,以便接受端根据这些 特征参数在不发送语音帧期间重构与发射端类似的背景噪声。 v a d ( v o i c ea c t i v ed e t e c t o r ) 的输入是输入语音本身和自适应多速率语音编 码器计算出来的参数集,v a d 用这些信息来决定每2 0 m s 的语音帧中是否包含语音 8 。 在语音同通信中,人们大约有7 0 左右的空闲没有讲话。在s c r 方式中,一个 基本问题就是噪声问题,噪卢和语音信号一起被传输,当没有语音时,它就不被传 输,这就导致了背景噪声的不连续,会使收听的人感觉不舒服,在强背景噪卢的情 况下这种感觉尤为明显。克服这个问题的方法就是在接受端重构与发射端类似的背 景噪声,因此,需要在发射端对背景噪声进行估计,并将其特征参数用s i d 传送到 接受端,s i d 帧中有关背景噪声参数被编码,接收端对s i d 帧进行译码,然后就在 没有正常语音期间产生舒适背景噪声 6 。 在无线通信环境中,语音帧可能会在传输过程中出现差错而无法在接收端正常 合成语音,为了不使听的人感觉到语音丢失,应告诉语音译码器进行差错隐藏,即 用没有差错的语音帧的参数集来进行合成。当出现连续差错帧导致参数无法恢复时, 就要采用减弱声音的技术让听得人知道传输被中断了 5 。 第三代移动通信系统中的a m r 语音编码是为了让容错度随无线信道和传输环境 的改变而改变,因此人们称之为自适应。 a m r 语音编解码器可以对语音信号进行八种速率编解码,它是基于代数码激励 线性预测( a c e l p ) 的编码方式,编码器输入为8 k l l z 采样,1 6 比特量化的线性p c m 编码,编码操作以2 0 m s 语音为一帧,即1 6 0 个样点。发送端编码器提取a c e l p 模型 参数( 线性预测系数,自适应和固定码本索引及增益) 进行传输,接收端译码器再 根据这些参数构成的激励信号合成出重建的语音信号。下面将详细介绍a m r 语音编 解码原理。 8 2 2a m r 语音编码 a m r 语音编码采用的方案是代数码本激励性预测技术,它是基于码本激励线性 预测技术。a m r 语音编码根据其实现功能可大致分为l p c 分析、基音搜索、代数码 本搜索二大部分。其中l p c 分析完成的丰要功能是获得1 0 阶l p c 滤波器的1 0 个系 数,并将他们转化为线谱对参数l s f ,以及对l s f 进行量化;基因搜索包括了开环 基因分析和闭环基因分析两部分,以获得基因延迟和基音增益这两个参数;代数码 本搜索则是为了获得代数码本索引和代数码本增益,还包括了对码本增益的量化。 a m r 编码器的信号流程如图: 图2a m r 编码器的信号流程图 a m r 语音编码器的功能包括九大部分:预处理、现行预测分析和量化、开环基 音分析、脉冲相应的计算、甘标相应的计算、自适应码本搜索和增益控制、代数码 本的结构和搜索、自适应码本增益和固定码本的量化、修改存储器。下面对各个部 分进行详细介绍。 2 2 1 预处理 编码器在编码之前将对输入信号进行两个预处理:高通滤波和信号降i 幅。 对信号的降幅是将输入信号的幅度减小一半,以此来避免在做定点运算时数据 溢出。 高通滤波器用来滤除不需要的低频成分。在这里采用一个截止频率为8 0 h z 的滤 波器,由下式给出: 月j(z):0927246093-18544了941z-1+0927246。903z-zhi 式( 2 1 ) ,tl7 i 暑一 nl ,- ij 、7 1 1 9 0 6 0 0 5 8 5 9 2 1 + 0 9 11 3 7 6 9 5 3 z - z 2 2 2 线性预测( l p ) 分析及量化 吲炉仁二蔫i :, 加埘 叫芎群,i 麓 加训 f r a m en 1 ram备e16 0s a m p l e s 怠s , f () ? 竺”翻黑 图3l p 分析窗 f r a m e n 经过加窗处理后的语音信号s ( 1 1 ) ,n = o ,o o b o oo 92 3 9 ,用来计算自相关系数: k ( 露) - s 。( 以b ( n - k ) ,露- o ,1 0 式( 2 4 ) 然后用下式中的窗函数对求得的自相关系数进行6 0 h z 的带宽展宽: 心唧h 矧卜p m ( 2 - 5 ) 其中i o = 6 0 t z 为带宽展宽幅度,六= 8 0 0 0 - z 是输入信号的采样频率。最后, k 【o ) 需要乘以一个白噪声修正因子1 0 0 0 1 ,相当于加上一个幅度为一4 0 d b 的噪声 阶。 ( 2 ) 1 0 2 ,7 9 5 ,7 4 0 ,6 7 0 ,5 9 0 ,5 1 5 ,4 7 5 k b i t s 模式 编码器在除了1 2 2 k b i t f s 之外的其他速率模式时,对信号的l p 分析每帧只进 行一次,除了当前帧和前一帧之外,还引入了后一帧的4 0 个样点( 5 m s ) 的提前量。 使用的窗函数由两部分组成:一个二分之一汉明窗和一个四分之一余弦窗,着重于第 四了帧,其表达式与1 2 2 k b i t s 模式时的第二个窗函数相同,只是参数为h = 2 0 0 , k :4 0 接下来的求自相关系数和带宽展宽及白噪声修正过程与1 2 2 k b i t s 模式时相 同。 2 莱文森德宾算法 莱文森德宾算法对所有速率模式均相同。 得到经过修正的自相关系数k i ( 0 ) l1 0 0 0 也。( 0 ) 和乞c 耻) 2k ) ) , k = l ,1 0 ,通过求解下式来计算l p 滤波器系数的直接形式: 酗厂:c 卜厂乙= 卜”,1 0 式( 2 - 6 ) 3 l p 与l s p 的转换 经莱文森德宾算法得出了l p 滤波器系数,而l p 系数的微小变化,会引起合成 滤波器极点位置的极大变化,甚至造成不稳定现象,影响编解码性能。因此将” 系数转换成线谱对( l i n e a rs p e c t r a lp a i r ) 的表示方式,用来进行量化和插值。l p 域和l s p 域的转换对所有速率模式相同。 3 。1l p 到l s p 的转换 对于一个全极点的1 0 阶l p 滤波器,逆滤波器定义为: et ( z ) = 彳( z ) + z 一1 1 a ( z 一1 ) 式( 2 7 ) e i ( z ) = a ( z ) - z 1 1 a ( z d ) 式( 2 8 ) 则以上两个和差多项式的根称为线谱对( l s p ) 频率,其余弦值即为l s p 系数。多 项式f ,( z ) 和f ,( ) 为对称和反对称的,并可以证明具有以下两个特性: 1 ) 这两个多项式的根部位于单位圆上 2 ) 两个多项式的根在单位圆上相瓦交错 并且多项式ek ) 和ek ) 分别有根:z 一一1 ( w 石) 和z = 1 = 0 ) 。 个根定义新的多项式: e ( z ) = 互- ( z ) ( 1 + z 1 ) f 2 ( z ) = 最( z ) ( 1 + z 一1 ) 为避免这两 式( 2 - 9 ) 式( 2 - 1 0 ) 每个多项式在单位圆上面有5 个共扼根,因此,多项式可以写成下面的形式: e ( z ) ,丌0 一z 。1 + z 2 ) 式( 2 1 1 ) f - 0 0 ,9 e ( z ) - 兀0 - 2 q , z 1 + z 之) 式( 2 一1 2 ) f 一2 勺声j 0 其中,吼2 c o s 【雌j ,m 为线谱频率( l s f ) ,q i 为余弦域的线谱对参数( l s p ) ,并 且满足0 m o 石。 由于多项式e ( z ) 和f 2 ( z ) 的对称性,因此每个多项式只需要计算前5 个参数。 这些参数满足以下递推关系( i = 0t o4 ) : 厂l “+ 1 ) ,q “+ 口。1 一万“) 式( 2 1 3 ) 厂2 a + 1 ) f f i = a j + l 一口。一1 + 厶“) 式( 2 1 4 ) 其中,m = 1 0 为预测器阶数。 在寻找线谱对参数时,我们将0 到兀的区间平均分成6 0 个点,在这些点上对多 项式e q ) 和e ( z ) 进行求解并找出其符号翻转区域每一个符号翻转区标志着一个 根的存在,然后再将这个区域细分为4 个点对根进行逼近。我们使用切比雪大多项 式来对多项式0 ) 和最q ) 进行求解,这样在余弦域就能够直接得到根 吼 。 令z t p 如,则f ( 叻一2 e - j s 弋( 石) ,其中: c 似) ;瓦o ) + f ( 1 ) t 4 0 ) + f ( 2 ) t 3 0 ) + f ( 3 ) t 2 0 ) + 厂( 4 ) 五0 ) + f ( 5 ) 2 , 式( 2 1 5 ) 其中,乙扛) = c o s ( m w ) :是m 阶切比雪大多项式,而f ( i ) ,i = l ,5 是多项式巧( z ) 或也【z j 的系数,多项式c ( x ) 可以用递推法求得: f o rk = 4d o w nt o1 入t ;2 x x i + j - x i + 2 + i ( s - k ) e n d c ( x ) - x x l 一入2 + f ( 5 ) 2 其中,x c o s ( w ) ,初始条件为x 5 = 1 和x 6 = 0 。 3 2l s p 到l p 的转换 当线谱对( l s p ) 参数的量化和插值完成后,需要将它们重新变换到l p 系数域 。 得到量化和插值后的线谱对参数4 后,对式( 2 - 1 4 ) 和式( 2 - 1 5 ) 进行扩展得到多 项式e ( z ) 和e ( z ) 的系数,用以下递推关系来计算五o ) f o ri = lt o5 五( f ) 一一2 畅一。 g - 1 ) + 2 f , q - 2 ) f o rj :i 一1d o w nt o1 ( ) t ( ) 一2 q 压一。五( j 一1 ) + ( j 一2 ) e n d e n d 初始条件为五( o ) = 1 和五( 一1 ) = 0 。计算a ( o 的方法相同, 中的锄一,替换为q 复,旦找到 “) 和厂2 0 ) 后,可以得到: u ) = o ) + ( f - i ) ,f - i , ,5 厶( f ) ;,2 “) 一厶g 一1 ) ,f = 1 ,5 最后,通过下式求得l p 系数: f 0 5 f 。t ( f ) + o 5 五l ( f ) ,f = 1 ,5 l o 5 ( 1 1 - i ) - 0 5 厂2 ( 1 1 - i ) ,f = 6 ,1 0 只是将以上递推关系 式( 2 - 1 6 ) 式( 2 - 1 7 ) 4 l s p 参数的量化 ( 1 ) 1 2 2 k b i t s 模式 在这种模式下,每一帧的两组l p 滤波器系数在频率域用l s p 的形式进行量化, 有如下关系式: := 是a r c c o s q ;, i ;1 , 2 ,1 0 式( 2 1 9 ) 己冗 其中,f , e 0 , 4 0 0 0 h z 为线谱频率( l s f ) ,正i 8 0 0 0 h z 为采样频率。因此线谱频 率矢量为f r 。【 ,2 。j ,其中t 表示矩阵转置。 首先进行1 阶移动平均( m 0 v i n ga v e r a g e ) 硕测,用z 1 ( 厅) 和z 2 ( 以) 表示第n 帧 中减去均值后的l s f 矢量,那么预测残差矢量r ( o ( 玎) 和r ( 2 ) ( 露) 可以由下式得到: r ( :5 丹22 z :5 以 一p ( ,n 2 式( 2 2 0 ) r 2 ) ( 栉) = z 圆( 以) 一p ( ,1 ) 一 其中,p ( n ) 为第n 帧的预测l s f 矢量,这里使用1 阶移动平均预测: p ( 刀) = 0 6 5 r 圆( 万一1 ) 式( 2 - 2 1 ) 其中。【尼一1 ) 为前一帧中量化后的第二个残差矢量。 接下来,对两个l s f 残差矢量r 0 ) ( 以) 和r 国( 甩) 用分裂矩阵量化( s m q ) 的方式同时 进行量化。矩阵1 1 1 j 被分裂为5 个2x2 的了矩阵,例如,第一个子矩阵含有元 素0 ,02 和矗射。这5 个子矩阵分别用7 ,8 ,8 + 1 ,8 和6 比特来进行量化, 其中8 + 1 表示第二个子矩阵量化时使用个包含2 5 6 个条目的有符号码本,8 比特 为码本索引,i 比特为符号。 在量化的过程中引入了一个加权l s p 失真度量,通常,对于一个输入的l s p 矢 量了和索引值为k 的量化矢量f ,寻找k 使下式最小: ;郭比一z m 2 其中,加权因子m ,i = 1 ,1 0 ,由下式给出: m 23 3 4 7 一塑喀f o r 盔 4 5 0 , 4 5 0 il 18一旦(4450)。therwise,1050 、 i , 其中,哦i 五+ t 一正一- ,初始条件为兀_ 0 , l 。4 0 0 0 。对于1 2 2 k b i t s 模式 的两个l s f 矢量分别计算两组加权参数,在对子矩阵进行量化时使用相应的加权参 数组。 ( 2 ) 1 0 2 7 9 5 7 4 0 6 7 0 5 9 0 ,5 1 5 4 7 5 k b i t s 模式 在这些模式下,每一帧得到的一组l p 滤波器系数在l s p 域用式( 2 - 2 2 ) 进行量化。 首先进行1 阶m a 预测,令:z 川j 表示第n 帧中减去均值后的l s f 矢量,则预测 残差矢量f ( n ) 可以由下式得到: r ( n ) 一z o ) 一p 0 ) 式( 2 2 4 ) 其中,p 婶j 为第n 帧的预测l s f 矢量,这里使用l 阶移动平均预测: p 肋) = q j r j ( n 一1 ) 式( 2 2 5 ) 其中厂,o 一1 ) 为前一帧量化后的残差矢量,而q j 为第j 个l s f 参数的预测因予。 对l s f 残差矢量r 的量化使用分裂矢量量化的方法。首先将矢量f 分裂成维度 分别为3 ,3 ,4 的3 个子矢量,然后对应不同的码率模式用7 到9 比特分别进行量 化。 在量化过程中采用式( 2 2 ) 所示的加权l s p 失真度和式( 2 3 ) 所示加权因子。 5 l s p 参数的插值 ( 1 ) 1 2 2 k b i t s 模式 在得到第二子帧和第四予帧的两组量化l p 滤波器参数后,通过插值的方法来计 算第一、第三子帧的l p 滤波器系数,这里采用了线性插值的方法,即采用前一子帧 与后一王巾贞的线谱对的均值作为当前子帧的l p 系数,捕值时使用q 域上的l s p 参数。 令q ,表示当前帧的第四予帧的l s p 矢量,q z 表示当前帧的第二子帧的l s p 矢量,吼表示前一帧的第四予帧的l s p 矢量,那么插值后的第一、第三子帧的 l s p 矢量由下式得出: 云佃。o 5 云佃4 + o 轼o i 。o 5 瓦”+ o 5 瓦加 式( 2 - 2 6 ) 插值后得到的l s p 矢量用前面所述的方法转换到l p 域,用来计算每一予帧的l p 滤波器系数( 包括量化和未量化的系数) 。 ( 2 ) 1 0 z ,。7 9 5 ,7 4 0 ,6 7 0 ,5 9 0 ,5 1 5 ,4 7 5 k b i

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论