




已阅读5页,还剩55页未读, 继续免费阅读
(信息与通信工程专业论文)itu+g7231标准的研究及其在tms320vc5509dsp上的实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
独创性声明 本人声明所呈交的学位论文是我本人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表和撰写过的研究成果,也不包含为获得国防科学技术大学或其它 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所僦的任 何贡献均已在论文中作了明确的说明并表示谢意。 学位论文题目: ! ! g ! :! ! ! :! 捶蕉煎盟壅丛甚查! ! ;! 匹 i ! ! 上盟塞塑 学位论文作者签名 垄壶 日期:) 口护2 牟月2 n ,日 学位论文版权使用授权书 本人完全了解国防科学技术大学有关保留、使用学位论文的规定。本人授权 国防科学技术大学可以保留并向国家有关部门或机构送交论文的复印件和电子 文档,允许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据 库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密学位论文在解密后适用本授权书。) 学位论文题目: ! ! 女q :! ! :! 捶壁曲盟童丞基查! 坠3 1 盟 ! ! ! 土曲塞丑 学位论文作者签名:垄盘 作者指导教师签名:銎燕些 日期:a 砂年t 月工2 ,日 日期:a 4 文年月a 文日 国防科学技术太学研究生院学位论文 摘要 为适应语音通信飞速发展的需要,国际电信联隘( i t u ) 于1 9 9 6 年3 月提出 了新一代语音压缩标准i t ug 7 2 3 1 。该标准是i t u 为低码率多媒体通信制定的 语音编码标准,它具有6 3 k b i v s 和53 k b i t s 两种编码速率,分别采用多脉冲最大 似然量化( m p m l q ) 和代数码激励线性预测a c e l p 编码算法,在两种数码率下 均取得了良好的综合话音质量,可广泛地应用于移动通信、保密通信等诸多领域。 本文在对该算法分析和研究的基础上,聚用t m s 3 2 0 v c 5 5 0 9 实时实现( 3 7 2 31 的编解码。论文的主要工作如卜: 1i t ug 7 2 31 算法的分析和研究。 2 在定点化的基础上,利用计算机高级语占对g 7 2 3 1 的编泽码算法进仃 了仿真。 3 根据高级语言仿真的结果,利用t m s 3 2 0 v c 5 5 0 9 实时实现了g 7 2 31 的编译码算法并根据t m s 3 2 0 v c 5 5 0 9 的特点,对汇编程序进行了优 化和改进。经测试,整个编译码算法的实时实现共用去2 7 9 1 m i p s 。 4 对g 7 2 3 1 对信道误码的敏感性做了基本的研究,提出了两种测试 g 7 2 3 1 比特误码敏感度的方法,即随机误码法和错误图样法,得出了 相应的结论。 【关键词】i t ug 7 2 3 1语音压缩d s p定点化t m s 3 2 0 v c 5 5 0 9 第1 页 国防科学技术大学研究生院学位论文 a b s t r a c t t om e e tt h en e e d so fr a p i dd e v e l o p m e n to fs p e e c hc o m m u n i c a t i o n ,an e ws p e e c h c o d i n gs t a n d a r di t ug 7 2 3 1w a sp r o d u c e db yt h ei n t e m a t i o n a lt e l e c o mu n i o n ( i t u 、 i nm a r c h 1 9 9 6 t h i sr e c o m m e n d a t i o ns p e c i f i e sac o d e dr e p r e s e n t a t i o nt h a tc a nb e u s e df o rc o m p r e s s i n gt h es p e e c ho ro t h e ra u d i os i g n a l c o m p o n e n to fm u l t i m e d i a s e r v i c e sa tav e r y1 0 wb i tr a t e t h i sc o d e rh a st w ob i tr a t e sa s s o c i a t e dw i t hi t , t h e s ea r e 5 3a n d6 3 k b i t s u s i n gm p m l qa n da c e l pc o d i n gt e c h n o l o g yr e s p e c t i v e l y a n d b o t ho f t h et w ob i tr a t e sa c h i e v en i c ev o i c eq u a l i t yc o m p r e h e n s i v e l y i t ug 7 2 3 1c a n b ew i d e l yu s e di nm a n ys p e c i a lf i e l d ss u c ha sm o b i l ec o m m u n i c a t i o na n de n c r y p t i o n c o m m u n i c a t i o n ,e t c t h ec h i pt m $ 3 2 0 v c 5 5 0 9j ss e l e c t e dt oi m p l e m e n tt h i sc o d c r , b a s e do na n a l y z i n ga n ds t u d y i n gt h ea l g o r i t h mo fg 7 2 31 d u r i n gt h ec o u r s eo f c o m p l e t i n gt h i sp a p e r , t h ef o l l o w i n gw o r kh a sb e e nd o n e : f i r s t l y ,m a n ye f f o r t sh a v eb e e nm a d eo ns t u d y i n go ft h ea l g o r i t h mo fi7 i 、u g 7 2 3 1 s c c o n d l y ,t h es i m u l a t i o no ft h ec o d i n ga n dd e c o d i n ga l g o r i t h mo fg7 2 3 1a r e c o n d u c t e d ,b a s e do nt h ef i x e d p o i n tp r o g r a m m i n g t h i r d l y , o nt h eb a s i so fh i g h l e v e ll a n g u a g es i m u l a t i o n ,t h ea l g o r i t h mo f g 7 2 3 1i si m p l e m e n t e du s i n gt h ef i x e d p o i n td s p c h i pt m s 3 2 0 v c 5 5 0 9 m e a n w h i l e v e e o p t i m i z e t h ea s s e m b l e p r o g r a m ,t a k i n g t h e a d v a n t a g eo ff e a t u r e s o f t m $ 3 2 0 v c 5 5 0 9 at o t a l2 7 9 1 m i p si sc o m s u m e dt oi m p l e m e n tt h ea l g o r i t h mo f g 7 2 3 1 a tl a s t ,s t u d yo ft h es e n s i t i v i t yo fg 7 2 3lt oc h a n n e le r r o r si sp e r f o r m e d a n dt w o m e t h o d so ft e s t i n gt h es e n s i t i v i t yo ft h eb i tc o d ee r r o ro fg 7 2 3 1a r ei n t r o d u c e d s o m e c o n c l u s i o n sa r ed r a w n f i n a l l y , s o m ew a y so nr e s i s t i n gc h a n n e le r r o r sa r ea p p r o a c h e d k e yw o r d i t ug 7 2 3 1 :s p e e c hc o m p r e s s i o n ;d s p ;f i x e d - p o i n tp r o g r a m m i n g t m $ 3 2 0 v c 5 5 0 9 第1 i 页 国防科学技术大学研究生院学位论文 第一章绪论 1 1语音压缩编码技术的进展和应用 人类进入信息社会以后,信息的流通量与f 1 俱增。通信作为信息交流的一 种重要手段,从古至今,以至于人类的各种活动息息相关,随着火量通信业务的 不断涌现和人类对通信业务需求的飞速增长,频带资源同益紧张和宝贵。为此, 人们方面致力于寻找新的通信煤体以提高通信容量,缓和频带资源进展程度; 另一方面则大力开展各种数据压缩技术的研究工作,并取得了显著的成就。 语音信号的数字化传输,一直是通信的发展方向之。采用低速率语音编码 技术进行语音传输比语音信号模拟传输有诸多优点,现代通信的发展趋势决定了 语音编码技术的儿个突出优势: 1 ) 人人节省了带宽。从最初的p c m 6 4 k 编码剑现在。标准语音压缩协议如 g 7 2 3 1 编码速率为j 3 k 或6 3 k b p s ;g 7 2 9 编码速率为8 k b p s 。还有未形成协 议标准但更低的编码速率已有成熟的算法可以实现,如a m b e 、c e l p 、r e l p 、v s e l p 、 m e l p 、m p m l q 、【。p c 1 0 等多种语音压缩算法,最低编码速率达到2 4 k b p s ,有蝗 算法已在包括第二代移动通信系统( 3 g ) 的多个领域得到应用。 2 ) 便于实现与i p 融合。i n t ”n el 的成功运用使得与1 p 的融合已成必然的 发展趋势。分组语音,即将分组交换的概念与语音传输相结合,使得语裔信息更 易于接入1 p 网。而分组语音的关键技术之一就是语音编码技术,低速率的语音 编码技术对语萏信息的实时性有更好的保证。采用分组语音传输的网络,其传输 的语音信息本身就是分组数据包,这样的语音信息在接入i n t e r n e t 时将是扑常 的方便。 3 ) 语音编码既可用软件也可用硬件的方法实现。软件实现就是将压缩算法 用软件方法实现,这样做的好处是成本低、修改方便灵活,但处理速度较慢,不 易保证处理的实时性。采用硬件实现就是将语音压缩算法固化到专用d s p :笛片 中,这样处理速度快,便于实时处理。 语音通信作为通信业务中一项古老的课题,使用面广泛,需求量大。近年 来,随着i s d n 和数字移动通信等技术的发展,人们对语音压缩编码技术表现出 极大的热情,语音信号的压缩已成为当今世界通信领域的关键技术之一。长期以 来,人们一直在孜孜不倦地研究和尝试各种语音压缩编码方法和体制,试图在语 音质量、传输码率、算法复杂度、时延等诸多因素中寻找最佳结合点,希望在降 低传输码率的情况下还能保证良好的话音质量。语音压缩技术就是在这样的环境 下产生并发展起来的。语音压缩编码算法大致经历了波形编码、参数编码、馄合 第1 页 国防科学技术大学研究生院学位论文 编码三个阶段1 3 】。 1 1 1 语音压缩编码技术的发展概况 ( 1 ) 波形编码 波形编码原理较为简单编码器按照采样定理对语音信号在时域上进行采 样、量化和编码,在解码端经数模转换后再境地同滤波器恢复出原始语音波形。 由于这种编码方法保留了语音信号的各种过渡特征,所以解码端的声音质量一般 较高。波形编码方法简单,它具有适应能力强、话音质量好等优点,但所需编码 速率较高,压缩比有限。当编码速率在1 6 k b p s - - 6 4 k b p s 时,话音质量较高,但 当速率进一步降低时,其性能下降较快。脉冲编码调制( p c m ) 是这种编码系 统的典型代表。为了进一步降低编码速率,对其进行了许多改进: 针对声音信号前后样值蚓的相关性,采用预测编码技术,以降低编码速 率。浚技术的实质是对预测样值与实际样值之差进行量化其原理是:对于大多 数语音信号数据,上述差值范围较小的数据将以较大概率出现,对这些差值进行 编码,可减少编码所需比特数。差分编码( d m ) 、自适应差分编码( a d p c m ) 就是这样的编码器。 声音信号对人耳听觉的影响斟频率而异,人耳对1 k h z 附近的频率成分 尤其敏感。人们根据这一原理设计了子带编码器( s b c ) :首先将原始语音信号 按频率划分成为不同的子带,然后根据各个子带对人耳听觉的贡献进行量化编 码。实现信号的子代划分可通过各种快速变换( f f t ,d c t 等) 或滤波器组来实 现。利用变换进行频率分割的编码系统也称为自适应变化编码( a t c ) ,其结构 较简单,但由于变换需截取一段卢音信号,等于对声音信号进行加窗处理,引入 了附加的频率成分,故分带结果稍差:采用滤波器绀进行子带划分能将由于量化 而产生的噪声限制在本子带内,减少了噪声的影响,但滤波器的设计较复杂,一 般采用正交镜像滤波器q m f l 3j 以保证分带的过程不产生附加的失真。 由于声音信号采样值间不但存在线形相关性,还存在非线形相关性,一 段样值和另段样值整体上也有相关性,根据信息论中多维信号熵小于单维信号 熵之和的理论提出了对多个样值进行整体化的矢量量化理论【4 ”,矢量量化方法 可以大大降低数码率,在中低速率语音编码中得到了广泛的应用。像i t u g 7 2 3 1 、g 7 2 9 2 1 等标准都采用了这种方法。 ( 2 ) 参数编码 人类发生器官的发音过程可以用一个数学模型柬逼近1 3 】,将该数学模型的参 数进行编码传输,此方法称为参数编码。同波形编码不同,参数编码通过对语音 信号特征参数的提取及编码,力图使重建语音信号有尽可能高的可懂度,即保持 原语音的语意。由于描述人类语音生成模型的参数只有十几个,并且考虑到语音 第2 页 国防科学技术大学研究生院学位论文 的短时平稳性特点( 2 0 m s 内,语音生成模型参数基本不变) ,所以此类编码系统 可将编码速率压缩得很低。此类编码器的优点是编码速率低,其速率可以达到 2 4 k b p s ,甚至2 ,4 k b p s 以下。它的主要问题是合成语音质量差,特别是自然度较 低,对讲话环境噪声较敏感等。线形预测声码器( l p c ) 是这类编码系统的一个 典型代表,其原理如图1 1 所示: s ( n ) 语占 样值 1清浊音判断 a n 爿_ 分 编 - - q 皋占用期提取l 码 信迫 接 一一 一, ,1 解复 接 码 器 器 皋岛、1 激 叫滤焉数茸 厂1信 图1 1l p c 原理图 图中左边是编码器,完成语音信号的l p c 分析,图的右边是解码器,完成 语音合成。激励信号在浊音语音段为周期脉冲序列,在清音语音段为白色随机噪 声序列。由于l p c 编码器每2 0 m s 分析和传送一次参数,故l p c 的编码率可以 降到很低。 ( 3 ) 混合编码 混合编码是综合波形编码和参数编码的优点而提出的,其复杂程度介于波 形编码和参数编码之间。码激励线形预测编码器( c e l p ) 是混合编码的一个典 型代表。这类编码器的共同特点是:先进行线形预测( l p ) 分析,去掉语音相 关性,然后再用合成分析法及感知加权均方误差最小准则分析出合适的替代余量 信号的最佳激励信号源,最后对l p 参数和激励信号源进行编码和传送。由于这 些方案的激励模型和误差计算与时域波形相联系,是合成语音具有较强的跟踪输 入语音变化的性能,从而改善了合成语音的质量及抗噪声的能力。混合编码中所 用到的这些共同技术,如合成分析法、感知加权滤波器等,将在l2 节作详细 介绍。 1 1 2 衡量语音编码性能的主要因素 语音编码研究的基本问题,就是在给定编码速率的条件下,如何能得到尽 量好的重建语音质量,或称编码质量,同时应尽量减小编解码延时及算法的复杂 度。换一个角度也可以说,在给定编码质量、编解码延时及算法复杂度的条件下, 如何降低语音编码所需的比特率,增强其稳定性。这几个因素之间有着密切的联 第3 页 国防科学技术大学研究生院学位论文 系,并且在不同的应用中对各方面的侧重要求也有所不同。 ( 1 ) 语音质量 语音质量是衡量语音编码算法优劣的重要指标之一。其评价方法可分为主 观评定和客观评定两大类。客观评定方法用客观测量的手段来评价语音编码质 量,常用的方法有信噪比、加权信噪比、平均分段信噪比等。他们都是建立在度 量均方误差的基础上,其特点是计算简单,但不能全面反映人对语音质量的感觉, 尤其不适合中低速率语音编码的评价,因此此方法主要适用于速率较高的波形编 码类算法。主观评定方法符合人们对语音质量的感觉,目前得到了广泛的应用。 其常用方法为平均意见得分( m e a no p i n i o ns c o r e ,简称m o s 得分) ,判断韵字 测试( d i a g n o s t i cr h y m et e s t ,简称d r t 得分) ,判断满意度得分( d i a g n o s t i c a c c e p t a b i l i t ym e a s u r e 简称d a m 得分) 等。 m o s 分评定法最常用,它采用五级评分标准:m o s 分在4 o 4 5 分为高品 质数字化语音,达到长途电话网的质量要求,常称之为网络质量;m o s 分在3 5 分左右为通信质量,这时能感觉到语音质量有所- 卜降但不影响正常通话;m o s 分在3 , 0 分以下为合成语音质量,此时音质较差。 ( 2 ) 编码速率 编码速率可以用“比特秒”( b i v s 或b p s ) 来度量,它代表了编码的总速率, 一般用i 表示。编码速率也可以用“比特样点”( b p ) 度量,它代表了半均每个 语音样点用多少比特编码,一般用r 表示。i 和r 可以通过采样速率联系起来: i = r 。( 1 - 1 ) 般情况卜,r 越低,对传输带宽要求越低,但同时语音质量越差,算法 复杂度也越高。 ( 3 ) 编解码复杂度 也就是实现编、解码算法的困难程度。编码和解码算法的复杂程度同语音 编码的话音质量有非常密切的联系。在同样数码率的情况下,采用复杂一些的算 法将会获得更好的话音质量。编解码复杂度可由算法的复杂程度、硬件的实现及 价格等多种因素来衡量。 ( 4 ) 编解码延时 即实现编解码算法所需的时间,国际上在不同的应用场合对编解码延时有 不同的规定如长话的编解码时延不得超过5 - l o m s ,而对可是电话则放宽至几 十m s 到1 0 0 m s 。 ( 5 ) 稳健性( r o b u s t n e s s ) 指编译码系统抗噪声、抗信道误码的能力。对于实用的声码器,要求在误 码率为1 0 。3 的信道上传输时,语音质量不至于过分恶化,而对于移动通信中的声 码器则要求在信道误码率为3 1 0 五时仍能正常工作。 第4 页 国防科学技术大学研究生院学位论文 1 1 3 语音压缩编码的相关国际标准 经过几十年的研究,人类在语音压缩编码方面取得了丰硕的成果,制定了 许多国际标准。目前,这些标准已被广泛地应用与通信的各个领域。其主要标准 如表1 1 所示: 表1 1 目前国际上一些电话语音编码标准算法的性能及主要应用 数码率 压缩标准或系统公布日期编码方式m o s 分j j途 ( k b p s ) i t ug 7 1 l1 9 7 2p c m6 443 公,j 电话网 i t ug 7 2 l1 9 8 4 1 9 8 6a d p c m3 2d1 公州网 m p m l q6 3 i t ug 7 2 3 11 9 9 63 5 多媒体通信 a c e l p5 3 i t ug7 2 81 9 9 2l d c e l p1 64 1 公刖嘲 1 ug7 2 91 9 9 6c s a c e lp8 4 0移动i u 话 g s m 1 9 8 8r p e i t p1 3 3 7移动电话 i s 一5 41 9 8 9v s e l p83 8 移动电话 保密和1 i 星 f s l 叭61 9 8 9c e l p4 83 2 通信 保密和j 艰 jn m a r s a t1 9 9 0i m b e4 1 5 3 4 通信 表中g 系列建议为i t u ( 国际电信联盟) 的标准,其中g 7 2 8 为低延时c e l p , 其特点是音质好,编、解码延迟小,适合于双工通信。在i t uh 3 2 0 会议电视系统 中作为三种语音编码方式中的一种。 g 7 2 9 是国际电信联盟为适应移动通信发展的需要而于1 9 9 6 年由第十五研 究组( i t u ts g l 5 ) 推出的新标准,其速率为8 k b p s ,采用代数共轭结构码激励线 性预测( c s a c e l p ) 算法i z j 。其话音质量良好,时延较短,综合性能较强,可 ,一泛地用于移动通信、保密通信等系统中。 g s m 是西欧数字移动通信标准,其中语音编码采用了具有长时预测规则码 激励( r p e l t p ) 的线性预测方案。其特点是算法简单、话音质量达到通信等级、 抗误码性能好,加纠错保护后能在1 0 。1 突发性信道误码情况下工作。f s l 0 1 6 是美 国安全局( n s a ) 于1 9 8 9 年公布的4 8 k b p s 的c e l p 语音压缩标准,可用于军事 第5 页 国防科学技术大学研究生院学位论文 保密通信等领域,其算法现已公开。 g 7 2 3 1 是i t u 为低码率多媒体通信制定的语音编码标准,它具有6 3 k b p s 和5 3 k b p s 两种编码速率,分别采用多脉冲最大似然量化( m p m l 。) 和代数码激 励线性预测( a c e l p ) 编码算法。将它与图象编码标准h 2 6 3 、复用协议h 2 2 3 、 控制协议h 2 4 5 等相结合,即可组成多媒体通信终端,在局域网l a n 或通过 m o d e m 在p s t n 上开辟多媒体通信业务。现在的i n t e r n e tp h o n e 也采用这一标 准。随后,i t u 又通过了g 7 2 3 1 的附件a ,支持“话音活动检测”( v o i c e a c t i v i t y d e t e c t ) 和“舒适噪声生成”( c o m f o r tn o i s eg e n e r a t o r ) 功能。目前国际上一些 知名的人公司纷纷围绕g 7 2 3 1 的建议,展开理论与应用方面的研究,有的公司 甚至己丌始研制并生产( 3 7 2 3 1 系列的号用功能芯片。在国内,清华大学、中围 科技大学、上海交通大学等高校和研究机构,在1 9 9 7 年前后便丌始围绕g 7 2 3 1 算法展丌应用方面的研究,并将研究成果应用于卫星通信、网络通信等诸多领 域。 1 1 4 总结 语音k 缩编码技术走过了漫长而辉煌的发展历程,从最初的波形编码到以 l p c 为基础的参数编码到现在的以c e l p 为基础的各种混合编码,数码率在一 步步降低,而话音质量、时延、稳健性等综合指标却不断上升。从7 0 年代中期, 特别是8 0 年代以来,随着计算机技术的发展,大规模、超火规模集成电路的出 现,人们对语音压缩技术的研究和应用取得了突破性的进展。近年来,还有一些 学苔正在把神经网络( n e u r a ln e t w o r k ) 及小波变换( w a v e l e tt r a n s f o r m ) 等新 技术应用于语音分析、编码等领域,并取得了可喜的成就。可见预见,随着语音 压缩编码技术的发展、新的编码方法的不断涌现,语音编码技术将会对人类通信 事、世做出更大的贡献。 1 2 语音压缩编码技术基础 g 7 2 3 1 协议基于线性预测综合分析编码原理,可以调整感知加权误差信号 至最小化。其中用到了许多语音压缩编码的基本技术,如短时分析技术,合成分 析法a b s ( a n a l y s is b y s y n t h e s is ) ,感知加权滤波器,预测分割矢量量化( p s v q ) 技术等,现将其分别介绍如下: 1 2 1 短时分析技术 由十语音信号的准平稳特性,任何语音信号数字处理算法和技术都建立住 “短h 寸”基础上。下面就语音压缩编码中常用的一些短时分析技术予以介绍。 在对语音信号进行压缩编码以前,一般先对采样信号进行预滤波,然后进 行加窗处理。预滤波的目的有两个:抑制输入信号各频域分量中频率超出f 。2 的所有分量( f 。为采样频率) ,以防止混叠干扰。抑制5 0 h z 的电源干扰。g 7 2 3 第6 页 国防科学技术大学研究生院学位论文 在对语音信号进行处理以前,就进行了预滤波,以滤除一些不必要的低频成分的 干扰。 语音信号经过预滤波和采样后,有a d 转换器变换为二进制数字码,而后 将这些数字化的语音信号序列一次存入一个数据区。在语音信号处理中一般用循 环队列的方式来存储者这些数据,以便用一个有限容量的数据区来应付数量极大 的语音数据( 已处理过的语音数据可以依次抛弃,让出存储空间来存入新数据) 。 在进行处理时,按帧从数据区中耿出数据,处理完后再取下一帧,等等。 已取出的一帧语音s ( n ) 一般要经过加窗处理,就是用一定的窗函数u ( n ) 来乘以s ( n ) ,从而形成加窗语音s 。( n ) : s , o ( n ) 2 s ( n ) 。u ( n )( 1 2 ) 在语音信号处理中常用的窗函数是方窗和汉明窗( h a m m i n g w i n d o w ) 。 利用加窗后的语音信号,可求其短时自相关函数r 。( 1 1 : 一卜1 月。( ,) = s ( n ) s 。( + ,) = s 。( h ) s 。( n + ,) ( 1 - 3 ) i i = - - - o cn = 0 对于浊音信号,由于它的短时周期性,其自相关函数也呈现出明显的周期性。相 反,由于清音语音接近于随机噪声,它的短时自相关函数不但没有周期性且r 。 ( 1 1 随着l 的增大而迅速减小。因此可以利用这个特点来判断个语音是浊音还是 清音,并且还可以决定一个浊音的基音周期等。 1 2 2 合成分析法( a n a l y s i s - b y - s y n t h e s i s ) 利用线性预测( l p ) 方法去除了语音信号的短时相关性和长时相关性后, 等到了预测余量信号。对于1 6 k p s 以下的高质量语音编码技术来说,能用于余量 信号编码的比特殊是较少的。若对于量信号进行直接的量化,并且使余量信号与 它的量化值之问的误差达到最小,并不能保证原始语音与重建语音之问误差最 小。只有采取合成分析法来求得余量信号的编码量化值,才能使重建语音与原始 语音的误差最小。 合成分析法是将综合器引入编码器,使之与分析器相结合,在编码器中产 生与译码器端完全一致的合成语音,将此合成语音与原始语音相比较,根掘一。定 的误差准则,来调整计算各个参数,使之二者之间的误差达到最小,这种方法即 称为合成分析法。 1 2 3 感知加权滤波器 感知加权滤波器的依据是人耳听觉的掩蔽效应( m a s k i n ge f f e c t ) 。在语音频 谱中能量较高的频段即共振峰处的噪声相对于能量较低频段的噪声而言不易被 感知。,因此在度量原始语音与合成语音之间的误差时可以考虑这一因素,在语音 能量较高的频段,允许二者的误差大一些,反之则小一些。为此i j 以引入一个频 域感知加权滤波器w ( f ) 来计算二者的误差如下: 第7 页 国防科学技术大学研究生院学位论文 p f 阻) 一雪( 刊2 w ( f ) d f ( 1 4 ) 其中是抽样频率,s ( ,) 、j ( j r ) 分别是原始语音与合成语音的傅里叶变换。可 以证明,为使e 达到最小值,整个积分项在积分域内应保持常数值。这可以通过 调整激励参数使e 达到最小值来实现。这样,只要在能量较大的语音频段内使 w ( o 较小,而能量较小的频段内w ( o 较大,就能达到目的。为此可取的感知加 权滤波器w ( f ) 在z 域的表达式w ( f ) 应为: p 岬) = 焘= 1 - z d 。z 感知加权滤波器的特性由预测系数f a 和加权因子r 来确定。r 取值在0 l 之间, 由它控制共振峰区域的误差的增加。 1 2 4 矢量量化( v q ) 技术 矢昔量化( v e c t o rq u a n t i z a t i o n ,简称v q ) 是一种极其重要的信号压缩办法, 广泛应用于图像信号压缩、语音信号压缩等领域【4j 。在低速语音编译码器研究q , v q 起着非常重要的作用。最简单的信号量化方泫是标量量化,就是用若_ t 个离 散的数字值来表示每一个幅度具有连续耿值( 模拟值) 的离散时域信号( 采样信 号) 。矢量量化则是将若干个幅度连续取值的时域采样信号分成一组,即构成欠 量,然后用若干离散的数字值( 或称为标号) 束表示各种矢量。 矢量量化研究的基础是信息论的一个分支:“牢一畸变理论”,其中的两 个结论对v q 算法的发展起关键作用。第一,对于一定的量化速率r ( 以每个采样 信号平均所用的量化比特数衡量,用比特采样表示) ,量化畸变d ( 以量化信号 和原信号之间的误差均方值和原信号均方值之比来衡量) 是一定的。因此d 可以 表示为r 的函数,记为d ( r ) 。对于不同的信号源,根掘其统计特性,可以计算 出相应的d ( r ) ,对于任何信息源即使是无记忆的信息源( 即各个采样信号之 间相互统计独立的情况) ,矢量量化总是优于标量量化,且矢量维数越夫优势越 明显。总之,对于一个特定的信息源,如果给定了量化速率r ,那么任何量化器 所给出的量化畸变都不可能低于“率一畸变理论”给出的下限d ( r ) 【4 “。矢量量 化器较之标量量化器能够接近这一下限,因而在同样的量化速率下给出更小的畸 变,或者在同样的畸变下给出更高的量化效率( 即更低的r 值) 。矢量量化的研 究目的即在于针对特定的信息源和矢量维数,找到一种最优的矢量量化器,它能 够在r 一定时给出最低的畸变。 第8 页 一 :, 口 p 肖 一 国防科学技术大学研究生院学位论文 v q 系统框图如图1 2 所示。其中特征矢量的形成部分的作用是每输入一帧 语音采样序列( 若帧长为n ,则可以表示为s ,s :,s n ) ,则输出一个与之 码本鸦牟 翌! 一屠恒呈 图1 2v o 系统的构成 相适应的特征矢量x ,若其维数为k ,则x = ( x 二,x 。) 。k 可以等于n ,也 可以不等于n 。x 也可以是对一帧语音进行各种变换或分析后得到的欠最。例如 各种1 jl p c 分析有关的特征矢量。v q 系统中有两个完全相同的码本,每个码本 中包含m 个码宁y ,i = i m ,每个码字是一个k 维矢量。v q 编码器的运行原理 是根据输入矢量x 从编码器码本中选择一个与之相适应的矢量y ,其输出v 即等 于此欠量的下标一般称为标号( i n d e x ) 。v 为一个数字,如采在传输过程中没 有发牛误码,则接受端接收到的数字仍为v ,译码器按照数字v 从译码器码本( 与 编码器码本相同) 中选出一个具有相应下标的码字作为输出y 。由j i 信道上传输 的仅仅是码矢量的标号数字,因而在矢量量化法卜,可以将传输码率将得很低。 v q 编码,所使用的最基本的码本搜索算法是“全搜索法”,即对每个输入 矢量,比较它与码本中每个码字f b j 的畸变,并以畸变最小的码字索引作为编码输 出,但这样做所需的运算量很大,而且存储m 个码字所需的存储量也很大。为此, 可以改变码本结构,或改进搜索策略,如采用树搜索v q 系统,或采用分裂式v q 等,以提高码本搜索效率。g 7 2 3 即采用了类似的策略,利用预测分裂式矢量量 化方法( p r e d ic t i v es p l i tv e c t o rq u a n t i z a t i o n ) ,简称p s v q ,大大简化了搜 索效二鲁。 1 2 4 码激励线性预测编码技术( c e i 。p ) 码激励线性预测编码技术( c e l p ) 是在1 9 8 5 年山m r s c h r o e d e r 和b s a t a l 二人提出的。c e l p 以高质量的合成语音及优良的抗噪声和多次转接性能,在 4 8 - - 1 6 k b p s 的速率上得到广泛的应用。后来,人们在此基础上,改进并制定了 许多标准,如f s l 0 1 6 ,v s e l p ( 矢量和激励线性预测编码) ,l d c e l p ( 短延时码激 励线性预测编码) 等。 第9 页 国防科学技术大学研究生院学位论文 c e l p 以帧为单位对语音信号进行编码,帧长般为2 0 、3 0 m s 。c e l p 编码基 于合成分析( a b s ) 的搜索过程、感知加权矢量量化( v q ) 和线性预测( l p ) 技术。在c e l p 中,用从码本中搜索出来的最佳码矢量,乘以最佳增益,替代l p 余量信号作为激励信号源。c e l p 一般将每一帧语音分成2 5 个子帧,在每个子 帧内搜索最佳的码矢量作为激励信号。c e l p 编码示意图如图1 3 所示。图中自 适应码本中的码字用来逼近语音的长时周期性( 基音) 结构,而随机码本中的码 字用来逼近语音经过短时长时预测后的余量信号。从两个码本中搜索出柬的最 佳码矢量,乘以各自的最佳增益后相加,其和即是c e l p 激励信号源。将激励信 号输入p 阶l p 综合滤波器1 a ( z ) ,得到合成语音信号j ( n ) 。j ( ”) 与原始语音s ( n ) 的误差经过感觉加权滤波器w ( z ) ,得到感觉加权误差e ( n ) 。c e l p 用感觉加权的 最小平方预测误差m i n i m u ms q u a r e dp r e d i c t i o ne r r o r ( m s p e ) 作为搜索最佳码 欠量及其幅度的度量准则。使感知加权误差平方最小的码矢量即是最佳码欠量。 为了减少计算量,c e l p 一般采用两级码本顺序搜索的方法。第级自适j 衄 码本搜索的目标矢量是加权l p 余量信号,第二级随机码本搜索的曰标矢量足第 一缴搜索的目标矢量问取自适应码本搜索得到的最佳码矢量激励综合加权滤波 器的结果。c e l p 编码器的计算量主要是对码本中最佳码矢量及幅度的搜索。计 算复杂度和合成语音的质量取决于码水的大小。 随机吗小 图1 3c e l p 编码示意图 第l o 页 国防科学技术大学研究生院学位论文 1 3 论文工作简介及论文结构 论文工作的主要内容如下: 1 对g 7 2 3 1 的算法进行了深入的分析和研究,并在此基础上,对其中 的基音估计和码本搜索算法进行了优化。 2 在定点化的基础上,利用计算机对g 7 2 3 1 的编译码算法进行了高级 语言的仿真。 3 完成了t m s 3 2 0 v c 5 5 0 9 与音频声码器( a d 、d a 变换器) t l v 3 2 0 a i c 2 3 的接口设计,并给出了对d s p 内部编解码数据进行缓冲 管理的方案。 4 根据高级语言仿真的结果,利用t m s 3 2 0 v c 5 5 0 9 汇编语言实现 g 7 2 3 1 的编译码算法,并根据t m s 3 2 0 v c 5 5 0 9 的特点,对,l 编程序进 行了优化和改进,以实现语音信号的实时编解码。 5 对( 3 7 2 3 1 编解码算法在5 3 k b i t s 码率时对信道误码的敏感性做了基 本的研究,提出了两种测试q 7 2 3 1 比特误码敏感性的方法,即随机误 码法和错误图样法,得出了相应的结论。 论文共分为四章。第一章,对语音压缩编码技术的发展概况作了简要概括, 并介绍了语音压缩编码中常用的一些技术。第二章对q 7 2 3 1 编译码算法进行了 深入的研究,并对其中的基音估计和码本搜索算法进行了优化。第三章,在高级 语言仿真的基础上,利用t m s 3 2 0 v c 5 5 0 9 汇编语言实现g 7 2 3 1 的编译码算法, 并对其进行了优化。第四章,对q 7 2 3 1 的比特误码敏感性进行了分析和研究, 给出了两种测试方法的结果。最后,在结束语中对整个论文的工作进行了总结。 第1 1 页 国防科学技术大学研究生院学位论文 第二章g 7 2 3 1 算法分析与研究 2 1 编译码原理概述 g 7 2 3 1 语音编解码器是国际电信联盟( i t u ) 为了可视电话的应用,而制 定的一种低码率编码方案。该语音编码方案是i t u 。t h 3 2 4 标准系列的组成部分, 能够以非常低的码率压缩语音或多媒体设备的其它音频信号分量。高码率 ( 6 3 k b i t s ) 时的激励信号为多脉冲最大似然量化( m p m l q ) ;低码率( 53 k b i t s ) 时的激励信号为代数码本激励线性预测( a c e l p ) 。 g 7 2 3 1 建议是基于码激励线性预测( c e l p ) 编码模型使感知加权误差最小 对语音进行编码的,模拟输入信号首先经过语音频带滤波,再将滤波输出经8 k h z 采样转换成1 6 比特线性p c m 语音信号,帧长为3 0 m s ( 2 4 0 个样点) 。对于其他 类型信号的输入,比如t hg 7 1 1 规定的6 4 k b p s p c m 数据,在编码前也要转换为 16 位线性p c m 码,并在解码后,从1 6 位线性p c m 码还原成相应的原始数据格式。, 然后,通过对延时语音进行分析提取c e l p 参数( l s p 参数、码本索引和增益等) , 将这些参数编码传送。在解码端,用这些参数构造激励信号和合成滤波器,将激 图2 1 编码器原理框图 励信号通过合成滤波器以获得重建语音信号。此外,在编码器到解码器之间的码 流均需符合g 7 2 3 1 的协议规范。 编码器原理如图2 1 所示。输入的原始数字语音先经高通滤波器滤除直流分 第1 2 页 国防科学技术大学研究生院学位论文 量,然后将每个3 0 m s 帧分成4 个等长子帧,对每一子帧进行l o 阶l p 分析计算 l p c 参数,为降低编码速率纸浆每一帧内最后一个子帧的l p c 参数转换为线谱 对( l s p ) 参数,用预测分裂矢量量化( p s v q ) 器量化、编码后加以传送,解 码过程中通过对当前帧和前一帧的l s p 参数进行内插来获得每一了帧量化后的 l p c 参数。之所以要把l p c 参数转换为l s p 参数是因为l s p 参数不仅能反映声 道幅度谱特性,而且在 0 ,叫内由小到大按顺序排列,各参数之间独立性较强, 这样就有利于分级矢量量化,用每一子帧未量化的l p c 参数构造短时感知加权 滤波器,对经过高通滤波的语音进行感知加权,利用感知加权后的语音每两个子 帧做次基音丌环预测。然后对每一子帧构造谐波噪声整形滤波器进行滤波并 用量化和未量化的l p c 参数计算加权合成滤波器的冲激响应h ( n ) ,从经过谐波 噪声整形滤波的语音信号中减去零输入响应得到目标信号t ( n ) ,利用冲激响应h ( n ) 和目标信号t ( n 】在开环基音预测值附近的小范围内进行闭环基音分析,搜索基普 周期和预测增益。这罩采用了5 阶长时预测滤波器,预测增益采用矢量垦:化。偶 子帧的基音周期用7 比特编码,奇予帧的基音周期用2 比特差分编码。将自适应 码字通过长时预测滤波器计算长时贡献p ( n ) ,从目 ,j 、信弓t ( n ) 中减去长时贡献p ( n ) 得到饯筹信号r ( n ) 。最后用冲激响应h ( n ) 和残差信号r ( n ) 对激励信号中的非周期 脉冲成分进行搜索对高码率( 63 k b i t s ) 采用多脉冲最大似然量化( m p m l q ) 激励,对低码率( 5 3 k b i t s ) 采用代数码本激励( a c e i 。p ) ,在搜索激励矢量的 过程中采用了高效的快速算法以降低运算复杂度。 表2 1 5 3 1 6 3 k b p s 编码算法比特分配 编妈参数j 随l了帧2f 帧2r 帧2 每帧总比特 线带对2 4 挂占纠朗 7 272l8 联合增益1 2l21 21 24 8 儿永冲位胃 2 0 ( h i g h l 1 2 ( i o u ) l8 ( h i g h ) 1 2 1 1 0 w ) 2 0 ( h i g hj 1 1 2 ( 1 0 w ) i8 ( h i g h ) i2 ( i o u ) 7 3 ( i “9 1 1 ) 7 4 8 ( 1 0 、) 脉冲符i : 6 ( h i g h ) 4 ( 1 0 w )5 ( h i g h ) 4 ( i o x 、)6 ( h i g h ) 4 ( i
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 钩针套件编织工艺考核试卷及答案
- 催化裂化工工艺考核试卷及答案
- 电机转子噪声检测设备选型工艺考核试卷及答案
- 酸洗钝化工专业技能考核试卷及答案
- 海藻胶提取工技术考核试卷及答案
- 服务心理学(第四版)课件 项目四 任务二 激发消费动机
- 银行转型面试题及答案
- 儿科中级专业试题及答案
- 药学面试专业试题及答案
- 河南省濮阳市华龙区濮阳第一高级中学2025-2026学年高二上学期开学摸底检测生物试卷(含答案)
- 2025年湖南省长沙市开福区财政局招聘历年高频重点提升(共500题)附带答案详解
- DB31∕638-2020 铸钢件单位产品能源消耗限额
- 公安食堂采购合同范例
- 3.1生活在新型民主国家-(教学设计) 2024-2025学年统编版道德与法治九年级上册
- 针刺伤预防与处理-2024中华护理学会团体标准
- 急诊专科护士进修汇报课件
- 高速公路项目竣工决算审计服务投标方案(技术方案)
- 科研项目管理
- 2024-2025学年辽宁省点石联考高三(上)段考数学试卷(10月份)(含答案)
- 基于机器视觉的智能工业物料分拣系统设计研究
- 《计算机制图-中望CAD 2023》中职全套教学课件
评论
0/150
提交评论