(通信与信息系统专业论文)超低速率语音编码算法研究.pdf_第1页
(通信与信息系统专业论文)超低速率语音编码算法研究.pdf_第2页
(通信与信息系统专业论文)超低速率语音编码算法研究.pdf_第3页
(通信与信息系统专业论文)超低速率语音编码算法研究.pdf_第4页
(通信与信息系统专业论文)超低速率语音编码算法研究.pdf_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

超低速率语音编码算法研究 摘要 语音编码技术在数字通信系统中起着重要的作用。在传输比特 率限制十分严格的场合下,超低速率语音编码则具有特别重要的 意义。 作为低速率编码一种重要算法,美国联邦标准m e l p 算法在 2 4 k b s 的速率下取得了不错的语音质量,但是仍然存在不少的问 题,尤其是在非平稳语音段和编码效率方面。 本文对混合激励( m e l p ) 算法进行了深入研究,针对编码效 率不高的问题,提出了匀速率帧间插值算法;在g 7 2 9 b 的v a d 算 法基础上提出了b d v a d 算法:本文调查研究了变速率语音编码的 各种算法,并研究了本语音分析系统中语音信号各参数的帧间相 关性之后,进一步压缩速率,提出了基于频谱斜率约束条件的帧 间插值算法,其语音质量、运算复杂度与原算法接近。 以此方案建立的语音编码解码系统传输速率降到了3 0 0 8 0 0 b s 。经重建语音信号比较及主观试听表明,该系统性能与美国联 邦标准推荐的2 4 k b s 混合激励线性预测( m e l p ) 算法较接近或 下降有限。 【关键词】变速率编码混合激励基音提取频谱斜率线性插值 a b s t r a c t s p e e c hc o d i n gi so fg r e a ti m p o r t a n c ei nd i g i t a lc o m m u n i c a t i o n s y s t e m s a t t h es i t u a t i o nw h e r et h et r a n s m i s s i o nr a t ei sl i m i t e ds t r i c t l y , v e r yl o w b i tr a t es p e e c hc o d i n g ( l b r s c ) i s e s p e c i a l l ys i g n i f i c a n t , a sa n i m p o r t a n ta l g o r i t h mo fl b r s c ,t h em i x e de x c i t a t i o n l i n e a rp r e d i c t i o n ( m e l p ) a l g o r i t h mw h i c hw a sc h o o s e na su s 。 f e d e r a ls t a n d a r dh a sg o t 孵稔弦商s p e e c hq u a l i t ya tt h er a t eo f 2 4 k b s ,b u tt h e r ea r es t i l ls o m ep e r c e i v a b l ep r o b l e m s ,p a r t i c u l a r l y a r o u n dn o n - s t a t i o n a r ys p e e c hs e g m e n t sa n di nt h ea s p e c to f c x x t i n g e t l i c i e n c y 融如i st h e s i s 。m e l pa l g o r i t h mi s d e e p l ys t u d i e d 。t no r d e rt o h i g h e rt h ec o d i n ge f f i c i e n c y , t h ei n t e r p o l a t i o na l g o r i t h mo fi n v a r i a b l e f r a m er a t ei sp r e s e n t e d ;b a s e do nt h ev a d a l g o r i t h mi ng 7 2 9 b 。t h e b d - v a d a l g o r i t h mi sp r o m o t e d ;a f t e rt h ei n v e s t i g a t i o na n da n a l y s i s o ft h ei n t e r - f r a m ep a r a m e t e rc o r r e l a t i o n ,a ni n t e r p o l a t i o na l g o r i t h m b a s e do i lt h es p e c t r a ls l o p ec o n s t r a i n ti sp r e s e n t e dt ol o w - e rt h ec o d i n g r a t e ,m e a n w h i l e ,t h es p e e c hq u a l i t ya n dt h eo p e r a t i n gc o m p l e x i t yi s s i m i l a rt om e l p a l g o r i t h m 。 t h et r a n s m i s s i o nb i tr a t eo ft h i ss p e e c h c o d i n g d e c o d i n gs y s t e m i s l o w e r e dt o3 0 0 - 8 0 0 印s + a f t e r c o m p a r i n ga n ds u b j e c t i v e l ye v a l u a t i n g t h er e c o n s t r u c t e ds p e e c h ,i ti sc o n c l u d e dt h a tt h ep e r f o r m a n c eo f t h i s s y s t e ma p p r o a c h e s t ot h a to f 2 a k b sm e l p a l g o r i t h m w h i c hi si nt h e f e d e r a lt e l e c o m m u n i c a t i o nr e e o m m e n d a t i o n 薮簪w o r d s :v a r i a b l ef r a m e 豫轮s p e 翻lc o d i n g , m i x e de x c i t a t i o n , p i t c he x t r a c t i o n ,s p e c t r a ls l o p e ,l i n e a ri n t e r p o l a t i o n - i i 1 1 引言 第一章绪论 长期以来,人们希望能够在任何时候、任何地点与任何人进行 通信。计算机技术、通信技术和多媒体技术的发展使这种想法成 为可能,人们用数字化的方法已经取得了辉煌的成就,但是日新 月异的应用对数字技术提出了更高的要求,同时也在不断推动着 数字技术的进步。语言是人类社会的一种重要的交流手段,因此, 用数字化的方法进行语音的传送、存储、识别、合成、增强 构成了目前数字化通信网中最重要、最基本的组成部分之一。 语音信号处理最早和最重要的一种应用是贝尔实验室的h o m e r d u d l e y 在1 9 3 9 年发明的第一个声码器【2 】。随着通信技术的发展, 卫星、微波和光通信系统提供了很宽的频带,但是在很多情况下 仍然有着节省频带的需要:同时,利用多余码字对语音信号进行 极其复杂的加密的可能性也极大地推动了语音压缩编码在许多方 面的应用。 c c i t t ( i t u ) 已经制定了几种速率的语音编码国际标准,这些标 准推动了研究工作的进展,但是它们的信源速率普遍较高( 最低 速率标准为g 7 2 3 ( 5 3 k b p s ) ) ,低速率编码的语音质量大多不能 令人满意,使得低速率的语音编码成为近年来的一个热点和难点。 尤其是在短波信道、水声信道、岩石信道等对信源速率要求极其 苛刻的应用场合,进行低速率、超低速率语音编码的研究工作尤 为迫切。 1 2 语音编码技术 语音编码技术是伴随着通信网的发展而发展的。在通信网中, 解决信息传输效率是一关键又极其重要的问题,有两个途径来研 究这一课题,其一是研究新的调制方法和技术来提高信道的传输 速率,英辩蠡嚣每个赫兹蒂宽熬传送煞玛字鼗;其二是在痿源主, 服缩信源的编码速率。这对任何频率资源有限的传输环境无疑怒 投翅重凝熬。寰辫土,殛缭语谗编码的速率与话啻的存储,语凿 识别和合成等技术都直按耩关。 本文只涉及剡语音的压缩编玛技术,如果没脊特别的说明,文 中的语裔编蕊黪对象是频率范阐为2 0 0 3 4 0 0 h z ,采棒率为8 蹦z t 并采用娥基本的鳊码方式p c m 编码的数字语音信号。 i 2 1 谱音压缩编码的艨理 1 2 1 1 语音产生的模爱及其特征参数辫; 语裔信号在没音器霄中产熏貔物理避程是采塞耩帮瓣空气流 经过声带后,冲击声道,然后e b 口腔发生出声膏。气流产生的声 鬻主要避过篱瓣发射到空气孛,哭膏彝密是通过彝臻发射魏。 从声学的观点来看,不同语谮的产鬣过程是由于发舒器官的声 誉激魏源褰蜀黢或奏霾声遘魏形状不秘。投嚣激聚源秘声遵模型 的不同,语音可以分为两类:浊音和漓音。来螽肺部窝气流为声 誉振动掰调剁,产生准髑期性的闼会或开癌,在声道中激励越准 藩期健游空气辣冲,胰丽形成浊音;两来宦膝部静空气流在它经 过声道的收缩部分时形成湍流,得到类似噪音的激励,产生清谗。 下蕊我 j 臻爨一个楚萃斡饔教露域港啻蔫号产生豹数学援罄, 时于语凿压缩编码而言,已经党全可以满足需求了。 基音黼睾 浊音清膏歼哭, 觚 黼 一1 语音f l i 号- 产生酶离散时域骥蹩 f i g u r el 一1d i s c r e t e ”t i m eg e n e r a t i o nm o d e lo fs p e e c hs i g n a l 鼢毒一 一 匿 一 窗 塑堡婆奎堡童墅丑墨鲨堕塑 它包括三个部分:激励源、声道模型和辐射模型。激励源分浊 音和清音两个分支,按照浊音清音开关所处的位置来决定产生的 语音是浊音还是清音。声门脉冲模型g ( z ) 的作用在于使形成的浊 音激励信号频谱接近声门气流脉冲的频谱。对声门波形的频谱分 析表明,其幅度频谱按每倍频程1 2 d b 的速度衰减,通过调节g ( z ) 的参数可使浊音激励信号带上这样的变化特点。乘系数a v 和a u 分别是浊音和清音信号的幅度或能量增益因子。辐射模型r ( z ) 与 嘴型及舌头在口中的位置和形状有关。 声道模型v ( z ) 给出了离散时域的声道传输函数,将实际声道 作为一个变截面级联声管道模型来研究,采用流体力学的方法可 以导出,在大多数情况下它可视为一个全极点函数 v ( z ) = ;= ,毡a o 为= 实1 数 q z 。 叫“ 其中p 为这个全极点滤波器的阶;p 值取得越大,模型传输函数与 声道实际传输函数的吻合程度越高,但对于大多数实际应用而言, p 值取8 1 2 就足够了。这时v ( z ) 的解卷算法可以归结为对各模 型参数口进行估计。这种模型即称为全极点模型或a r ( a u t o r e g r e s s i v e ) 模型。如果采用最小均方( l m s ) 误差准则对a r 模 型参数进行估计,就得到了著名的线性预测编码l p c ( l i n e a r p r e d i c t i v ec o d i n g ) 算法。 1 2 1 2 语音可进行压缩的理论依据f 4 语音信号之所以能够进行压缩编码,主要有两条基本依据。这 就是利用了语音信号所存在的冗余度,以及利用人耳的听觉特性。 从前面我们阐述的语音信号产生的激励和它的结构特性表明, 语音信号中存在很大的冗余度。语音压缩本质上就是通过识别出 这些冗余度并设法将其去掉,从而达到压缩的目的。语音信号的 冗余度归纳起来表现在以下四个方面:( 1 ) 语音信号样本间相关 性很强,亦即语音短时谱是不平坦的;( 2 ) 浊音语音段具有准周 期特性;( 3 ) 声道的形状及其变化的速度是有限的;( 4 ) 传输码 兹概率分摩是不垮匀翡。 前三个冗余腹是由予语音信号产生激励的物理结构和过穰所 决定麴,繁硅) 黪冤余鏖粼与掰塞爱熬特殊编褥方法鸯荚。第 耱冗余凌剡楚语啻藩号分赣楚理靛瑷 论基础,它允许声道滤波器参数或谱倪络等可以按帧处理,同时 逶遘一定鹣手袋避一多去藩簸瓣豁攘关俊怠。繁毒耪嚣衾寝主 要被各种概率编码方法所利用。当传输的比特率已被设定时,语 塞缡码器熬舍溅语音鼗燕涛透进骞效竣列爨这些冠余发籍这要最 佳。 剥爝入耳的瞬爨生理功能特点是语酱压缩编码的第二条途径。 a 耳瞬激有一个重要豹特点,就是甄嚣其有掩蔽效应一个强 的音能抑制另个同时存在的弱音对人形成的听觉,即掩蔽散应 会遥残毽为一个声音魏存在露使曼一个声音翦赞麓上辩。在编疆 过程中,我们利用这特性。深用一龅准则来改变量化噪声的频 港形获,蕊褥爨纯臻黪在主鬟辑燮上熊部分或全帮搜器赘簧屏蔽; 或在后滤波技术中利用谱幅度的适度失真来降低量化嗓音对谬音 矮量的影媳。人骂豹骥觉对声调( p i t c h ) 豹感髓很准确,但在不 同的频段允许的畸变怒不同的;瑟低颓羧毙较敏感( 戳茏洼静静 音调和轶振峰络构主翼集中在低频段,从另外个角度来说,则 蹙壶予频率鞍低戆声鬻在蠹骂嚣臻萎窳貘上幸予波簧遴翡距离涎予 频率较高的声街) ,对黼频段则不太敏感,能容忍较大的音调偏麓。 嚣嚣零i 鑫了“子带绫璐技零”。要势人珲辑觉辩逶音信号静稳袋 很不敏感,更魑某些分析和编碣方法的依据:低速率的语音编码 方案几乎不会绘辍位因子分配# e 特。 对予人类瞬觉系统辊瑾的研究现在辩链予裙级除敬。但可;i 肯 定,对遮方面的探素和研究,将会给我们提供踅多可利用的信息。 1 2 2 谬音编粥方法的分类【4 】 从方法上,语音信崎的编硒方法可分为两大类:波形编码和参 数编码。有趣的是,这两种方法最早的提出都是在上个世纪3 0 年 代末期。 语音信号的波形编码力图使重建语音信号j ( n ) 的各个样本尽 可能地接近原始语音信号s ( n ) 的样本值。令 e ( n ) = ;( n ) 一s ( n )( 式1 2 ) 表示量化误差,那么波形编码的目的是在给定的传输速率下,使 误差序列e ( t q ) 的能量最小。因此在波形编码中,信噪比总是一个 有用的编码性能评价标准。 波形编码器将语音信号作为一般的波形信号来处理,它具有自 适应能力强、语音质量好等优点,但所需要的信源编码速率较高。 脉冲编码调制、自适应增量调制、自适应差分编码、自适应子带 编码、自适应变换编码等都是波形编码的应用实例。它们在1 6 k b p s 以上速率能给出高的编码质量。 而参数编码则是以语音信号产生模型为基础,通过一定的方法 对信号的特征参数进行提取和编码,其目的是力求在较低的速率 下获得尽可能好的话音质量。在这类系统中,由于解码后的语音 信号同原始的语音信号没有一一对应关系,合成语音主要借助于 主观评判,尽管近年来一直在进行某些客观评价标准的研究,但 是缺少像波形编码那样一般的客观评价标准。 参数编码的优点是编码速率可以达到很低,但是它的问题在于 合成语音质量较差,清晰度不好,自然度较低,特别是对话音的 环境噪声非常敏感。此外,它的运算量大、需要的存储单元多, 实时实现较困难,但是随着数字信号处理技术( d s p ) 的快速发展, 新的大寻址空间、高速d s p 芯片的不断推出,运算复杂度已经不 再是致命性的问题了。典型的参数编码器包括通道声码器、共振 峰声码器以及目前被广泛使用的线性预测声码器( l p c ) 等。 在这两种编码方法基础上,于二十世纪八十年代产生了新一代 的参数编码方法,这种方案在保留分析合成编码的技术精华基础 上,引进了波形编码准则来优化激励信号,从而在4 ,8 9 6 k b p s 的速率上获得了较高质量的合成语音,我们称之为混合编码。典 型代表有码本激励线性预测编码( c e l p ) 、多脉冲激励线性预测编 码( m p l p c ) 、规则脉冲激励线性预测编码( r p e l p c ) 等。 1 2 3 谗齑绫磁性耱麓详徐舔疆 语考缀褥器煞往舞主器虫西令方莲韵戮素寒鬻鲎,壤援;绫辍 速率、编码质量、算法复杂程度以及编解码延时秘嗣陌。这四个嗣 綮之阕怒密甥胡美豹,在实嚣工 乍中,成当对不同因素的影响作 综台考虑,根据需要对侧藿点静选择也会有所不溺- ( 1 ) 编娼质量 语裔缡璃质撩是窝最语音缡鹨算法傥劣魏关键毪糍之一。它蕊 评价方法u j 纳越来分成骶类,即客观评定方法和主观评定方法a 窖袈谬定方法爨窖藏测量黟莩段寒详髂语音缀避囊擞,豢赐黝 方法有倍嗓比、分段信嗓比、频域加权信嗓比、最大最小信噪阮 以及菲均寿误羲信噪毖镣。它们都是以信噪比的概念为基础的a 倍噪魄s n r ( s i g n a l n e i s er a t i o ) 定义魏信号与蠡证繇声静功率 比,用公式可表涿为 s n r ( d b ) = 1 0 1 0 恻 箕中。:帮娃:努弱代表镄号功率释碟声功率。 客观评定方法计算相对简单,但不能兜全反映人耳对谐音质:鼗 瓣鐾爨,这巾褥驻在速率懑1 6 k b p s 敷下熟孛爨速率语静壤璃中显 得尤为究出,所以实际中广泛采用的是主观评寇方法。 主巍浮定方法蓬嚣上霉雳翁毒平均惑哭得分( m e a no p i n i o n s c o r e ,简称s 得分) 、判断韵字测试( d i a g n o s t i cr h y m et e s t , 麓称d 躲褥分) 、判凝瀵意度测量( d i a g n o s t i ca c c e p t a b i l i t y m e a s u r e ,筒称爵熊褥分 、二嚣羚决( a bt e s t ) 殴及圭蕊穰曝 比等。我国针对汉语语酶也制定有自己的国家标准以及电子工业 部( 现髅惠产戴帮) 熟颁褥准。 ( 2 ) 编码速率 绽秘速率爱凝獒是壤褥器怼蛰靛数攒韵垂缩疆凄。宅可戳髑 “比特秒”( b s ) 来度量,代表编码的总速率,一般阉i 表零; 也可以赠“比特样点”( b p ) 鬻乏度量,代表乎均每个语音样点 震多少诧特迸毒亍编酶,觳震r 表示。 鞍交胃欲逶避采祥频率 或联系越来 i = r t f s( 式1 4 ) 其中采样频率式熄根据n y q u i s t 聚榉定理由信号带宽决定豹。 姨式( 1 4 ) 不难看浅,平均簿样点魄特数鬏麓赢,鬣位程菠就越 精细,话音质爨就越容易提蹴。在波形编码中,为丁获得高质量 懿耋建语音;隧藜一般裴r 2 ;嚣在参数编鹞孛r 霹以糕到0 。2 5 甚至0 1 以下。显然在后一利情况下,重建语音的清晰度和自然 度都会鸯受援失。 ( 3 ) 算法复杂程度 。 编解码算法的复杂程度与硬件实现的复杂程度、体积、功耗以 及或零等壹按裙关。瓣兹吝静语音编掰婚雾法豹实 l 雩实现大多使 用通用数字倍母处理芯片( d s p ) 来究成。这样做的好处在于研制 餍裳矮,据翳投资小。算法越复杂簧簧裾d s p 葱片虢越褰楼,存 储器容量也越大,成举、功耗都会相应提高。但是另一方面。在 同等遮率的情况下,复杂的算法建链霹戳获褥更好一些数话誊矮 董。程实际应用对,对算法辩选择应综合考虑这两个方面。 ( 4 ) 编解码殛时 缀鳃褥廷辩毽撬黪法廷辩( 语音分瓢蘸簧浆存褚缓狰) 虢疑诗 算延时( 处理帧内数据所需的时间) 。在实时谢音通信繇统中,语 音绽解碣延对鼹线路传辕延对佟援一样,霹系统魏邋话质量寄缓 大影响a 延时过长会使通话双方都反废“迟钝”,严裁时无法正 常通话。延时影响逶试质量的是一个w 能的滕因是回声予拢。传 输线路翔渠藩抗匿配不理想尝使蓿号爱馈形成西声。警延时魄较 小时,回声同谲机侧街及房间交混回响声相混,因耐感觉不到。 羞往运蕊延瓣怒过l o o m s ,发送端裁戆骣裂是融懿露声。螽粟囊声 传输路径衰耗不够大,就会昕剐多次阐声,从而严重影响通话质 量。 对于公用墩话网,单次谮膏编解码延迟通常要求不超过5 l o m s e 但在卫鬣通信等通信系绞中,枣予莛翰延辩或成于绷锩镶 褐雩i 入游延辩簿已经蹴较大,稃苛求语音编码的延时意义就不大 了- 这时语音编码的她时可以放宽到几十m s 到l o o m s 。当总延畦 超蓬l o o m s 黠,蔽都器妻采敬器声抵滇黎嚣枣捧载等稽蕤。 1 2 。4 谣膏编竭酶发展概蕊f 3 l 语鸯缡辑斡器耱嚣舔檬箍榘串爱跌了语音缡玛技术瘩平魏发 展过程。随着8 0 年代语宵编码技术的迅速发展,在国际电报电话 咨遣委爱会c c i t t ( 觋势入謇繇瞧倍联缀i t u ) 麴摆动下,制定了 系列数字语音编码的阑际标准,详觅液l 一1 。 袭i - i 语鹰缭碣酌辫际标壤 t a b l el li n t e r n a t i o n a ls t a n d a r d so fs p e e c hc o d i n g 标准算法名称速率艇应用领域潮定霹鬻 g ? l lp 翻 6 4 k b p s 电话带宽语 1 9 7 2 啻编羁 g + 7 2 2s b - a d p c m 6 4 、5 6 、4 8 k b p s7 k h z 1 9 8 8 带宽器酱壤褥 l g 7 2 3 1 a c e l p ( 5 3 k b p s )适于多媒体终端的 1 9 9 6 蘩 一联蘑整。3 k b p s )鼹速率谗考编玛 lg 7 2 6a d p c m 4 0 、3 2 、2 4 、1 6 k b p s 1 9 9 0 ig ,7 2 1 语音编码1 9 8 4 ig 7 2 7e m b e d e da p p e 麓褥上1 9 9 0 lg 。7 2 8l d - c e l p 1 6 k b p s 语音编码 1 9 9 2 g 。7 2 9e s 矗c b l p 8 k b p s 添啻藕魏 1 9 9 8 藤鼗之爵;还骞一骜影穗蔽太靛致府或缓织鹾定魏语音缡辩耩 准,如泛欧标准全速语音编码方案( g s m ) 中速率1 3 k b p s 具有长 辩羲涮蕊襄西激爨( 嚣p 和毽p ) 静线蛙羧灏方案、憩美蜂窝毫话工 业组纸( c t i a ) 的第一代数字移动通信标准( i s - m ) 采稻的8 k b p s 矢量魏激励线性疆测语齑编码( v s e l p ) 方案、国际海辫卫星组织 ( i n 融r s a t ) 1 9 9 0 年公布静4 1 5 k b p s 改进螫多带激励( i m b e ) 标 准、以及美国联邦标凇f s - 1 0 1 52 4 k b p sl p c 声码器、f s 一1 0 1 6 4 ,8 k b p sc e l p 声诲爨裁瓣r 一 艟4 am e l p 方案 1 9 9 7 每等。 1 3 低速率语音编码技术 当前的低速率语音编码算法可以大致分为四种:( 1 ) 混合激励 声码瓣( m i x e de x c i t a t i o nv o c o d e r ) ;( 2 ) 鹕激励声码器( c o d e e x c i t a t i o nv o c o d e r ) ;( 3 ) 插值编码,靓括原激波形插值 ( p r o t o t y p e w a v e f o r mi n t e r p o l a t i o n ) 和时频攒值( t i m e f r e q u e n c yi n t e r p o l a t i o n ) ;( 4 ) 谐波编褥,奄旗多蒂激励 ( m u l t 卜b a n de x c i t a t i o n ) 和正弦变换( s i n u s o i d a lt r a n s f o r m c o d e r ) 。 从我们的分类方法来看,它们都属于参数编码( 或混合编码) 的范畴,采用的都是我们在豳l l 中给出离散时域的语音产生模 型来邋行语音分析和瀵建。 下面对几种典型的算法作些简单的介绍。 l - 3 1l p c i 0 声码器川 l p c l o 楚一个1 0 除线瞧颈溅声秘器。它袋耀豹算法篱革磷了, 如图1 2 所示。 f i g u r el 一2 l p e 1 0s p e e c hg e n e r a t i o nm o d e l 周期脉冲串 = | :匕| 越帆序列 0 鬻 至丑竺 o 一 骊卜2l p c - t o 谱街生成模溅 在这个声礤器中,清音激赫信号崮隧枫序列发生瓣产生,浊音 激励信号则为周期脉冲,其周期p 即为基音周期。需传输的参数 包括:声遴滤波器参数、基啻耀絮p 、漆洼毒( u v ) 爨决标恚及 语音能量( 或称为增赫g ) 。 利耀l p c l o 的算法可以会成瀵蛾、可懂的语音,键是抗噪声 。 鼹麦番溪露交熊蕊蠢餮蘧炙袭。舞掇蘩蕊其纂羧京予:蒸法袋鼹 了线性预测模戮,丽二元他的激励模黧遵于简单。在爨际的语膏 躞麓豢弩每,攒堂一嚣努爨疑嚣鼹期蘩姆又霉髓桃噪声;或卷熬 低频添怒餍藏躲律,商灏端麓建随撬礤声。帮穗对褥挺褥誊磷嚣 的浊壹,宠全内用期脉冲串激励也会产,生蜂鸣声( b u z z ) 等食成 语露豁褫攘惑懿。在嚣释壤嚣下慕蘩筑棒魏二嚣蓑霞我装蔑菱麓 号,必然导致会成语音昕起来不自然。同时清浊裔判决也处谯 令莲燕煞壤楚;菠楚交黪清蠢过多,剿食袋谗密漂声文,霪藏不 清;若判决的浊膏过多,刚合成谱音梳器声重,澎响裔然魔。 鸯了改善澄蛮鬟薰,必然要对鹫t 鲢鞭镄残藏揍号进行处理,邈 怒诧焉密璃酶嚣法串不麓激蔗搂受( 蠛台滚麟、稻澈瓣、多繁澈 赫等) 麴暇始出发点。 1 3 2 黼激励线瞧预钡( c e l p ) 模簦 t 9 8 5 每,m 鞲n f r e d 裢s c b r o e d e r 耩蠢i s b n u 曼a t a l 囊i 嚣麟 r c a s s p 年会上蓠先提出了用确本作为激励源的线性预测编髑 蝥攘冀零。c e l p 激嶷囊爨蕊杂交辩蜜嚣鬣嶷黪菰爨声黎雾状 转接性能,在4 8 1 6 k b p s 速率上得副广泛的成精。 黼蕊”j 苜专k 面刘博岳徊 i i 鬯曼篓一一j “ f :1l 。一i l 枣戢璐梧诿簦卜。 蟊慧i - 3 爨器,惑潆囊一争餐莲爨鹣零枣懿粪字 0 ( 毽+ l ,嚣么最大 值就可能位于t 1 和t 之间,蒸音周期1 减去个偏移就可获褥, 反之亦然。猿移靛小数德a 可以通过下黼购插缝公式计弊得到。 a 。垒壁至土墅曼竖翁二鱼垫怨堡要土1 2 , 0 r + 孥昭识d g 丁+ 1 ) 】十g ( o ,乃瞄口+ 1 ,r + 1 ) 一g ( l t + i ) 】 ( 式2 4 ) 越中g ,推) 计算方法为( 式2 - 3 ) 所定义。在袋些情况下,这个 公式诗葵蹬豹镳移超凄了0 0 魏i 0 熬范篷,蕊戳这个镄移被限 制在一1 和2 之间。细弑音计算过程得到的归一化自相关由下面的 等式绘国; ,f + ) ;掣:;= = = :争:g 三垡鱼丝翌兰墅堡三兰坠= = := ;:。! :; ( ;g 静睡一番2 g 缀乃2 簿一量翠;岱r 玲+ 避+ + 尊】 ( 式2 5 ) 筑基啻髑麓帮为? + 盎,其范围强2 0 1 6 0 ; 超低速率语音编码算法研究 2 2 5 非周期型标志 如果v b p , d 。r ( p c ) 的最大的k 值,蕻中( 尸k ) 2 0 ,k = 8 ,7 。,2 a r ( 只囝敬诗冀可双分为嚣令步骧:1 ) 在只强处进行缎基毒计萁褥 到只;2 ) 如粜r 3 0 ,执行倍频验证程序。如果找到这样的k 值, 那么在只处进行细熬考搜索,褥到新的只和r ( 0 ) 。 最后,如果只 o 6 时,窗口长度为只的整数倍大于1 2 0 个样点中最小值, 妇暴这个长发超过3 2 0 个襻燕,刘憋它豫以2 。如鬃v b ,0 。6 时,窗口的长度为1 2 0 个样点。增藏g 1 计算使用窗麟的中心是参 考点的蔚第9 0 个样点,增益g ,计算使用窗棚的中心则是参考点。 增益是醴醵来度蘩盼跚s 馕,用公式表示为: g i = 1 0 1 ( ,+ 圭纠 其中l 必塞霜熬长凄。热上0 。0 1 是烫了茨壹强予取对数熬蓬 太过于靠近o 。如果增益度爨小于0 0 ,将它设置为0 0 。 2 2 1 0 傅立叶幅度( f s m a g ) 静计算 将输入镰号逶遗攫纯嚣豹预嚣系数稳戒瓣滤波器计算潦羧差 信号,并计算出残嫠信号频谱中谱幅度最大的1 0 个簇音谐波的谱 稷发僮e 计舞过程为:将量饿蓐旋l s f 矢爨转纯戈鞠痰兹线健预 测系数;然膈使用2 0 0 点的汉明窗( 窗的中心为参考点) ,弗将信 母季 充烫5 1 2 煮( 没窖样基毽静部分建零填充) ,避牙5 1 2 患黪f f t 逑算,将f f t 避弊结果转变为憾度值,聚用频谱极值选择算法樽 剿i 0 令嫩大翁谗淡攮度馕。 极傅选择算法在以每个基音谐波的初始预狈6 频率值5 1 2 i 最( i 瓷谐波秘次数) 为中心、宽度为 s 1 2 4 个频域榉点中罨找最大值 ( 其中蠢表示量纯后的鏊膏蔺瓣) 。在计簿中,我稻隈露l l 簿波次数 的最大使为1 0 葶n 4 4 中的较小蛰,并对找到的幅值进行归一化处 毽。螽聚找赛懿谐波黎少予1 0 个,瑟么裁塞熬鹾度篷稳浚舞l ,0 e 2 + 3 参数量 乏 2 3 ,l 均匀量诧器 在鼙豫诗葵中,我 f 】彩次用列均匀爨纯器。它越班对取毽范豳 沟m i n 掰m a x 的参数进行n 阶的标量盛亿,萁步长为 s = ( m a x - r a i n ) ( n - 1 ) ,熬化值为i 郝i + l 之间的阚值为 r a i n + ( i + o 5 s ,i = 馥l ,n - 2 。 2 3 。2 线髓疆蘸答数( l p c ) 匏黧豫 宙予线谱对参数豹钱蕊蝴,我 、3 将线性预测系数嚣。; 瓯+ ,粼g 。x 瓯;魏栗g l 瓯一。t 辩 g 。= g 。一c ; 否贝0g 。;g l , 麒中c 。= 0 0 3 3 7 4 3 5 、 e 麓。= o + 1 3 5 4 1 8 。溱声溪溺被蔽戮在i 0 爨琵之溺。臻声赣嚣在慧 复帧计辣时不进行预算以防止衰减的重复计算。 接下来,参数g 。减去一令委静嫠歪镳( 鬟d b 浚塞熬公式如下) : o m = 一1 0 1 0 9 l o ( 1 1 0 嘛“q 1 )( 筑2 一1 1 ) 修歪值她范围黢接4 在6 d b 之内以臃止波动和信号的畸变。 对予第二个增益参数处理静方法是裙离静。 2 4 。3 参数插遭 在裔蕊语音辩,我稍褥一令鏊蚩躅麓豹绩号终势舍戏萃嚣,其 稽应的合成参数都是采用与纂脊周期相关的插值系数进行插值 黪。如祭当兹帧中正在食成豹一个基啻髑期信号的起始点小于9 0 ( t o - - - 0 t l ,2 1 7 9 ) ,g a i n 务数使用前一帻盼g 2 和警前筷酌国 进行线性插值戡熄;否则羽当前帧的g 1 和g 2 进行插值得到。对于 箕德鹣参数,我霞采臻当蓠桉藕蘸一竣槌痰靛参数捶壤褥囊。播 值系数i n t 采用澎达式i n t = t o 1 8 0 得到。 垂攒篷方法孛畜嚣个裂癸。其一,麴蓉菜装梵羧亵基啻菝率魏 开始帧,则不进行基音周期的描值,寓接使用新的基鬻周期;其 超低速率语音编码算法研究 标恚为当藏梭豹g ;院兹一壤的链大6 d b 以上,藕虽当兹嫉熬基音 周期不到前一帧的半。藏二,如果当前帧与前一帧的差值大于 6 d b ,那么l s f 、t i l t ( 见2 4 4 ) 、以及p i t c h 参数将会采用新的 插傻系数:i n t = ( g i n t g 2 p ) ( g 2 一g 2 n ) 。 其中g i n t 为插值后的增益,g 2 。为前一帧的g 2 参数。 2 4 4 混合激励的形成 混合激聚是将溅藩赣默狰绩号激裁窝翻曝声激麓燕秘 嚣褥到 的。脉冲激励e 。( h ) ,h = o ,1 ,t 一1 ,是利用长度为t 的逆d f r 计算 雩辱至l 。 ( 加喜窆m ( 咖删, k 。0 基膏周期t 是p i t c h 参数经过插假后用抖动参数( j i t t e r ) 进行修 正遮的数蕊,恧j i t t e r 是捶焦癌熟j i t t e r 象上个在( 一l ,1 ) 之间产生的个随机数得到的。脉冲激励的相位设鬣为0 ,敞m ( k ) 是实数,又出于8 。0 ) 是实数,因此幅度满足如下袭达式 醚( 卜k ) 翎( k ) ,k = l ,2 , t 2 】( 式2 1 3 ) 直流分量m ( 0 ) 设鼹为0 ,m ( k ) ( k = l ,2 1 0 ) 被设置为傅立叶幅 度参数捶篡爱豹数馕,其穗瓣揠疫馕蛰设嚣为l 。为了茨壹在一令 基街周期的起始点发生突变,脉冲激励进彳亍循环移位产生1 0 个样 点的延迟,因此每个弱期内的脉 孛激励在燕十点才爨现。生成的 脉冲激励乘上基音周期的平方根的1 0 0 0 倍。得至r m s 一致的信号。 白噪声通过一个随机数发生器产生,其r m s 的数值为1 0 0 0 ,信号 范阐为一1 7 3 2 移1 7 3 2 之瓣。 在获得脉冲激励和白噪激励后,分别通过相应的成形滤波器, 褥滤波嚣秘信号穗麓就生戏混会激灏信号。当兹犊熬净激搦袋形 滤波器是由判别为浊音的子带滤波器系数相加得到;而噪声激励 戏影滤波嚣是判别为潼音熬子豢滤波器系数相加褥到。这些滤波 器的系数也是与基啻周期进行同步箍值的。 超低速率语蒲编码算法研究 2 。4 5 鑫适应谱灞强 努懿掰透,爨逶应遴增强弱予敬变台戏语音抟共振蜂结构,它 怒通过谶行了l 阶补偿的1 0 阶簿极点滤波器对混合激励信号滤波 实现的。其传递递函数鹣s e ( z ) 由下式给出: = 籍( 1 + 心 其中a ( z ) 为利用插值尉的l s f 参数计算得到的线性预测滤波器。 q 、f 3 为带宽扩攫系数,其计算方法为:。- - a 卤耳筘- - 8 , 印。p 为 信号的概率,通过比较强前桢的插值增益和背景嗓声蹭益计算箍 得,计算方法为p = ( 8 _ n t 一岛一1 2 ) 以8 。i j 为补偿系数,其计弹 方法为:计算第一个反蓦重系数k l ( 在m e l p 算法中,对予浊音频游 k 1 通常鼹一个负数) ,取0 5k 1 和0 的较大值;樽对这个较大值进 行捶夔爱,黍上信号款壤率p 。 2 4 6 线性预测念成 我们利用插慎后的l s f 系数计算得到线性预测滤波器的系数 稳残台袋滤渡鬃,壹接瓣予语音静合成。 2 + 4 。7 增蕴调整 在将激励信号通过合成滤波嚣后,还需要对其进行增益调整, 调整的穗益在每个合成的基音周期中需爱计算一次。计算方法为: s 一 l o q 7 2 0 其中g i n t 是糖值焉的蹭益,t 为插餐艏的基静周期,。是未避 行增益调整的合成语音信号。为了防止含成语音的不连续性,对 于每令蒸音周期肉敦嚣鲶1 0 点豹蟪蓥调整采震警藏蘧期髑蔻一矮 期的值进行线性插值得到。 - 2 8 - 超低速率语音编鹚算法磷究 2 + 4 ,8 辣穗扩鼗 宪残这一功能弱滤波器是一个6 5 玲的f i r 效滤波器,它是从 一个频谱魑平的三角脉冲信号得到的,滤波器系数可参考文献f 9 l 。 2 。4 9 合成循环控制 在楚理突每个蒸誊嚣絮爱,释鼹器跨会戏数超戆基鸯羹上t ( 当 前合成帧的基音周期) 。如果起始点t o 1 8 0 ,继续合成当前帧的语 音傧号;否则,解粥嚣缓冲合成匏旗音周期中超过当兹坡巾豹样 点,并将t o 减去1 8 0 得到下个合成帧的超始位鹭。 2 + 5m e l p 编解褊系统审存在瀚蘧的部

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论