(微电子学与固体电子学专业论文)极低速率语音通信的实现.pdf_第1页
(微电子学与固体电子学专业论文)极低速率语音通信的实现.pdf_第2页
(微电子学与固体电子学专业论文)极低速率语音通信的实现.pdf_第3页
(微电子学与固体电子学专业论文)极低速率语音通信的实现.pdf_第4页
(微电子学与固体电子学专业论文)极低速率语音通信的实现.pdf_第5页
已阅读5页,还剩82页未读 继续免费阅读

(微电子学与固体电子学专业论文)极低速率语音通信的实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

山东大学硕士学位论文 摘要 随着信息社会和通信技术的高速发展,频率资源愈发显得宝贵。因此,压缩 数字语音信号的传输带宽或者降低电话信道的传输码率,一直是人们追求的目 标,数字语音编码在实现这一目标中担当着重要角色。 越来越多的语音数字处理系统需要按照实时方式或在线方式工作,特别是在 嵌入式系统设计中,对系统的硬件环境要求更高。随着语音处理算法的日益复杂, 用普通处理器对语音信号进行实时处理,已经显得力不从心。专用语音信号处理 芯片由于能解决语音信号处理并行性和速度的问题,在语音信号处理上尤为重 要。 本论文正是基于这一出发点,对低速语音从算法上进行仿真和模拟,目的正 是为了实现高性能的低速语音处理专用芯片,以满足质量要求越来越高的低速语 音通信需要。本次论文的主要工作有: 1 论文首先调研和总结了低速语音通信的研究现状,分析了低速语音处理 芯片的广泛应用市场和实现的意义。 2 论文完成了对现有较新的低速语音处理芯片a m b e 2 0 0 0 的外围功能电路的 设计和应用,从硬件上实现了低速语音信号处理,在1 2 k b p s 的极低速率下得到 了良好的语音质量。 3 论文完成了低速语音核心算法l p c 的模拟和仿真。通过对算法原理的理 解和分析,利用m a t l a b 为平台,成功完成了基于l p c 算法的压缩语音编码器和 解码器。通过对8 k h z 采样率的语音进行试验,得到了2 4 k b p s 的极低速率下良 好的语音通信质量。 山东大学硕士学位论文 4 为了达到更低的速度和更好的性能,在完成l p c 算法的基础上,论文对 a m b e 算法也进行了深入的研究和分析,并实现了基于该算法的编码器部分的仿 真和验证。 本文的研究结果对于低速语音通信硬件实现具有参考价值,为实现较高质量 的低速语音处理专用芯片奠定了技术基础。 i i 【关键词】:语音编码,l p c ,a m b e ,算法,低速率语音通信 山东大学硕士学位论文 a b s t r a c t 、矾t ht h ed e v e l o p m e n to fi n f o r m a t i o ns o c i e t ya n di n f o r m a t i o nt e c h n o l o g y , f r e q u e n c yi sb e c o m i n gm o r ea n dm o r ei m p o r t a n t s o w ea l w a y si ns e a r c ho f c o m p r e s s i o nd i g i t a ls p e e c hc o m m u n i c a t i o no rl o w r a t ev o i c ef r e q u e n c yg r a d ec h a n n e l d i g i t a ls p e e c hc o d i n gp l a y s a l li m p o r t a n tr o l ef o rt h i s m o r ea n dm o r ed i g i t a lp r o c e s s i n gs y s t e mh a st ob er e a l t i m em o d eo rt ob e o n 1 i n em o d e t h er e q u i r e m e n to fh a r d w a r ee n v i r o n m e n ti sh i g h e ra n dh i g h e r , e s p e c i a l l yi nt h ed e s i g no fe m b e ds y s t e m t h es p e e c h p r o c e s s i n ga r i t h m e t i ci sm o r e a n dm o r ec o m p l i c a t e d ,a n da b i l i t yn o te q u a lt oo u ra m b i t i o nt h a tt od e a lw i t h s p e e c h s i g n a lr e a lt i m ew i t hc o m m o np r o c e s s o ns p e c i a ls p e e c h c h i pc a n r e s o l et h e p r o b l e mo fp a r a l l e la n ds p e e do fs p e e c h s i g n a lp r o c e s s i n g , s ot h ea p p l i c a t i o no nt h e s p e e c h - s i g n a lp r o c e s s i n gs y s t e mi se s p e c i a l l yi m p o r t a n t a tt h i sp o i n t ,t h i st h e s i se m u l a t e da n ds i m u l a t e dt h ec o r ea l g o r i t h mo fl o wr a t e s p e e c h ,w i t ht h ep u r p o s eo fh i g h p e r f o r m a n c el o w - r a t es p e c i a ls p e e c h - c h i p t h em a i n a c h i e v e m e n t so f t h i sw o r ka r es u m m a r i z e da sf o l l o w s : i d or e s e a r c h e so nt h ec u r r e n ts i t u a t i o no fl o wr a t es p e e c hc o m m u n i c a t i o n , a n a l y s i st h em a r k e tp r o s p e c to f l o w r a t es p e c i a ls p e e c h c h i p 2 t h et h e s i sr e a l i z e dt h ec i r c u i td e s i g na n dd e b u g g i n go fa m b e 2 0 0 0 ,a n d f i n i s h e d1 2 k b p sr a t es p e e c hc o m m u n i c a t i o nt h r o u g hh a r d w a r el e v e l ,w eg o tv e r y g o o dv o i c e r e s u l t 3 f i n i s h e de n c o d i n ga n dd e c o d i n go fl p c ,t h es y s t e mi sd e s i g n e db a s e do n m a t l a b ,a n dt h ee x p e r i m e n t a lr e s u l t ss h o w e dt h a tt h es p e e c hq u a l i t yi sv e r yg o o d e v e na tt h el o wr a t e1 2 k b p s 4 f o rb e t t e rr a t ea n dp e r f o r m a n c e , t h et h e s i sa l s od oai n - d e p t ha n a l y s i sa n d r e s e a r c ho na m b ea l g o r i t h m ,f i n i s h e dt h ed e c o d i n gs i m u l a t i o na n dv e r i f i c a t i o n i nc o n c l u s i o n , t h es t u d i e sn o to n l yh a v ei m p o r t a n tt h e o r e t i c a lm e a n i n ga n dg r e a t v a l u et oh a r d w a r er e a l i z a t i o no fs p e e c hc o m m u n i c a t i o n , b u ta l s om a k eag o o d t e c h n o l o g i c a l f o u n d a t i o nf o rs p e c i a ls p e e c h c h i p k e yw o r d s e n c o d i n g ,l p c ,a m b e ,a l g o r i t h m ,l o wr a t es p e e c hc o m m u n i c a t i o n i i i 山东大学硕士学位论文 英文缩写 a d c a m 旧e 陋 a s f c t d a m d a s d c s d v s i l p a l p c l s f m b e m e m e l p m r p d p s p w i s o s t c s v s 嘲 v q v r s i v 英文缩略语对照 英文全称 a n a l o gd i 西t a lc o n v e r t o r a d v a n c e dm u l t i - b a n de x c i t a t i o n a p e r i o d i cp u l s e a d a p t i v es p e c t r a lf i l t e r i n g c d l u l a rt e l e p h o n y d i g i t a la n s w e r i n gm a c h i n e s d i a g n o s t i ca c c e p t a b i l i t ys c o r e d i g i t a lc o m m u n i c a t i o ns y s t e m s d i g i t a lv o i c es y s t e mi n c o r p o r a t i o n l i n e a rp r e d i c t i v ea n a l y s i s l i n e a rp r e d i c t i v ec o d i n g l i n es p e c t r u mf r e q u e n c y m u l t i b a n de x c i t a t i o n m i x e de x c i t a t i o n m u l t i b a n de x c i t a t i o nl i n e a rp r e d i c a t i o n m o b i l er a d i o p u l s ed i s p e r s i o n p a g i n gs e r v i c e p r o t o t y p ew a v e f o r mi n t e r p o l m i o n s c a l a rq u a n t i z a t i o n s i n u s o i d a lt r a n s f o r mc o d i n g s e c u r ev o i c es y s t e m s t i m ef r e q u e n c yi n t e r p o l a t i o n v e c t o rq u a n t i z a t i o n v o i c er e s p o n s es y s t e m s 中文译名 数模转换器 改进多带激励 非周期脉冲 自适应谱滤波 蜂窝电话 数字应答机 诊断可接受分 数字通信系统 美国数字声音系统公司 线性预测分析 线性预测编码 线性频率 多带激励 混合激励 混合激励线性编码 移动无线电 脉冲散布 呼叫服务 波形插值 标量量化 正弦变换编码 保密语音系统 时频插值 矢量量化 声音响应系统 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不 包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研 究作出重要贡献的个人和集体,均已在文中以明确方式标明。本声明 的法律责任由本人承担。 1 芦节 论文作者签名:兰堕:丝 日 关于学位论文使用授权的声明 本人完全了解山东大学有关保留、使用学位论文的规定,同意学 校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论 文被查阅和借阅;本人授权山东大学可以将本学位论文的全部或部分 内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段 保存论文和汇编本学位论文。 ( 保密论文在解密后应遵守此规定) 论文作者签名:藿尘垄导师签名:衅 期:坦i :互垫 山东大学硕士学位论文 第一章绪论 1 1 研究的应用背景乜1 尽管通信网络的容量在不断的增加,但是语音压缩编码一直是现在和未来应 用中令人感兴趣的,这是因为它有着广泛和强烈的应用背景。主要体现在以下两 个方面: ( 1 ) 语音信号的数字传输。该类应用主要有数字通信系统( d i g i t a l c o n m u n i c a t i o ns y s t e m s ) 、移动无线电( m o b i l er a d i o ) 、蜂窝电话( c e l l u l a r t e l e p h o n y ) 和保密语音系统( s e c u r ev o i c es y s t e m s ) 等。这类应用又称作数 字电话语音通信系统或者数字语音通信系统,与模拟语音通信系统相比较,它具 有抗干扰性强,保密性好,易于集成化等优点。它要求能够实时编解码,有高的 抗信道误码能力,能传输带内数据、单频和多频等非语音信号,并具有多次音频 转接能力。信道条件、时延和数据速率是该类应用中重要的考虑对象。图1 1 为该类应用的系统框图。 输入语 输出语 图1 1 数字语音通信系统框图 ( 2 ) 语音信号的数字存储。该类应用主要有呼叫服务( p a g i n gs e r v i c e ) 、 数字应答机( d i g i t a la n s w e r i n gm a c h i n e s ) 和声音响应系统( v o i c er e s p o n s e s y s t e m s ) ,如数字录音电话、语音信箱、电子留言薄、发声字典、多媒体查询系 山东大学硕士学位论文 统以及各类电子发声玩具等,这类应用又称为数字语音录放系统,它与模拟语音 录放系统相比较而言具有灵活性高,可控性强和寿命长等优点。这类应用中对编 码器的实时性要求不高,即不一定要求实时编码,但希望有较高的压缩效率,以 降低所需要的存储器容量。对解码器而言,则要求算法尽量简单,成本要低,并 且能够实时解码。在该类应用中人们最关心的是语音质量和存储需求。 图1 2 给出了该类应用的系统框图。 输入语音出语音 图1 2 数字语音录放系统框图 近十几年来,语音编码取得了突飞猛进的发展,在国际标准化工作中堪称最 为活跃的领域,已经具备比较完善的技术体系,并且进入了实用阶段。 本次低速语音编解码系统的研究就是基于这个背景,研究低速语音编解码的 实现。 1 2 低速语音编码现状 自l p c i o 和l p c i o e 语音编码标准出现以来,在z k b s 一4 k b s 的低速率语 音编码领域的研究仍十分活跃,主要原因是人们对l p c i o 的语音质量不满意。在 长期的研究中,人们逐步认识到,l p c i o 参数模型中所采用的二元简单激励模型 是其合成音质难以提高的主要原因。由此出现了很多基于l p c 语音产生模型激励 源改进的编码算法,这些算法大致可分为三类,即插值类、谐波类和混合激励类。 1 2 1 波形插值( w i ) 与时频插值( t f i ) 编码1 h 町 1 9 9 1 年美国a t & t 贝尔实验室w b k l e i j n 博士提出了典型波形插值 ( p w i 一一p r o t o t y p ew a v e f o r mi n t e r p o l a ti o n ) 的语音编码算法。p w i 算法就是 2 山东大学硕士学位论文 在一定的时间范围内( 2 0 3 0 m s ) 以慢渐变的基音周期波形为基础,在浊音帧里提 取和传送一段典型波形,用线性插值恢复未传送的信号。图1 3 是p w i 编解码原 理框图。 图1 3p w i 编解码原理框图 w b 幻e i j n 博士的实验结果表明,运用p w i 原理在3 0 - 4 0 k b s 能获得优 良的浊音语音质量。但p w i 也有其局限性,如p w i 仅适用于浊音语音,必须与 c e l p 或其它方法结合起来才能实现一个完整的编码系统,从而导致清浊两种工 作模式转换处附近产生明显的听觉失真:再者,基音周期的线性插值引入了过强 的周期性,有时会产生“嗡嗡”声:另外p w i 编码器的算法复杂,现有的d s p 实 现很困难。 当编码速率低于3 k b s 时,p w i 重建语音质量会明显下降,鉴于此,w b k l a j n 博士又提出了特征波形( c w _ ) 分解的语音编码算法。该方法将语音信号表示为渐 变的特征波形,当语音信号为明显的浊音时,c w 慢渐变,当语音信号为明显的 清音时,c w 快渐变。用简单的非自适应滤波器将c w 分解为慢渐变波形( 周期的) 和快渐变波形( 非周期的) ,对这两种成分分别编码,大大增加了编码效率,在 山东大学硕士学位论文 2 4 k b s 的语音质量接近f s l 0 1 6 标准。该方法避免了清浊判决带来的影响,适 用于所有语音段。 时频插值( t f i t i m ef r e q u e n c yi n t e r p o l a t i o n ) 编码方法是贝尔实验室的 y a i rs h o h a m 提出的,它将一段典型的特征波形变换到频域,编码传送的是这段 特征波形的频谱矢量,未传送的语音频谱采用频域插值的方法恢复,然后采用付 氏反变换得到整帧语音的时域信号。其编解码原理框图如图1 4 所示。 图1 4t f i 编解码器原理框图 典型谱的提取是在语音残差域进行的,与p w i 极为类似。用t f i 方法在 2 s k b s 一4 k b s 可获得高质量的浊音语音,但t f i 也有与p w i 类似的缺点,必 须与c e l p 或其它方法结合起来才能实现一个完整的编码系统。值得注意的是, 目前的t f i 谱内插采用线性内插方式,非线性t f i 是这一领域未来研究中一个有 意义的方向。 1 2 2 多带激励编码( m b e ) 与正弦变换编码( s t c ) ( 1 ) 多带激励编码( m b e ) m b e 编码算法是美国麻省理工学院( m i t m a s s a c h u s e t t si n s t i t u t eo f t e c h n o l o g y ) 的d w g r i f f i n 博士在1 9 8 5 年提出的,它是基于语音产生模型改进 4 山东大学硕士学位论文 的编码算法。m b e 语音模型与传统的l p c 语音模型不同,它的主要改进点是,在 激励源的模型构造上附加了自由度。即:m b e 编码器将每帧语音的短时谱按照其 基频划分为多个频带,对每个频带作清浊判决,取代了l p c 语音模型中对每帧 语音作单一清浊判决的简单处理,考虑到了每帧语音的激励信号是周期( 浊音的) 和类噪声( 清音的) 能量的混合情况。这种在激励模型中附加自由度的做法使得 m b e 语音模型重建的语音质量高于传统的l p c 语音模型,也使得m b e 语音模型抗 背景噪声的能力增强。图1 5 是m b e 编解码的原理图。 语音: 分析程序合成程序 一一一。一一一一。一一一一一。i 。一一。一。1 i ii 等固 l i 语音 图1 5m b e 编解码原理框图 m b e 编码器是一个不用预测残差的全参数化语音编码器,所以,它易于依比 例决定其它的码速率,在2 4 k b s 保持了语音的可懂度和自然度。由于m b e 编码 器码书较小或基本不需要码书,所以它的计算复杂度很低,易于用d s p 实现。 m i t 己经开发了m b e 编码器。美国数字声音系统公司( d v s i d i g i t a lv o i c e s y s t e mi n c o r p o r a t i o n ) 及其它公司继续了这个技术的开发,他们改进的多带 山东大学硕士学位论文 激励( i m b e i m p r o v e dm b e ) 和先进的多带激励( a m b e w a d v a n c e dm b e ) 编码器技 术在商品化领域取得很大成功。其中,i m b e 技术被选为几种应用的语音编码标 准,如1 9 9 0 年国际海事卫星( i n m a r s a t ) 组织选择了4 1 5 k b s 的i m b e 算法作为 其系统的语音编码标准,4 4 k b s 的i m b e 编码器被t i a 选为公共安全通信主管 协会( a p c o a s s o c i a t i o no fp u b l i c s a f e t yc o m m u n i c a t i o no f f i c e r s ) 计划 2 5 ( p r o j e c t2 5 ) 北美陆地移动通信系统的标准。由d v s l 公司开发的3 6 k b s a m b e 编码器,其性能与全速率( 8 k b s ) v s e l p 北美数字蜂窝标准( 1 5 5 4 ) 的性能相当。 现在d v s i 公司己推出了低价全双工话音c o d e c 组件,9 7 年生产出了基于a m b e 算法的、数据速率从2 4 k b s 一9 6 k b s 的单片语音编码器( a m b e - 1 0 0 0 僧) 。这 些a m b e 和i m b e 硬件产品具有用户可选择纠错码率、话音激活及噪声嵌入、双音 多频( d t m f ) 信号检测及合成、回声抵消等功能。 ( 2 ) 正弦变换编码( s t c ) 正弦变换编码( s t c s i n u s o i d a lt r a n s f o r mc o d i n g ) 是一种谐波类语音编 码方法,它是由音频波形的正弦模型建立开发的,其分析合成系统框图如图1 6 所示。 6 山东大学硕上学位论文 m : 输入; 语 _ 叫加窗i :1 j 频率 相位 : : ; 分析端 i ;i m : 压囵 幅度 频率 相位 图1 6 正弦分析合成系统框图 最早的s t c 编码器是由美国麻省理工学院的林肯实验室发明的,它是将一段 音频波形表示为一系列正弦波信号,每一个正弦波由其幅度、频率和相位确定。 当给定足够高的编码速率时,可使得编码器的性能任意接近系统的要求。事实上, 当用基于正弦波的基音估计器时,用正弦波的谐波组产生高质量的合成语音也是 可能的,其编码语音的质量取决于对正弦波幅度和相位高保真编码的能力。为了 开发码率低于4 8 k b s 的语音编码器,避免对正弦波相位的编码非常必要,因而 以语音信号的生成机理为基础,产生了一种称为最小相位谐波( m i n i m u m - p h a s e h a r m o n i c ) 的语音编码方法。这种最小相位谐波语音编码器仅仅依赖于基音、u v 信息和正弦波幅度三个参数,所以,低速率编码器的质量完全取决于有效量化正 弦波幅度的能力。当前一种新的方法是用全极点模型表征正弦波幅度,通过量化 全极点模型参数可实现低速率语音编码。 在1 9 9 2 年进行的t i a 半速率数字蜂窝语音编码方案预选评估中,4 8 b p s 编 7 山东大学硕士学位论文 码器的性能等价于8 k b sv s e l p 算法。在1 9 9 5 年9 月为取代l p c i o e 而进行的的 美国联邦政府标准评估中同,2 4 k b s s t c 编码器为候选方案之一,其测试结果 f s l 0 1 64 8 k b s 的c e l p 接近。正弦模型方法也是低速率语音编码研究的一个主 要趋势。 1 2 3 混合激励线性编码( m e l p ) m e l p ( m u l t i b a n de x c i t a t i o nl i n e a rp r e d i c a t i o n ) 编码方法是由亚特兰 大乔治亚州理工学院的a v m c c r e e 博士提出的,它是传统l p c 语音编码的改进 型算法。其主要改进点是在传统的l p c 参数模型中引入了四个附加特征,它们是 混合激励( m i x e de x c i t a t i o n ) 、非周期脉冲( a p e r i o d i cp u l s e ) 、自适应谱滤波 ( a d a p t i v es p e c t r a lf i l t e r i n g ) 和脉冲散布( p u l s ed i s p e r s i o n ) ,这四个特征 例示于图1 7 的m e l p 语音合成模型框图中。 图1 7m e l p 语音合成模型 这四个特征的引入,在相当大的程度上改善了原有l p c 参数模型的激励源构 造,也消除了l p c 合成语音中有时出现的机械的或蜂鸣的音调噪声,增强了抗背 景噪声的能力。在正式的听力测试中,2 4 k b s m e l p 声码器得到的诊断可接受分 ( d i a g n o s t i ca c c e p t a b i l i t ys c o r e ) 比运作在同样速率上的l p c l o e 标准高5 山东大学硕士学位论文 分。1 9 9 6 年5 月8 日在亚特兰大乔治亚州举行的国际声学、语音和信号处理会 议( i c a s s p ) 上,m e l p 声码器被美国国防部数字声音处理协会( d d v p c d e p a r t m e n to fd e f e n s ed i g i t a lv o i c ep r o c e s s i n gc o n s o r t i u m ) 选作为2 4 k b s 语音编码的联邦标准。在7 个候选方案中,m e l p 是最好的,甚至可以与两倍码 率的f s i o l 64 8 k b s 声码器比试。 1 3 低速率语音编码意义n 随着通信技术和信息化社会的高速发展,频率资源愈发显得宝贵。语音通信 作为人们交流信息的主要手段之一,作为通信的主要业务量,也在不断地向数字 化方向发展。因此,压缩语音信号的传输带宽或降低电话信道的传输码率,一直 是人们追求的目标,在实现这一目标中语音压缩编码技术扮演着重要角色。近十 年来,语音编码取得了突飞猛进的发展,是国际标准化工作中较为活跃的领域之 一。在4 k b s 速率以上的语音编码己具备比较完善的理论和技术体系,并进入实 用阶段。 尽管通信网络容量在不断增加,但低速率语音压缩编码一直是现在和未来应 用所感兴趣的。目前语音编码的研究热点集中在4 k b s 速率以下的编码算法,国 际上的许多研究机构已把“4 k b s 速率以下的语音压缩编码 作为未来几年的重 点研究课题,因为这方面的研究有着广泛与强烈的应用背景。如移动电话系统、 多媒体通信、语音信箱、i p ( i n t e r n e tp h o n e ) 电话等都需要低速率语音压缩编码 方面的关键技术。 我国在低速率语音编码研究方面与国外相比存在一定的差距,尤其是在算法 的基础研究方面。为了跟踪国际上这一领域的研究前沿,国内应大量投入人力、 9 山东大学硕士学位论文 物力及财力,以加强国内这一领域的研究力量,赶上国际研究步伐。 1 4 文档安排 本次课题的内容主要包括:认识和了解现有压缩语音编解码芯片,对现有压 缩语音编码器进行系统上的实验,以及编解码算法的实现。 根据系统设计的要求,本次设计首先是熟悉低速语音通信的系统工作原理, 然后是了解核心算法的原理和对对编解码算法进行仿真和验证,本文重点研究了 两个算法,也就是压缩编解码算法最为基础和核心的l p c 算法以及现在热门研究 的a m b e 算法的仿真和实现。 一共分为6 章。第一章是绪论部分,讲述语音通信的现状以及低速率语音通 信的必要性;第二章利用现有芯片,实现了极低速率语音通信系统;第三章和第 四章则是从算法上实现压缩语音编解码,其中第三种实现了l p c 算法,第四章实 现了a m b e 算法,第五章是对核心算法a m b e 和l p c 实验结果的记录、分析和总结; 第六章是参考文献和附录部分。 本次设计核心内容分布在第二章,第三章和第四章;而实验结果主要记录在 第二章和第五章,其中第二章对电路功能系统的测试,第五章则是对算法仿真结 果的测试。关于测试过程中遇到的问题以及解决方案,和所有相关的软件以及说 明文档则包含在论文附件中。 1 0 山东大学硕士学位论文 第二章压缩语音编解码系统实现口一3 为了便于算法的理解和实现,在做算法之前,设计了基于d v s i 公司的 a m b e 一2 0 0 0 芯片的语音传输系统,为整个项目设计提供了良好的对比实验硬件平 台。a m b e 一2 0 0 0 芯片采用改进的多带激励( m b e ) 算法,能实现可变速率低比特 率、高语音音质的语音压缩编解码。实验获得了低速下良好的语音质量。 2 1 系统结构框图 s 本语音传输系统结构框图如下图所示: m i ca d 、 语 模 掣 。 - e r 数 勺墨 o 曰 。缩 部 转孓 囝 语 i e a k e r 分 d a 换 喇- e r 器 ,一 n 日 、1o o o 图2 1 语音传输系统结构图 在本系统中,麦克风输入语音信号,经过语音模块进行放大。然后送到模数 转换模块进行a d 转换,输出p c m 语音信号。这就是需要处理的语音信号。 将此信号送给本次系统的核心器件舢i b e 2 0 0 0 ,利用a m b e 2 0 0 0 对语音信号进 行压缩和编码。从a m b e 2 0 0 0 出来的压缩后的语音信号送给c p l d 控制器,c p l d 收到压缩语音数据后,将语音部分进行提取和处理。此时的语音数据便是 2 0 k 一9 6 k b p s 的低速率语音数据,可以进行传输。 由于a m b e 2 0 0 0 可以编码也可以解码,所以本系统同样实现了语音的接收。 前面编码部分发出的语音信息反馈回来,由c p l d 接受,并转化为a m b e 2 0 0 0 可以 识别的格式,再由a m b e 2 0 0 0 进行解码,恢复成p c m 语音信号,送到模数转换模 块进行d a 转换,输出模拟信号再经过语音模块进行功率放大送到扬声器。 山东大学硕士学位论文 2 2 硬件设计 硬件设计是系统应用的核心工作。硬件的功能模块包括语音模块部分,模数 转换模块,语音编码解码部分以及各部分之间的接口。 2 2 1 语音模块 本模块的作用是将麦克风微弱语音信号放大给a d ,以及将从d a 中出来的语 音信号播放出来。包括了从麦克风输入语音,以及语音从扬声器输出两部分。 语音输入部分电路如图2 2 所示,这里利用l m 3 8 6 进行两级放大,采用的是 单电源3 3 v 供电。输出的信号送到a d 图2 2 语音输入部分电路 麦克风输入之后的弱信号必须经过放大才能处理,所以输入放大部分实际上 就是经过两级放大。而要使声音可以听到,输出的声音必须有足够大的功率,所 以输出语音电路实际上就是功率放大电路,其电路如图2 3 所示,该电路采用功 率放大芯片t p a 2 0 0 5 d 1 ,进行语音放大。 1 2 山东大学硕士学位论文 图2 3 语音输出部分电路 2 2 2 模数转换器及其与编码器接口电路 本次采用的a d ,d a 芯片是p c m 3 5 0 0 ,这是一款带有1 6 位串行a d 和d a 的芯 片,采样频率范围很宽,从7 2 k b p s 到2 6 k b p s ,并且它自带有回环自检测模式, 便于电路功能自测。另外,这款芯片的配置简单,不需要复杂的配置就能有效工 作。它与a m b e 2 0 0 0 接口部分电路如图2 4 所示。 图2 4p c m 3 5 0 0 与a m b e 2 0 0 0 接口电路图 1 3 山东大学硕士学位论文 这里,需要配置的只有主动被动模式选择端m s ,本电路采用主动模式。l o o p 则是选择回环检测功能端口,当它为高电平的时候,相当于a d 转化以后的输出 d o u t 接到d i n ,p c m 3 5 0 0 的此项功能为系统的测试带了很大便利。a m b e 2 0 0 0 和 p c m 3 5 0 0 的通信接口是s p i 口,b c k 提供时钟,它是晶振5 1 2 分频后的时钟信号, f s 为选通频率,与b c k 严格同步。 2 2 3 编码器部分以及与c p l 接口 1 4 图2 5a m b e 2 0 0 0 外围接口电路 a m b e 2 0 0 0 电路是整个设计的核心,除了与p c m 3 5 0 0 接口以外,其余部分的电 山东大学硕士学位论文 路如图2 5 所示。从功能上看,主要可以分为以下四个部分:时钟部分,功能配 置,功能模式选择模块,以及s p i 接口部分。 a m b e 2 0 0 0 外接1 6 3 8 4 1 怔i z 的晶振,芯片复位之后才能工作,复位时间至少为 9 5 m s 。功能配置部分可以根据应用需要进行选择,包括回音消除,语音激活,滑 动补偿等功能,使用起来比较灵活。功能模式选择部分,可以选择压缩数据率, 在实际电路测量中,即使是最低2 。o k b p s 语音数据速率,也能获得很好的语音质 量。p i n 7 5 ,p i n 7 7 ( c h a n n _ s e l ) 用来选择工作模式,一共有主动有帧,主动无 帧,被动有帧,被动无帧四种模式。s p i 接口则是需要c p l d 配置的部分, c p l d 提供时钟信号以后,压缩语音数据通过s p i 口传到c p l d ,这时便可以收下数据 进行反馈或者处理和传输。 2 3 软件设计 系统软件配置相对比较容易。通过c p l d 提供时钟,用于编码解码以及压缩 语音数据的传输。在主动有帧格式下,帧同步脉冲由a m b e 2 0 0 0 产生,与c p l d 输出的时钟信号严格同步;被动模式下,需要c p l d 提供帧同步信号。 各个功能选择端,根据需要,可以利用外围硬件配置,复位之后,也可以通 过c p l d 进行软件配置。 2 4 实验结果 在1 2 k b p s 的低速率下,仍然能够得到很好的语音效果。关于测试过程中遇 到的问题,将在最后附上的文档中给予详细说明,这里只列出了在测试语音信号 时候记录的数据。 语音测试部分所做的测试是输入语音信号,并且将回来的语音信号通过耳机 放出来。表2 1 和表2 2 是在电路正常工作时候测试出来的芯片各个管脚静态电 1 5 山东大学硕士学位论文 压: p i n lp i n 2p i l l 3p i n 4p i n 5p i l l 6p i n 7p i i l 8 3 3 v1 6 v1 6 v1 6 v1 6 v3 3 v0v1 6 v 表2 1t p a 2 0 0 5 d 1 静态电压 p i n lp i l l 2p i n 3p i n 4 p i n 5 p i n 6p i i l 7p i i l 8 1 6 3 l vi 6 3 1 6 1 2 vov1 6 2 1 v 1 6 2 6 v 1 6 2 7 v3 2 0 v 表2 2l m 3 8 6 静态电压 电路板上电以后,只有当各个管脚的静态电压正常,电路模拟部分才能正常 工作,工作电流为0 0 1 h - o 0 2 a 。 关于p c b l 3 5 0 0 ,上电之后,正常工作情况下得到如下的波形图: 终 的c 嘲 d 0 坍 明几八n 门订 以n 门曩nnf几nnn 门l 门门门门nlf她 | l s:1 3 1 2l ls 32 l 01 s 1 1 毒 邮2 | 1 | 5 毒3 2 ll 丞 l 娜豳i 黝l s a li i c 键1 3 1 2” 4l3 2f n 1 1 沁1 3 1 :1 1s 毒32it0 i 。0 v 黜 钨 瞄黝峨 图2 6p c m 正常工作的输出波形图 调节其模式,使得b c k = 8 k h z ,送到a m b e 2 0 0 0 ,才能确保a m b e 2 0 0 0 正常工作。 经过本系统测试,a m b e 2 0 0 0 在其最低的2 o k b p s 的极低速率下,语音质量 良好。 1 6 山东大学硕士学位论文 第三章语音编码模型的算法实现 前面一章从硬件上对低速率通信进行了模拟。本章从算法上对低速率语音通 信系统进行更加深入的讨论。在算法实现了,这里在广泛了解了目前存在的语音 编解码算法的基础上,仿真和实现了目前最为有效的线性预测编码l p c 以及最流 行和性能很好的算法a m b e 。 3 1 语音模型 要实现数字语音压缩编解码,首先必须从原理上对实际语音进行数学建模。 这里首先提出数字语音编解码的语音模型。 3 1 1 模型基础d 啦! 3 在语音中去除冗余度,是所有低速率编码器要解决的主要问题。语音信号中 存在大量的相关性,因此线性预测技术得到了广泛使用。一种方法是通过线性预 测器后得到残差信号,残差信号具有很小的冗余度,只需要传送残差信号就可以 了。另一种方法是求出声道模型和有关参量,通过采用合成一分析技术传送残差。 第一种方法不传送预测器参数,由于声道的短时非平稳性,必须自适应的调整预 测器的系数,在i t u - t g 7 2 6 标准中就采用了前向自适应预测( a p f ) 。第二种方法 主要以l p c 编码器为蓝本,按照残差信号的不同产生方式,产生了许多不同的低 速率编码器。 在低速率语音编码中,a m b e 本身也是基于l p c 类型的编码器,因此理解l p c 编码器的工作原理,对于理解后文中提出的a m b e 编码器的工作原理,也十分重 要。 3 1 2 模型建立柳1 人类发音器官的工作原理如图3 1 所示。肺是发音器官的能量提供者,通过 1 7 山东大学硕士学位论文 肺的作用将空气压缩进气管;再通过声带周期性的闭合,空气流从声门喷出,形 成一系列离散脉冲;咽喉、口腔和鼻腔以及舌头通过控制各自的形状和位置,使 离散脉冲气流在经过时产生许多共振,最后从口腔和鼻腔发出声音。 喉 声 图3 1 人体发音器官示意图 当发清音时,声带不振动,只是在从咽喉到口腔的路途中对气流作阻塞后迅 速打开( 塞音如b ,d ,g ) 或摩擦( 摩擦音如f ,s ,h ) ,因此清音可以看成 是无规则气流( 噪声信号) 通过声道系统,而浊音是周期气流通过声道系统。 语音信号的频谱可以写为: s ( 6 0 ) = g ( ( 1 ) ) v ( ) x r ( ) ( 3 - 1 ) s ( ) 是语音波s ( t ) 的傅立叶变换,g ( ) 是激励源的傅立叶变换,v ( ) 是 声道系统函数的傅立叶变换,r ( ( i ) ) 是v i 腔声辐射特性的傅立叶变换。声道被表 示为非均匀截面的声管,声道的谐振频率是由声道截面面积沿着声道变化的情况 决定的。声门脉冲模型g ( z ) 的作用是使浊音的激励信号具有声门气流脉冲的实 际波形。声门波形的频谱分析表明,其幅度频谱按每倍频1 2 d b 衰减。g ( z ) 的大 致形式可用下面函数表示: 1 8 g 2 瓦杀历 模拟声道特性的时变线性系统v ( z ) 是一个包含零极点的滤波器: ( 3 - 1 ) 山东大学硕士学位论文 矿( z ) = 兀( 1 - b , z _ ) 三! 兀( 1 - a k z _ ) ( 3 2 ) 辐射特性和嘴有关,辐射模型r ( z ) 一般可近似表示为r ( z ) = ( 1 - r z 叫) ,l ( 单零点传递函数) 。对照图1 - 2 中语音信号产生的数字模型,可以看出激励源由 g ( z ) 构成,时变线性系统由v ( z ) r ( z ) 构成。 在上述语音信号产生的数学模型中,g ( z ) ,r ( z ) 保持不变,基音( t ) ,增益 ( g ) ,声道滤波器v ( z ) 以及清浊音选择开关是时变的。对于声道滤波器参数一 般在2 - 3 0 毫秒内保持短时平稳,对于激励参数在5 毫秒内保持平稳。只要能知 道时变参量,就可以合成语音信号。 3 2l p c 算法的仿真和实现 l i n e a rp r e d i c t i v ec o d i n g ( l p c ) 线性预测编码是目前进行低速率语音分析 最有效和最流行的技术之一。从原理上讲,l p c 是通过分析话音波形来产生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论