已阅读5页,还剩67页未读, 继续免费阅读
(信号与信息处理专业论文)基于低比特率语音算法mcu的设计与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
北方工业大学硕士学位论文 摘要 语音编码是利用冗余度或者语音听觉上的制约来压缩语音信号中的不必要 信息,从而达到降低传输速率或存储容量的目的。本文利用这两方面特性来实现 对语音数据的压缩,并完成算法的软件与硬件实现。 本文首先介绍波形编码算法的原理并详细论述了自适应差分脉宽编码调制 ( a d p c m ) 算法的原理及实现过程,利用v c 6 0 进行了软件仿真:在此基础上,利用 v e r i l o gh d l 对该算法进行了集成电路设计,并用m o d s i ms e 6 1 对算法进行了仿 真,验证,与测试,最后用s y n p l i f yp r o7 3 对电路作了综合,并且具体讨论了 在设计过程中遇到的问题及解决方法。由于此算法受数码率的限制,它适合对语 音音质要求较高的场合。 另一部分对参数编码算法中常用到的关键技术进行了深入的剖析,并对代数 码激励线性预测编码( a c e l p ) 的原理及各功能模块进行了细致的分析,在此过程 中,对关键功能模块的执行效率与代码实现及优化都进行了分析讨论。这为后面 硬件实现奠定了基础,最后用软件进行了仿真,并将其结果与a d p 踊编码效果作 了比较,对其差异作了分析解释。 最后对a c e l p 算法的硬件实现进行了讨论。本文的硬件采用的是i pc c o r e , 它对乘法运算占用较多的指令周期,而此算法中乘法运算占用较大的比重,所以 本文设计了专用的乘法器,同时对算法代码实现作了大量的优化,并对算法中主 要模块的运算量作了统计分析。最终完成了a c e l p 算法的硬件实现,但要达到实 际应用中高效实时的需求,还需进一步的完善优化。 关键词:语音编码,线性预测,数字语音系统,a c e l p 北方工业大学硕士学位论文 a b s t r a c t s p e e c hc o d i n gi st a k i n gu s eo f t h er e d u n d a n c yb e t w e e ns p e e c h e sa n dt h er e s t r i c t o fe a rt og e tr i do ft h eu n n e c e s s a r yi n f o r m a t i o na n da t t a i nt h eg o a lt or e d u c et h eb i t r a t e so rs t o r a g ec a p a c i t y 。i nt h ep a p e rw ej u s tr e a l i z et h ec o m p r e s s i o no fs p e e c h a c c o r d i n gt ot h e s et w oc h a r a c t e r s t h ec o n t e n to ft h ep a p e ri s t oc o m p l e t et h e i r r e a l i z a t i o n si ns o f t w a r ea n dh a r d w a r er e s p e c t i v e l y 。 f i r s tw ei n t r o d u c et h et h e o r yo f w a v ec o d i n ga n dd e s c r i b et h et h e o r yo f a d p c m a n dt h ep r o c e s so f i t sr e a l i z a t i o n ;t h e nw es i m u l a t ei ti ns o f t w a r ev c 6 0 。b a s e do nt h i s , i n t e g r a t e dc i r c u i ti sd e s i g n e di nv e r i l o gh d l f o rt h i sa l g o r i t h m ;i na d d i t i o n ,t h ec i r c u i t h a s p a s s e d t h es i m u l a t i o n , v e r i f i c a t i o n , a n d t e s t i n g u s i n gs o f t w a r e m o d s i m s e 6 1 ;f i n a - l l yw es y n t h e s i z et h ec i r c u i ti ns y n p l i f yp r o7 3a n dd i s c u s st h eq u e s t i o n si nd e s i g n a n dp r o c e s so fs o l v i n gp r o b l e m s 。d u et ot h ec o n s t r a i no f b i tr a t ef o rt h i sa l g o r i t h m ,i t m a i n l ya p p l i e st ot h eo c c a s i o n sw h i c hr e q u i r eh i g l lq u a l i t yf o rs p e e e h 。 mt h eo t h e rh a n d , w ed e e p l ya n a l y z et h ec r i t i c a lt e c h n o l o g yo fp a r a m e t e rc o d i n g a l g o r i t h m , a n ds p e c i a l l y d i s c u s st h et h e o r yo fa c e l pa n dt h ef u n c t i o n so fa n p a r t s , d u r i n gt h i s , w ea n a l y z et h ep e r f o r m a n c ee f f i c i e n c yf o rt h o s ei m p o r t a n tp a r t sa n d o p t i m i z et h ep r o g r a mc o d e , w h i c hp r o v i d et h ef o u n d a t i o nf o rt h ef o l l o w i n gr e a l i z a t i o n i nh a r d w a r e ;t h e nw es i m u l a t ei ti ns o f t w a r ea n dc o m p a r et h er e s u l t sb e t w e e n a d p c ma n da c e l p , a n de x p r e s st h er e a s o n sa n da n a l y z et h e mf o rt h e i rd i f f e r e n c e s 。 i nt h el a s tp a r t , w ed i s c u s st h eh a r d w a r er e a l i z a t i o nf o ra c e l pi nh a r d w a r ed e s i g n w h i c hi sb a s e do ni pc c o r e ;s e v e r a li n s t r u c t i o nc y c l e sa l en e e d e dw h e ni te x e c u t e s m u l t i p l yo p e r a t i o n , w h i l ei nt h i sa l g o r i t h m , m u l 自i p l yo p e r a t i o no c c u p i e sb i gp r o p o r t i o n s , s ow ed e s i g nas p e c i a lm u l t i p l yc i r c u i t 。m o r c o v e r , ag r e a tm a n yp r o g r a m sa r e o p t i m i z e dt oi m p r o v et h ee f f i c i e n c yi nh a r d w a r e 。u l t i m a t e l yw ec o m p l e t et h e r e a l i z a t i o ni nh a r d w a r e ;b u ti no r d e rt os a t i s f yt h ea p p l i c a t i o ni np r a c t i c e , m o r ew o r k l l c c d s t o b e d o n e 。 k e yw o r d s :s p e e c hc o d i n g , l i n e a rp r e d i c t i o n , d i g i t a ls p e e c hs y s t e m , a c e l p 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及 取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外。论 文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得韭友王 些盔堂或其他教育机构的学位或证书而使用过的材料。与我一同工作的同 志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 嚼 学位论文作者签;又主吾;年占月f 日 学位论文版权使用授权书 本学位论文作者完全了解j e 友王些太堂有关保留、使用学位论文的规 定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论 文被查阅和借阅。本人授权j 左王些太堂可以将学位论文的全部或部分内 容编入有关数据库进行检索。可以采用影印、缩印或扫描等复制手段保存、 汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名厦 签字日期: 年月1 日 学位论文作者毕业后去向: 工作单位: 通讯地址: 导师签名: 签字日期: 电话: 邮编: 北方工业大学硕士学位论文 1 1 引言 第一章绪论 随着微电子和计算机技术的高速发展,许多嵌入式集成应用系统应运而生, 其中,各种语音处理系统不断被开发出来,在各行业得到广泛应用,如语音播放 器、报站器、自动解说装置、采访录音笔等,为人类的生产、生活提供了极大的 便利。特别是窄带信道要求以及对语音信号的高效存贮,促使语音编码技术向着 低编码速率、高可懂度和自然度的方向发展;低比特率语音芯片在有线通信、无 线通信、保密通信及语音应答系统中等各方面有着极其广泛的应用;而语音编码 技术经过8 0 年代中期9 0 年代中期l o 年的研究已经取得了很大的成果,国际 电信联盟( 删) 已制定出若干国际标准,如g 7 2 8 、g 7 2 9 、g 7 2 9 a 、g 7 2 3 1 等,已获广泛使用,这给通信业务带来巨大的商机。 1 2 本课题研究的意义 本文目的是利用语音特点研究语音编解码算法原理以及经济高效的实现方 法。 随着信息社会的高速发展,频率资源变得愈加宝贵,因此压缩通信系统的 传输带宽就成为人们研究的热点,语音编码在这一过程中担当着重要的角色。 如标准p c m 编码,对3 4 k h z 频带信号需用6 4 k b p s 比特率传送,而压缩这一比特 率显然可以提高信道传送的话路数;对语音进行压缩编码的基本依据有两个:一 个是从产生语音的物理机理和语言结构的性质来看,语音信号中存在较大的冗余 度,语音压缩实质上就是识别这些冗余度并设法去掉它们;第二个依据是利用人 类听觉的某些特点,从听觉器官的物理机理来看,人所能听到声音的动态范围和 带宽受到限制,比如利用听觉的“掩蔽”现象( 即一个强的音能够抑制另一个同 时存在的弱的音) 可抑制与信号同时存在的量化噪声。因此,利用冗余度或者语 音听觉上的制约,可以压缩表示语音信号的必要信息,从而可以降低传输速率或 存储容量。目前,语音信号的编、解码研究正处于蓬勃发展时期,有大量产品投 放市场。 、 另一方面考虑到算法实现的实时及经济问题,在对算法实现时需综合考虑算 法的执行速度及占用的资源。通常情况对算法的实现采用d s p 处理方式,这种方 式可以达到很高的执行效率,但有时造成资源浪费。在本文中对两种不同的编码 北方工业大学硕士学位论文 方式采用了不同的实现方法:对波形编码算法直接采用了硬件集成电路的方式, 将波形编码算法直接设计成硬件电路,完成算法的实时执行,而不是常用的专用 d s p 形式;而对运算量较大的参数编码算法尝试用软硬件相结合的方式,对算法 中某些运算量很大的模块采用专门硬件模块来实现以提高运算速率。 所以对语音编解码算法的研究及实现不仅具有一定的学术意义而且具有很 强的现实价值。 1 3 论文的研究内容及系统规划 本论文的研究内容是语音编解码算法以及它的软件与硬件实现过程,它包括 波形编码算法及参数编码算法的软件实现以及硬件实现。 本文首先介绍了波形编码的原理,并对波形编码的多种实现方式进行了比较 对照,重点论述了a d p c m 算法,并用v c 6 0 进行了软件仿真。它的硬件实现采用 硬件描述语言( v e r i l o gh d l ) 编写代码实现编解码,通过仿真、验证、测试后, 将其综合成集成电路的形式,完成数字语音系统设计,实现算法的硬件编解码。 本设计采用自顶向下的设计方法,将设计好的集成电路下载至f p g a 中,设计专 用的集成电路语音编解码芯片。它具有如下的功能:能将内存中送进的语音数据 ( p c m ) 进行编码压缩,同时将压缩过的语音数据通过解码器进行解码,解码后的 数据经由d a 转换成模拟信号,再通过喇叭输出。 为了实现此功能的系统,除了其核心部分语音编解码芯片之外,还需有语音 数据、数据采集( 数字p c i l 语音) ,内存以及f p g a 等。本系统的结构如图1 1 : 图1 1 系统结构框图 2 北方工业大学硕士学位论文 而对参数编码算法,在详细分析介绍了低比特率压缩编码的原理及常用到的 编码技术之后,着重分析了代数码激励线性预测编码( a c e l p ) 的实现过程,并对 算法中的代码实现作了分析优化,完成了在软件环境v c 6 0 下的仿真,从主观听 觉上有很好的编解码效果。另外,针对算法的特点,在算法的硬件实现过程中, 探讨了利用算法代码优化及软硬件相结合的方式达到既经济又高效的目的。 1 4 论文章节的安排 本文在第一章中介绍了本文的研究意义及研究内容和系统的规划。 第二章阐述了波形编码算法的原理,软件实现以及数字语音系统的硬件设计 过程,它包括波形编码算法的软件实现,集成电路的设计,仿真,验证,可靠性 分析,综合等。 第三章,第四章介绍了参数编码算法常用的关键技术,并详细分析了a c e l p 算法的原理及程序代码在实现过程中的执行效率问题。 第五章探讨了a c e l p 算法的软硬件实现并对此算法的优化改进作了分析。 第六章对所作的工作进行了总结,并提出日后展望。 3 北方工业大学硕士学位论文 第二章波形编码算法及数字语音系统设计 第一章中已提到对语音编码的必要性,并提出了两种不同的方法,也即波形 编码与参数编码算法。本章首先介绍波形编码算法,后面章节介绍参数编码算法。 波形编码是将时域信号直接变换为数字代码,力图使重建语音波形保持原语 音信号的波形形状。它的基本原理是在时间轴上对模拟语音按一定的速率抽样, 然后将幅度样本分层量化,并用代码表示。解码是其反过程,将收到的数字序列 经过解码和滤波恢复成模拟信号,如脉冲编码调$ 1 j ( p u l s ec o d em o d u l a t i o n ,p c m ) 、 差值脉冲编码调制( d p c m ) 、增量调制( d m ) 以及它们的各种改进型自适应差分 编码( a d p c m ) 、自适应增量调制( a d m ) 、自适应差值脉冲编码调制( a d p c m ) 、 自适应传输编码( a d a p t i v et r a n s f e rc o d i n g ,a t c ) 和子带编码( s b c ) 等都属 于波形编码技术。它的特点是:高话音质量、高码率,适用于高保真音乐及语音 应用的场合。 2 1 语音信号编码原理及仿真 在数字通信系统中,语音信号被编码成二进制数字序列,通过信道传输或存 储,再经过解码后恢复成可听懂得语音,通信框图如图2 1 。因为把语音信号编 码成二进制数字序列后再进行传输或存储有其独特的优点,如它可以摆脱传输或 存储过程中噪声的干扰。最简单的数字编码方法是对语音信号直接作模数变换, 只要取样率足够高,量化每个样本的比特数足够大,就可以保证解码恢复的语音 信号有很好的音质,不会丢失有用信息,但是这种语音信号直接量化所需的数码 率太高,即使对很大容量的传输信道也难以接受,因此为了提高传输效率,必须 对数字语音信号进一步作压缩编码。 常用的压缩编码手段有两类。一类是降低量化每个语音样本的比特数,同时 保持相对好的语音质量。因为这类技术是针对语音波形进行的,常称作“波形编 码技术”。另一类是先对数字语音信号进行分析,提取一组特征参数,这些参数 携带着语音信号的主要信息,对它们只需用较少的比特数编码,在解码后可以由 这组参数重新合成出重构的语音信号,这类方法常称为“声码技术”。此方法中 数码率的降低主要取决于分析和提取什么样的特征参数,以及合成器的类型“”。 4 北方工业大学硕士学位论文 输入语音厂传输信道厂 输出语音 ,1编码器存储弄云 i解码器卜 图2 1 数字语音通信框图 2 1 1 波形编码原理 波形编码是在不利用语音信号的任何特性而希望产生一种重构信号,它的波 形与原始语音波形尽可能一致。一般来说,这种编码的复杂程度比较低,数据速 度在1 6 k b p s 以上,质量相当高,低于这个数据率时,音质急剧下降 2 6 1 2 7 1 1 捌。 波形编码方式的最简单形式是脉冲编码调制( p u l s ec o d em o d u l a t i o n ,简 称p c m ) 。它是用同等的量化级数进行量化的,即采用均匀量化,而均匀量化是 基本的量化方式。所以作为a d 与通常的a d 变换是相同的,而a d 是语音数字 表示的起点。这种方式将语音变换成与其幅度成正比的二进制序列,而二进制数 值往往用脉冲表示,并用脉冲对采样幅度进行编码,故称为脉冲编码调制。波形 编码的过程实际上是量化过程。此种编码方法中,输入信号j 扫矽幅值的范围被 分成n 个相同宽度的区间,所有落入同一区间的样本都编成相同的二进制代码 字。只要足够大,我们可以合理地假定,量化误差p 6 在各个宽度为的区 间内是均匀分布的,信号对量化噪声的功率比( 简称信噪比) 可近似地写成 s n r = 1 0 1 0 甙2 ) = 6 0 2 b + 4 7 7 2 0 l o g ( j ) ( 公式2 - 1 ) 式中,函2 和历2 分别表示输入信号和量化噪声的方差或平均能量;x 为信号 的最大幅度;口表示量化字长;s n r 的单位为d b o 而根据语音的分布统计特性, 可以取x m 戡= 4 0 x ,则上式变为: s 次= 6 0 2 曰一7 2 ( 公式2 - 2 ) 这表明,量化器每增加一个比特,信号量化噪声比增加6 d b 。一般语音信号波形 编码技术都是以p c m 码为基础的,例如d p c m ,a p c m ,a d p c m 等都是应用某种算法 对p c m 码进行再次编码,以达到压缩的目的。因为均匀量化有一个缺点,那就是 在信号动态范围较大而方差较小时,其信噪比将下降;从语音信号概率密度可知, 语音信号大量集中在低幅度上。因而,可以利用非均匀量化,这种量化在低电平 上量化阶梯最密集。非均匀量化的基本思想就是对大幅度的样本使用大的,对 小幅度的样本使用小的,在接收端按此还原。通常被电话系统采用的p c m ,利 用语音信号幅度的统计特性,对幅度按对数变换压缩,将压缩后的信号作p c m , 5 北方工业大学硕士学位论文 这也称为对数p c m 。 2 1 2 波形编码算法分类比较 上一节介绍波形编码算法的原理,根据此原理,可设计出不同的实现方法。 波形压缩编码方式又可以分为时域法( t i m ed o m a i na p p r o a c h ) 和频域法 ( f r e q u e n c yd o m a i na p p r o a c h ) 。其中时域法中又包括预测编码、自适应预测编 码( a p c ) 、自适应脉冲编码调制( a p c m ) 、差分脉冲编码调制( d e c m ) 、自适应差 分脉冲编码调制( a d p c m ) 、增量调制( 叫或m ) 及自适应增量调制( a d m ) 。频 域法则有子带编码( s b c ) 和自适应变换编码( a t c ) 。它的分类如图2 2 : 图2 2 波形编码算法分类 a p c 与d p c m ,自适应预测编码( a d a p t i v ep r e d i c t i v ec o d i n g ) 。是根据线性 预测分析原理,利用线性预测改进编码中的量化器性能,对预测误差进行量化和 编码,可使量化比特数减少。在接收端,使用与发送端相同的预测器,即可恢复 原信号,这就是预测编码;当预测系数是自适应随信号变化时,则称为自适应预 测编码。预测编码a p c 的一种特殊情况是d p c m ,即差分脉冲编码调制 ( d i f f e r e n t i a lp u l s ec o d em o d u l a t i o n ) ,其优点是差分信号比原语音信号的动态范 围和平均能量都小,这样可以用较少的比特数对其量化。 a p c m ,自适应脉冲编码调制( a d a p t i v ep u l s ec o d em o d u l a t i o n ) 。它使量化 器的特性自适应于输入信号的幅值变化,也就是量化间隔匹配于输入信号的方 差值,或使量化器的增益随着幅值而变化,从而使量化信号的能量为恒定值。通 常,采用了白适应技术之后可得到约删b 的编码增益。 d m 与a d m ,增量调制( d e l t a m o d u l a t i o n ) 和自适应增量调制( a d a p t i v e d m ) 。 增量调制的原理是:对于相关信号,随着采样率的提高,邻近样本间的相关性变 强,预测误差减小,根据差分结构,由于预测增益很高,所以也能够允许粗糙的 量化。其实质是使用l b i t 的量化器的d p c m ,它最大特点是简单、易于实现。 6 北方工业大学硕士学位论文 当采用随输入波形自适应地改变量化间隔大小的自适应编码方式时,即为自适 应增量调制。 s b c ,子带编码( s u b b a n dc o d i n g ) 也称为频带分割编码。它首先使用带通 滤波器组将语音信号分割成若干个频段也称为子带,输入的语音信号被分成各子 带,交换到每个子带中的信号都可以使用如a d p c m 进行单独编码。这样,量化 噪声只能出现在各被分割的频带内,对其他频带没有任何影响,所以可以较容易 地控制噪声谱。但它比使用简单的a d p c m 编码复杂,而且还增加了更高的编码 时延。 a t c ,自适应变换编码( a d a p t i v et r a n s f o r mc o d i n g ) 。它与s b c 一样,是在 频域上分割信号的编码方式,但比s b c 增加了相当大的自由度。 以上编码方式各有优缺点,d m 和a d m 编码简单,容易实现,但易于产生 斜率过载失真和颗粒噪声较高;s b c 和a t c 去噪性能较好,但编码复杂,生产 成本高等等。从技术实现、生产成本以及市场前景等方面综合考虑,需要选择一 种兼备它们优点的语音压缩编码方式,这就是a d p c m 。 a d p c m ,自适应差分脉冲编码调制( a d a p t i v ed i f f e r e n t i a lp u l s ec o d e m o d u l a t i o n ) 。它采用自适应量化及高阶自适应预测的d p c m ,即利用语音信号中 大量的冗余度和相邻的语音样本之间存在着明显的相关性的特征,对相邻样本间 的信号差值( 差分) 进行编码,以达到压缩信息量的目的。其本质上也是一种 a p c 。但a d p c m 并不像a p c 那样包括短时预测、长时预测及噪声谱整形的系统, 它是只有短时预测的编码系统。 2 1 3 自适应差分脉冲编码调制原理 从上面各种波形编码算法的实现可看出,a d p c m 算法有其独特的优点:它是 使量化器的特性自适应于输入信号的幅值变化,也就是匹配于输入信号的方差 值,或使量化器的增益口随着幅值而变化从而使量化前信号的能量为恒定值。它 的数码率能达到2 4 k b p s ,这种自适应可以是瞬时自适应,即量化阶的大小每隔几 个样本就改变,也可以是音节自适应,即量化阶的大小在较长时间周期里发生变 化。由于g 7 2 1 建议高音质的3 2 k b i t sa d p c m 主要用来对现有p c m 信道扩容, 即把2 个2 0 4 8 k b i t s3 0 路p c m 基群信号转换成一个2 0 4 8 k b i t s6 0 路a d p c m 信 号,因此,a d p c m 编码输入与解码输出都采用标准a 率或率p c m 信码。 为了便于数字运算,在编码器中先将输入的8 位p c m 码c ( ) 转换成1 4 位线 性码研( j 。然后,同预测信号昂倒相减产生差值信号d f j 砂,再对d 倒进行自 适应量化,产生4 b i ta d p c m 代码,6 。一方面把,倒送给解码器,另一方面把 7 北方工业大学硕士学位论文 ,例进行本地解码得到量化后的差值信号4 6 ,再同预测信号s p 俐相加得到本 地重建信号s ,扫,自适应预测器采用二阶极点、六阶零点的混合预测器,它利 用品6 、正扫以及前几个时刻的值,对下一时刻将要的信号研白+ 进行预测, 计算出昂白手 。为了使量化器能适应语音、带内数据及信令等具有不同统计特 性以及不同幅度的输入信号,自适应要依输入信号的特性自动改变自适应速度参 数来控制量阶。这一功能有量化器定标因子自适应、自适应速度控制、单音及过 渡检测3 个功能单元完成。它的编码器框图如下; 图2 3a d p c m 编码框图 自适应差分脉冲编码调制a d p c m 是利用样本与样本之间的高度相关性和量 化阶自适应来压缩数据的一种波形编码技术,它综合了a p t m 的自适应特性和 d p c m 系统的差分特性,是一种性能比较好的波形编码。a d p c m 的核心想法是: 利用自适应的思想改变量化阶的大小,即使用小的量化阶距( s t e p - s i z e ) 去编 码小的差值,使用大的量化阶去编码大的差值,使用过去的样本值估算下一个输 入样本的预测值,使实际样本值和预测值之间的差值总是最小。 2 1 4 软件实现编码 为验证上述算法的正确性及判断算法的编解码效果,最简单常用的方法是 通过软件方式直接仿真,通过人耳可以直接听出编解码的音质效果,软件实现流 程如下。 8 北方工业大学硕士学位论文 图2 4h d p o a 量化流程 上图中,s 表示输入的1 6 位语音值,s t e p 表示量化阶距,b 3 8 2 b i b o 表示从高位 到低位元的量化值,此也即为量化的a d p c m 码。 2 1 5 软件实现编解码结果 利用上述a d p c m 编解码算法对一段语音数据”拼音学习”( t t e s w a y ) 进行编 解码: 数据特点:1 6 b i tp c m , 单声道,8 k 采样,大小为:2 5 8 k ; 编译环境:v c 6 0 ,w i n x p ;时域结果如下: 翩后播敷董纠i 警习 从上图可看出,选择的语音数据”拼音学习”是一段比较清晰语音,清浊音也很容易 判断,这样在编解码之后,易于判断算法编解码的效果;我们可以从语音数据的能 9 北方工业大学硕士学位论文 量来分析编解码后的效果。 因为语音信号的能量随着时间信号变化比较明显,而且一般清音部分的能量 比浊音的能量小得多,所以该参数可以区分出语音的清音和浊音,因此可以判断编 解码后语音数据对原数据的还原程度。比较结果如下图: i 语黼:黜瞅摹$ 锄帑尉疆:黜 和过$ 事 其中上图的横坐标为帧数,纵坐标为短时能量。每帧数据为2 5 6 个1 6 b i t 语音数 据经过了h a m m i n g 码加窗后得到的。从上图可看出,在刚开始的两帧数据的能量 很小,而在第4 ,1 5 ,2 5 ,2 9 帧的能量很大,另外它们的清音部分的能量也基本相同, 这与编解码后时域波形图相一致,所以编解码后的语音数据还原出了原语音数据, 获得了非常好的效果。 2 2 数字语音系统的设计 在2 1 3 节介绍了a d p c m 算法通过软件实现语音编码与解码过程,在此基 础上,利用硬件描述语言v e r i l o gh d l 对软件算法进行硬件集成电路设计,利用 仿真工具m o d d s i m 6 1 对设计的硬件电路进行功能仿真,验证。将验证好的硬件 电路通过下载至f p g a 来实现功能。最后利用综合工具s y n p l i f yp r o7 3 对设计 的硬件进行综合。数字语音系统框图如图2 5 : 图2 5 数字语音系统 1 0 北方工业大学硕士学位论文 2 2 1 数字语音编码部分实现 根据2 1 3 介绍的语音编码原理,可设计出语音编码的接口结构框图如下: a o p c m 编码 g n c d a t a 3 一o 】 e n c _ o u t _ f i g 图2 6a d p c m 编码接口框闰 其中e l k 是系统时钟,r s t 是系统复位,开机清零信号,为高电平l 时有效; 出为从内存中取出的数据;e n c f l g 为使能标志位,当串行数据传到8 位时,存 入一寄存器,进行编码运算;e n c d a t a 为编码后的a d p c m 码,e n c _ o u tf l g 输出 控制解码过程。 为进一步详细介绍编码过程,可将设计分为如下几部分: 从存储器中取出语音数据:查询表一得出索引调整值( i n d e x t a b l e ) ;计算查 询表二的索引值( i n d e x ) ;求出量化阶距( s t e p s i z e ) ;该设计采用状态机的形式 来实现。 表一i n d e x 索引调整表二i n d e x 索引阶距 a d p e i l l l 旺位 索引调整 0 0 0 一l 0 0 1 l 0 1 0 一1 0 1 l 一l 1 0 0 2 1 0 1 4 l l o 6 1 i l 8 i n d e x阶距 i n d e x 阶距 07 1 32 5 l8 1 42 8 2 9 1 5 3 1 3 l o 1 63 4 4l l 1 73 7 5 1 2 1 8 4 l 6 1 3 1 9 4 5 71 4 2 05 0 8 1 6 2 15 5 9 1 7 2 26 0 l o1 9 2 36 6 l l 2 1 2 47 3 1 2 2 3 1 状态机设计嘲嘲咖: 依据编码的原理,它的状态转移设计如图2 7 ,首先初始化i n d e x 值,从 表一中查出s t e p 值,再利用输入语音信号值与预测值求出他们之间的差值d i f f 咄m 出 心 北方工业大学硕士学位论文 ( 其中预测值初始复位成零) ,利用差值和s t e p 值计算出编码的值( d e l t a ) ,此即 为压缩编码,再依据v p d i f f = ( d e l t a + o 5 ) * s t e p 4 求出预测值,为计算下一个 编码作准备。i n d e x 的值等于编码d e l t a 从表- - e e 查出i n d e x 的偏移值与原i n d e x 相加。再从表一中查找出s t e p ,依次循环,对数据进行编码。 圈2 7a i ) p c m 编码状态机 2 表一与表二数据的读取:对表一与表二中的值查询采用直接从寄存器中取值 的方式,前1 6 个值为依据d e l t a 得出的i n d e x 偏移值,后2 4 个值为依据i n d e x 从表一中查出的s t e p 。设计代码如下: a l w a y s o ( r o m _ i n d e x ) 8 h 0 0 :r o m _ v a l u e = 8 h f e : 8 h o l :r o mv a l u e - 8 h f f : 8 h 0 2 :t o mv a l u e 8 ,h f f : 8 h 0 3 :r o m _ v a l u e - 8 h f f ; 8 h 0 4 :t o mv a l u e ( - 8 ,h 0 2 : 8 h 0 5 :r o m _ v a l u e ( - 8 h 0 4 ; 8 h 0 6 :r o m - v a l u e - 8 h 0 6 : 8 h 0 7 :r o mv a l u e - 8 h o b : 8 ,h 0 8 :r o mv a l u e ( - 8 h f e ; 8 h 0 9 :r o m _ v a l u e ( - 8 h f f : 8 h o a :r o a _ v a l u e = 8 h f f : 8 h o b :r o m _ v a l u e - 8 l l f f : 8 h o c :r o m _ v a l u e - 8 h 0 2 : 北方t 业大学硕士学位论文 一_ _ _ _ _ _ _ _ _ - _ _ - - _ - _ _ - _ _ _ - _ _ _ _ - _ _ _ - _ _ _ _ - _ - _ _ _ _ - _ _ _ _ - _ _ _ i _ 一 8 h o d :r o mv a l u e ( _ 8 h 0 4 ; 8 h o e :t o mv a l u e - 8 h 0 6 : 8 h o f :t o mv a l u e ( = 8 h o b ; 8 h l o :r o mv a l u e = 8 h o t : 8 h l l :t o mv a l u e ( - 8 h 0 8 : 8 h 1 2 :r o mv a l u e - 8 h 0 9 ; 8 h i 3 :r o mv a l u e = 8 b o a : 8 h 1 4 :r o mv a l u e - 8 h o b ; 8 h i 5 :t o mv a l u e ( - 8 h o c ; 8 h 1 6 :r o mv a l u e :8 h o d ; 8 h i t :t o mv a l u e = 8 h o e ; 8 h 1 8 :r o mv a l u e = 8 h l o ; 8 h 1 9 :r o m v a l u e = 8 h l l : 8 h l a :r o mv a l u e ( 8 h 1 3 ; 8 b i b :r o mv a l u e - 8 h 1 5 ; 8 h l c :t o mv a l u e - 8 h 1 7 : 8 h l d :t o mv a l u e = 8 h 1 9 ; 8 h l e :t o mv a l u e = 8 h l c : 8 h l f :r o mv a l u e = 8 ,h l f ; 8 h 2 0 :t o m _ v a l u e = 8 h 2 2 : 8 h 2 1 :t o mv a l u e = 8 h 2 5 : 8 h 2 2 :t o m _ v a l u e = 8 h 2 9 ; 8 h 2 3 :t o mv a l u e ( - 8 h 2 d : 8 h 2 4 :r o m _ v a l u e = 8 h 3 2 : 8 h 2 5 :r o mv a l u e = 8 h 3 7 ; 8 h 2 6 :t o m _ v a l u e = 8 h 3 c : 8 h 2 7 :r o m _ v a l u e = 8 h 4 2 : d e f a u l t :r o m _ v a l u e = s t e p ) b e g i n d e l t a _ t m p = 4 : d i f f = d i f f s t e p ; v p d i f f _ t m p l : v p d i f fs t a t e l : v p d i f fs t a t e - s t e p ) b e g i n d e l t at m p ( = d e l t at m pi2 : d i f f l : v p d i f f _ s t a t e ( - v p d i f f3 ; e n d e l s e b e g i n s t e p l : v p d i f f _ s t a t e = s t e p ) b e g i n d e l t a _ _ t m p = d e l t a _ _ t m p i : d i f f = d i f f s t e p : v p d i f f _ t m p 1 : v p d i f f _ _ s t a t e 。v p d i f f _ e n d : e n d e l s e s t e p :v p d i f fe n d ; v p d i f f _ e n d : b e g i n v p d i f f = v p d i f t t m p ; d e l t a - d e l t a _ t m p ; v p d i f f _ _ f l g ( = o : e n d e n d c a s e e n d e n d t a s k 其中v p d i f f _ s t a t e 表示计算差值的状态,当为v p d i f f _ 1 时,首先判断差值( d i f f ) 与阶距( s t e p ) 之间的大小,当d i f f 大时,用d i f f 减去s t e p ,然后将它们之间的差 值再赋给d i f l 而将s t e p 右移一位后同样赋给s t e p ,这样首先得到的预测值大小 为s t e p ;当d i f f 小于s t e p 时,仅对s t e p 右移一位,而预测值不变,当状态为 v p d i f f _ 2 ,同样比较差值与阶距的大小,执行步骤同状态v p d i f f _ l ,当经过四个时 钟后,即可得到它的预测值v p d i f f 。通过以上分析可看出,每次对s t e p 的移位后 又直接赋给它,这种同址运算大大降低了代码占用的资源,使代码更简洁,精练。 2 2 2 编码部分验证与综合 1 语音数据的选择:通过以上编码模块的介绍,即可实现对语音数据的编 码。考虑到对代码测试的可靠性与完整性,本文截取了2 ,1 5 节中语音数据”拼 音学习”中的”学”字。因为这段语音具有较明显语音特性( 清浊音清晰,且具有 一些混合音) 。该数据特点: 1 5 北方工业大学硕士学位论文 1 6 b i tp c m ,单声道,8 k 采样,大小为6 k 2 编码的验证:首先将原语音数据( x u e w a y ) 作数据转换,因为对”w a y ” 文件读取时,会读出一些非语音数据,而且v e r i l o gh d l 也不支持读取这种数据 格式,从而导致读取数据出错。所以首先需要编写了一个c 语言程序对”w a y ” 文件处理,使其格式转化为如下形式: 7 98 27 a7 f7 f + 7 f8 48 08 88 28 b8 68 a8 98 a8 a8 78 78 37 e7 a7 b6 c 7 16 86 b6 96 f6 c7 2 7 87 9 8 48 b8 e ( 注:数据的转换只是为了测试验证的需要才对其转换的,而实际应用中输入的是 p c m 码流数据,可直接对其编码) 。 这样在写t e s tb e n c h 时,将上述转换后的数据读入,通过编码模块,得到编码 后的数据为: 7 7 7 18 00 8 1 9 1 81 80 89 0b bb 9f ob 19 29 33 17 2 0 31 12 8 c 1 f oa bb da o8 3 编码后的数据大小约为1 2 k ,压缩比为5 倍。为验证编码的正确性,将此压缩后 的数据与2 1 5 节中用v c 6 0 压缩的数据比较,结果是相同的,这样就验证了它的 正确性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 锅炉运行值班员测试验证知识考核试卷含答案
- 手工皂制皂师岗前可持续发展考核试卷含答案
- my city作文英语作文少余50字
- 幼儿园老师请假条 样本
- 2025年机力通风冷却塔合作协议书
- 2025年锂电池配套试剂项目合作计划书
- 中国咳塞坦行业市场前景预测及投资价值评估分析报告
- 2025 小学一年级科学下册鳞片的保护意义课件
- 班主任师德培训课件模板
- 犬猫骨科术前沟通技术
- 供水管道抢修知识培训课件
- 司法警察协助执行课件
- 广东物业管理办法
- 业务规划方案(3篇)
- 双向晋升通道管理办法
- 集团债权诉讼管理办法
- 上海物业消防改造方案
- 钢结构施工进度计划及措施
- 供应商信息安全管理制度
- 智慧健康养老服务与管理专业教学标准(高等职业教育专科)2025修订
- 2025年农业机械化智能化技术在农业防灾减灾中的应用报告
评论
0/150
提交评论