(微电子学与固体电子学专业论文)语音编码中基音搜索算法的asic实现.pdf_第1页
(微电子学与固体电子学专业论文)语音编码中基音搜索算法的asic实现.pdf_第2页
(微电子学与固体电子学专业论文)语音编码中基音搜索算法的asic实现.pdf_第3页
(微电子学与固体电子学专业论文)语音编码中基音搜索算法的asic实现.pdf_第4页
(微电子学与固体电子学专业论文)语音编码中基音搜索算法的asic实现.pdf_第5页
已阅读5页,还剩57页未读 继续免费阅读

(微电子学与固体电子学专业论文)语音编码中基音搜索算法的asic实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着通讯技术、计算机技术和超大规模集成电路技术的迅速发展,语 音压缩编码技术在移动通信、卫星通信和i p 电话通信中得到了广泛的应 用。i t u tg 7 2 2 2 ( a m r - w b ) 是i t u 组织2 0 0 3 年颁布的最新可变码率的 语音编码方案,该方案采用了线性预测编码( l p c ) 技术、基音搜索技术 和码本搜索技术。基音搜索是现代语音编码方案中的关键技术之一。本文 研究的内容是基音搜索算法、并完成a m r - w b 中的基音搜索算法的a s i c 设计和实现。 论文首先对基音搜索进行分析和研究,并对其进行模块划分和功能定 义,然后用硬件描述语言v e r i l o g 对各个模块进行r t l 级的设计,最后将 各个功能模块联合起来,进行顶层模块的设计和验证。本论文包括以下几 个方面的内容: ( 1 ) 对现代的语音压缩编码技术以及基音搜索技术进行了综合性的分 析研究。并在此基础上分别对开环基音搜索算法和闭环基音搜索算法进行 完整的功能模块划分。 f 2 ) 基本算术运算单元的设计和实现。在进行系统设计之前,首先总 结出基音搜索模块中所需要的基本算术运算单元,再根据精度要求设计出 各种运算单元的位数。在基音搜索模块中主要用到了加法单元、乘累加单 元、比较单元和一个简单的函数运算单元。 f 3 ) 设计完成了开环基音搜索算法单元,用r t i ,代码实现。在u m c 0 2 5 9 m 工艺条件下,模块在3 3 m h z 的频率下功能正确,综合后开环基音 搜索算法模块为1 7 3 6 4 门。 f 4 1 设计完成了闭环基音搜索算法单元,用r t l 代码实现。在u m c 0 2 5 k t m 工艺条件下,模块在3 3 m h z 的频率下功能正确,综合后闭环基音 搜索算法模块为1 5 5 4 0 门。 本文设计的基音搜索模块另一个优点就是经过少量改动便可以用于 g 7 2 3 1 、g 7 2 8 、g 7 2 9 等各类语音编码方案中。 关键词语音编码;基音搜索:多码率语音编码;专用集成电路 啥尔滨工业大学工学硕士学位论文 a b s t r a c t w i t ht h e r a p i dd e v e l o p m e n t o ft h e c o m m u n i c a t i o n ,c o m p u t e r a n d m i c r o e l e c t r o n i c s s p e e c hc o d i n g h a sb e e n w i d e l y u s e di nm o b i l e c o m m u n i c a t i o n s ,s a t e l l i t ec o m m u n i c a t i o n sa n di pt e l e p h o n e i n2 0 0 3 ,i t u p r o m u l g a t e st h en e w e s tp r o t o c o li t u tg 7 2 2 2 ( a m r - w b ) t h a ti s aa d a p t i v e m u l t i r a t ep r o t o c o l ,a n dt h e p r o t o c o l i sm a d eu po fl p c ,p i t c hs e a r c ha n d c o d e b o o ks e a r c h p i t c hs e a r c hi so n eo ft h ek e yt e c h n i q u e si nm o d e ms p e e c h c o d i n g t h i st h e s i sw i l li m p l e m e n ta s i co fp i t c ha n a l y s i s t h et h e s i ss u i n m a r i z e st h ep i t c h a n a l y s i s a n dp i t c hs e a r c h f i r s t l y ,t h e n m o d u l e p a r t i t i o n a n df u n c t i o n s p e c i f i c a t i o n a r em a d ea n dt h em o d u l ei s d e s i g n e du s i n gh a r d w a r ed e s c r i p t i o nl a n g u a g e - - v e r i l o g t h ef u n c t i o n a l i t yo f t h em o d u l et h a ta c c o r d e dw i t ht h er e q u e s ti sv e r i f i e d a f t e rs i m u l a t i o n ,t h e m o d u l ei ss y n t h e s i z e db yt o o l s t h ef o l l o w i n gi st h em a i nc o n t e n t so f t h et h e s i s : ( 1 1t h es u m m a r yo ft h es p e e c hc o d i n g a f t e rt h ed e t a i l e ds t u d y ,a n dt h e n t h eo p e n e d - l o o pp i t c hs e a r c hs t r u c t u r ea n dc l o s e d l o o pp i t c hs e a r c hs t r u c t u r e w i t ha ni n d e p e n d e n ta n di n t e g r a t e df u n c t i o ni sd e f i n e d f 2 、i m p l e m e n t a t i o no ft h eb a s i ca r i t h m e t i cu n i t b e f o r et h ed e s i g no f t h e p i t c ha n a l y s i ss y s t e m ,t h eb a s i ca r i t h m e t i cu n i tt h a ti si m p l e m e n t e di nt h ep i t c h a n a l y s i si sg i v e n a n dt h ew i d t ho f t h e s eu n i ti sg i v e na c c o r d i n gt op r e c i s i o n , s u c ha sa d d e r , a c c u m u l a t o r , c o m p a r o ra n da ne a s ya r i t h m e t i cu n i ti se s s e n t i a lt o t h e p i t c ha n a l y s i s ( 3 ) i m p l e m e n t a i o no ft h eo p e n e d l o o pp i t c h s e a r c hm o d u l ei nr t l i n u m c o 2 5 9 m ,t h em o d u l e b e h a v e p e r f e c t l yi n3 3 m h z ,l 7 3 6 4l o g i ce l e m e n t sa r e m a d eu oo ft h i sm o d u l ea f t e rs y n t h e s i z e d ( 4 ) i m p l e m e n t a i o no f t h ec l o s e d - l o o pp i t c hs e a r c hm o d u l ei nr tl i nu m c 0 2 5 9 m ,t h em o d u l eb e h a v ep e r l e c t l yi n3 3 m h z ,1 5 5 4 0l o g i ce l e m e n t sa r em a d e u po f t h i sm o d u l ea f t e rs y n t h e s i z e d t h ep i t c hs e a r c hm o d u l ei n t h i st h e s i sw i l lb et i l e 8 a l l l ew i t hi t ug g 7 2 3 1 i t ug 7 2 8 ,g ,7 2 9a f t e ri ti sm o d i f i e dal i t t l e k e y w o r d ss p e e c hc o d i n g ,p i t c ha n a l y s i s ,a m r - w b ,a s i c i l 竺玺鋈三些查兰三兰墨圭兰堡篓兰 1 1 课题背景 第1 章绪论 近年来,语音编码技术飞速发展,导致了一些国家和国际标准化组织相 继制定了语音压缩编码的标准。其中最具有代表性的是i t u 国际组织颁布 的g 7 2 8 、g 7 2 9 、g 7 2 3 1 和g 7 2 2 2 等标准,这些标准的推出也加快了语 音编码技术的发展。另外,随着微电子i t 3 1 技术飞速发展,超大规模集成电 路设计技术的不断成熟,也给语音压缩编码带来了巨大的发展空闻。正是由 于语音压缩编码技术的这种飞速发展,使得语音压缩编码技术的应用越来越 广泛,已经深入到了通讯领域、消费类电子领域。复读机和电子录音笔等产 品就是语音压缩编码技术1 4 - , 6 1 的最典型的应用。 目前,在国内开发的整机产品中,语音编码技术基本采用t i 等公司的 d s p 编程实现。这种实现方案的个致命的缺点就是成本太高,一片d s p 最少需要1 0 美元以上。经调研,深圳市的所有语音产品开发公司都是采用 这一实现方案。这就使得公司的利润变得非常小,往往是费力不讨好。 至于消费类电子产品,例如录音笔等语音编码芯片,基本上是来自三 星、东芝以及台湾等国外公司开发的专用芯片。在国内还没有发现有人采用 a s i c 方式实现语音编码芯片。 同时,国家对集成电路设计产业得重点支持,以及语音编码产品的广阔 的市场前景,使得国内众多公司、高校和科研所都在从事音视频的研发工 作。本文正是基于国内外的这种基本现状,针对g 7 2 2 2 语音压缩编码标准 的基音搜索算法部分进行分析和设计。而且本文是设计出的开环基音搜索算 法与闭环基音搜索算法的最大优点就是经过少量改动就可以应用于g 。7 2 8 、 g 7 2 9 、g 7 2 3 1 等语音编码协议,这样做的好处是使产品的设计周期可以尽 可能的缩短。 1 2 语音编码技术的发展现状 数字音频编码7 1 分为语音信号的编码和宽带音频信号的编码由于两种 方法处理的对象具有不同的特征,他们的编码原理有很大的不同,因此分别 盟玺鋈三些查耋三兰堡圭兰垒墼耋 对语音编码算法及宽带语音编码算法发展的新动向进行分析。 1 2 1 语音编码算法发展的新动向 近二十年来,语音编码的研究主要集中于以码激励线性预测( c e l p ) 为核心的线性预测分析合成( l p a s ) 编码方面。目前,在4 8 k b i t s 1 6 k b i t s 的码率范围内较成功的语音编码方案都基于c e l p 技术,如g 7 2 8 标准、 g 7 2 9 标准及g 7 2 3 1 标准。这些编码方案的线性预测分析( l p c ) 大多为 1 0 阶,且采用l p s 量化参数。各方案都使用了矢量量化技术和加权滤波器 处理,主要的不同点在于激励源码本的构造和搜索方法。 语音编码今后的研究重点将逐步转向更低码率的编码方法【8 】。然而,在 更低的码率下,由于c e l p 能用于激励源的编码比特数过少,合成语音质量 下降较快。为了解决这一问题,较多采用了美国m i t 大学林肯实验室提出 的多带激励( m b e ) 语音编码 9 1 技术。m b e 编码器与传统的c e l p 编码器 相比,主要差别在于激励信号表示方法不同。它不是把整个段语音进行统一 处理,而是将语音谱按各基音的谐波频率分成若干个子带,对每一个带采用 不同的激励信号产生其合成语音。最后将各子带的合成语音信号相加,形成 全带的合成语音信号。m b e 语音编码方案可以在2 4 k b i t s 4 8 k b i t s 的码率 范围内合成出具有良好质量的语音信号,是目前这一码率范围内较理想的编 码方案1 。 另外,随着研究的深入,语音编码的研究也进入了新的分析技术,例如 非线性预测、小波分析技术以及高阶统计分析技术等。预计这些技术更能挖 掘人耳听觉掩蔽等感知机理,更能以类似人耳的特性作语音的分析与合成, 使语音编码系统更接近于人类听觉器官的处理方式工作,从而在低码率语音 编码的研究上取得突破。 1 2 2 宽带音频编码算法发展的新动向 在宽带音频编码领域,m p e g 1 、m p e g 一2 语音编码算法和a c - 3 系统 以其合成语音质量高、压缩比大和运算量小而得到广泛应用。但是随着使用 要求的提高,需在保证语音质量的前提下,进一步降低码率。为了达到这一 要求,宽带音频编码算法向两个方向发展,一是研究改进现有技术方案中存 在的问题;二是探索新的技术途径。 1 2 2 1 信号分解及滤波器组无论是改进现有方案还是探索新的途径,其 关键问题都是如何利用人耳的掩蔽效应,对输入信号进行最有效的分解。而 信号分解通常是用多速率滤波器组或等效的重叠变换得到的。目前已经研究 了多种不同的滤波器组改进方案,例如规范双正重叠变换( b o l t ) 等。 1 2 2 2 基于小波变换的宽带音频编码小波是一簇能量有限的奇函数。由 于它具有伸缩、平移和放大功能,可以对信号进行多尺度分析,可以实现对 信号的时域局部化分析。而且小波变换系数具有固定的时间信息和频率信 息,特别是对时域中的能量集中的信号,在某种程度上将产生变换系数的集 中。因此,小波变换非常适用于处理非平稳过程的信号,例如针对音频信 号、图像信号等。 近几年来,对小波变换【l2 在宽带音频编码中的应用进行了大量的研 究,研究内容主要集中在以下几方面:临界频带滤波器组的逼近和离散小波 包的优化,以便充分利用人耳的掩蔽效应;小波分析与现有编码技术( 如变 换编码) 的结合,以改进现有的音频编码技术;基于小波变换的宽带音频编 码系统等设计。 从目前的研究情况看,基于小波变换的音频编码技术有着很好的发展前 景。 i 3 语音压缩的依据 在实际应用中,未进行压缩的编码的语音数据量很大。而如此大的数据 量在进行传输或存储时,要占据相当多的资源。语音压缩编码就是要在保证 一定的声音质量的条件下,以尽量小的数据率来表达和传送声音信息。从信 息保持的角度讲,只有当信源本身具有冗余度,才能对其进行压缩a 根据统计分析结果,语音信号中存在着多种冗余度,其最主要部分可以 从时域、频域【1 6 ”1 和人的听觉感知机理三个主要的方面来考虑去。时域信 息的冗余包括幅度的非均匀分布、样本间的相关、周期之间的相关、基音之 间的相关、静止系数等方面的信息冗余。频域冗余则包括了非均匀的长时功 率普密度和语音的短时功率谱密度等方面的信息冗余。从人的听觉感知机理 方面来说,则有人的听觉具有掩蔽效应、人耳对不同频段的声音的敏感程度 不同和人耳对语音信号的相位变化不敏感等主要方面的信息冗余。 兰兰篓三些查兰三兰鎏圭兰堡篓塞 1 4 经典的语音编码算法 语音编码方法从技术特征方面归纳起来可以分成三大类:波形编码、参 数编码、混合编码。 1 4 t 波形编码 波形编码( w a v e f o r mc o d i n g ) 比较简单,编码器按照采样定理对模拟 语音信号在时间上进行量化,然后进行幅度量化,再进行二进制编码。解码 器作数模变换后再由低通滤波器恢复出现原始的模拟语音波形,这就是最 简单的脉冲编码调制( p c m ) ,也称为线性p c m 。可以通过非线性量化,前 后样值的差分、自适应预测等方法实现数据压缩。波形编码的目标是让解码 器恢复出的模拟信号在波形上尽量与编码前原始波形相一致,即失真要最 小。波形编码的方法简单,数码率较高,在6 4 k b i t s 至3 2 k b i t s 之间音质优 良,当数码率低于3 2 k b i t s 的时候音质明显降低,1 6k b i t s 时音质很差。 1 4 2 参数编码 参数编码( p a r a m i t r i cc o d i n g ) 又称为声码器,是根据人的发声机理, 来进行编码的。参数编码方法通过建立起声音信号的产生模型( 如语音发生 模型) ,将声音信号用参数来表示,在对参数进行编码。这种方法的声音信 号解码后,与原来的声音采样值不存在固定的对应关系,而是通过合成各种 声音元码来产生声音的,因而合成的语音质量只能根据实际效果,主观地加 以评定。参数编码中常用的语音参数有共振峰,线性预测系数,滤波器等。 参数编码后的码率可以做到很低,如1 2 k b i t s 、2 4 k b i f f s ,但是也有其缺 点。首先是合成语音质量较差,往往清晰度可以而自然度没有,难于辨认说 话人是谁,其次是复杂度比较高。 1 4 3 混合编码 混合编码( h y b r i dc o d i n g ) 是将波形编码和参数编码的原理结合起来, 数码率约在4 k b i t s 一1 6 k b i t s 之间,音质比较好。 前面已经提到,波形编码虽然可提高质量的话音,但数据率低于1 6 k b s 的情况下,在技术上还没有解决音质的问题;声码器的数据率虽然可以降低 哈尔演工业大学工学硕士学位论文 到2 4 k b s 甚至更低,但它的音质根本不能与自然语音相提并论。为了得到 音质高而数据率又低得编译码器,历史上出现了很多形式的混合编译码器, 但最成功的并且普遍使用的编译码器之一是始于合成分析a b s ( a n a l y s i s b y s y n t h e s i s ) 编译码器。这种编译码器使用的声道线性预测滤波 器模型与线性预测编码l p c ( 1 i n e a rp r e d i c t i v ec o d i n g ) 使用的模型相同,但 是它不使用两个状态( 有声无声) 模型来寻找滤波器的输入激励信号,而 是企图寻找这样一种激励信号,使用这种激励信号产生的波形尽可能接近于 原始话音的波形。一种a b s 编译码器有a t a l 和r e m d e 在1 9 8 2 年首先提 出,并命名为多脉冲激励m p e 博1 9 】( m u l t i p u l s ee x c i t e d ) 编译码器,在此 基础上随后出现的是等间隔脉冲激励r p e ( r e g u l a r p u l s ee x c i t e d ) 编译码 器、码激励线性预测c e l p ( c o d ee x c i t e dl i n e a rp r e d i c t i v e ) 编译码器和混合 编译激励线性预测m e l p ( m i x e de x c i t a t i o nl i n e a rp r e d i e i t i o n ) 编译码器。 1 5 基音搜索算法介绍 基音周期是语音编码中的重要特征参数,近几十年中人们提出了近百种 提取基音周期的方法1 3 1 。例如相关法基音搜索算法、平均幅度差函数基音 搜索算法和近年来基于局部分析的小波变换技术的基音搜索算法1 4 ,”1 等, 从算法角度来看,可以越来越准确的预测出基音周期。基音搜索的分类所使 用的方法上分主要可以分为三类。 1 5 1 时域方法 时域方法中又有时间事件频率法、自相关法和y i n 估计等。时域方法 主要是通过检验时域波形的重复出现率,如果波形是周期性的,那么就会计 算出相同的事件。这种方法主要是通过计算平均过零率( z e r o c r o s s i n g r a t e ) 、共振峰频率( p e a kr a t e ) 和倾斜频率( s l o p er a t e ) 等参数来预测基音参数 的。总体来说由于语音波形通常是非常复杂的,所以这种方法通常是难以实 现的;但从另一个角度来看这种方法又是最简单的。 1 5 2 频域方法 频域分析方法又可以分为成分频率比方法( c o m p o n e n tf r e q u e n c y 竺玺鎏三些查耋三茎堡圭兰竺兰兰 r a t i o ) 、基于滤波器的分析方法( f i l t e r - b a s e dm e t h o d ) 和频谱分析方法 ( c e p s t r u ma n a l y s i s ) 等。 频域分析方法与时域分析方法相比提高了基音搜索的准确率,但同时也 使得预测的方法更加复杂以及计算量的大量增加。 1 5 3 统计方法 由于现代统计方法学的快速发展,基于统计方法的基音搜索方法如雨后 春笋一样不断出现。其中最具有代表的方法有神经元网络法( n e u r a ln e t w o r k ) 和最大似然分析方法等。 从预测角度来讲统计方法的精度比前两种方法都要更加精确,但是它也 存在着计算量大,难以用硬件实现等难点。 1 6 语音信号的基音搜索 由于语音信号的基音周期是一种准周期,所以只能采用短时平均方法来 估计其周期,基音周期估计也就是我们通常所说的基音搜索2 1 o 自相关函数和短时平均幅度差函数都能反映出原始语音信号的周期,这 是人们构造出了两种简单的时域分析方法。后来短时频谱技术的应用到基音 搜索技术中产生了一种估计精度更高的基音搜索方法,在后来的统计技术和 人工神经元网络就是逐渐应用于基音搜索方法中。这使得基音搜索的精度不 断的得到提高,但另一方面在提高了精度的同时也使得基音搜索算法的复杂 度不断的提高,这就使硬件实现基音搜索模块的难度也越来越大。语音信号 包括十分丰富的谐波分量,基音频率最低可达8 0 h z 左右,最高可达5 0 0 h z 左右,但基音频率处在1 0 0 2 0 0 h z 的情况占多数。因此,浊音信号可能包 括有三四十次谐波分量,而基波分量往往不是最强的分量。因为语音的第一 共振峰通常在3 0 0 1 0 0 0 h z 范围内,这就使说,2 - 8 次谐波成分常常比基波 分量还强。丰富的谐波成分使语音信号的波形变得非常复杂,给基音搜索带 来了困难,经常发生基频估计结果为其实际基音频率的二三次倍频或二次分 频的情况。加之还有清浊混杂等情况,使基音搜索和清浊判别成为一个大问 题。可以说,至今还没有一种有效的方法在任何情况下能准确可靠地估计出 基音周期。 哈尔滨工业大学工学硕士学位论文 1 6 1 基音检搜索处理 浊音的短时自相关函数r 。( 1 ) 在基音周期的各个整数倍点上有很大的峰 值,那时不是只要找到第一个最大峰值点的位置并计算它与1 = 0 点的间隔, 便可以估计出基音周期。实际上并不是这么简单,第一最大峰值点的位置优 势不能与基音周期相吻合。产生的原因有两方面,一方面是与窗的长度有 关,如果窗长过短,第一最大峰值与基音周期不一致。一般认为窗长应大于 两个基音周期,才能有较好的效果,所以窗长应选的比2 0 m s 更长一些。第 二方面与声道特性的影响有关。有的情况下即使窗长已选的足够长,第一最 大峰值点与基音周期仍不一致,这就使由于声道的共振峰特性造成的“干 扰”。为克服这一困难,可采用以下三种方法对原始语音信号进行预处理: 1 6 1 1 中心削波处理中心削波处理是使用如图1 1 所示的中心削波函数进 行处理的: f x ( 竹) 一l 当x ( 疗) q 时 y ( 月) = c ( n ) = 0当i x ( 玎) i c l 时 ( 1 1 ) 【x c n ) + 三当x ( n ) o 时 y ( n ) = c ( y 1 ( n ) ) = 0 当y ( ,1 ) = o 时( 1 2 ) 【一1勤( 聆) o 时 显然( y l ( n ) ) 只有- 1 ,0 ,+ 1 三种可能的取值,因而这里的互相关计算只需加减 法,而这个互相关序列的周期性与 y ( n ) 的自相关序列是近似相同的。 下面结合一个具体例子来叙述这种自相关基音搜索算法步骤。这里设信 号灯采样率1 0 k h z ,窗序列采用3 0 0 点长的矩形窗,连续分析信号时采用 t o m s 的帧间隔,即每相邻两帧重叠2 0 0 个样点。截止频率为9 0 0 h z 的低通 滤波器是一个2 0 阶线形相位的优先冲激响应滤波器。下面是对每一帧进行 基音搜索的计算步骤: 1 用9 0 0 h z 低通滤波器对一帧语音信号f x ( b ) ) 进行滤波,并去掉开头 2 0 个输出值不用( 置o ) ,得到f x l ( n ) ) ; 2 分别求 x l ( n ) 的前部1 0 0 个样点和后部1 0 0 个样点的最大幅度,并 取其中较小的一个,乘以因子0 6 8 作为门限电平c l ; 3 用式( 1 一1 ) 和式( 1 2 ) 分别进行中心削波和三电平削波,即: ,、1 c ( x ( h ) ) 2 0 n 3 0 烈”j 。1 0 其它 f c ( y ( 竹) ) 2 0 3 0 y 。2 1 0 其它 4 求 y ( n ) 和 y ( n ) ) 的相关值: r ( 七) = :l y ( 珂) y ( h + t ) 七= 0 , 2 0 , 2 1 ,2 2 1 5 0 ( 1 - 3 ) 此处k 的取值范围2 0 1 5 0 相应于基音频率范围6 0 - 5 0 0 h z ,r ( o ) 相应于短时 能量。 5 求出r ( 2 0 ) r ( 1 5 0 ) c p 的最大值r 。; 6 如果胄。 0 2 5 r ( 0 ) 贝i j 认为本帧为清音,令基音周期值p = 0 ,否则基 音周期即为使r ( 七) 取最大值r 。时的位置的k 值,即 p = a r g m a x o r ( _ | ) 哈尔滨工业大学工学硕士学位论文 尸就是检的基音周期估计。 1 6 3 平均幅度差函数( a m d f ) 基音搜索算法 为了减少基音搜索周期估计中乘法的运算量,在自相关函数的基础上产 生了一些简化方法,如三电平削波等。另外a m d f 法同样也可以省去乘法 运算。a m d f 法的思想是:如果信号是一个标准的周期函数,那么不同周 期端的对应信号之差为零。浊音是一个准周期信号,在一帧语音内基音周期 近似恒定,那么不同基音周期段的对应信号之差应该很小;但清音因其接近 于随机噪音声而不具备上述特点。a m d f 基音搜索算法1 2 5 2 s 典型的电路图 如图1 3 所示。a m d f 法的计算公式为: 图1 3a m d f 基音搜索算法的电路图 f i g u r e l - 3s c h e m a t i cd i a g r a mo f t h ea m d f p i t c hd e t e c t i o na l g o r i t h m r n ( 七) = 1 x ( n + m ) w :( m ) 一x ( 玎+ 肌+ 七) 峨( m + 后) 1 ( 1 - 4 ) m = 一 一1 且。( 七) = 【x 研+ 朋) w ( m ) x 即+ 研+ 七) w ( 肌+ 七) 】 ( 1 _ 5 ) 哈尔滨工业大学工学硕士学位论文 r 一( ) = 2 :x ( m + n ) z ( h + m + l j ) ( 1 6 ) 从以上各式可以发现,如果x ( h ) 在窗范围内具有周期性的话,那么( 七) 在 k = p , 2 p , 处幅度将急剧下降。若两个窗函数长度相同,则a m d f 可以得到 类似式( 1 5 ) 短时自相关的函数;若w 2 ( 棚) 窗场大于w 1 ( m ) ,则a m d f 可以 得到类似于式( 1 6 ) 修正自相关的函数。在这里,宵函数般都取矩形窗。 可以证明: 仄一 ( 七) = 口( 七) 、r 一( o ) 一r 一( 七) ( 1 7 ) 其中,b ( ) 是随t 做缓慢变化的固定函数。 下面我们采用与上例相同的信号背景来介绍其计算步骤: 1 用同上的9 0 0 h z 低通滤波器处理一帧信号 x ( n ) ) ,得 x l ( n ) ) : 2 计算短时平均幅度差函数: 2 击:,i x ( 咖州聊呐i 扣孔2 2 , ,1 4 0 ( 1 - 8 ) 3 求k k ) 中的最小值,并以取得这一最小值时的下标作为基音周期初 步估计值,即p = a r g m ) n r ( k ) 4 用清浊门限a ,判别上述估计是否合理: 口如果,。a 则认为该帧是清音,将估计值p 取为0 ,代表清 音。其中门限风由实验统计确定,m 为该帧信号的平均幅度, 弧吖。击孙( ”) l 口如果r l i ( p 2 ) m a ,p 暂时不改变,认定是浊音。 5 用另一门限口,进一步修正基音周期估计值: 口如果。( p 2 ) m 2 ,则说明p 是二分频的周期,令p 减半, 否则p 不变。 口如果,m 。( p 3 ) m 口:,则说明p 是三分频的周期,令p 缩小到 1 3 p ,否则p 不变。 上述门限值a ,又是经统计得到,如果一共估计川贞,其正确的基音估计 分别为: p ni = 1 2 。1 那么,取口2 = m i n r i ( p ,) m , 其中 t ( j | ) ) 为第i 帧的平均幅度函数,m t 为该帧的平均振幅。显然, 口, q ,因为清音的平均幅度小而且缺乏周期性,所以其,瑚。m 比浊音的 大。 用平均幅度差函数基音检测算法( a m d f ) 进行基音估计有如下特点:( 1 ) 在基音周期点,它的谷点锐度较之短时自相关函数的峰点锐度更尖锐,因而 估计精度更高、更稳健。( 2 ) a m d f 的计算只涉及加减和求绝对值,而自相 关则需要相乘运算,因而前者的运算量较小。( 3 ) a m d f 对于语音信号幅度 的快速变化比较敏感,它影响估计的精度。 1 7 本文主要研究内容 本文主要以集成电路设计理论和语音压缩编码技术为基础,对语音压缩 编码算法、语音编码中的基音搜索、基本的逻辑运算单元、超大规模的集成 电路设计方法学和其设计流程等方面进行了深入研究并且用a s i c 的方法实 现了语音压缩编码中的基音搜索部分。 1 8 本文结构 本论文结构如下: 第1 章为绪论,包括课题的背景、语音压缩编码技术的发展历史与现状 以及现在流行的语音压缩编码的集成电路设计方法等。 第2 章详细论述了基音搜索模块中将要用到的各种不可缺省的算术逻辑 单元。 第3 章详细论述了开环基音搜索的设计。包括详细介绍了开环基音搜索 模块的整体功能,以其各个子模块的功能和实现。 第4 章详细论述了闭环基音搜索的设计。包括详细介绍了闭环基音搜索 模块的整体功能、其各个子模块的功能和实现。 论文最后为结论。 哈尔滨工业大学工学硕士学位论文 第2 章基音搜索模块运算单元的实现 2 1 语音编码的体系结构 现代语音编码技术的标准发展非常迅速。自从1 9 9 1 年国际电信联盟推 出g 7 2 8 以来,在短短的十几年间,先后出现了g 7 2 9 、g 7 2 3 1 、g 7 2 2 2 等现代语音编码技术。但是各个标准中基本采用线性预测、基因搜索、码本 搜索等基本部分。图2 - 1 所示“d s p + 硬件加速器”结构是实现现代语音编 码技术比较通用的结构。 基音周期是一个具有实际物理意义的语音参数,所以语音周期搜索的好 坏就直接关系到了语音在合成是的音质。另一方面,现在语音编码技术以及 其实现的结构多决定了基因搜索可以单独以a s i c 方法实现。 i ”0 7 ll 矾m 剖l 里 : 州粥ii _ :i,1 0 0 驯l 疆l t a r d w r e 删 i i 0 e e 飘e h a l o r 图2 - 1 语音编码的体系结构 f i g u r e 2 - 1s t r u c t u r eo f t h es p e e c he n c o d i n g 哈尔滨工业大学工学硕士学位论文 2 2 基音搜索模块 通过对g 7 2 3 1 、g 7 2 8 以及g 7 2 9 等语音编码协议中有关基音搜索的 分析,可以得出在该模块中的运算只涉及到了加、乘累加、比较、开根号和 倒数四种运算。又由于开根号与倒数运算每次都是同时出现的,所以在该设 计中把开根号与倒数运算合成一个操作进行设计。根据语音编码的楚体实现 的特点,该模块采用的结构如图2 - 1 所示。 下面详细的对各个模块单元进行详细的介绍。 2 3 运算逻辑单元的实现 2 3 1 加法单元的实现 出于精度方面的考虑设计中采用了3 2 位的加法单元,同时也为了方便 以后模块功能扩展,设计中把减法运算也集成到了单元中,其结构框图与结 构图如图2 - 2 所示。 在加法单元中,同时又调用了一个4 位超前进位链,在3 2 位加法器的 图2 - 23 2 为超前进位加法器结构 f i g u r e 2 - 2s t r u c t u r e o f 3 2 b i tc a r r yl o o k - a h e a da d d e r 单元中,共调用了1 1 个4 位超前进位连单元。在设计中定义g = a & b 、p = a fb ;注意到只有a 和b 同时为“l ”时,g 才为“l ”,而当a 和b 同时 为“1 ”时,一定是有进位产生的,所以又称g 位进位产生函数;而当a 和 b 之中只要有一个为“1 ”时,p 就为“1 ”,与g 相仿,称p 为进位传递函 数。由4 位加法器的功能真值表可以推出4 位超前进位连的逻辑函数为:c l 2 p o + g o c o s c z = p i + g i c t :c 3 = p 2 + g 2 c 2 ;c 4 = p 3 + g 3 c 3 。而设计中的 3 2 为超前进位加法器 2 9 3 2 1 共用到了8 个上述单元其结构如图2 2 所示。 模块的输入端口有a d dai n 、a d dbi n 、a d dc t r li n 、a d dc a r r y ;模_in 块的输出端口有a d ds u mo u t 。其中a d dai n 和a d dbi n 为3 2 位的输入线 型变量,a d d _ c a r r y为i 位的输入线型变量,而为32位的寄_in a d ds u mo u t 存器型输出变量。可实现下述功能:a d dc t r li n 为“1 ”时,a d d 为被a i n 加数,a d dbi n 为加数,a d d为进位, 为加法结果输c a r r y i n a d ds l l l 2 io u t 出。此时所实现的功能为a d ds l i mo u t = a d d ai n + a d dbi n + a d dp a r r y 当为“o ”时, a 为被减数,为减_in; a d dc t r li na d di na d dbi n 数,a d dc a r r yi n 恒为“l ”,a d ds u mo u t 为减法运算的输出结果。此时所 实现的功能为a d d $ 1 1 1 1 qo u t = a d dai n a d dbi n 。该模块的功能仿真波形如 图2 3 所示。 图2 - 33 2 位超前进位加法器仿真波形图 f i g u r e 2 - - 3w a v eo f 3 2 - b i tc a r r yl o o k - a h e a da d d e r 2 3 2 乘累加单元的实现 由于在基音搜索模块中用到了大量的卷积运算,即乘累加运算,所以在 设计中没有单独设计乘法运算,而是将乘法运算和加法运算和为一体,设计 成了特有的乘累加运算单元。乘累加单元同样也是3 2 位运算单元,出于对 精度和对速度方面的考虑,该乘法单元是采用b o o t h 编码的迭代算法实现其 嘧瑚 汹咖珧 帖 譬!、;塞嗍胁、。叭, “叫iil ? c i 一札 盘羞:嚣品 翳睁 吁旺吁爵吁爵爵 一 兰至篓三些奎兰三耋罂圭兰堡耋兰 图2 43 2 位累加器的原理图 f i g u r e 2 - 4p r i n c i p l eo f 3 2 - b i tm i l t i p l y 具体功能的【 哪j 。其原理图见图2 4 和数据流程图如图2 5 所示j 模块的输入端口有a 、b 两个3 2 位的输入端口分别代表被乘数和乘 数,输入1 6 位精度的有效数据存放在a 、b 的低1 6 位;a c 是一个代表累 加输入的3 2 位输入端口,输入1 6 位精度的有效数据存放在a c 的高1 6 位:d 代表乘法输出的结果是一个3 2 位的输出端口;对于正常的乘法运算 来书应该有6 3 位的有效输出才对,但是由于本设计只要求2 4 位的精度,所 以输出我们只保留了乘法器单元中所用到的加法器的输出。这样做的好处 时,可以在以后对精度要求高的时候,很容易的进行精度扩展。s t a r t u p 是 l 位的输入端口,当s t a r t u p 为“1 ”时,该模块将a 、b 的值存入模块中 的相应的寄存器,以供模块运算时使用,当s t a r t u p 为“0 ”时,模块处于正 常工作状态。b u s y 是1 位的输出端口,当b u s y 为“1 ”时代表着模块正在 工作,输出数据无效;当b u s y 为“o ”是代表着模块已经运算结束,外部 模块可以正常接收数据。o v e r 是l 位的输出端口,当o v e r 为“1 ”是代表 着外部其他模块可以从该模块接收数据,当o v e r 为“0 ”时,禁止外部其他 模块接收数据,输出数据处于处理中。a c c e p t 是1 位输入端口,当a c c e p t 为“1 ”同时o v e r 信号也为“1 ”时代表着外部功能模块正在接收数据,一 个时钟后,o v e r 信号被置“0 ”;当a c c e p t 为“0 ”是说明没有外部功能模 块接收数据,此时当o v e r 信号为高电平,即“l ”时,模块会一直处于等待 状态,直到a c c e p t 信号为“1 ”时将有效数据输出,模块才会进入下个状 图2 - 53 2 位累加器的流程图 f i g u r e 2 5d a t a f l o wo f3 2 - b i tm i l t i p l y 态;e l k 是模块的系统时钟,r s t 是模块的异步复位信号。该功能模块所实现 的逻辑功能为d = a b + a e ,不难看出当a c 位0 时,功能模块实现的是 乘法运算;该模块的功能仿真波形图如图2 - 6 所示。 2 3 3 比较单元的实现 在运算中使用的1 6 位比较运算,出于便于功能扩展方面的考虑,在基 音搜索模块中我们使用了2 0 位的比较单元。其结构图如图2 7 所示。 在比较单元中,又涉及到了两个子单元分别是无符号4 位并行比较器, 其结构如图2 氇所示,和有符号4 位并行比较器,其结构如图2 - 9 所示,下 面分别介绍。首先介绍无符号的4 位并行比较器,假设a 3 a 2 a j a o 和b a b 2 b l b o 是两个待比较的数,不难看出,只有当a 为“i ”,同时b 为“0 ”时,m 2a & ( ( a & b ) ) 才能为“l ”。也就是说,当m 为“1 ”时就代表着a 大于b ;同 竺至鎏三兰查耋三兰塑圭兰竺兰奎 圈2 - 63 2 位累加器仿真波形图 f i g u r e 2 - 6w a v e o f3 2 - b i ta c c u m u l a t o r 理,只有当a 为“0 ”,同时b 为“1 ”时,1 = b & ( ( a b ) ) 才能为“o ”, 也就是数,只有当l 为“1 ”时,才代表着a 小于b :同时注意到,当a 和b 同时为“i ”或“0 ”时,q = ( a & ( ( a & b ) ) ) l ( ( ( a & b ) ) & b ) ) 才能为 “1 ”,这样q 就成为a 等于b 的标志,也就是说可以用q 来标志a 等于b 的 情况。依此类推不难得出4 位并行运算的比较器的逻辑。如图2 8 所示的4 位无符号数并行比较器的结构图。 对于4 位有符号数比较来说,由于在设计中的所有数都是采用补码的编 码方式,所以对于有符号数来说,只是最高位的代表意义刚好和无符号时的 比较方法相反,这样就可以在无符号数比较操作的基础上做一简单处理即 可。如图2 - 9 所示有符号数并行比较器的结构图。 2 0 位比较器的设计就是在上述这两个模块的基础上实现的,用1 个有 符号4 位并行比较器和3 个无符号数4 位并行比较器,采用类似于超前进位 加法器的结构来实现2 0 位的有符号数并行比较器。其结构图如图2 7 所 示。 设计中所涉及到的功能模块的端口说明与功能描述。 堕釜鎏三些查兰三耋矍圭:堡篁三 图2 72 0 位比较器结构图 f i g u r e 2 7s t r u c t u r eo f 2 0 - b i tc o m p ”e 占 l 古 公会 余佘

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论