![(电路与系统专业论文)基于TMS320C6713的变速率语音编解码器的实现研究[电路与系统专业优秀论文].pdf_第1页](http://file.renrendoc.com/FileRoot1/2019-12/13/b2d6bf2b-32bf-42de-b2ab-047cbbc9168c/b2d6bf2b-32bf-42de-b2ab-047cbbc9168c1.gif)
![(电路与系统专业论文)基于TMS320C6713的变速率语音编解码器的实现研究[电路与系统专业优秀论文].pdf_第2页](http://file.renrendoc.com/FileRoot1/2019-12/13/b2d6bf2b-32bf-42de-b2ab-047cbbc9168c/b2d6bf2b-32bf-42de-b2ab-047cbbc9168c2.gif)
![(电路与系统专业论文)基于TMS320C6713的变速率语音编解码器的实现研究[电路与系统专业优秀论文].pdf_第3页](http://file.renrendoc.com/FileRoot1/2019-12/13/b2d6bf2b-32bf-42de-b2ab-047cbbc9168c/b2d6bf2b-32bf-42de-b2ab-047cbbc9168c3.gif)
![(电路与系统专业论文)基于TMS320C6713的变速率语音编解码器的实现研究[电路与系统专业优秀论文].pdf_第4页](http://file.renrendoc.com/FileRoot1/2019-12/13/b2d6bf2b-32bf-42de-b2ab-047cbbc9168c/b2d6bf2b-32bf-42de-b2ab-047cbbc9168c4.gif)
![(电路与系统专业论文)基于TMS320C6713的变速率语音编解码器的实现研究[电路与系统专业优秀论文].pdf_第5页](http://file.renrendoc.com/FileRoot1/2019-12/13/b2d6bf2b-32bf-42de-b2ab-047cbbc9168c/b2d6bf2b-32bf-42de-b2ab-047cbbc9168c5.gif)
已阅读5页,还剩81页未读, 继续免费阅读
(电路与系统专业论文)基于TMS320C6713的变速率语音编解码器的实现研究[电路与系统专业优秀论文].pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
硕士学位论文摘要 摘要 语音通信是一种基础而有效的获取信息的方式,语音信号的压缩 编码是语音通信中的关键技术。为了满足移动通信系统对高质量语音 和大容量系统的需要,用变速率语音编码来提高频带的有效利用程 度,将是未来数字蜂窝和微蜂窝网的必然发展趋势。s c - v r - c e l p 编 码模型是一种高效优质的变速率语音编码算法,平均编码速率低,合 成语音的音质较好,且具有更好的抗干扰能力。为了满足数据的大动 态范围、高精度和实时性的要求,本文选用美国德州仪器公司( t i ) 的 高性能浮点d s pt m s 3 2 0 c 6 7 1 3 ,对这种语音编解码算法进行实现。 本文首先研究了s c - v r c e l p 算法原理,详细分析了算法中的 语音激活检测技术、语音帧分类、速率判决、线性预测、矢量量化、 自适应码本搜索和固定码本搜索等。然后选用t m s 3 2 0 c 6 7 1 3 d s k 作 为硬件平台,对t m s 3 2 0 c 6 7 1 3 和a i c 2 3c o d e c 芯片结构、工作原理 进行了一定的描述。本系统采用c 语言对s c v r - c e l p 语音编解码 算法进行了编程,并在v c 6 0 环境下进行了算法的实现。再将调试成 功的c 程序移植到集成开发环境c c s 3 1 中,使语音编解码算法在 t m s 3 2 0 c 6 7 1 3d s k 目标板上实现,同时对d s p 环境下的实现进行了 优化,方法包括c 6 7 1 3 芯片配置,c 语言级的优化和汇编语言级的优 化,优化后算法降低了复杂度。最后,对系统进行测试和性能分析, 实验结果表明,系统对实时输入语音能有效地进行编解码处理,合成 语音有较好的可懂度。 s c v r - c e l p 编码器速率和音质达到了移动通信的要求,可以将 这种编码模型应用到移动通信系统中,相比固定速率语音编码模型, 可进一步提高通信系统的容量。 关键词变速率语音编码,t m s 3 2 0 c 6 7 1 3 ,c c s 3 1 ,代码优化 硕十学位论文 a b s t r a c t a b s t r a c t s p e e c hc o m m u n i c a t i o ni sa b a s i ca n du s e f u lw a yt og e ti n f o r m a t i o n , a n dt h ek e yt e c h n i q u eo fs p e e c hc o m m u n i c a t i o ni s s p e e c hc o m p r e s s c o d i n g t om e e tt h en e e d so ft h et h i r dm o b i l ec o m m u n i c a t i o ns y s t e mf o r h i g h e rs p e e c hq u a l i t ya n dg r e a t e rs y s t e mc a p a c i t y ,i ti st r e n do fd i g i t a l c e l l u l a ra n dm i c r oc e l l u l a rn e t w o r kt oi m p r o v eu t i l i z a t i o ne x t e n to fb a n d u s i n gv a r i a b l er a t es p e e c hc o d i n g s c - v r c e l pm o d e li sh i g h - q u a l i t y v a r i a b l eb i tr a t es p e e c hc o d i n ga l g o r i t h m ,i ti sl o wa v e r a g er a t ea n dg o o d r e b u i l d s p e e c ha n db e t t e ra b i l i t yo fa n t i d i s t u r b a n c e t om e e tt h e r e q u i r e m e n t f o rd a t a l a r g ed y n a m i cr a n g e ,h i g hp r e c i s i o n r e a l t i m e p r o c e s s i n g t e x a si n s t r u m e n th i g hp e r f o r m a n c e32 - b i tf l o a t i n g - p o i n td s p t m $ 3 2 0 c 6 7l3i ss e l e c t e d t h ep r i n c i p l e sa n d i m p l e m e n t a t i o no f s c - v r - c e l p a l g o r i t h mo nd s pp r o c e s s o ra r ed i s c u s s e di nt h i sp a p e r t h ep r i n c i p l eo ft h ea l g o r i t h mo fs c v r c e l pi ss t u d i e di nt h i s p a p e r ,m o r e o v e rs o m ei m p o r t a n tt e c h n o l o g i e si n c l u d i n gv a d ,s p e e c h c l a s s e d ,i m a ,l i n e a r p r e d i c t i o n ,v e c t o rq u a n t i z a t i o n ,a d a p t i v e c o d e b o o k s e a r c h ,a n df i x e d c o d e b o o ks e a r c hh a v eb e e na n a l y z e di nd e t a i l t h e n t m $ 3 2 0 c 6 7l3 d s ki ss e l e c t e d a sh a r d w a r e p l a t f o r m t h i sp a p e r i n t r o d u c e st h es t r u c t u r ea n dw o r kp r i n c i p l ef o rt h et m $ 3 2 0 c 6 713a n d a i c 2 3 c o d e c t h ep r o g r a m m eo fs c v r c e l pa l g o r i t h mi sc o m p i l e d u s i n g t h ecl a n g u a g ea n dr e a l i z e d u s i n gv c 6 0 t h es u c c e s s f u lc p r o c e d u r ei st r a n s p l a n t e dt oc o d ec o m p o s e rs t u d i 0 3 1i no r d e rt ob e r e a l i z e di nt h et m s 3 2 0 c 6 7l3d s k i nt h ep r o g r a m m i n gp r o c e s sas e r i e s o fo p t i m i z a t i o nw o r ki sp e r f o r m e dt oi m p l e m e n tt h ea l g o r i t h mb e t t e r t h e o p t i m i z e dm e t h o di n c l u d e dd s pc h i pa n dcl a n g u a g ea n da s s e m b l y l a n g u a g e f i n a l l y ,t h es y s t e mi st e s t e da n dt h ep e r f o r m a n c ei sa n a l y z e d t h r o u g ht e s t e dr e s u l t ,t h es y s t e mc a na v a i l a b i l i t yi m p l e m e n te n c o d i n g a n dd e c o d i n gt ot h er e a l - t i m ev o i c e q u a l i t yo fv o i c er e c o n s t r u c t e di sw e l l u n d e r s t o o d t h er a t ea n d q u a l i t y o fs c v r - c e l pr e a c h r e q u i r e o fm o b i l e c o m m u n i c a t i o n ,w h i c hc a nb ea p p l i e dm o b i l ec o m m u n i c a t i o n ,a n d i n c r e a s et h es y s t e mc a p a c i t yi nc o n t r a s tt of i x e ds p e e c h c o d i n g 1 1 硕十学位论文 k e yw o r d s v a r i a b l er a t e s p e e c hc o d i n g ,t m s 3 2 0 c 6 7 1 3 , c c s 3 1 ,c o d eo p t i m i z a t i o n 原创性声明 本人声明,所呈交的学位论文是本人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢 的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不 包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我 共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。 作者签名:日期:年月生日 学位论文版权使用授权书 本人了解中南大学有关保留、使用学位论文的规定,即:学校 有权保留学位论文并根据国家或湖南省有关部门规定送交学位论文, 允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内 容,可以采用复印、缩印或其它手段保存学位论文。同时授权中国科 学技术信息研究所将本学位论文收录到中国学位论文全文数据库, 并通过网络向社会公众提供信息服务。 作者签名:兰兰壹煎师签名挫日期: 年月兰日 硕十学位论文 第一章绪论 1 1 课题背景 第一章绪论弟一早三百y 匕 语言是人类社会的一种重要的交流手段,语音通信毫无疑问是人类通信的最 重要形式之一。随着移动通信与互联网的飞速发展,语音通信技术也在不断地进 行更新并与之相融合。语音信号的数字化传输和存储,在可靠性、抗干扰能力、 快速交换等方面远胜于模拟化,且灵活方便,易于保密,价格低廉。人们用数字 化的方法己经取得了辉煌的成就,但是r 新月异的应用对数字技术提出了更高的 要求,同时也在不断推动着数字技术的进步。因此,用数字化的方法进行语音的 传送、存储、识别、合成、增强构成了目前数字化通信网中最重要、最基本的组 成部分之一l 。从2 0 世纪5 0 年代以来,数字化语音在通信系统中所占的比重越 来越大。 语音编码技术是伴随着语音的数字化而产生的,目前主要应用在数字语音通 信和数字语音存储两个领域。由于简单地由连续语音信号抽样量化得到的数字语 音信号,在传输和存储时要占用较多的信道资源和存储空间,随着数字技术的飞 速发展,数字业务量急剧增长,如何在提供高质量语音的基础上用尽可能低的码 率来传送和存储数字语音信号,从而增加现有信道的带宽利用率、通信的安全性、 顽健性以及降低成本已经越来越受到人们的重视。因此如何在尽量减少失真的情 况下,高效率地对模拟语音信号进行数字化表达,即压缩编码,就成为语音编码 技术的主要内容1 2 j 。为了压缩数字语音传输的比特率,以使同样的信道容量能传 输更多的语音信号,节省存储空间,语音压缩编码也有了很大的发展,并在有线 无线电话的话带语音信号、会议电视的宽带语音信号、h d t v 和高保真音乐等 的音频信号等领域有广泛的应用【3 】【4 1 。 通信系统是围绕着通信传输的数量与质量两个类型的三种指标( 有效性、可 靠性和安全性) 进行不断优化的。移动通信中的各类新技术,都是以解决移动通 信中的有效性、可靠性和安全性为目标而设计的。移动通信属于无线通信。在无 线通信中有效性的要求显得非常突出,这是由于无线信道的频率资源是有限的。 提高移动通信的有效性主要通过改进信源编码技术来完成。近年来,通信系统发 展迅速,随着移动通信的发展,目前以t d m a 或窄带c d m a 为核心技术的第二 代数字蜂窝系统由于容量小和业务种类有限,己不能满足飞速发展的移动通信业 务量的需要,尤其是第三代移动通信的发展,对语音压缩编码算法提出了更高的 要求,不但要求编码码率较低以增加系统容量,而且要求合成音质较高以保证通 硕士学位论文 第一章绪论 话质量。用传统的语音压缩编码方式,很难同时满足这两个要求。变速率语音压 缩编码的提出,使这个问题有了突破性进展。在移动通信系统中采用变速率语音 压缩编码,可以根据需要动态调整编码速率,在合成语音质量和系统容量中取得 灵活的折衷,最大限度地发挥系统的效能。 在当前应用广泛的码分多址( c o d ed i v i s i o nm u l t i p l ea c c e s s ,c d m a ) 移动通 信系统中,采用的变速率语音编码算法对于系统的容量和通话质量有非常重要的 影响。由于移动通信市场竞争异常激烈,使得变速率语音编码的研究成为一个热 点。近几年来变速率语音编码技术发展得很迅速,并不断有新的国家和国际标准 公布出来。随着技术的成熟,它的应用领域也越来越广阔,不仅限于移动通信系 统,在i p 电话、互联网等也有很好的应用前景。 自从2 0 世纪8 0 年代初期第一片数字信号处理芯片( d i g i t a ls i g n a l p r o c e s s o r s ,d s p ) 问世以来,d s p 就以数字器件特有的稳定性,可重复性,可大 规模集成,特别是可编程性和借口简单等特点,给数字信号处理的发展带来了巨 大的机遇,并使得数字信号处理的手段更加灵活,功能更加强大,应用领域也越 来与广泛。d s p 极其高速的数字处理能力和很强大的运算量使之成为语音处理、 图像硬件处理技术的基础。最近十年,d s p 相关技术得到了迅猛的发展,其丌发 环境也越来越强大,为加快d s p 系统的开发周期提供了方便,大大的缩短了产品 的上市时问。同时,随着d s p 芯片的发展,d s p 系统的成本,体积、重量和功耗 有很大程度的下降,d s p 为变速率语音编码的实现提供了一个很好的硬件开发平 台。 1 2 变速率语音编码的发展历史和方向 传统的语音编码从方法上讲,自1 9 3 7 年a h r e e v e s 提出脉冲编码调制以来, 开创了语音数字化通信的里程,语音编码经历了几十年的发展历程。语音编码技 术有很多种,归纳起来大致分为四种方式:时域波形编码、变换域编码、参数编 码和混合编码【5 l 【6 1 。时域波形编码不基于声学模型,只针对语音波形进行编码。 使用各种方式尽量逼近原始信号的波形,一般来说语音质量较好,但所用的编码 速率较高。变换域编码方式也是不基于声学模型的编码方法,主要有子带编码 ( s b c ) 和自适应变换编码( a t c ) 。参数编码是基于模型的编码方法,通过对语音 信号特征参数的提取和编码,力图使重建语音信号有尽可能高的可懂度,而重建 信号的波形和原语音信号波形可能有相当大的差别。一般来说参数编码的编码速 率很低,但合成语音质量比较差,自然度低。为了能获得高效优质的编码性能, 近年来新的编码算法大多采用上述几种编码方式的结合,即混合编码的算法。混 合编码在参数编码技术的基础上,用波形编码的准则去优化激励源信号,从而在 2 硕士学位论文第一章绪论 4 8 9 6 千比特秒的比特率上获得较高质量的合成语音。其代表是合成分析 ( a b s ,a n a l y s i s b y s y n t h e s i s ) 线性预测编码。它采用感觉加权技术,在闭环的 基础上寻找主观意义上失真最小的激励矢量。山于采用的激励信号模型不同,这 类方法派生出的多种新的编码方法都能在9 6 k b s 码率上获得较高的话音质量。 典型的方法有规则脉冲激励线性预i 贝j j ( r p el p ) 、多脉冲激励线性预测( m p el p ) 和码激励线性预沏, u ( c e l p ) 等。m p el p 采用数目有限、非均匀间隔的冲激序列作 为激励,在r p el p 中信号同样为冲激序列,但其间隔为常数,所以r p el p 除 需指明序列的起始位置外,无需对每一个脉冲位置进行描述【7 】【引。c e l p 采用矢 量量化技术,传送给解码器的是码本索引而不是样值矢量,c e l p 能高效地压缩 数码率,但是建立码本搜索码字的运算量比较大。 以上都属于定速率编码,从整体上讲,较高速率的编码算法对话音质量较易 保证,但占用网络资源较大;较低速率的编码算法占用网络资源较小,但对话音 质量较难保证。 v a d 技术的出现和发展,使对有无话音进行判断成为可能,从而可能对背 景噪声和激活的话音部分以不同的速率进行编码,降低平均速率,也就是采用变 速率编码的方法。自从变速率语音编解码算法诞生以来,因为其不但可以根掘需 要动态调整编码速率,在合成语音质量和系统容量中取得灵活的折衷,最大限度 地发挥系统的效能,而且非常适合分组交换网络,得到了很大的发展。 2 0 世纪9 0 年代,c d m a 移动通信系统的飞速发展,及其对语音编码技术的 进一步要求,把变速率语音编码技术推上了前台,采用的变速率语音编码算法对 于系统的容量和通话质量有非常重要的影响。由于移动通信市场竞争异常激烈, 变速率语音编码的研究已成为热点。也随之产生了一系列的变速率语音编码标 准,主要包括q c e l p 、e v r c 、a m r 、a m r w b 和s m v 五种算法标准。 1 9 9 5 年5 月,美国通信工业协会( t i a ) 公布了i s 9 6 a 1 9 j ,内容是高通公司提 出的可变速率码激励线性预测( q c e l p ) 编码算法。这是c d m a 系统中最早采用 的8 k 变速率语音编码算法,使用4 种速率:全速率( 8 5 5 k b i t s ) ,半速率( 4 o k b i f f s ) , 1 4 速率( 2 0 k b i t s ) ,1 8 速率( 0 8 k b i t s ) 。1 9 9 8 年3 月公布的i s 7 3 3 t 1 0 是1 3 k q c e l p 标准。i s 7 3 3 使用4 种速率:全速率( 1 3 3 k b i t s ) ,半速率( 6 2 k b i t s ) ,l 4 速率( 2 7 k b i t s ) ,1 8 速率( 1 o k b i t s ) 。这两种算法使用的主要技术大致相同,但 i s 7 3 3 使用了两级编码数据速率判决,而i s 9 6 用的是单级编码数据速率判决。 另外,i s 7 3 3 对线谱频率( l s f ) 使用矢量量化,i s 9 6 使用的是标量量化。后来对 这两个协议分别进行了修改和增补i i 。 t 认在1 9 9 7 年1 月公布了i s 1 2 7 0 2 j ,即增强型变速率编解码( e n h a n c e d v a r i a b l er a t ec o d e c ,简称e v r c ) 算法,这个协议可以很好地解决i s 9 6 话音质 硕士学位论文 第一章绪论 量不高和i s 7 3 3 码率较高等问题。它既保持了与i s 7 3 3 相近的合成语音音质, 又具有较低的平均码率。它使用三种编码速率:全速率( 8 5 5 k b i t s ) 、半速率 ( 4 0 k b i t s ) 和l 8 速率( o 8 k b i t s ) ,没有使用1 4 速率编码。这种算法的特点有:语 音帧根据语音的特性分为三种速率进行传输;预处理环节加入适合于无线移动通 信的噪声抑制模块:速率判决机制的应用;l s p ( 线谱对) 参数采用矢量量化,以 子帧为单位的码本搜索分为自适应码本搜索和代数结构固定码本搜索等。1 9 9 8 年8 月t i a 公布了t i a e i a i s 1 2 7 1 i i 引,其内容是对i s 1 2 7 协议的补遗,形成 i s 7 1 8 ,并对i s 1 2 7 协议的相关部分做出调整。1 9 9 9 年9 月t i a 公布了t i a e i a i s 1 2 7 2 t 1 4 】,其内容以i s 1 2 7 协议为基础进行了扩展,主要增加了对4 5 4 5 波特 t t y t d d 的可靠性传输( t e l e t y p e t e l e c o m m u n i c a t i o n sd e v i c ef o rt h ed e a f ) 的支 持。2 0 0 1 年9 月t i a 公布了t i a e i a i s 1 2 7 3 t ”1 ,对t i a i e i a i s 1 2 7 2 的修改 以取代t i e i i s 1 2 7 2 。 1 9 9 9 年公布的第三代伙伴计划( 3 耐g e n e r a t i o np a r t n e r s h i pp r o j e c t3 g p p ) 把自 适应多速率( a m r ) 语音编解码【l 川1 17 】作为主要技术,有8 种速率供选择( 1 2 2 ,1 0 2 , 7 9 5 ,7 4 0 ,6 7 0 ,5 9 0 ,5 1 5 , 4 7 5k b i t s ) ,采用语音激活技术( v a d ) 、舒适背 景噪声( c n a ) 、源控速率( s c r ) 、重帧及误码消除( e c u ) 、抗稀疏处理等先进技术。 它能根据信道质量选择不同的编码速率。a m r 编码是针对g s m 系统设计的, 对c d m a 的环境不是很适合i l 引。 a m r w b 是i t u ( 国际电信联盟) 2 0 0 0 年1 2 月公布的白适应多速率宽带 ( a d a p t i v em u l t ir a t e w i d e b a n d ) 编码器的标准g 7 2 2 2 g t l 9 j ,其输入原始信号为 5 0 h z - 7 k h z ,采样率为1 6 k h z ,相对于2 0 0 h z 3 4 k h z 为宽带。它已被3 g p p 选定为g s m 和3 g 无线w - c d m a 的宽带编码器,并将应用于i p 电话、第三代 移动通信、i s d n 宽带电话、i s d n 可视电话和电视会议等领域,这标志着无线 和有线业务第一次采用同样的编码器。支持九种速率模式:6 6 、8 8 5 、1 2 6 5 、 1 4 2 5 、1 5 8 5 、1 8 2 5 、1 9 8 5 、2 3 0 5 和2 3 8 5 。 2 0 0 1 年1 2 月公布的可选模式声码( s e l e c t a b l em o d ev o c o d e r ,s m v ) 是3 g p p 2 公布的最新的语音编码算法标准【2 0 1 。这种算法合成语音质量高,灵活性更强, 很有发展前途。s m v 有六种可选择的工作模式,其中基本模式有0 、1 、2 、3 四 种,将最大半速率规则分别应用于模式0 和模式l ,就得到了模式4 和5 。最大 半速率规则的含义是不选用全速率编解码器,因而选用的最大编码速率为半速 率。 随着移动通信的飞速发展,用变速率语音编码来提高频带的有效利用程度, 将是未来数字蜂窝和微蜂窝网的必然发展趋势。为了获得更加实用的变速率算 法,人们将对变速率语音编码的自适应技术进行更深入的研究,在将来的通信系 4 硕十学位论文第一章绪论 统中,除了源控制、信道控制和网络控制这三种方式以外,由用户控制也是可能 的,也就是说,用户可能选择平均比特率来控制通话的质量。这样的控制允许用 户限制移动传输的功率,这会增加误码率和所需的前向纠错的程度,因此就必须 减少用作语音编码的比特数。当然,将来的通信系统也可能综合考虑几种控制方 式的有机结合,使系统更好地发挥作用,用户更加满意,从而增强竞争力。但由 于通信系统的复杂性,这不是一个简单的问题,需要多方面进行考虑。 另外,对语音压缩编码从基本原理和方法的研究也是非常重要的。语音压 缩编码的依据,一方而是语音信号本身存在很大的冗余度,主要体现在: ( 1 ) 语音信号样本间有很强的相关性,即短时谱是不平坦的。 ( 2 ) 浊音语音段具有准周期特性。 ( 3 ) 声道的形状及其变化的速率是有限的。 ( 4 ) 传输码值的概率分布是非均匀的。 另一方面是人耳的听觉心理特性,主要体现在: ( 1 ) 人耳对不同频段的声音敏感程度不同,通常对低频比对高频敏感一些。 ( 2 ) 人耳对语音信号的相位不敏感。 ( 3 ) 人耳有“掩蔽”效应( m a s k i n g e f f e c t ) ,即一个强音能抑制一个同时存在的 弱音的听觉现象。对人耳听不到或极小敏感的声音分量可以看作是冗余。语音压 缩编码本质上就是设法去掉这些冗余度,从而达到压缩比特率的目的。 未来变速率语音压缩技术的研究也将在所采用的基础语音编码技术上做更 多的工作,主要体现在以下三个方面。 1 对速率判决和控制的进一步改进 通过对速率判决算法的改进提高编码的效率。把更精确的语音检测技术应用 到速率判决算法中来,使速率判决更符合语音信号的特性,从而进一步降低编码 速率或者提高合成语音质量。对c d w a 通信系统本身也可以做进一步研究,速 率控制机制也可以进一步改进,更多地考虑用户的需要和信道的实际情况,使速 率控制更加灵活、有效。 2 与新的低速率语音编码技术的结合 目前所采用的变速率编码方式还是基于c e l p 的编码方式,近年来又出现了 很多新的低速率编码方案,而新出现的许多低速率语音编码方案从技术角度出发 也可以实现变速率编码,如目前比较流行的m b e 算法。人们可以对低速率语音 编码作进一步研究,并与变速率语音编码相结合,以获得更低的平均编码速率, 或者采用其中的一些技术,用来提高合成语音的质量。 3 对c d m a 通信系统特点的研究 c d m a 通信系统本身有很多不同于传统通信系统的地方,这些特性对采用的语 硕士学位论文 第一章绪论 音编码算法也会有影响。通过对系统特性的研究,可以改进语音编码算法中的不 足之处,增强顽健性,使之更适应于通信系统的需要。 1 3d s p 技术的发展及在语音编码中的应用 2 0 世纪6 0 年代以来,随着计算机和信息技术的飞速发展,数字信号处理技 术应用迅速发展,现已形成- - f - j 独立的学科,在通信、自动化等多个领域获得极 为广泛的应用。8 0 年代初世界上第一片单片可编程d s p 芯片的诞生,将数字信 号处理的理论研究成果广泛应用到实际系统中。d s p 芯片的诞生对于数字信号处 理的发展起了十分重要的作用。d s p 可以代表数字信号处理器( d i g i t a ls i g n a l p r o c e s s o r ) ,也可以代表数字信号处理技术( d i g i t a ls i g n a lp r o c e s s i n g ) ,后者是理 论上的技术,要通过前者变成实际产品。两者结合起来就成为解决某一实际问题 和实现某一方案的手段即数字信号处理解决方案( d s p s ) 。d s p 是在模拟信号变 换成数字信号以后进行高速实时处理的专用处理器,其处理速度比最快的c p u 还快1 0 - 5 0 倍。在当今的数字化时代背景下,d s p 己成为通信、计算机、消费 类电子产品等领域的基础器件。业内人士预言,d s p 将是未来集成电路中发展最 快的电子产品,并成为电子产品更新换代的决定因素。 在d s p 出现之前数字信号处理只能依靠m p u ( 微处理器) 来完成。但m p u 较低的处理速度无法满足高速实时的要求。因此,7 0 年代有人提出了d s p 的理 论和算法基础。而d s p 仅仅停留在教科书上,即便是研制出来的d s p 系统也是 由分立组件组成的,其应用领域仅局限于军事、航空航大部门。 随着大规模集成电路技术的发展,1 9 8 2 年世界上诞生了首枚d s p 芯片。这 种d s p 器件采用微米工艺n m o s 技术制作,虽功耗和尺寸稍大,但运算速度却 比m p u 快了几十倍,尤其在语音合成和编码解码器中得到了广泛应用。d s p 芯 片的问世标志着d s p 应用系统由大型系统向小型化迈进了一大步。随着c m o s 技术的进步与发展,第二代基于c m o s 工艺的d s p 芯片应运而生,其存储容量 和运算速度成倍提高,成为语音处理、图像硬件处理技术的基础。8 0 年代后期, 第三代d s p 芯片问世,运算速度进一步提高,其应用于范围逐步扩大到通信、 计算机领域。 9 0 年代d s p 发展最快,相继出现了第四代和第五代d s p 器件。现在的d s p 属于第五代产品,它与第四代相比,系统集成度更高,将d s p 芯核及外围组件 综合集成在单一芯片上。这种集成度极高的d s p 芯片不仅在通信、计算机领域 大显身手,而且逐渐渗透到人们日常消费领域,前景十分可观。 早期的脉冲编码调制( p c m ) 等波形编码运算复杂度不高,在电话系统中得到 6 硕十学位论文第一章绪论 广泛应用。随着用户量的增加和无线通信技术的发展,人们对带宽的要求越来越 高,但是参数编码和混合编码运算复杂度比较高,在d s p 出现以前并不能得到 大规模的应用。d s p 的出现,为这些复杂的语音压缩编码算法的实时实现铺平了 道路,用高速d s p 系统实现语音压缩编码算法,不但可以满足于语音缩编码算法 在速度方面的需求,而且和专用集成电路设计相比d s p 系统具有开发时问短,成 本低的优势。t i 、a d 和m o t o r a l a 等公司的通用d s p 具有很好的灵活性, 广泛应用在多媒体通信、移动通信等领域。同时,各种专用语音编码芯片由于集 成度高、性价比逐年提高,实时性更强,也很好的满足了语音通信的要求。 1 4 本课题所做的主要研究及论文安排 本论文的主要任务是采用t i 的t m s 3 2 0 c 6 7 13d s p 芯片对s c v r c e l p 语 音压缩编码实现的研究。论文首先研究了s c v r c e l p 的算法,再重点对 s c v r - c e l p 实现的c 程序进行了编写和调试。然后论述了t m s 3 2 0 c 6 7 1 3d s k 硬件目标平台,了解浮点d s p t m s 3 2 0 c 6 7 1 3 芯片的c p u 结构及片上外设,以及 这个语音编码算法在t m s 3 2 0 c 6 7 1 3d s k 上的实现,并对系统进行了优化。最后 对系统的软件性能进行了测试和仿真,得出了主观和客观性能分析结果。 第一章绪论。主要介绍课题背景、变速率语音编码的发展历史和方向及d s p 技术的发展及在语音编码中的应用、本文所做的主要研究和论文安排。 第二章s c v r c e l p 语音编解码模型。研究了s c v r c e l p 算法原理,并 对编码中一些相关理论和技术进行了详细分析。 第三章s c v r - c e l p 编解码器在d s p 上的实现。首先论述了t m s 3 2 0 c 6 7 13 d s k 硬件目标平台,介绍了t m s 3 2 0 v c 6 7 1 3 芯片的特点,同时对d s p 和各外围 芯片的接口设计做了简要的介绍。然后讨论了编解码器的软件设计,使语音编码 算法在t m s 3 2 0 c 6 7 1 3d s k 上进行了实现。同时对d s p 环境下实现系统进行优 化,方法包括硬件优化,c 语音级的优化和汇编语言级的优化。 第四章系统测试及性能分析。主要是对系统的软件性能进行了测试和仿真, 得出了主观和客观性能分析结果。 第五章结论与展望。对本论文所做的工作进行了总结,说明了本文创新点, 并讨论了今后需深入研究的可能性和必要性,对下一步的工作进行了展望。 7 硕十学位论文第二章s c - v r - c e l p 语音编解码模型 2 1 概述 第二章s c - v r o e l p 语音编解码模型 变速率语音压缩编码理论上仍属于c e l p ,但在“变上有了新的研究,由 此引进了相关的先进技术。这些相关技术主要包括:用来检测语音通信时是否有 语音存在的语音激活检测技术、为了突出“变”字而进行速率判决的自适应技术、 为了避免语音帧丢失后带来负面效应的差错隐藏技术、为克服背景噪声不连续的 舒适背景噪声生成技术等等。这些相关技术的应用使变速率语音编码之后的语音 合成效果几乎没有降低。 语音分类的可变速率c e l p ( s c v r c e l p :s p e e c hc l a s s e dv a r i a b l er a t e c o d ee x c i t e dl i n e a rp r e d i c t i o n ) 语音编解码模型是以码激励线性预测算法为基础, 其语音编码器的原理框图如图2 1 所示。 图2 - 1s c v r c e l p 语音编码器的原理框图 s c v r c e l p 对输入信号用8 k h z 采样,1 6 比特线性p c m 量化,每2 0 m s 分为一个语音帧,每帧包括1 6 0 个样本点,可以选择以下四种速率中的任一种进 行编码:全速率、1 2 速率、1 4 速率和1 8 速率。全速率编码后的数据包有1 5 8 比特,1 2 速率数据包有7 6 比特,1 4 速率数据包有4 2 比特,1 8 速率数据包1 8 比特,相应的速率分别为7 9 k b s 、3 8 k b s 、2 1 k b s 、0 9 k b s 。s c v r c e l p 将每 一帧又分为l p c 子帧、基音子帧和固定码本子帧,编码速率不同,每帧中各子 帧的数目、包含的样本点及其参数编码所占比特数也不同,各参数编码的比特分 8 硕士学位论文第二章s c v r - - c e l p 语音编解码模型 每帧l p c 子帧更新的次数 每个l p c 子帧所包含的样本数 每个l p c 子帧编码所1 1 1 的比特数 每帧基音子帧更新的次数 每个基音子帧所包含的样本数 每个基音子帧编码所t 吁的比特数 每帧同定码本子帧更新的次数 每个同定码本子帧所包含的样本数 每个固定码本子帧编码所占的比特数 分类模式 l 1 6 0 l 1 6 0 l 1 6 0 1 1 6 0 ( 2 0 m s ) ( 2 0 m s ) ( 2 0 m s )( 2 0 m s ) 3 2 4 4 0 3 2 2 8 0 1 0 l 1 6 0 ( s m s )( 1o m s ) ( 2 0 m s ) 1 1 8 2 0 1 l 2 8 0 1 0 2 8 0 1 0 o l 1 6 0 ( 2 5 m s )( 1o m s )( io m s )( 2 0 m s ) 1 0 2 1 0 2 l o 2 6 2 2 2s c - v r - c e l p 编码原理 2 2 1 预处理 预处理主要包括高通滤波和加窗两部分。 1 输入样点高通滤波 为了去除输入信号中不需要的背景噪声和电流噪声,并防止信号中直流分量 能量过大,需要对采样的语音信号进行高通滤波处理。一个典型的高通滤波器的 传输函数如下定义: 脚( z ) = 0 9 4 6 1 5 # 勰 ( 2 - 1 ) 9 硕十学位论文 第二二章s c - v r - - c e l p 语音编解码模裂 2 加窗 经过高通滤波的语音信号需要加窗处理,这里采用汉明窗,长度为1 6 0 个样 本点,窗的中心位于每帧的第1 3 9 矛t l 第1 4 0 个样本点的中间。汉明窗定义为: 帅) :0 5 4 - 0 4 6 c o s ( 嚣) ,呦舛( 2 _ 2 )( ,2 ) = l l 。 “ ( 2 2 ) l0 , 其它 其中,l = 1 6 0 为每帧的样本点数。加窗后的语音s 。( ,2 ) 为 s 。( 门) = s ( n + 6 0 ) 陟0 ( 聆) ,0 甩l 一1 ( 2 3 ) 由式( 2 3 ) 可以看出,窗内的语音样本点与当前帧内的语音样本点有6 0 个样本点 的偏移量,式中s ( 刀+ 6 0 ) ( 10 0 ,2 15 9 ) 指的是下一帧的前6 0 个样本点。 2 2 2 语音激活检测技术 语音激活检测( v o i c ea c t i v i t yd e t e c t o r o v a d ) 的目的是检测语音通信是否存 在有话音,其基本原理是通过计算连续几帧的部分语音编码参数( v a d 参数的计 算) ,来决定采用何种方法判断语音的存在与否( v a d 判决方法) 。v a d 算法的输 出结果是布尔值( “1 或“0 ”) ,用于指示当前信号帧是语音帧还是非语音帧, 如果输出是“l ,则说明当前信号帧是语音帧;如果输出是“0 ”,则当前信号是 非语音帧。 从离散小波变换的定义可知,离散信号的小波变换相当于离散信号经过一组 滤波器而被分成了一系列子带信号。每个子带内的小波系数表现了信号相应频带 内的能量分布。系数较大者携带的信号能量较多,系数较小者携带的信号能量较 少【2 l 】。一般来说,语音与噪声的能量分布是不相同的【2 2 】,语音的能量分布在一 个相对窄的频带上,而噪声的能量分别在较宽的频带上。并且基音频率的范围约 为5 0 - 4 5 0 h z ,而第一共振峰多出现在5 0 0 h z 左右,因而这一频段包含的语音成分 应当比噪声丰富。带噪语音经过小波变换以后,随着尺度i 的增大,近似部分的 幅度将会降低。当尺岗增大到一定值时,带噪语音的近似部分将主要由纯语音 部分组成,而噪声的近似部分幅度将变得非常小,所以带噪语音和噪声的近似部 分有着相当大的区别。而t e a g e r 能量算子可以有效地提取语音信号的能量,因此, 可以将改进型离散小波变换和t e a g e r 能量算子相结合来进行激活检测。 ( 1 ) 对语音信号进行分帧,帧长为2 0 m s 。 ( 2 ) 分别对每帧信号进行离散小波变换。离散小波变换相当于离散信号经过 一组滤波器而被分成一系列子带信号。滤波器组是由低通滤波器和高通滤波器组 1 0 硕十学位论文第二章s c - v r - - c e l p 语音编解码模趔 成的滤波器组,低通滤波器的输出是近似信号,高通滤波器的输出是细节信号 2 3 1 1 2 钔。小波的多分辨分析只是对低频部分进行进一步分解,使低频的分辨率变 得越来越高,而高频部分不予考虑矧2 6 1 。公式如( 2 4 ) ;f 1 ( 2 5 ) ,其中。和叱。分 别表示d w t 输出的近似部分和细节部分。f ( 力) 、办( 胛) 分别表示低通滤波器和高通 滤波器。m 表示分解的层数,力表示分解的系数的索引值。为了进一步研究离散 小波变换的近似部分和细节部分对于语音的影响,对原始语音进行3 层的离散小 波变换,本文选取的小波函数为d a u b e c h i e s 中的d b 5 方法,使用d a u b e c h i e s 的 理由是:1 较接近于对称性函数:2 j 、波函数甲和尺度函数的有限承载长度为 2 - j :3 d a u b e c h i e s 函数具有正交性。 ,。= 2 c m - l , k l ( k - 2 玎) ( 2 - 4 ) d m ,。= 2 - 1 女h ( k - 2 n ) ( 2 5 ) ( 3 ) 将小波变换后的系数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《危化品运输车辆安全警示与培训合同》
- 餐饮服务员劳动合同范本(含合同签订与备案流程)
- 离婚协议子女户口迁移及子女抚养费支付与监护权合同
- 2025超市条形码服务合同
- 离婚后前配偶人寿保险权益补偿及终止协议
- 黄山学院招聘考试真题2024
- 地下修车店转让合同模板(3篇)
- 2025年辽宁省葫芦岛市事业单位工勤技能考试考试题库及参考答案
- 贵州公务员考试真题2025
- 幼儿音乐启蒙活动方案设计集
- 2025-2026学年统编版一年级上册道德与法治教学计划含教学进度表
- 做有梦想的少年+课件-2025-2026学年统编版道德与法治七年级上册
- 医院2025年院感防控及传染病考核试题及答案
- 老乡贷贷款管理办法
- 2025年职业技能内河船员证理论知识-理论知识参考题库含答案解析(5卷)
- 安装大棚合同(标准版)
- (2025秋新版)人教版八年级历史上册全册教案
- 2025年小麦种子研发与应用技术合作开发协议
- 维稳工作汇报课件
- 企业重污染天气应急预案
- 患者身份识别管理标准WST840-2025学习解读课件
评论
0/150
提交评论