




已阅读5页,还剩59页未读, 继续免费阅读
(信号与信息处理专业论文)基于vpm642的g729a语音编解码器的实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 数字语音通信业务是当前信息产业中发展的最快、普及面最广的业务之一。 g 7 2 9 语音编解码标准是目前中、低速率语音编码中的主流算法之一。该标准采 用共轭结构的代数码激励线性预测语音编码方案,其码率为8k b i t s ,是i t u t 推荐的语音压缩编码标准中算法最为复杂的一种。( 2 7 2 9 标准的应用非常广泛, 如v o i p 、可视会议和和电话会议等。g 7 2 9 a 是g 7 2 9 的简化版本。两者的编解 码结构相同,码流可以互通。g 7 2 9 a 的运算量比g 7 2 9 减少约一半,而语音质 量下降不大,因此在工程应用中一般都采用g 7 2 9 a 。 g 7 2 9 a 算法的复杂性和语音通信的实时性都对硬件提出了很高的要求。同 时,作为通信网络的重要组成部分的多媒体通信终端,往往需要融合系统、传输、 图像、语音、数据等多种功能,这就要求其核心处理器具有强大的处理能力。 t m s 3 2 0 d m 6 4 2 是t i 公司专门针对多媒体通信而推出的一款定点d s p 处理器, 它强大的功能为多媒体信息的处理提供了良好的硬件基础。 本文首先介绍了语音压缩编码技术的发展概况和语音编码的原理,以码激励 线性预测编码技术为重点,详细分析了码激励线性预测编码技术中最重要的几种 实现技术,包括线性预测分析、矢量量化、合成分析等,并在此基础上对g 7 2 9 a 算法进行了进一步的研究。接下来本文着重地讨论了基于v p m 6 4 2 的g 7 2 9 a 语 音采集与处理系统的软件设计,及其在v p m 6 4 2 开发板上的实现与优化。简要 介绍了系统的硬件平台、t m s 3 2 0 d m 6 4 2 架构以及d s p 系统的开发环境c c s 等。 通过一系列针对t m s 3 2 0 d m 6 4 2 硬件平台的g 7 2 9 a 算法的优化,例如使用存储 器分配优化、内联函数优化、数据打包技术优化、软件流水优化循环等技术,极 大的提高了程序的运行效率,满足实时性的要求。 最后对系统进行了测试,测试结果表明:本课题中基于v p m 6 4 2 的g 7 2 9 a 的语音编解码器完全能够达到实时性要求,经g 7 2 9 a 编解码器处理后的重建语 音话音质量良好。 关键词:d s p 、g 7 2 9 a 、d m 6 4 2 、语音编码、算法优化 a b s t r a c t n o w a d a y sd i g i t a ls p e e c hc o m m u n i c a t i o nh a st h eh i g h e s ts p e e do fd e v e l o p m e n t a n dt h ew i d e s tr a n g eo f a p p l i c a t i o n si nt h ef i e l do fi n f o r m a t i o nt e c h n o l o g y c o d i n go f s p e e c ha t8 k b i t sa l g o r i t h mg 7 2 9w a sb a s e do nc s a c e l ei ti so n eo ft h em o s t c o m p l i c a t e da l g o r i t h m so fs p e e c hc o m p r e s s i o n ,w h i c hu s e sk i n d so f a d v a n c e d t e c h n o l o g i e si ns p e e c hc o d i n ga n dc o m p r e s s i o n g 7 2 9i sav e r ye f f i c i e n td i g i t a l c o d i n ga l g o r i t h mw h i c hc a nb ea p p l i e dt om a n yf i e l ds u c ha sv o i pa n dn e t - m e e t i n g a n de t c c t 7 2 9 a n n e xai sar e d u c e dc o m p l e x i t y8k b i t sc s a c e l ps p e e c hc o d e c t h i sa n n e xp r o v i d e st h eh i g hl e v e ld e s c r i p t i o no far e d u c e dc o m p l e x i t yv e r s i o no ft h e g 7 2 9s p e e c hc o d e c i ti sb i ts t r e a mi n t e r o p e r a b l ew i t ht h ef u l lv e r s i o n t h e c o m p u t a t i o n a lc o m p l e x i t yo f t h eg 7 2 9 a n n e x ai so n l yo n eh a l f o f t h a to f t h ef u l l v e r s i o n ,w i t hal i t t l el o s si nt h es p e e c hq u a l i t y t h e r e f o r ep e o p l eu s et h eg 7 2 9 a n n e x ai nt h ep r a c t i c a lp r o j e c t s t h ec o m p l i c a t e dn a t u r eo fc j 7 2 9 a a l g o r i t h ma n dt h er e a l t i m ef e a t u r e so fs p e e c h c o m m u n i c a t i n gp u tf o r w a r dh i g hr e q u e s tt ot h eq u a l i t yo ft h eh a r d w a r e b e s i d e s ,a s i m p o r t a n tc o m p o n e n to ft h ec o m m u n i c a t i o nn e t ,m u l t i m e d i ac o m m u n i c a t i o nt e r m i n a l u s u a l l yi n t e g r a t e sm a n yf u n c t i o n ss u c ha ss y s t e m c o n t r o l ,i m a g ea n ds p e e c h p r o c e s s i n ga n dd a t ap r o c e s s i n ga n de t c a l lo ft h e s er e q u e s tp o w e r f u la b i l i t yf o rt h e c o r ep r o c e s s o r t m s 3 2 0 d m 6 4 2i saf i x e dd s p p r o c e s s o rf o rt h ea p p l i c a t i o no f m u l t i m e d i ac o m m u n i c a t i o n ,w h i c hi sp r o d u c e db yt h et e x a si n s t r u m e n t s i t sp o w e r f u l a b i l i t ye n s u r e sag o o dh a r d w a r ef o u n d a t i o nf o rm u l t i m e d i ap r o c e s s i n g t h i sp a p e rf i r s t l yi n t r o d u c e db r i e f l yt h eg e n e r a ld e v e l o p m e n to f s p e e c hc o d i n g t e c h n o l o g y t h e ns t r e s s f u ll ys t u d i e st h ek e yt e c h n o l o g i e si nt h ec e l p , s u c h a sl i n e a r p r e d i c t i v ea n a l y s i s ,v e c t o rq u a n t i z a t i o n ,a n a l y s i sb ys y n t h e s i sa n de t c o nb a s eo f t h e s es t u d i e sa n dt h ef a m i l i a r i t yo ft h ecs o u r c ec o d e ,m a d ef u r t h e rr e s e a r c ho nt h e g 7 2 9 ac o d e c a f t e ri n t r o d u c i n gt h ed e v e l o p m e n to f t h ed s pa n dc c s 3 0w h i c hi s t h ed e v e l o p m e n te n v i r o n m e n to fd s p s y s t e m ,t h el a s tp a r to ft h i sp a p e rb r o u g h tu pa m e t h o do f r e a l t i m ei m p l e m e n t a t i o no f g 7 2 9 ao nv p m 6 4 2 b e c a u s et h eg 7 2 9 a a l g o r i t h mi st o oc o m p l i c a t e dt h a ti ti sh a r dt or e a l i z er e a l - t i m ep r o c e s s i n g t h e r e f o r e n e x tw eu s e ds o m ec o d eo p t i m i z a t i o nm e t h o d ss u c ha sd a t ap a c k i n ga n de t ct o i m p r o v et h ee f f i c i e n c yo ft h ec o d e c t h er e s u l t so ft e s ts h o wt h a tt h e s em e t h o d sc a nr e m a r k a b l yr e d u c et h e c o m p u t a t i o n a lc o m p l e x i t y , t h u si m p r o v e dt h ee f f i c i e n c yo f t h ec o d e c a n dt h e d e c o d e ds p e e c hs i g n a lw h o s ed e f i n i t i o na n dn a t u r ec h a r a c t e r i s t i ca r ea l lg o o db yt h e m e t h o do fs u b j e c t i v ea u d i t i o n k e y w o r d s :d s p , g 7 2 9 a ,d m 6 4 2 ,s p e e c hc o d i n g ,a r i t h m e t i co p t i m i z a t i o n 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的 研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他入已经发表 或撰写过的研究成果,也不包含为获得:苤鲞盘堂或其他教育机构的学位或证 书而使用过的材料。,与我一同工作的同志对本研究所做的任何贡献均已在论文中 作了明确的说明并表示了谢意。 学位论文作者签名:确烨砌 签字日期: 砌苫年月j 日 学位论文版权使用授权书 本学位论文作者完全了解墨盗盘堂有关保留、使用学位论文的规定。 特授权苤鲞盘堂可以将学位论文的全部或部分内容编入有关数据库进行检 索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校 向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名:布 聊繇钐惜芭 签字日期:硼年6 月j 日 签字日期:加孵璋易月广日 第一章绪论 1 1 引言 第一章绪论 语音通信是多媒体通信的基础。自从2 0 世纪3 0 年代末提出p c m 及通道声 码器理论以来,语音编码技术已有6 0 余年的发展历史。随着信息社会和通信技 术的飞速发展,各种与语音应用服务相关的新业务不断涌现,要求语音数据能被 灵活处理、存储、转发和传送。因此,语音压缩编码去除语音信息中的冗余 度,降低传输比特率( 或存储空间) ,具有很重要的意义。从价值观考虑,语音 编码的实时实现是很重要的。任何语音编解码算法都可利用信号处理芯片( d s p ) 实现。在最近2 0 年中,d s p 技术有了很显著的发展,很多强有力的定点和浮点 d s p 芯片,已经为复杂语音编码算法的实时实现铺平了道路。 1 2 语音编解码技术的发展 语音编码最初是由人们企图压缩通信频带而来。最初18 7 6 年贝尔 ( a l e x a n d e rg r a h a mb e l l ) 发明了电话,开创的电话通信,但是在之后几乎半个 世纪中,人们对电话通信系统了解甚少。从2 0 世纪2 0 年代开始,美国贝尔实验 室开始研究电话信号,同时也对电话系统的理论进行研究。在之后半个多世纪中, 各国的研究者们从人类发音机理和听觉机理出发,对语音的基本元素如声学特 性、频谱特征和语意表达等做了大量的研究,建立了发音模型和听觉模型,在不 同程度上逼近真正的语言过程,并取得了长足的发展,逐步形成了通信和信息处 理科学的重要研究方向。1 9 3 9 年美国的h o m e r d u d l e y 发明了以滤波器为主构造 的通道声码器,从此以后,语音处理开始了参数编码或模型编码的研究。 2 0 世纪6 0 年代,s a t o ,l t a k u r a ( 1 9 6 6 ) 和a t a l ,s c h r o e d e r ( 1 9 6 7 ) 研究出了 实用的共振峰声码器,这是最早把“l p c ( l i n e a rp r e d i c t i o nc o d e ) ”技术应用到语 音分析和合成的技术。他们以线性组合模型满足均方误差最小条件下逼近原始波 形的方法提取参数,研究出了自相关法、协方差法和格型法等快速算法。这一发 明具有里程碑式的标志意义。 2 0 世纪8 0 年代以来,基于线性预测技术的分析合成编码算法( l i n e a r p r e d i c t i v ea n a l y s i sb ys y n t h e s i s ,l p a s ) 得到了最广泛的研究和发展。并且推动 第一章绪论 了对于语音编解码算法的研究飞快的发展。1 9 8 2 年,美国国家安全局公布了 2 4 k b s 的l p c 一1 0 声码器标准( f s 1 0 1 5 ) ;1 9 8 4 年,美国国防部制定了s t u 1 l l 计划,采用2 4 k b s 的l p c 1 0 e 增强型声码器,并于1 9 8 6 年正式投入使用。1 9 8 5 年b s a t a l 和m r s c h r o e d e r 提出了码激励线性预测算法( c o d ee x c i t e dl i n e a r p r e d i c t i o n ,c e l p ) 。从此,闭环分析算法( l i n e a rp r e d i c t i o na n a l y s e sb ys y n t h e s i s , l p a b s ) 成为语音编码算法的主流。美国国防部公布了4 8 k b sc e l p 联邦标准 ( f s 1 0 1 6 ) 。欧洲电讯管理局于1 9 8 8 年公布了1 3 k b sr p e - l t p ( r e g u l a rp u l s e e x c i m t i o n l o n gt i m ep r e d i c t i o n ) 语音编码方案。l9 8 9 年,北美蜂窝电话工业组 织公布了i s 5 4 ,8 k b sv s e l p ( v e c t o rs u me x c i t e dl i n e a rp r e d i c t i v e ) 语音编码方 案( 日本:6 7 k b s ) 。1 9 9 2 年,国际电话与电报咨询委员会( i t u ) 公布了( 1 7 2 8 1 6 k b s ld c e l p ( l o wd e l a yc o d ee x c i t e dl i n e a rp r e d i c t i o n ) 语音编码方案,19 9 5 年又公布g 7 2 35 3 6 3 k b sa c e l p m p m l q ( a l g e b r a i c c o d e e x c i t e d l i n e a r - p r e d i c t i o n m u l t i p u l s em a x i m u ml i k e l yq u a n t i f i e r ) 双速率多媒体语音编码标 准,l9 9 6 年公布了g 7 2 98 k b sc s a c e l p ( c o n j u g a t e s t r u c t u r e a l g e b r a i c c o d e e x c i t e dl i n e a r - p r e d i c t i o n ) 语音编码标准【2 。】。短短十几年中就产生 了3 个国际标准、2 个地区标准和2 个国家标准,可见语音压缩编码的研究发展 之快,其在国际标准化工作中堪称为最活跃的研究领域。就语音编码的现状而言, 6 4 k b s ,3 2k b s ,16k b s 和8k b s 的技术己经标准化和产品化,已具备比较完善的 理论和技术体系,并已进入实用阶段f 4 j 。 目前,随着研究的深入,语音编码的研究也在不断引入新的分析技术,如非 线性预测、多精度时频分析技术( 包括子渡分析技术) 、高阶统计分析技术等。 预计这些技术更能挖掘人耳的听觉感知机理,更能模仿人耳的特性作语音分析与 合成,使语音编解码系统的工作更接近于人类听觉器官的处理方式,从而在低速 率语音编码的研究上取得突破【5 j 。 总之,语音压缩编码技术的发展是十分迅速的,语音压缩编码发展的趋势向 着具有更低速率、更高质量和更低延时的压缩编码方案方向发展。 表1 1 中列出了国际一些语音编码标准算法的性能【l j 。 在这些中低速率的编码方案中,i t u tg 7 2 9 a 采用共轭码本激励线性预测 ( c s a c e l p ) 算法,速率为8 k b i f f s ,它可以以较低的编码速率获得高质量的重 建语音,比较适合现代通讯的要求,因此在许多方面得到了应用。在本论文中, 我们将使用g 7 2 9 a 标准作为语音压缩算法,研究基于d s p 的实时实现方法。 2 第一章绪论 表1 1 语音编码标准算法 编码标准 年份 算法数据速率m o s 分 延迟时间 ( k b s ) ( m s ) g 7 1l19 8 8压扩p c m6 44 3o 1 2 5 g 7 2 61 9 9 0s b a d p c m 4 0 3 2 2 4 16 长途 0 1 2 5 g 7 2 819 9 2l d c e l p1 640 6 2 5 g 7 2 919 9 6c s a c e l p 8415 g 7 2 9 a1 9 9 6c s a c e l p83 91 5 g 7 2 3 11 9 9 6 a c e l p m p - m l q 5 3 6 3长途 3 7 5 g s m1 9 8 8 r p e l t p133 。73 0 c t i a19 8 9v s e l p8 3 8 1 3d s p 技术发展概况 2 0 世纪8 0 年代以来,随着电子计算机、大规模集成电路( l s i ) 技术的发展, 1 9 8 1 年美国德州仪器公司研制出了第一片数字信号处理器t m s 3 2 0 c 1 0d s p 。以 后,各种数字信号处理器不断出现和成熟,使得音频范围内的数字信号处理技术 得到了广泛的实时应用。当时通用数字信号处理器的内部结构已经采用改进的哈 佛结构和乘法累加器硬件单元,只是并行处理的能力还比较弱。2 0 世纪9 0 年代 以后,由于超大规模集成电路( v l s i ) 技术,以及微处理器技术和计算机技术 的迅猛发展,数字信号处理无论在理论上还是在工程应用上,都是发展最快的学 科之一,并且日趋完善和和成熟。数字信号处理器的内部结构实现了多总线、多 功能单元、多d s p 并彳亍【6 1 。目前,数字信号处理器正在向高速度、高精度和低功 耗发展。许多数字信号处理器除了不断提高处理速度、增大芯片p 勺r a m 容量和 片外寻址能力外,还增加了串并行口的种类、数量及速度,增加定时计数器、 d m a 通道和a d 、d a 变换器等i ,j 。 d s p 在计算机、通信和自动化等领域得到了极为广泛的应用。t i 、a d 和 m o t d r a l a 等公司的通用d s p 具有很好的灵活性,广泛应用在多媒体通信、移 动通信等领域l3 1 。t i 公司作为世界上最大的d s p 芯片供应商,其d s p 市场份额占 全世界份额近5 0 。t i 公司的一系歹u d s p 产品已经成为当今世界上最有影响的 d s p 芯片。美国模拟器件公司( a n a l o gd e v i c e s ,简称a d ) 在d s p 芯片市场上也 占有一定的份额,相继推出了一系列具有自己特点的d s p 芯片。t i 公司在8 0 年 代推出第一代产品t m s 3 2 0 1 0 以来,相继推出了定点、浮点两大类别多代产品, 第一章绪论 目前形成了t m s 3 2 0 c 2 0 0 0 ,t m s 3 2 0 c 5 0 0 0 和t m s 3 2 0 c 6 0 0 0 三大d s p 芯片系列。 t m s 3 2 0 d m 6 4 2 是t i 公司专门针对多媒体通信而推出的一款定点d s p 处理器,它 强大的功能为多媒体信息的处理提供了良好的硬件基础,是进行音频、视频编解 码开发的不二之选。在本课题中,我们将以t m s 3 2 0 d m 6 4 2 为核心芯片进行开发, 并针对c 6 0 0 0 芯片的特点进行一系列的算法优化。 1 4 论文研究内容 本文以g 7 2 9 a 语音编解码协议为基础,回顾了当前最流行的语音编码理论 和技术,深入研究和阐述了g 7 2 9 a8 k b sc s a c e l p 语音编码算法的基本原理; 以t m s 3 2 0 d m 6 4 2 为重点,详细介绍了d s p 系统的功能结构特点及开发要点; 深入分析了i t u t 推荐的参考标准c 源程序,结合t i 公司d m 6 4 2 芯片的指令 系统和硬件结构,对程序进行c 级和汇编级优化工作,最后在v p m 6 4 2 硬件开 发板上进行调试,实现了编解码器的实时工作。 本文主要包括以下章节: 第一章简要介绍了语音编解码技术的发展概况和本文的主要工作。 第二章详细论述了i t u g 7 2 9 a 语音编解码原理,从原理上分析和介绍了编 解码算法中的关键技术。 第三章介绍了硬件的开发平台、d s p 芯片特点、t i 公司的系列d s p 芯片, d s p 系统的开发工具,以及利用d s p 集成开发工具c c s 进行d s p 系统的开发 流程等。 第四章设计语音采集与处理系统,并在v p m 6 4 2 开发板上实现了g 7 2 9 a 实 时编解码算法。由于原有的算法无法满足实时性的要求,因而之后文章中提出了 一系列的算法优化方法,并对优化后的结果进行了测试。 第五章对本文的工作进行总结,并对下一步的研究进行了展望。 4 第二章语音编解码原理 2 1 概述 第二章语音编解码原理 语音编码目前分为三类,即波形编码、参数编码和混合编码。波形编码的基 本思想是使重建语音波形保持原语音信号的波形形状,它通常将语音信号作为一 般的波形信号来处理,具有适应能力强、话音质量高等优点,但所需比特率高, 通常能在1 6 6 4k b s 的速率上能给出高的编码质量,当速率进一步降低时,其性 能会迅速下降博j 。这类算法结构简单,易于实现,适用于各种不同的信号。参数 编码是以语音信号产生的数学模型为基础,根据输入语音信号分析出模型参数 ( 主要是指表征声门振动的激励参数和表征声道特性的声道参数) ,然后在解码 端根据这些模型参数来恢复语音。这种编码算法并不忠实地反映输入语音的原始 波形,而是着眼于人耳的听觉特性,确保解码语音的可懂度和清晰度。重建语音 信号的波形同原始语音信号的波形可能会有相当大的差别,但其编码速率很低, 可低至1 2 2 4k b s 。参数编码的主要问题是合成语音质量差,特别是自然度较 低;另外,它对讲话环境的噪声比较敏感,只有在安静的讲话环境下才能给出高 的可懂度1 7 j 。当前参数编码的研究方向主要是线性预测( l p c ) 声码器和余弦声 码器。在各种声码器算法中,得到最广泛研究的就是l p c 声码器。混合编码则克 服了波形编码和参数编码的弱点,同时又结合了他们各自的长处,在4 1 6k b s 速率上能够得到高质量的合成语音,在本质上它也具有波形编码的优点【8 j 。( 3 7 2 9 标准c s a c e l p 算法采用的是混合编码形式。其特点是:先进行线性预测( l p ) 分析,去掉语音的相关性,然后用合成分析法及感觉加权均方误差最小准则分析 出合适的替代余弦信号的最佳激励信号源,最后对l p 参数和激励信号源进行编 码和传送,该算法是i t u t 推荐的语音压缩编码标准中算法最复杂的一种,它采 用了当今语音压缩编码的各种先进技术,如闭环线性预测合成分析法( l p a b s ) 算 法、感知加权技术、复合窗技术、线谱对( l s p ) 及线谱频( l s f ) 技术、后置滤波技 术、增益自适应技术、分数基音内插技术等。 2 2 语音信号产生的数字模型 为了对语音信号进行数字处理,首先要建立一种能够精确描述语音产生过程 第二章语音编解码原理 和语音特征的数字模型。本文主要介绍当今流行的线性预测模型,它是f a n t 和 f l a n a g a n 在2 0 世纪6 0 年代末、7 0 年代初提出的。该模型以人类语音的发音生 理过程和语音信号的声学特性为基础,较为精确的表达了语音的特征。 源 系统 图2 - l 语音产生的源一系统模型 语音输出 根据发声器官和语音产生过程,语音信号可由图2 1 所示的源系统模型产 生,即把激励特性和声道及辐射特性分离开来,激励发生器产生一种信号,它或 是一串( 声门) 脉冲,或是随机变化( 噪声) 信号。声道辐射的影响用一个时变 线性系统来表示f 5 j 。通过选择源和系统的参数,使所得的输出具有所要求的类似 语音的性质1 8 】。这就是参数编码的基本思想。 将上述源系统模型展开成为可实现的数字模型,如图2 2 所示。 图2 2 语音信号产生的数字模型 语音信号 s ( 1 1 ) 该模型包括三个部分:激励源、声道模型和辐射模型。 激励源分浊音和清音两个分支,按照浊音清音开关所处的位置来决定产生 的语音是浊音还是清音。在浊音的情况下,激励信号由一个周期脉冲发生器产 生。所产生的序列是一个周期为n 的冲激序列,即每隔n 点便有一个样值为1 , 6 第二章语音编解码原理 而其它样值均为0 。周期取决于基音频率和语音信号采样频率。在清音的情况 下,激励信号由一个随机噪声发生器产生。可令该序列服从均值为0 ,方差为l 的高斯分布。浊音清音开关模拟了加在声道上的激励的改变情况。 辐射模型与嘴有关。而声道模型给出了声道的传递函数,把实际声道作为一 个变截面声管加以研究,在大多数情况下,可以导出它是一个全极点函数。 数字语音处理中的语音分析和语音合成问题都是基于上述模型来实现的。 2 3 码激励线性预浈i j ( c e l p ) 编码的关键技术 基于参数模型方法的语音编码的主要问题是合成语音质量较差,通过长期的 研究,人们发现音质难于提高的关键不在于声道模型,而是在于对该模型的激励 信号的描述不够精确。因此,2 0 世纪8 0 年代后期出现了基于合成分析 ( a n a l y s i s b y s y n t h e s i s ,a b s ) 的线性预测编码方法。该方法在保留参数模型法 技术精华的基础上,应用感觉加权技术和波形编码准则去优化激励信号,即在闭 环基础上寻找主观失真最小的激励矢量,从而以低于16k b s 码率获得较高质量 的合成语音捧l 。基于a b s 的典型例子是码激励线性预测( c o d e e x c i t e dl i n e a r p r e d i c t i o n ,c e l p ) 语音编码技术,它用线性预测技术提取声道参数,用一个包 含许多典型的激励矢量的码书作为激励信号,实现了高效压缩和高语音质量1 8 】。 目前在4 8 k b s 16 k b s 的码率范围内较成功的语音编码方案都基于c e l p 技术,它 的关键技术包括线性预测分析、矢量量化、合成分析法和感觉加权等。 c e l p 语音编解码原理如图2 3 所示。 厂 i 激励【 l 码书i i 一 五 ( a ) 编码器 第二章语音编解码原理 i 最佳激励 短时合成 滤波器 ( b ) 解码器 图2 3c e l p 语音编解码原理框图 输出语音 c e l p 编码模型通过频繁地修正时变滤波器参数和激励参数来得到最佳匹配 原始语音信号。系统的分析过程按帧进行。首先确定时变滤波器参数,然后确定 固定激励参数。 2 3 1 语音信号的线性预测分析 线性预测分析( l i n e a rp r e d i c t i v ea n a l y s i s ,l p a ) 的基本思想是:由于语音 样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值,即 一个语音的采样能够用过去若干个语音采样或它们的线性组合来逼近。通过使实 际语音采样和线性预测采样之间的误差在某个准则下达到最小值来决定唯一的 一组预测系数 5 , 8 - n 。 线性预测分析一般借助线性预测误差滤波器来实现。线性预测误差滤波器的 传递函数a ( z ) 为: 彳( z ) = 1 一口,z 一 ( 2 - 1 ) i = 1 其中,p 为预测器阶数, 口a i i :,p 为预测器系数。其实现框图如图2 - 4 所 示。 语音输入s ( n )预测误差e ( n ) a ( z ) 图2 - 4 语音信号的线性预测模型 由图2 - 4 和式2 1 可知,线性预测就是用过去p 个样本值的线性组合来预测 现在或未来的样本值: 童( 刀) :兰口,s ( ,z f ) ( 2 - 2 ) i = 1 式中:称为线性预测系数;p 是预测阶数;j ( 胛) 是s ( 胛) 的预测值。 第二章语音编解码原理 线性预测分析( l p a ) 实质上就是求解l p 系数 口a 暑l ,:,使得l p 误差 e ( n ) = s ( n ) 一j ( 甩) 在某个预定的准则下最小。理论上常用的是均方误差研p 2 ( ,z ) 】 最小准则。 为了得到使e e 2 ) 】最小的,可将e e 2 ( 咒) 对各个系数求偏导,并令其结 果为零,即 o e = e 2 ( 一n ) :- 2 e l p ( 疗必( ,2 一) 】:0 ,l ,p ( 2 3 ) o a j 将e ( n ) = s ( n ) 一;( 刀) 按照式( 2 2 ) 代入式( 2 3 ) 可得: e s ( n ) s ( n - j ) - 口,s ( n - i ) s ( n - j ) = ,( ) 一口,| ( 歹一f ) = 0 ,1 j p f 鲁l,= l ( 2 4 ) 式中r ( j ) = e s ( n ) s ( n 一朋是s ( n ) 的自相关序列。令 a p = 口l 口2 : 口p ,r p = 厂( o )厂( 1 ) r ( p 1 ) r o )厂( 0 )r ( p 一2 ) : r ( p 一1 ) r ( p 一2 ) r ( o ) ,r ;= 口l a 2 : 口p ( 2 5 ) 那么式( 2 4 ) 司写成矩阵形式: 哆一尺尸a p = 0 或者a p = 巧1 哆 ( 2 6 ) 式中:r ;1 是p 阶自相关阵尺,的逆矩阵。 式( 2 6 ) 称为y u l e w a l k e r 方程,p 个预测系数口,可通过求解方程式( 2 6 ) 得到, 由此求得的 口 | 1 :,p 将使得预测误差的输出均方值最小,令最小均方误差为 易,即: e p = e e 2 ( ,z ) 】i l l i 。= e p ( 胛) s ( ,z ) 一口,s ( 刀一f ) ) ( 2 7 ) f = l 因为由式( 2 3 ) 有: e e ( n ) s ( n - j ) 】- 0 ,1 j p ( 2 - 8 ) 所以可得: e | d = r ( 0 ) - 羔a i r ( i ) ( 2 9 ) i = 1 组合式( 2 6 ) 和式( 2 9 ) 可得: r ( o ),( 1 ) r ( 1 )厂( o ) r ( 2 )r ( 1 ) r ( p ) r ( p 1 ) r(雏pr(p 一1 ) i | _ 口l 一2 ) 0 一口2 r ( o ) 0 一口p e p 0 0 : 0 ( 2 - 1 0 ) 通过计算可以得出:当按均方误差最小准则设计线性预测误差滤波器时,所 9 第二章语音编解码原理 得预测器系数与语音产生模型参数有相同的值 7 - 8 , 1 0 】。 因此,线性预测分析的关键是求解下面的方程组: r上 i ,( o ) 一口f r ( f ) = e p 于1 ,1 j p ( 2 - l1 ) i ,| ( ) 一a i r ( j f ) = 0 l i = 1 式中:r ( j ) = e s ( n ) s ( n 一朋是待分析语音信号s ( n ) 的自相关序列。 要求解预测器系数,必须首先计算出r ( j ) 。一旦算出r ( j ) ,则只要解方程组 ( 2 1 1 ) 即可求得a i 和e p 并得到增益常数g = e ,。 计算自相关序列r ( j ) 是十分复杂的问题。经典的解法主要有自相关法、协方 差法和格形法等【粥】。相比而言自相关算法的计算要简单一些,利用 l e v i n s o n - d u r b i n 的递归解法能够有效的求解自相关方程,由于自相关算法中所加 的窗长三远大于p ,自相关算法所带来的误差是可以忽略的,而且采用汉明窗这 样的平滑窗,能进一步减少误差,所以在实际运用中往往采用自相关算法。 2 3 2 线谱频率分析 线谱频率( l i n es p e c t r u mf r e q u e n c y ,l s f ) 参数是线性预测参数的另一种表 现形式,同样可以用来估计基本的语音特性。由于线谱对参数是频域参数,所以 它和语音信号谱包络的峰有更紧密的联系。此外,用线谱对参数构成合成滤波器 h ( z ) 时容易保证稳定性,而且因为这种参数的量化特性和内插特性均优于反射 系数,使得产生相同质量的合成语音所需的数码率得以降低。对于中低速率编码, 不能直接采用前面的l p c 量化方案。最普遍的方法就是采用线谱对( l s p ) 表示 l p c 参量1 5 j 。 设第i 阶线性预测误差滤波器传递函数的递推关系式为: a ( z ) = a ( i - 1 ) ( z ) 一k i z 一a7 1 ( z 一1 ) ( 2 - 1 2 ) 式中彳“( z ) = 1 一口“z ,i = 1 , 2 ,p i = 1 又设p 阶的线性预测误差滤波器传递函数为a ( z ) ,即i l ( z ) = a ( z ) ,可以定 义两个p + l 阶的多项式: p ( z ) = a ( z ) + z - ( p + i ) a ( z 一)( 2 13 a ) q ( z ) = a ( z ) 一z 一升”a ( z 一) ( 2 - 1 3 b ) 由式( 2 1 2 ) ,( 2 1 3 a ) 和( 2 1 3 b ) 推出: 1 a ( z ) = 瓤以z ) + q ( z ) 】 ( 2 1 4 ) l o 第二章语音编解码原理 它和合成滤波器h ( z ) 之间满足关系h ( z ) = 。当么( z ) 的零点在z 平面单 a t z ) 位圆内时,p ( z ) 和q ( z ) 的零点都在单位圆上,并且尸( z ) 和q ( z ) 的零点沿着单位 圆上随缈的增加交替出现。因此,式( 2 1 7 ) 中的a ( z ) 和z 一一”a ( z 一) 可分别写成: a ( z ) = 1 一口l z 一- - o r 2 z 吨一一口口z p z - ( p + 1 ) a ( z 一1 ) = z 一p + 1 一口l z p 一口2 z 一口一一- - a 口z 一1 ( 2 l5 ) 故可以推出:。 尸( z ) = l 一( 口i + 口p ) 一( 口2 + 口p 一1 ) z 2 - ( a p + 口1 ) z p + z 一p + 1 ( 2 1 6 ) q 0 ) = 1 一( 口l 一口p ) z - ( a 2 - - a p 1 ) z - 2 一( 口p 一口1 ) z p z 一p + 1 ( 2 2 7 ) 若阶数p 是偶数,p ( z ) 的零点为p 硒,q ( z ) 的零点为e 士鸺,那么p ( z ) 和q ( z ) 可写成下列因式分解形式,即: rp l2 fp ( z ) = ( 1 + z 一) n ( 1 2 c o so ) l z 。+ z - 2 ) 劣: ( 2 - 1 8 ) iq ( z ) = ( 1 - - z 一) 兀( 1 - 2 c o s o j z 一+ z 以) l i = l 国、鼠按下列关系排列: 0 ( 1 3 l 岛 c o p 2 9 p 2 称为码书 或码本( c o d e b o o k ) ,把每个量化矢量y ,称为码字或码矢,n 称为码本的大小【1 2 - 1 3 。 矢量量化器的原理如图2 4 所示。 传输 一曲硼l 专 储器 图2 4 矢量量化器的原理框图 矢量量化器工作过程如下:在编码端,将输入矢量置,与码本中的每一个码 字进行比较,分别计算出它们的失真。搜索到失真最小的码字艺血。的序号歹并将 此序号编码传输;在译码端,先把信道传来的编码信号译成序号,再根据此序 号从码本中找出相应的码字一曲,由于两个码本完全一样,所以_ 曲就是输入 矢量墨的重构矢量。 2 3 4 合成分析法 合成分析法( a n a l y s i sb ys y n t h e s i s ,a b s ) 的基本思想是用合成来指导分析。 假设信号能够用某种形式表示,然后假设产生信号的模型理论形式,这个模型受 一些参量控制,改变这些参量就能够产生不同的观测信号。采用一个误差程序, 有规则的改变模型参量,从而可以找到一组参量,它所产生的合成信号,能够以 最小误差与真正的信号匹配。因此,当计算这样的匹配时,模型参量就可以认为 是真正的参量l l j 。 具体的,将合成器引入编码端,使之与分析器相结合,在编码器中产生与译 1 2 第二章语音编解码原理 码器端完全一致的合成语音,将此合成语音与原始语音相比较,根据一定的误差 准则,来调整计算各个参数,使得二者之间的误差达到最小。将误差最小时的系 统参数传送到接收端,可以合成较高质量的语音。 在线性预测编码( l p c ) 1 1 0 1 算法基础上采用合成分析法( a b s ) 的语音编码 方法称为基于合成分析法的线性预测编码( a b s l p c ) 算法。各种采用a b s l p c 算法的语音编码在4 8 k b p s 1 6 k b p s 的速率范围取得了极大的成功。基于合成分析 法的线性预测编码( a b s l p c ) 算法基本结构如图2 5 所示【1 。 原始语音 m p l p c r p e l p c e l p ( a ) 合成语 合成滤波器 ( b ) 图2 5 合成分析法的线性预测编码结构图 ( a ) 分析端;( b ) 合成端 从a b s l p c 基本结构图可以看出,其信号产生模型与传统的l p c 声码器模 型很相似,都是用激励信号通过l p
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年R1快开门式压力容器操作证考试题库及答案
- 2025内蒙古赤峰市林西县体制单位面向林西招录考前自测高频考点模拟试题附答案详解(考试直接用)
- 2025年事业单位招聘考试综合类职业能力倾向测验真题模拟试卷(备考难点备考解析)
- 黑龙江单招考试题及答案
- 《数字 通信原理》课件-数字通信原理
- 2025国考葫芦岛市安全生产岗位行测模拟题及答案
- 2025国考河北金融监管局申论贯彻执行高频考点及答案
- 2025国考陕西民航公安申论公文写作必刷题及答案
- 2025国考承德市治安管理岗位行测高频考点及答案
- 2025国考白山市行政管理岗位申论预测卷及答案
- 口腔疾病治疗质量控制课件
- 贵州福贵康护理院装修改造工程环评报告
- 《中国居民膳食指南(2022)》解读
- 中西医结合课件梅毒详解
- DB37T 4502-2022滤水模压混凝土板现场制作质量控制规范
- 常见秋冬季传染病预防
- LY/T 2459-2015枫香培育技术规程
- CRM-客户关系管理系统毕业论文
- 质量源于设计-QbD课件
- 教学第三章土壤侵蚀课件
- 仓储物流安全隐患排查表-附带法规依据
评论
0/150
提交评论