




已阅读5页,还剩66页未读, 继续免费阅读
(信号与信息处理专业论文)amrwb编码算法的研究以及amrnb基于zsp500的优化实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
南京邮电大学硕十研究生学位论文 摘要 摘要 在当前移动通信系统中,a m r w b ( a d a p t i v em u l t i r a t ew i d e b a n d ) 自适应多速 率宽带语音编解码器由于其音频带宽扩展至l j t k t i z ,采样频率扩展到1 6 k h z ,突破了窄 带语音编解码器带宽方面的限制,因此在语音的自然度、音乐处理等方面有较大的 改善。本论文首先完整的介绍了a m r l i b 编码器各个组成部分原理和实现算法,对编 码部分的算法进行了详细的分析和研究,突出了a c e l p ( 代数码激励线性预测) 语音 编码的本质和特点,论文还对a m r w b 编码器的代数码本搜索作了改进。 本文第二部分,依托实际项目,结合合作单位中兴通信公司的具体要求,基于 z s p 5 0 0 处理器的仿真系统,开发实现了一个具有实用价值的a m r - n b 窄带语音编解码 器。a m r n b 的c 代码赢接在z s p 5 0 0 运行时,其运行速度很慢,我们通过两个阶段的优 化:c 代码优化和手工汇编优化,充分利用z s p 5 0 0 硬件资源,不断优化以达到实用的 指标,最终代码运算效率提高3 5 倍。 3 g 移动通信系统中将使用的a m r l i b 和a m r n b 声码器,都是基于a c e l p 模型的,其 核心算法类似,所以本次的a m r - n b 基于z s p 5 0 0 的优化实现,将给下一步a m r w b 的实 现提供非常好的借鉴。 关键词:语音编码,a m r w b ,a m r n b ,v a d ,a c e l p ,z s p 5 0 0 ,算法优化 第l 页 南京邮电大学硕士研究生学位论文 a b s t r a c t a b s 嗣r a c t a tp r e s e n ti nm o b i l ec o m m u n i c a t i o ns y s t e ma m r - w b ( a d a p t i v em u l t i - r a t e w i d e b a n d ) c o d e cm a k e ss p e e c hf r e q u e n c ye x t e n d e dt o7 k h za n ds a m p l ef r e q u e n c y e x t e n d e dt o1 6 k h z ,g r e a t l yb r e a k t h r o u g h st h er e s t r i c t i o no f t h eb a n d w i d t ht h a nt h e n a r r o wb a n dc o d e c t h e r e f o r e ,a m r w bc o d e cw i l la m e l i o r a t eg r e a t l yi nm a n ya s p e c t s s u c ha ss p e e c hn a t u r a l n e s sa n dm u s i c a lp r o c e s s i n g t h i sp a p e re l a b o r a t e l yi n t r o d u c e st h e p r i n c i p l e s o f e a c hc o m p o n e n t o f a m r w bc o d e r a n d i t s i m p l e m e n t a t i o na l g o r i t h m s f u r t h e rm o r e ,d e t a i l e da n a l y s i sa n dr e s e a r c hf o rt h ec o d e ra r eg i v e n ,w h i c hg i v e s p r o m i n e n c et ot h ee s s e n c ea n dc h a r a c t e r i s t i co f a c e l pc o d i n g t h ep a p e ra l s om a k e s s o m ei m p r o v e m e n to nt h ea l g e b r a i cc o d es e a r c ho f a m r w bc o d e r o nt h es e c o n dp a r to f p a r t ,r e l i e do nt h ep r a c t i c a lp r o j e c t ,c o n s i d e r i n gt h ed e m a n d o f t h ec o o p e r a t e dc o m p a n y ,av a l u a b l es i m u l a t i o ns y s t e mo f a m r - n bc o d e ri s d e v e l o p e db a s e do nz s p 5 0 0 a st h es p e e di sv e r ys l o ww h e nt h ec c o d eo fa m r - n b d i r e c t l yr u n si nz s p 5 0 0 ,t w os t a g e so f o p t i m i z a t i o na r ec a r r i e do u t ( c - c o d eo p t i m i z a t i o n a n dm a n u a lc o m p i l a t i o no p t i m i z a t i o n ) ,w h i c hm a k et h eb e s tu s eo ft h eh a r dr e s o u r c eo f z s p 5 0 0t oa c h i e v et h eo b j e c to f t h ec o m p a n y ,a tl a s tt h ee f f i c i e n c yo f o p e r a t i o ni s i m p r o v e db y3 5t i m e s a sb o t ha m r w ba n da m r - n bi n3 gs y s t e ma r eb a s e do nt h em o d e lo fa c e l e t h e i rc o r ea l g o r i t h mi ss i m i l a r , w h i c he n s u r e st h a tt h i se x p e r i e n c eo fo p t i m i z a t i o n c o m p l e m e n t a t i o no fa m p , - n bo nz s p 5 0 0w i l lg i v e ag o o du s ef o rr e f e r e n c eo ft h e i m p l e m e n t a t i o no f a m r w b k e y w o r d :s p e e c hc o d i n g ,a m r w b ,a m r - n b ,v a d ,a c e l p , z s p 5 0 0 ,o p t i m i z m i o n 第1 l 页 南京邮电大学 硕士学位论文摘要 学科、专业:工学信号与信息处理 研究方向:语音处理与现代语音通信技术 作 者:二塑生级研究生 朱敏指导教师扬震 题目:a m r w b 编码算法的研究以及a m r n b 基于 z s p s 0 0 的优化实现 英文题目:t h er e s e a r c ho ft h ea m r w ba n dt h ea m r n ,b a l g o r i t h mo p t i m i z a t i o nr e a l i z e do nz s p 5 0 0 主题词:语音编码a m r w b a m r n bv a d a c e l p z s p 5 0 0算法优化 k e y w o r d s :s p e e c hc o d i n g a m r - w ba m r _ _ n bv a d a c e l p z s p 5 0 0 o p t i m i z a t i o n 南京邮电大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的 地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包 含为获得南京邮电大学或其它教育机构的学位或证书而使用过的材 料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了 明确的说明并表示了谢意。 研究生签名: 二j j 1 1 南京邮电大学学位论文使用授权声明 南京邮电大学、中国利学技术信息研究所、国家图书馆有权保留 本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其 他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一 致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布 ( 包括刊登) 论文的全部或部分内容。论文的公布( 包括刊登) 授权 南京邮电大学研究生部办理。 研究生签名:导师签名挞魄 南京邮电大学硕士研究生学位论文 第一章绪论 第一章绪论 1 1 课题研究背景 当今使用的大多数语音编解码系统是基于电话带宽的窄带语音,这种语音带宽通 常被限制在约2 0 0 h z 3 4 0 0 h z ,采样速率为8 k h z 。传统公共交换电话网( p s t n ) 的这 种内在的带宽限制制约了通讯质量的进一步提高,致使在语音的自然度、音乐处理 以及一些特殊音处理等方面还不尽人意。 端到端数字网络的发展,如第二和第三代无线系统、i s d n 、v o i p ,使我们可以使 用一个更宽的语音带宽来提供远远超过p s t n 的语音通讯质量。在宽带语音编解码中 信号以1 6 k h z 的频率采样,带宽限制在5 0 h z 一7 0 0 0 h z ,可以给人一种面对面交流感觉 的通讯质量。尽管许多语音信号中尤其是清音信号中其能量频谱分布要l t 7 0 0 0 h z 还 高,但一般7 0 0 0 h z 赫兹以上信号强度太低,传输它们的代价太大,得不偿失。宽带 语音编码也使语音主观质量明显提高。同窄带电话语音相比,增加的从5 0 h z - 2 0 0 h z 的低端频率提高了自然度、表现力、舒适度,扩展的3 4 0 0 h z 一7 0 0 0 h z 的高频部分可以 更好地区分摩擦音所以更易于理解。5 0 h z 一7 0 0 0 h z 的带宽不仅提高了可理解性和语音 自然度,而且使说话人识别变的简单“1 。 图1 1 显示了窄带和宽带的浊音段能量频谱,图l 一2 “显示了窄带和宽带的 轻音语音段的能量频谱。在窄带语音编码中,高于4k h z 频谱段语音被滤波掉,这影 响了语音的理解性,例如语音s 和“f ”的区分。在浊音段大多数能量在低频中, 滤掉低于2 0 0h z 频率段的语音会影响语音的自然度。 0 一- 2 0 专一4 0 一6 0 - 8 0 。“ 1 脚,m 3 - 蜘7 0 0 08 0 0 0 f f e 印c y 1 - i z 】 图1 一l 浊音段的能量额谱倒子 第l 页 南京邮电大学硕士研究生学位论文 第一章绪论 f r e 平l e n c y 【h z l 图1 2 清音段的能量频谱 可以预见,宽带服务提供了一个更高的话音质量,宽带语音通信将在下一代网络如 3 g 网络应用中有广泛的市场。 宽带语音编解码器的自然度在高保真电话、扩展的通讯业务如声音会议、电视广 播中是一个重要的特征。以下简要介绍几种宽带语音的应用领域“: ( 1 ) 3 g 移动通讯系统 提供多媒体服务是3 g 无线通讯系统的一个主要功能,这也意味着在多媒体部分要 使用高质量的声音和语音,即使在说话声音的电话应用中,宽带语音也是无线服务 提供商可以提供比传统公共交换电话网( p s t n ) 更高语音质量的重要一步。3 6 p p 标准 化组织,最近选择a m r w b 作为g s m 与w c d m a 网络系统的宽带语音编解码器的标准,选 择v m r w b 专为无线c d m a 2 0 0 0 标准设计,已经认识到宽带语音的重要性。 ( 2 ) 宽带包网络和综合业务数字网( is d n ) 上的高保真电话 宽带包网络和综合业务数字网( i s d n ) 是端对端数字网络,可以提供高保真宽带电 话,是服务供应商在传统窄带公共交换电话网( p s t n ) 上的一个主要手段。这些包网 络包括x d s l 、包电缆、a t m 、帧中继、宽带i s d n 。传输数据的i p 协议可以被用来传输 实时的声音信号。 ( 3 ) 音频和视频会议 在综合业务数字网( i s d n ) 和包网络上,宽带语音编解码可以提高音频和视频会议 中说话者的声音质量和现场感,可以让人感觉声音更加真实。 第2 页 阿京邮电大学硕士研究生学位论文 第一章绪论 ( 4 ) 网络应用 宽带电话可以促进几个网络应用,如:广播和交流,聊天,虚拟王见实沉浸环境, 多媒体实时协作工具,叙述内容的存档和分布,基于网络的语言学习。 ( 5 ) 数字无线广播 宽带语音可以在数字调幅、无线广播、新闻的音频视频广播、电视节目、人数较 少的电路讲座中使用。 1 2 语音编码分类 语音编码技术是伴随着语音的数字化而产生的,目前主要应用在数字语音通信和 数字语音存储两个领域。由于简单地由连续语音信号抽样量化得到的数字语音信号, 在传输和存储时要占用较多的信道资源和存储空间,因此如何在尽量减少失真的情 况下,高效率地对模拟语音信号进行数字表达,即压缩编码就成为语音编码技术的 主要内容。 窄带语音编码方法,按传统的概念分为三大类“1 :波形编码、参数编码和混合 编码。波形编码技术已尽可能重构语音波形为原则进行数据压缩,即在编码端以波 形逼近为原则对语音信号进行压缩编码,解码端根据这些编码数据恢复出语音信号 的波形。它具有语音质量好、抗噪性能强等优点,但所需用的编码速率高,一般在 6 4 1 6 k b i t s 之间。而参数编码则从听觉的角度注重语音本身的重现,它通常都是 基于某种假定的语音产生模型假定,在编码端分析出该模型参数并选择适当的方式 对其进行高效率的编码,解码端则利用这些参数和语音生成模型重新合成语音。它 具有编码速率低的优点,可以达n 2 4 k b i t s 以下。但语音音质差,而且对噪声较敏 感、鲁棒性不够好。混合编码是上述两类方法的有机结合,与参数编码相同的是它 也基于假定的语音产生模型的假定并采用了分析与合成技术,但同时它又利用了语 音时间波形信息,增强了重建语音的自然度,使得语音质量有明显提高,其代价是 编码速率相应上升,一般在2 4 - 1 6 k b i t s 之间。 本课题中所讨论的a m r - w b 语音编码虽然是宽带语音编码,但采用的技术仍是属于 混合编码,它是基于代数码激励线性预测( a c e l p ) 编码模式的自适应多速率宽带编 码器。具体的编码方式将在第二章介绍。 第3 页 南京邮电大学硕士研究叶- 学位论文 第章绪论 1 3 宽带语音编码的标准 宽带语音信号以i 6 k h z 采样,每个样本以l 6 位整数表示,原始位速率是 2 5 6 k b i t s 。所以语音编解码,或者说是语音压缩,对于宽带语音通讯就具有十分重 要的意义。人们在宽度语音编解码方面做了很多努力,使宽带语音编解码器提供一 种高质量、低比特率的语音。 宽带语音编码标准主要有以下几种: ( 1 ) g 7 2 2 ( s b - a d p c m ) i t ug 7 2 2 于1 9 8 8 年标准化,是第一个用于1 6 k h z 采样率的标准化宽带语音编码 算法。该编解码器将1 6 k t t z 的频带分为两个子频带,并用a d p c m 算法在子频带中进 行编码。其总延迟约3 m s ,这已经很小,不致造成电信网络中的回声问题。此外,该 编解码嚣传输位误差率仪为1 0 3 ,其性能可以接受。即使遇到最差的网络传输条 件,上述要求也可确保性能只是稍稍下降。 g ,7 2 2 编解码器在1 6 k h z 频率上接收1 6 位数据( 带宽从5 0h z 至7k h z ) , 并将其压缩为6 4 、5 6 与4 8 k h i t s 。 ( 2 ) g 7 2 2 1 ( 转换( t r a n s f o r m ) 编码器) i t ug 7 2 2 1 于2 0 世纪9 0 年代末开发,可实现比g 7 2 2 编解码器更低的比特率 以及更大的压缩。目标是以大约一半的比特率实现与g 7 2 2 大致相当的质量。该编 解码器由p i c t u r e t e l 开发,使用了转换编码的方法。其在1 6 k i i z 频率上接收1 6 位数 据( 带宽从5 0 h z 至7 k h z ) ,井将其压缩为3 2 与2 4 k b i t s s 。目前大多用于电视会议系 统。 ( 3 ) 自适应多速率宽带语音声码器( a m r - w b ) “1 a 帜一w b 是种最初为g s m 无线网络定义的宽带编解码器,但最近扩展为包括有线 系统。由于其计算强度很大,因此要充分利用多年来显著提高的d s p 处理能力。a m r w b 建立在c e l p 语音编码器基础上,音频带宽为5 0 - - 7 0 0 0 h z ,在66 至2 3 8 5k b i t s 间提 供g 种语音编码。 a m r - w b 于2 0 0 1 年标准化,用于g s m 与w c d m a 网络。2 0 0 2 年底,i t u 决定它还将作为 有线应用的宽带标准。它是第一个具有双重应用范围的编解码器。 有线应用的宽带标准。它是第一个具有双重应用范围的编解码器。 第4 页 南京邮电大学硕十研究生学位论文 第一章绪论 ( 4 ) 变速率多模式宽带语音声码器( v m r w b ) 1 v m r w b 是新型可变速率多模式宽带语音编解码器,专为无线c d m a2 0 0 0 标准而设 计,目的在于在5 0 至7 0 0 0 h z 频带上进行语音编码,采样率为1 6 k h z 。v m r w b 基于3 g p p a m r w b ( g 7 2 2 2 ) 编解码器,在每秒速率1 2 6 5 k b i t s 上可实现互操作。v m r w b i 作 模式有四种,具体选择哪种应视网络的流量情况而定。前三种模式专门针对c d m a 系 统,而第四种模式为a m r w b 互操作性模式。v m r w b 与a m r w b 的互操作性允许 g s m w c d m a 与c d m a 2 0 0 0 系统无须进行自动解码即可通信,这就不至于增加额外的延迟 以及引起语音质量下降。 几个标准制定组织最近组织起来对在1 6 k b it s 的宽带语音编解码器进行了标准 化,最后由3 g p p e t s i 和i t u t 选择出一种全新的宽带语音编解码器( a m r w b ) ,新语 音编解码器标准的采纳正在为宽带电话做准备。a m r - w b 语音编解码器是高质量、低 速率的宽带语音编解码器,首次可以同时应用于无线与有线业务,意味着3 g 与i p 固 定网络之问的互通更加容易。本课题主要对a m r - w b 编码器原理作了一定的分析和研 究。 1 4 本文工作 由于a m r w b 为一个全新的宽带编解码器,国内对其的研究也属于起步阶段,其还 没有真正进入实用阶段,故对其进行全面的分析和深入的研究是必要的,相信会对 今后本方向的研究打下良好的基础。 研究工作的另一部分是和中兴公司合作项目的一部分,a m r n b 基于新型的d s p 处 理器z s p 5 0 0 的软件实现以及对其代码的优化。 本研究工作的主要成果为: ( 1 ) 对a m r w b 标准中的主要算法a c e l p ( a l g e b r a i cc o d ee x c i t a t i o nl i n e a r p r e d i c t i o n ) 进行了详细分析,特别是对一些理论上的难点和要点以及实现方法给出 了详细说明,为构筑a m r w b 仿真环境打下了技术基础。 ( 2 ) 对a m r w b 编码器的代数码本搜索作了改进。 ( 3 ) 研究了z s p 5 0 0 处理器硬件结构和特点,在z s p s 0 0 基础上实现了a m r n b 的c 代码优 化,优化的效果在4 一5 左右。 第5 页 南京邮电人学硕士研究生学位论文第。章绪论 ( 4 ) 由于a m r n b 的c 代码在z s p 5 0 0 二计算量非常大,不能实现实时处蝉,因此就需要 充分利用z s p 5 0 0 硬件资源和精简的指令,用于工汇编的方法对其进行代码优化,优 化的效果是很明显的。并用给定的测试语音进行了全面验证,以保证手写汇编代码 的正确| 生。 第6 页 南京邮电人学硕士研究生学位论文 第二章3 g 移动通信系统中的a m r w b 宽带语音编码 第二章3 g 移动通信系统中的a d y i r - v c b 宽带语音编码 器 传统的通信系统中,使用的语音编码系统大部分是基于窄带语音的,频带一般 限制在2 0 0 3 4 0 0 h z 以内。这一内在的带宽局限性从人类实现电话通信时开始,就已 经限制了语音质量的进一步提高。为了实现高品质的语音通信,带宽的限制必须打 破。此外,数字通信网络技术的不断突破,如第三代移动通信的出现,给宽带语音 编码的应用提供了更广阔的空间。人们在宽度语音编解码方面做了很多努力,使宽 带语音编解码器提供一种高质量、低比特率的语音。3 g p p 标准化组织,最近选择 a m r w b ( a d a p t i v em u l t i r a t ew i d e b a n d ) 语音编码即自适应多码率宽带语音编码 作为g s m 与w c d m a 网络系统的宽带语音编解码器的标准。a m r - w b ( a d a p t i r e m u l t i - r a t ew i d e b a n d ) 是一种新型的多速率、高质量的宽带语音编码,其有以下几 种特性: a m r w b 是一种最初为g s m 无线网络定义的宽带编解码器,之后又被i t u 采纳,将 作为有线应用的宽带标准,因此它是通信史上第一种可以同时用于有线与无线 业务的语音编码系统。 现今的g s m 语音和信道编码器工作在固定速率上,这些速率在设计阶段就已经选 定,是理想信道性能和信道误码鲁棒性的一个折衷。而a m r 语音编码器实时根据 信道类型( 全速率或半速率) 选择多种速率中的一种,从而达到语音编码和信道 编码的最优组合以满足瞬时的无线信道条件和本地容量需求。a m r w b 提供了从 6 6 k b i t s 至i j 2 3 8 5 k b i t s 的多种速率选择。 a m r w b 语音带宽为5 0 一7 0 0 0 h z ,采样率为1 6 k h z ,相对于传统的2 0 0 3 4 0 0 h z 带宽, 拓宽的5 0 2 0 0 h z 部分增强了语音的自然度和舒适度,高频带扩充的3 4 0 0 7 0 0 0 h z 部分增强了摩擦音的区分度,从而提高了语音的可理解性。 a m r w b 凭借其优异的性能成为3 g p p e t s i 和i t u 第三代移动通信系统候选编码标 准,新语音编解码器标准的采纳正在为宽带电话做准备。a m r w b 为一个全新的宽带 编解码器,国内对其的研究也属于起步阶段,其还没有真正进入实用阶段,故对其 进行全面的分析和深入的研究是必要的,对今后本方向的研究打下良好的基础。 第7 页 南京邮电大学硕士研究生学位论文 第二章3 g 移动通信系统中的a m r w b 宽带语音编码 2 1 脓耶语音编解码系统组成部分 a m r w b 宽带语音编解码器系统由多个部分组成,包括多速率语音编解码器,语 音激活检测器( v a d ) ,舒适噪声产生( c n g ) 的源控制速率方案系统利防l e 帧丢失及传 输错误的纠错机制。图2 1 “”给出a m r w b 的单路信号流程功能框图,其中包括了带 模数转换和数模转换的音频部分,以显示在用户设备音频的输入输出和网络的数字 接口之间的完整路径。 u 。甜强。* “、 o o p 匮 窭 一 仕功由 糖i l 端 l :焉i 0o l j 、l 广蕊 叫争 n l 型! i 伊 刳; # 琅“轴 辅 丽1 。 i 丌、 心然1i 激 l h 爵蚌0 o f “料盹雌 牡站链帝讷卉) # 】i 缱 f 转 1 ) t x 图2 1a m r - w b 语音信号处理流程 系统参数: 1 ) 8 位a 一1 a w 或m - l a wp c m ( i t u t 建议g 7 1 1 ) ,采样频率8 k h z 2 ) 1 4 位均衡p c m ,采样频率1 6 k h z 3 ) 端点检测( v a d ) 标志 4 ) 编码后的语音帧,5 0 帧秒,每帧的位数跟a m r w b 的编码模式相关 5 ) 静音检测帧( s i d ) 6 ) t x t y p e ,3 位,指示信息位是否可用或者它们是语音还是静音信息 7 ) 传递到3 g 接入网的信息位 8 ) 从3 g 接入网接收的信息位 第8 页 南京邮电堂硕十研究生学位论文 第:章3 g 移动通信系统巾的a m r w b 宽带语爵编码 9 ) r x t y p e ,用3 位表示的接收端帧的类型 l o ) 静音描述标志( s i d ) 1 1 ) 时间同步标志( t a f ) ,表示静音帧在慢速辅助控制信道( s a c c h ) 复帧中的位置 2 2 多速率语音编码原理 多速率语音编码器“2 是单个的集成语音编码器,由9 种不同模式组成,编码器 输出位速率分别为2 3 8 52 3 0 51 9 8 5 1 8 2 5 1 5 8 51 4 2 5 1 2 6 58 ,8 5 和 6 6 k b i t s 。它也包括了一种背景噪声模式,以用在g s m 的非连续传输操作中,也可 以在其他系统中作为一种低速率的信源独立模式以便用来编码背景噪声,在g s m 系统 中该模式的速率为l - 7 5 k b i t s 。该语音编解码器使用a c e l p ( a l g e b r a i cc o d e e x c i t a t i o nl i n e a rp r e d i c t i o n ) 技术,这个技术也在a m r - n b 、e f r 和i t u t 的g 7 2 9 和g ,7 2 3 1 中的5 3 k b i t s 的编解码方案中使用。1 2 6 5 k b i t s 及其之上的编码模式能 够提供相当高质量的宽带解码语音,8 8 5 和6 6 k b i t s 的两种最低模式一般用在非常 恶劣的无线信道环境或者网络拥塞的场合“”时虽然编解码语音质量不太高,但较低 的速率使得在恶劣网络环境下仍然保持了通话的进行。 2 2 1o e l p 原理“1 a m r - w b 声码器基于c e l p ( 码激励线性预测) 模型编码,c e l p 以高质量的合成语 音及优良的抗噪声性能”1 ,在4 8 - 1 6 k b i t s 速率上得到广泛应用。c e l p 编码基于合 成分析的搜索过程、感觉加权矢量量化和线性预测技术,c e l p 合成模型如图2 2 “” 所示: 图2 2c e l p 语音合成模式简要框图 第9 页 南京邮电大学硕士研究生学位论文 第二章3 g 移动通信系统巾的a m r w b 宽带语音编码 在这种模型中,l p c ( 线性预测) 黼圳垆丽1 2 焉i 万; 合成滤波器是一个1 6 阶的短时滤波器,其形 ( 1 ) 其中二,是量化的线性预测滤波器系数,m = 1 6 为线性预测阶数。基音周期合成滤波器 ( 长时合成滤波器) 9 1 形式为:b ( z ) = _ 与; ( 2 ) j g z 这里t 为基音延迟( 或基音周期) ,g 为摹音增益,基音合成滤波是通过自适应码 本实现的。c e l p 用一个自适应码本中的码字( 码矢量) 来逼近语音的长时周期性( 基音) 结构;用一个固定的随机码本中的码字( 码矢量) 来逼近语音的经过短时、长时预测 后的残差信号。从两个码本中搜索出来的最佳码矢量,乘以各自的最佳增益后相加, 其和即是c e l p 激励信号源。将激励信号输入p 阶线性预测综合滤波器1 a ( z ) ,得到合 成语音信号;( n ) ,;( ) 与原始信号s ( n ) 的误差经过感觉加权滤波器w ( z ) ,得到感觉 加权误差e ( n ) ,c e l p 用感觉加权的最小平方预测误差m s p e ( m i n i m u ms q u a r e d p r e d i c t i o ne r r o r ) 作为搜索最佳码矢量及其幅度的度量准则,使感觉加权误差最小 的码矢量即是最佳码矢量。 自适应码本和随机码本的搜索过程在本质上是一致的,不同之处在于码本结构 和目标矢量的差别。为了减少计算量,一般采用两级码本顺序搜索的方法。第一级 自适应码本搜索的目标矢量是加权预测残差信号,第二级随机码本搜索的目标矢量 是:第一级搜索的目标矢量减去自适应码本搜索得到的最佳码矢量激励经过加权滤 波器后的信号的结果。c e l p 编码器的计算量主要是对码本中最佳码矢量及幅度的搜 索,计算复杂度和合成语音的质量取决于码本的大小。 2 2 2a m r - w b 编码过程 a m r - - w b 编码器对输入语音的采样频率为1 6 k h z ,以2 0 m s 为一个帧,编码时分成 两个频带,即5 0 h z 一6 4 0 0 h z 中低频带和6 4 0 0 h z 一7 0 0 0 h z 高频带。两个频带信号的编码 是独立的,这样主要是为了降低复杂性,并且可以对最重要的频率范围传输更多的参 数信息,信号流程图如下图2 3 ”所示。 数仅仅为:在2 3 8 5 k b p s 模式下高频增益; 第1 0 页 对6 4 0 0 h z 一7 0 0 0 h z 的高频信号,传输的参 5 0 h z 一6 4 0 0 h z 频带采用c e l p 模式编码,编 庸京邮电大学硕十研究生0 位沦文 第章3 g 移动通信系统叶1 的a m r w b 宽带语音编码 码器从每一帧中提取c e l p 参数( 【p c 滤波器系数,a 适应码本和固定码本的序号和增 益) ;对这些参数经编码后传输到接收端。5 0 h z 一6 4 0 0 h z 频带以1 2 8 k h z 的采样频率 进行工作,因此输入信号必须从1 6 k h z 的采样频率降到1 2 8 k h z 。1 6 k h z 的采样频率先 内插4 升采样至i 6 4 k t l z ,然后经过一个截至频率为6 4 k h z 的低通滤波器进行输入信号 滤波,再对信号进行抽取5 得到1 2 8 k h z 的采样频率。 图2 3a c e l p 编码器的原理图 l - 预处理 在降采样后,在编码以前先进行预测处理,其包括:高通滤波和预加重。高通 滤波为了抑制低频的干扰,一个截至频率为5 0 h z 的高通滤波器形式为: “( z ) :0 9 8 5 0 2 - 1 , 9 7 9 0 0 r 4 z - j + 0 9 8 9 5 0 r 2 z - 2 : ( 3 ) ” 1 1 9 7 8 8 8 2 z “+ 0 9 7 9 1 2 6 z 。 高通滤波器的系数缩小为原来的1 2 倍,以防止信号在后续的定点运算过程中溢出。 在宽带信号中由于低频到高频宽的动态范围,其频谱倾斜有更多的发音,在编 码之前先添加一个预加重信号用来控制频谱倾斜和加重高频信号,其形式为: 第1 1 页 j 羔曼! ! ! ! ! ! ! 生:! 兰竺主堕塞竺兰竺笙壅 兰:兰! 竺堡垫塑生墨竺! 塑垒竺璺:! 呈丝堂! 堡苎塑型 ( 4 ) 其r 1 u 取o 6 8 ,而传统的窄带预加重u 取o9 5 。由图2 4 女 i u = 0 6 8 可以使宽带信号变 的更平坦。 两种预加重滤波器 图2 4 用于宽带和窄带的不同预加重滤波器比较 2 线性预测分析和量化 用3 0 m s 不对称窗的自相关方法,对每帧( 2 0 m s ,2 5 6 个采样点) 进行一次短时预测 或线性分析( l p ) ,求取自相关函数时仅用头 5 m s 部分的数据,其帧结构如下: 些塑笔塑重至至固 i ! ! ! ! ! r l - 广t 一i l iii i f r a m cn f 4x5 m s ) 加窗语音的自相关值通过l e v i n s o n - d u r b i n 算法转换为l p 系数,l p 系数被转换为i s p ( i m m i t t a n c es p e c t r a lp a i r ) 域用于量化和内插。 3 感觉加权 第1 2 页 南京邮电大学硕士研究7 i 二学位论文 第章3 g 移动通信系统巾的a m r w b 宽带语膏编 捌嗍燃”脚,:筹:笔, 传统的感觉加权滤波器在电话带宽的信号中可以很好的使用, :【= ! 是它= j f 、= 适合宽度信 号中的感觉加权,因为传统的w ( z ) 在调整共振峰结构和频谱倾斜有固有i 艮i i i 。在宽 带信号中由于低频到高频宽的动态范围,其频谱倾斜有更多的发音,这就要求在这 感觉加权滤波前添加一个滤波器到w ( z ) 来控制宽带输入信号的倾斜和共振峰加权 “”。一个解决的方法是在输入端的预处理阶段引进一个预加重滤波器对宽带信号进 行滤波,预加重滤波器的形式如公式( 4 ) 所示,经过预加重滤波器产生一个高频信号 增强的预加重信号。在预加重后的信号基础上计算线性预测合成滤波器系数以及通 过感觉加权滤波器产生的感觉加权语音信号。这里的感觉加权滤波器”将其分母设 定为固定的,其形式为:w ( z ) = a ( z o 9 ) ( 1 一o 6 8 z 。) ; ( 6 ) 这个结构充分减少了共振峰的倾斜性。由于这里的a ( z ) 是基于预加重语音信号s ( 1 2 ) 的基础计算,所以相对于a ( z ) 在原始信号基础上计算,滤波器a ( z ,;) 的斜波具有很 少的发音。 4 开环基音分析 语音信号大致可以分为两大类:清音和浊音,清音的波形接近随机噪声波形,浊 音信号呈现一定的周期性。浊音波形上的周期我们称之为基音周期,它是语音的一 个重要参数,能否准确的检测对合成语音的音质影响很大。基音检测的方法可以分 为两大类:开环法和闭环法。开环法利用的纯粹是浊音波形的周期性,没有考虑编码 重建合成语音的失真情况,常用的方法有自相关函数法和平均幅度差函数法:闭环法 则是考虑了语音编码的目的,尽量使合成语音的波形和原始语音的波形接近,使其 具有一定的波形编码的特点。开环法可以确定基音的大概范围,并且计算量小:闭环 法可以比较精确的确定基音,但是由于它是基于分析一合成的思想,计算量很大。 综合双方的优点,标准中采用了开环和闭环相结合的方法来完成基音检测。开环基 音分析的目的是简化基音分析,并将闭环基音分析的范围限制在开环基音分析结果 的周围小区域内。其中开环基音估计是基于预加重信号的基础上计算的。 第1 3 页 m 京邮电人。? 硕十研究生学位论文 第带3 0 穆础通信系统巾的a m r w b 越糟“ 秆编硝 墩决1 一语音编码的模式,每一帧作次或两次开叫i 綦音分析来搜索每一i 帧的萃 音延迟的大概范围。对模式为6 6 0 k b i t s 的语音编码,每一帧作一次开环基音分析。 对其他速率模式2 3 ,8 52 3 0 51 9 8 5 1 8 ,2 51 5 8 51 4 2 51 2 6 58 8 5 k b i t s 每一帧 作两次开王1 、基音分析来估计皋音延迟的大概范围。 5 脉冲响应计算 在搜索激励信号时,准则是感觉加权误差的均方误差最小,所以闭环基音搜索 ( 自适应码矢量搜索) 和代数码矢量搜索时,每个可能的激励信号都要进行加权合成 滤波,其表达式为:( :矽( :) = d ( z y j ) h 女一。“0 ) ,盈:) ; ( 8 ) 每一帧计算一次加权合成滤波器脉冲响应h ( n ) ,将滤波器a ( z y 1 ) 的系数矢量通过滤波 器i j ( z ) 和女一。m g ) 可得出冲激响应。 6 自适应码本搜索 自适应码本搜索是基于子帧进行的,它由两部分组成:第一步,实现闭环基音搜 索;,第二步,在选定的分数时延处内插上次的激励来计算自适应码书。自适应码本 参数( 或基音参数) 是指基音滤波器的时延和增益。不同语音模式的自适应码本搜索 的过程大致相同,不同之处在于所选择的分数基音分辨率和应用范围以及内插时使 用的f i r 滤波器。下面给出1 2 ,6 5 k b s 语音模式的自适应码本搜索过程。 在第1 和第3 子帧,分数的基音时延的搜索策略为:1 4 的基音分辨率用于 1 3 4 ,1 2 7 范围内,1 2 的基音分辨率用于 1 2 8 ,1 5 9 告 范围内,整数仅用于 斗上 1 6 0 ,2 3 1 范围内。在第2 和第4 子帧,1 4 的基音分辨率用于 正一8 ,五+ 7 ,此处i 4 是上一子帧分数基音延时最近的整数基音延迟。闭环基音分析是在开环基音估计的 基础上得到在第一和第三子帧的搜索范围为:7 0 7 ,r o p 介于3 4 和2 3 l 之间。在第 2 和第4 子帧中,闭环基音分析是在上一子帧整数基音的周围实现的。第l 和第3 予帧 的基音时延用9 b i t 编码,第2 和第4 子帧的相对时延用6 b i t 编码。 闭环基音搜索是按原始语音与合成语音之间的均方加权误差最小化原则实现 的。也即找到使下式最大的k 值: 第1 4 页 南京邮电人学硕十研究生哥位论文第带3 g 移动通信系统巾的a m r w b 赶带语音编码 c 9 ) 自适应码本增益为: 驴舞,b o u n d e d b y 0 - 0 ) h a n g c o u n t = h a n g _ c o u nt 一1 v a d _ f l a g = l p o w s u m 是当前帧和上一帧的功率和,v a d p o w - l o w 是控$ i j v a d 延迟的常量, b u r s t c o u n t 指语音爆破音的帧数长度,b u r s t l e n # 旨爆破音为高电平的帧数, h a n g _ c o u n t 延迟帧数,h a n g _ l e 时旨延迟为高电平的帧数。 2 5 舒适噪声生成系统的源控制速率方案 ( 1 ) 源控制速率 在正常的电话交谈中,对话双方轮流说话,因此每个方向的平均传输量各占5 0 , 所以通信信道的每个方向存在大量空闲无语音时间段。源控制速率的作用就是让语 音编解码器用一个低速率来编码只包含背景噪音的语音帧,而不必在所有时间都以 高速率编码。在g s m 系统中也存在这个机制,这称为不连续传输( d t xd i s c o n t i n u o u s t r a n s m i s s i o n ) 控制和操作“,编解码器在采用这种模式编码的时候,背景帧位速 率是1 7 5 k b i t s 。这主要是为了两个目的“: 1 ) 对用户而言,可以延长电池寿命或者使用一个更小的电池来运行同样时间。 2 ) 减少网络中的冲突和干扰。 源控制速率操作主要需要进行以下的操作: a 在t x 端( 发送端) 迸行语音端点检测。 b 在t x 端( 发送端) 端进行背景噪声的评估,以便把特征参数传n r x 端( 接收 第1 8 页 南京邮电火学硕十研究生学位论文 第。幸3 g 移动迎f 占系统巾的a m r w b 雠带l 甜卉编码 端) c 在r x 端牛成类似的噪声,这个噪卢称作舒适噪声 如果在接受端收到的参数被检测到严重破坏,则从前几帧相关的数据中提取参数产 牛语音或者舒适噪声以免听者有不舒服的感觉。图2 7 给出了单向源控制速率的操作 框图。 图2 7 单向源控制速率操作框图 ( 2 ) 舒适噪声生成 当没有语音的时候,语音解码器中的合成同正常接受语音帧时的情况是不同的。 基于收到的非语音参数而进行的人工噪声的合成称为舒适噪声产生
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 轻工企业安全知识培训课件
- 公安考试申论考试题及答案
- 2024鹰潭市贵溪市河潭镇社区工作者招聘考试试题
- 2024金华市浦江县浦南街道社区工作者招聘考试试题
- 2024重庆市渝北区礼嘉街道社区工作者招聘考试试题
- 2024重庆市石柱土家族自治县悦崃镇社区工作者招聘考试试题
- 2024金华市婺城区乾西乡社区工作者招聘考试试题
- 2025年能源行业智能电网在电力系统智能化升级中的应用报告
- 2025年进厂打工测试题及答案
- 机械伤害考试题及答案
- 断桥门窗产品培训
- 课件-运动损伤的预防和处理
- 自卸汽车司机、驾驶员安全责任制
- GB/T 44951-2024防弹材料及产品V50试验方法
- 外研版初中英语单词总表(7~9年级)
- 开学第一课主题班会
- 降低住院病人胃管非计划拔管率不良事件RCA分析PDCA改善报告
- 轴承装配组装SOP
- 过敏性休克完整版本
- 《大学美育》高职全套教学课件
- 小学必背古诗词182首(带目录及释义)人教(部编版)
评论
0/150
提交评论