




已阅读5页,还剩86页未读, 继续免费阅读
(信号与信息处理专业论文)基于msc8122的amrwb算法的优化和实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 中文摘要 为了满足w c d m a 和g s m 对高质量语音业务的需求,3 g p p e t s i 提出了宽 带自适应多码率( a m r - w b ) 编解码器。随后,a m r w b 又被n u - t 选用为其 1 6 k b i t s 宽带语音编码标准1 2 7 2 2 2 。a m r - w b 具有语音质量高、平均编码速率低 和自适应好等优点,在无线通讯领域和有线通讯领域都有着广阔的应用前景。 d s p 具有体积小、功耗低和性能高的特点,在语音编码发展过程中起着重要 作用。飞思卡尔d s p m s c 8 1 2 2 内部集成了4 个s t a r c o r e l 4 0 d s p 核,m s c 8 1 2 2 在 提升性能的同时还能维持较低的功耗,从而降低了整个系统的成本。 在a m r w b 算法实际应用过程中,提高系统用户通道数和降低系统的功耗和 成本成为首要考虑因素。这需要在选用高性能、低功耗d s p 的同时,对a m r w b 协议算法进行高效的优化,降低整个算法的复杂度。 本文首先对a m r w b 算法进行了系统的分析,重点研究了编码器的线性预测 和量化、自适应码本搜索和固定码本搜索以及解码器的语音合成原理,并对3 g p p 提供的定点标准c 源程序的各个算法模块进行了分析,简要地对其变速率技术进 行了介绍。接着研究了m s c 8 1 2 2 的硬件结构、内存存储方法和t d m 接口,并分 析了d s p 实现的软件体系结构和系统平台的搭建。然后,本文对m s c 8 1 2 2 汇编 优化的关键技术和a m r w b 核心算法汇编优化的方法进行了研究,并分析了 a m r w b 编码器和解码器的接口、入参和初始化,给出了基于s m a r t d s p 操作系 统和m s c 8 1 2 2 2 6a d s 板多通道实时实现a m r - w b 算法的方法。最后本文对 a m r w b 算法优化和实时实现的结果进行了详细的测试和分析。 测试结果表明,相比汇编优化前整个算法的复杂度降低了5 9 ,经过优化后 的a m r 。w b 算法时间复杂度为1 6 6 2 m c p s ,单核实时实现了1 6 个通道的 a m r - w b 算法,输出语音仍然保持了较高的合成语音质量。 关键词:宽带自适应多码率,语音编码,数字信号处理,算法优化 a b s t r a c t a b s t r a c t t h ea d a p t i v em u l t i r a t ew i d e b a n d ( m r w b ) s p e e c hc o d e cw a ss e l e c t e db y 3 g p p e t s if o rg s ma n dw c d m as y s t e mf o rp r o v i d i n gh i g hq u a l i t ys p e e c hs e r v i c e s t h e n , i tw a sa l s os e l e c t e db y u - ta sr e c o m m e n d a t i o ng 7 2 2 2f o rw i d e b a n ds p e e c h c o d i n ga r o u n d1 6 k b i f f s a m r - w bp r o v i d e sh i g l ls p e e c hq u a l i t y , l o wa v e r a g eb i tr a t e s a n dh i g h e ri n t e l l i g e n c e ,m a k i n gi tw e l ls u i t a b l ef o rm a n ya p p l i c a t i o n si nw i r e l e s ss y s t e m a n dw i r e l i n es y s t e m d s ph a sp l a y e dad o m i n a n tr o l ei nd e v e l o p m e n to fd i 百t a ls p e e c hc o d i n gw i t h c o m p a c t n e s s ,h i g hp e r f o r m a n c ea n dl o wp o w e rd i s s i p a t i o n t h em s c 8 1 2 2d e v i c eo f f r e e s e a l ec o m p a n yi sah i g h l yi n t e g r a t e dd s pt h a tc o m b i n e sf o u rs t a r c o r e l 4 0c o r e s , w h i c hd e l i v e r se n h a n c e dp e r f o r m a n c ew h i l em a i n t a i n i n gl o wp o w e rd i s s i p a t i o na n d g r e a t l yr e d u c i n g o v e r a l ls y s t e mc o s t e n h a n c i n gs y s t e mu s e rc a p a c i t ya n dr e d u c i n gs y s t e mp o w e rd i s s i p a t i o na n dc o s ti s t h ep r i n c i p a lc o n s i d e r a t i o nf a c t o ri nc o u r s eo fr e a la p p l i c a t i o no f a m r w ba l g o r i t h m i t n e e dc h o o s e sh i g hp e r f o r m a n c ea n dl o wp o w e rd i s s i p a t i o nd s pa n de f f i c i e n t l y o p t i m i z e st h e a m r - w ba l g o r i t h mt or e d u c e s i t sc o m p l e x i t y f i r s t l y ,t h i sp a p e rg i v e sas y s t e m i ca n a l y s i so fa m r w ba l g o r i t h m ,w h i c hf o c u s o na n a l y s e st h ep r i n c i p l eo fc o r ea l g o r i t h mo fc o d e ra n dd e c o d e r , s u c ha sl i n e a r p r e d i c t i o na n a l y s i sa n dq u a n t i z a t i o n ,a d a p t i v ec o d e b o o ks e a r c h ,a l g e b r a i cc o d e b o o k s e a r c ha n ds p e e c hs y n t h e s i s i ta l s od e t a i l st h ef i x e d - p o i n tcs o u r c ec o d er e c o m m e n d e d b y3 g p pa n db r i e f l ya n a l y s e st h et e c h n o l o g yo fv a r i a b l er a t e s e c o n d l y , t h ep a p e rr e s e a r c h e so nt h ea r c h i t e c t u r ea n dt h ek e yt e c h n o l o g yo f m s c 8 1 2 2w h i c hi n c l u d e sm 1 ,m 2a n dt d mi n t e r f a c e ;i ta l s od e t a i l st h ef l o wo f s o f t w a r ed e s i g na n dt h ef r a m e w o r ko fs y s t e mh a r d w a r e t h e n ,t h ep a p e rr e s e a r c h e so n t h ek e ya s s e m b l eo p t i m i z a t i o nt e c h n o l o g yo fm s c 8 1 2 2a n dd e t a i l st h ew a y so f a s s e m b l eo p t i m i z a t i o no fc o r ea l g o r i t h m , 勰w e l la sa n a l y s e st h ei n t e r f a c e s , i n p u t p a r a m e t e r sa n di n i t i a l i z a t i o no fc o d e ra n dd e c o d e ra n dg i v e st h ew a y o fm u l t i c h a n n e l a b s t r a c t r e a l t i m er e a l i z a t i o no fa m r w ba l g o r i t h mb a s e do ns m a r t d s po sa n dm s c 8 1 2 2 2 6 a d sb o a r d f i n a l l y , t h ep a p e rg i v e st h ep e r f o r m a n c et e s tr e s u l to fo p t i m i z e da m r - w b a l g o r i t h ma n d r e a l - t i m er e a l i z a t i o n t h er e s u l tp r o v e d :a f t e re f f e c t i v eo p t i m i z a t i o n ,c o m p l e x i t yo fa m r w ba l g o r i t h m f a l l5 9 a n dt h et i m ec o m p l e x i t yo fa m r w ba l g o r i t h mo n l y1 6 6 2m c p s ;e a c h s t a r c o r e l 4 0c o r ec a l lr e a l t i m em n1 6c h a n n e l s a m r w ba l g o r i t h ma n dt h eo u t p u t s p e e c hh a sah i g hr e c o n s t r u c t e ds p e e c hq u a l i t y k e y w o r d s :a m r w b ,s p e e c hc o d e c ,d s p , a l g o r i t h mo p t i m i z a i t o n i i i 图目录 图目录 图1 - 1 语音编码发展的三个阶段2 图2 - 1 编码器原理框图9 图2 - 2 解码器原理框图1 0 图2 - 3 加窗帧结构示意图1 1 图2 - 4v a d 算法结构简图3 0 图2 - 5a m r w b 中s c r 操作连接图3 2 图2 6 址i r - w b 编码器在v c 中的编码输出界面3 3 图2 7 a m r - w b 解码器在v c 中的解码输出界面3 3 图3 1a m r - w b 语音编码算法实现的系统平台框图3 5 图3 2a m r - w b 语音编码算法实时实现数据流程3 5 图3 3 语音文件及实时语音处理主调函数流程3 6 图3 4m s c 8 1 2 2 2 6 a d s 板实物图3 7 图3 5m s c s l 2 2 结构框图3 8 图3 6s t a r c o r e l 4 0 扩展核结构框图3 8 图3 7s t a r c o r e l 4 0 核功能框图3 9 图3 8s t a r c o r e l 4 0 流水线3 9 图3 9m 2 和m q b u s 系统图4 0 图3 1 0c o d e w a r r i o r 界面4 2 图4 1 流水线编排流程及折叠法示例5 0 图4 2 优化工作流程图5 2 图4 3 评估工作流程图5 6 图5 - 1p e s q 测试后的界面7 2 图5 2 原始语音信号的波形及语谱图7 3 图5 - 3a m r - w b 算法6 6 k b i t s 模式编解码后语音信号波形和语谱图7 4 图5 4 a m r - w b 算法1 5 8 5 k b i t s 模式编解码后语音信号波形和语谱图7 4 图5 5a m r - w b 算法2 3 8 5 k b i t s 模式编解码后语音信号波形和语谱图7 5 表目录 表目录 表1 - 1 宽带语音编码标准对比5 表2 - 11 5 8 5 k b i t s 模式下的代数码本结构2 2 表4 - 1 优化级别说明。4 5 表4 2c o d e r 0 和d e c o d e r 0 在各个模式单帧所耗的时钟周期数5 6 表4 3d e c o 的予函数单帧所耗时钟周期数统计5 7 表4 4c n c o 的子函数单帧所耗时钟周期数统计5 7 表4 5 评估结果及测试结果对比5 8 表5 11 9 8 5 k b i t s 模式下a m r w b 算法各模块汇编优化前后耗时对比7 0 表5 2 编码器和解码器优化前后在各模式所耗时钟周期数对比7 0 表5 3 a m r - w b 算法优化前后时间复杂度对比7 1 表5 4 a m r w b 算法在m s c 8 1 2 2 平台运行通道数对比7 1 表5 5 a m r w b 优化前后空间复杂度对比7 l 表5 - 6 a m r w b 算法的p e s om o s 得分 表5 - 7a _ m r w b 实听测试结果。 7 3 7 5 缩略词表 英文缩写 a a u a c e i 卫 a m r a s s - w b c a n c e i j d a l u e c u l p :a b s i s p p 玎- 1 i j c e r p m c p s m m a c s m o s p c m p e s q s c r v a d v l e s 3 g p p 英文全称 缩略词表 a d d r e s sa r i t h m e t i cu n i t a l g e b r a i c c o d e e x i t a t i o n l i n e a r p r e d i c t i o n a d a p t i v em u l t i r a t e a d a p t i v em u l t i - r a t ew i d e b a n d c o m f o r tn o i s ea s p e c t s c o d e e x c i t e dl i n e a rp r e d i c t i o n d a t a a r i t h m e t i cl o g i cu n i t e r r o rc o n c e a l m e n tu n i t s l i n e a rp r e d i c t i o na n a l y s i s - b y s y n t h e s i s i n t e r l e a v e ds i n 西e - p u l s ep e r m u t a t i o n i n t e r n a t i o n a lt e l c c o m m u n i c a t i o nu n i o n t e l e c o m m u n i c a t i o ns e c t o r l i n e a rp r e d i c t i o n l i n e a rp r e d i c t i v ec o d i n g l o n gt c r mp r e d i c t o r m j l h o nc y c l e sp e rs e c o n d m i l l i o n m u k i p l y a n da c c u m u l a t e c o m m a n d sp c rs e c o n d m c a no p i n i o ns c o r e p u l s ec o d em o d u l a t i o n p e r c e p t u a le v a l u a t i o no fs p e e c hq u a l i t y s o u r c ec o n t r o l l e dr a t e v o i c ea c t i v i t yd e t c c l o r v a r i a b l e l e n g t he x e c u t i o ns e t t h et h i r dg e n e r a t i o np a r t n e r s h i pp r o j e c t - 中文释义 地址运算单元 代数码本激励线性预测 自适应多码率 宽带自适应多码率 舒适背景噪声 码激励线性预测 数据运算逻辑单元 差错隐藏单元 分析合成线性预测 交替正负脉冲 国际电信联盟通信标准 部 线性预测 线性预测编码 长时预测 百万次周期每秒 百万次乘累加每秒 平均意见分 脉冲编码调制 感知语音质量评价 信源控制速率 语音激活检测 可变长度执行包 第三代合作伙伴计划 主要符号表 主要符号表 含义 合成滤波器 量化的线性预测系数 线性预测分析窗 名称 q 形( z ) 无 含义 未量化的线性预测系数 感觉加权滤波器 采样频率 第n 帧i s f 预测残差矢量p 0 )第n 帧i s f 预测矢量 加权合成滤波器脉冲相应h 0 ) 0 ) 加权合成滤波器 加权后的语音信号 重建语音信号 自适应码本搜索目标信号屯0 )代数码本搜索目标信号 代数码本矢量v o )自适应码本矢量 激励信号 代数码本增益 预测的代数码本增益自适应码本增益 预测的自适应码本增益 最佳开环基音延迟 釜黎翟娈萝薯妻瑟翌篥箩数r e s l v ( n ) 线性预测残差信号 码本增益之间的修正因子 “”一。 滤波后的自适应码本矢量 x 一 徘 咄 反 州 删 槲 撕 州露 k 州 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作 及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为 获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与 我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的 说明并表示谢意。 签名: 日期:沈叼年,月谚日 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘, 允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全 部或部分内容编入有关数据库迸行检索,可以采用影印、缩印或扫描 等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:导师签名: 沙炉 日期:访) 年1 月 瑁 第一章引言 1 1相关背景 第一章引言 语言是人类进行交流的重要手段,通信系统中最常见的数据形式就是语音。 语音通信是人类通信最基本、最重要的方式之一。随着移动通信和互联网的飞速 发展,语音通信技术也在不断地进行更新并与之融合。语音信号的数字化传输和 存储,在可靠性、抗干扰能力、快速交换等方面远胜于模拟化,且易于保密,价 格低廉,所以从2 0 世纪5 0 年代以来,数字化语音在通信系统中所占的比重越来 越大【l i 。语音编码是数字语音通信中的一项重要技术。在尽量压缩数字语音传输的 比特率以便以同样的信道容量传输更多路语音信号的推动下,语音压缩编码有了 很大的发展,并在有线和无线电话的话带语音信号、会议电视的宽带语音信号、 高清晰度电视( h d t v :h i g hd e f i n i t i o n t e l e v i s i o n ) 信号和高保真信号等领域有着 广泛的应用。 1 1 1 语音编码技术的发展历程 语音信号处理的研究在极大程度上一直为现实世界的应用所驱动,其每一次 新的突破都与相关领域新的技术应用和新的理论提出息息相关。1 8 7 6 年贝尔发明 了电话,通过声电、电声转换技术第一次实现了远距离的语音通信。1 9 3 7 年 a h r e e v e s 提出的脉冲编码调制( p c m :p u l s ec o d em o d u l a t i o n ) 理论则开创了语 音数字化通信的历程。 语音编码按编码方式大致可以分为三种:波形编码、参数编码和混合编码。 波形编码是将时间域或频率域( 变换域) 信号直接变换为数字信号,力求使重建 语音波形保持原始语音信号的波形形状。波形编码具有语音质量好、抗噪性能强 等优点。其缺点是所需的编码速率高,一般在1 6 k b i t s 一6 4 k b i t ,s 之间。参数编码又 称声码器编码,它是将信源信号在频域或其它变换域提取特征参数,然后对这些 特征参数进行编码和传输;在译码端再将接收到的数字信号译成特征参数,根据 这些特征参数重建语音信号。参数编码的优点是可实现低速率语音编码,其编码 速率可低至2 4 k b i t s 以下。其缺点是语音质量差,自然度较低。混合编码将波形 编码和参数编码结合起来,克服了波形编码和参数编码的缺点,吸收了它们的长 1 电子科技大学硕士学位论文 处,在4 k b i t s 一6 k b i t s 速率上能够得到高质量的合成语音。 从最初的6 4 k b i t s 的标准p c m 波形编码器到现在4 k b i t s 以下的参数编码的声 码器,从最初的单一编码速率到现在自适应多码率,话带语音编码在最近几十年 得到了迅速的发展。语音编码按其发展年代大致可以分为三个阶段,如图1 - 1 所示。 簧 量- s 搴 琶 4 8 发展阶段( 年) 图1 1 语音编码发展的三个阶段 在第一个阶段( 1 9 3 5 年至1 9 8 5 年) ,各国学者从人类发音机理和听觉机理出 发,对语音的声码器做了大量研究。1 9 3 9 年美国人h o m e r d u d l y 研制成功了第 个声码器,从此奠定了语音产生模型的基础,语音处理开始了参数编码( 或模型 编码) 的研究。2 0 世纪6 0 年代,s a t o ,i t a k u r a ( 1 9 6 6 ) 和a t a l ,s c h r o e d e r ( 1 9 6 7 ) 研究出实用的共振峰声码器,最早把“线性预测编码( l p c :l i n e a rp r e d i c t i v e c o d i n g ) ”技术应用到语音分析和合成,并提出了自相关法、协方差法、格型法等 实用快速算法。1 9 6 6 年,j l f l a n a g a n 提出了以瞬时频率为基础的相位声码器。1 9 6 9 年,a v o p p e n h e i m 提出了以倒谱为基础的同态声码器。1 9 8 2 年,美国国家安全 局( n s a ) 公布了2 4 k b i t s 的l p c i 0 声码器标准( f s 1 0 1 5 ) ;1 9 8 4 年,美国国防 部制定了s t u i i i 计划,采用2 4 k b i t s 的l p c 1 0 e 增强型。在众多声码器中,i _ p c 声码器终因其成熟的算法和参数的精确估计成为研究的主流,并逐步得到实用, 参数编码在这个阶段获得了较大的发展。 2 0 世纪8 0 年代中期到2 0 世纪9 0 年代中期处于第二个阶段。在这1 0 年间, 语音编码技术有了突破性的进展,闭环分析算法( l p a b s ;l i n e a rp r e d i c t i o n 2 第一章引言 a n a l y s i s b y s y n t h e s i s ) 成为了主流。l p a b s 思想是在1 9 8 1 年被提出的,最早实 用的l 卫a b s 方案则是1 9 8 5 年由b s ,a t a l 和m r s c h r o e d e r 提出的码激励线性预测 ( c e l p ;c o d e e x d t e dl i n e a rp r e d i c t i o n ) 算法。在1 9 9 1 年,n s a 公布了4 8 k b i 柏 的c e l p 联邦标准f s 一1 0 1 6 。删t 在1 9 9 2 年和1 9 9 6 年公布了适用于公用网g 7 2 8 、 t 2 7 2 9 和g 7 2 9 a 等语音编码标准,分别采用低时延码激励线性预测( l i e ) c e l p ) 、 共轭结构代数码激励线性预测( c s a c e l p ) 等技术,1 9 9 4 年公布了用于因特网 的双速率( 5 3 6 3 k b i t s ) 多媒体语音编码标准g - 7 2 3 ,其中5 3 k b i t s 采用代数码激 励线性预测( a c e l p ) 技术,6 3 k b i t s 采用多脉冲最大似然度量化( m p m l q ) 技 术。随着口( v o i c eo v e ri n t e r a c tp r o t o c 0 1 ) 需求激增,按照r r u - t 的h 3 2 3 建议, v o 口主要采用的语音编码标准有g 7 2 9 、( 1 7 2 9 a 、g 7 2 3 等协议。 同时,由于第二代数字蜂窝移动通信系统开始在全球商用,欧洲电信标准协 会( e t s l ) 、美国通信工业协会( t i a ) 和日本数字蜂窝( j d c ) 分别制定了适用 于本地区第二代移动通信的语音编码标准。e t s l 分别在1 9 8 9 年、1 9 9 5 年和1 9 9 6 年公布了1 3 k b i t s 的脉冲激励一长时预测( r p e - l t p ) 语音编码方案( 全速率语音 编码f r ) 、6 5 k b i t s 的矢量和激励线性预测编码( v s e l p ) 方案( 半速率语音编码 h r ) 和1 2 2 k b i t s 的a c e ip 方案( 增强型全速率语音编码e f r ) 。t i a 在1 9 9 1 年 公布了i s 5 4 ( 7 9 5 k b i t s 的v s e l p 技术) 标准,j d c 在1 9 9 2 年公布了j d c ( 6 7 k b i t s 的v s e i j p 技术) 标准。 以上介绍的这些算法共同特点是采用闭环l p a b s 算法、感觉加权技术、复合 窗技术、线性谱对( l s p ) 技术、后置滤波技术、增益自适应技术和分数基音内插 技术等【2 】,现在一般把以l p a b s 为基础的用矢量量化( v q ) 技术对激励信号进行 量化编码的算法统称为c e l p 。另外,在这个阶段n t u t 还制定了一些基于自适应 差分脉冲调制( a d p c m ) 的语音编码标准,如的g 7 2 1 、g 7 2 2 、g 7 2 6 和g 7 2 7 等,采用正弦编码范畴的多带激励( m b e ) 、自适应变换编码( 铷r c ) 和子带编码 ( s b c ) 等技术的编码方案也有制定。但总的来说,采用混合编码c e l p 算法是这 个阶段语音编码的主流。 2 0 世纪9 0 年代中期到现在为语音编码发展的第三阶段。在这个阶段第三代移 动通信技术逐渐成熟并走向商用,变速率语音编码得到了迅速的发展,不断有新 的国际标准和地区标准公布。应用于第三代移动通信的变速率语音编码主要有可 变速码激励线性预测( q c e l p ) 、增强型变速率编解码器( e 0 c ) 、自适应多码率 ( a m r ) 、宽带自适应多码率( a m r w b :a d a p t i v em u l t i r a t ew i d e b a n d ) 、可选模 3 电子科技大学硕士学位论文 式声码器( s m v ) 和变速率多模式宽带( v m r w b ) 等。在3 g 三大标准中,中 国提出的时分一码分多址( t d s c d m a ) 采用了a m r 语音编码技术;美国提出 的c d m a 2 0 0 0 标准随着无线技术和编码技术的发展,先后采用了q c e l p 、e v r c 和v m r w b 等声码器作为其语音编码方案;欧洲提出的宽带码分多址( w c d m a ) 标准采用先后采用了a m r 、a m r 。w b 语音编码技术,s m v 作为其备选语音编码 方案。 1 1 2 宽带语音编码 宽带语音编码【3 1 的语音信号带宽在7 k h z 左右,采样率在2 0 k h z 左右,主要应 用于高质量语音需求的场合。普通话带语音编码的语音信号带宽在3 0 0 h z 3 4 0 0 壬i z 范围内,采样率为8 k h z ,通常所指的语音编码一般都是指普通话带语音编码,日 常生活中的公众电话网( p s t n ) 就是采用普通话带语音编码。随着端对端数字网 络的增长,如第二代和第三代移动通信系统、综合数字业务网( i s d n ) 、i p ,允 许人们使用一个相对于p s t n 更宽的语音带宽来进行语音通信,这将给人一种面 对面交流感觉的语音质量。带来这种变化的主要原因是语音带宽在低频和高频都 作了扩展。扩展的低频部分( 5 0 h z 一3 0 0 h z ) 提高了自然力、表现力和自然度,扩 展的高频部分( 3 4 0 0 h z 一7 0 0 0 h z ) 可以更好的区分摩擦音,增加了清晰度【4 】。因此 宽带语音不仅提高了可理解性和语音自然度,而且还增加了透明传输的感觉,使 说话方的个人特征体现得更充分。 标准组织多年来一直在努力定义宽带语音编码标准。早期定义的宽带语音编 码标准主要应用于会议电视,近期定义的则主要应用于移动通信和v o i p 。宽带语 音编码标准g 7 2 2 、g 7 2 2 1 及a m r - w b ( g 7 2 2 2 ) 的详细对比如表1 - 1 所示。 g 7 2 2 是i t u - t6 4 k b i t s 宽带语音编码标准,也是第一个1 6 k h z 采样率的宽带 语音编码算法。g 7 2 2 的编码器有两个子带,每个子带的信号用a d p c m 编码,使 用的技术是类似于g 7 2 6 的窄带标准。在编码器端,语音信号以1 6 k h z 的速率采 样,并被分解成相同带宽的两个子带,每个子带的信号在编码前采样速率减半。 在解码器端,量化的子带语音信号的采用频率被使用同编码器端分解信号相同的 滤波器加倍。重新建立的子带信号被加到一起形成合成信号。 g 7 2 2 1 主要为降低g ;7 2 2 编码速率而提出来的宽带语音编码标准,在1 9 9 9 年 被删- t 制定。g 7 2 2 1 由p i c t u r e t e l 公司开发,使用了码转换的方法。当时选用 p i c t u r e t e l 方案时,主要考虑其算法复杂度相对于其它方案较低,因此没有考虑其 4 第一章引言 它变速率技术,并且没有1 6 k b i t s 左右编码速率。 a m r - w b 是由3 g p p e t s i 在2 0 0 1 年制定用于w c d m a 和g s m 的宽带语音 编码标准,h u - t 在2 0 0 2 年将其选为其1 6 k b i t s 编码速率的宽带语音编码标准 g 7 2 2 2 。这也标志无线与有线首次采用了同一语音编码器,意味着在3 g 与口固 定网络之间的互通更加容易,为宽带语音在更多的通信系统和设备的应用和服务 打下了基础。a m r w b 有9 种编码速率,并拥有话音激活检测( v a d ) 、信源控 制速率( s c r ) 、舒适噪声生成( c n g ) 等变速率技术。 表1 1 宽带语音编码标准对比 标准g 7 2 2g 7 2 2 1a m r w b ( g 7 2 2 2 ) 公布时间 1 9 8 8 正1 9 9 9 年2 0 0 1 ( 2 0 0 2 ) 年 编码速率( k b i t s ) 4 8 ,5 6 ,6 42 4 ,3 26 6 ,8 8 5 ,1 2 6 5 ,1 4 2 5 ,1 5 8 5 , 1 8 2 5 ,1 9 8 5 ,2 3 0 5 ,2 3 8 5 编码算法 a d p c m码转换a c e l p 时延o 1 2 5 m2 0 m s2 0 m s 性能 c o m m e n t a r y ( 6 4一些条件下合成语 在1 2 6 5 k b i t s 以上合成语音 k b i t s )音音质质量差,音音质质量高,音乐较差 乐性能较好1 5 8 5 g 7 2 25 6 k b i t s 2 3 0 5 g 7 2 26 4 k b i t s 复杂度1 0 加p s o 6 ,则 ,在下 一帧置为1 0 ,否则更新为,= 0 9 ,。 开环基音增益g 为: g 暑 ( 2 2 6 ) d 一是c ) 取最大值时的基音延迟。中值滤波只在浊音帧时更新,加权受前帧基 音延迟可靠性影响,如果前一帧包括清音和静音,加权函数则会受到参数,的哀减。 ( 2 ) 其它模式 在其它模式,a m r w b 算法进行两次开环基音分析,其算法和6 6 k b i t s 是一 样的,只是在求c ) 和g 时,其累加和的上限不是1 2 7 ,而是6 3 。 开环基音分析的实现代码为p i t c hm e d _ 0 1 0 ,其输出的结果,包括函数返回值 基音延迟的整数部分瓦和通过参数返回的基音延迟的小数部分毛一f r a c 。对于非 6 6 0 k b i t s 速率编码有两个基音延t _ o p 和to p 2 ;对于6 6 0 k b i t s 速率编码只有一 个基音延迟功p ,第二个基音延迟t 印2 = to p 。 2 2 5 脉冲相应的计算 a m r - w b 语音编码中要计算的脉冲响应是指加权合成滤波器日( z ) ( z ) = 1 8 第二章a m r - w b 语音编码标准研究 , 4 ( z v 1 ) h 一。砷0 ) j 0 ) 的单位脉冲相应 o ) , o ) 每子帧计算一次。该冲击响应 在进行自适应码本搜索和固定码本搜索时用到。 2 2 6目标信号的计算 目标信号x o ) 主要用于自适应码本搜索,每子帧计算一次,它是l p 残差信号 ,o ) 通过加权合成滤波器4 ( z ,n ) h 。一。砷( 力a 0 ) 得到的。在确定子帧激励后,该 滤波器的初始状态就会通过滤除i j p 残差和激励间差异的方法进行更新。l p 残差 信号为: ,o ) _ s o ) 一薹幺s o 一) ,n = 0 , - - , 6 3 ( 2 - 2 7 ) 2 2 7自适应码本搜索 自适应码本搜索是在各个子帧进行的,每帧进行4 次,它包括闭环基音搜索 和自适应码本矢量的计算( 后者通过在基音分数延时处内插过去的激励来得到) 。 自适应码本的参数是基音延时和基音滤波器增益。自适应码本搜索的目的是要得 到一个最佳的自适应码本索引。在搜索阶段,l p 残差激励扩展使闭环搜索简单化。 1 在6 6 0 k b i t s 模式时,对于第1 子帧,如果基音周期在【3 4 ,9 1 圭】范围内,搜索 z 得到的基音周期精确到1 2 :如果基音周期在 9 2 ,2 3 1 范围内,搜索得到的基音周 期精确到整数。对于第2 、第3 和第4 子帧,搜索范围在【n 8 ,乃+ 7 妻】,其中t t 是 z 距离第1 子帧基音周期最近的整数,结果精确到1 2 。在8 8 5 k b i t s 模式时,对于 第1 和第3 子帧,如果基音周期在【3 4 ,9 1 圭】范围内,搜索得到的基音周期精确到 z 1 2 ;如果基音周期在 9 2 ,2 3 1 范围内,搜索得到的基音周期精确到整数。对于第2 和第4 子帧,搜索范围在【乃8 ,n + 7 委】,其中孔是距离第1 和第3 子帧基音周期最 。 近的整数,结果精确到1 2 。 在非6 6 0 k b i t s 和8 8 5 k b i t s 模式时,对于第1 和第3 子帧,如果基音周期在 3 4 ,1 2 7 - ;】范围内,搜索得到的基音周期精确到l 4 ;如果基音周期在 1 2 8 ,1 5 9 1 范围内,搜索得到的基音周期精确到1 2 ;如果基音周期在 1 6 0 ,2 3 1 范围内,搜索 得到的基音周期精确到整数。对于第2 和第4 子帧,搜索范围在【乃8 ,t x + 7 - ;】,结 1 9 电子科技大学硕士学位论文 果精确到1 4 ,其中n 是距离第1 和3 子帧的基音周期t 0 最近的整数。 闭环基音分析是在开环基音估计基础上进行计算的。在非6 6 0 k b i t s 模式的第 1 和第2 子帧以及6 6 0 k b i t s 模式的第1 帧搜索范围是,7 ,限定在3 4 2 3 1 之间。 所有模式下的其它子帧,闭环基音分析都如前面所述在前予帧所选整数基音延迟 值附近搜索得到。在6 6 0 k b i f f s 模式下,第1 予帧基音延时8 b i t 编码,其它子帧的 基音延时5 b i t 编码;在8 8 5 k b i t s 模式下,第1 和第3 子帧基音延时8 b i t 编码,其 它子帧的基音延时5 b i t 编码;在非6 6 0 k b i t s 模式和8 8 5 k b i 伽模式,第1 和第3 子帧基音延时9 b i t 编码,其它子帧的基音延时6 b i t 编码。 闭环基音搜索,也就是使原始信号和重构语音信号之间的均方加权误差最小, 即使瓦最大: ,罗:。x o ) n ) 轴摭 ( 2 2 8 ) 其中x ( n ) 为目标信号。y k ( n ) 为时延的滤波激励( 前一激励与,1 0 ) 作卷积) , 即: 删; 篓娑删f 。i 咖r s 绑td e 如l a y 缈协2 , 其中u ( n ) ,n 一( 2 3 1 + 1 7 ) ,6 3 是激励缓冲器。由于在搜索阶段, u ( n ) ,n = o ,6 3 未知,但是对于基音延时小于6 4 时需要它,为了简化搜索,将l p 残差信号复制到“) ,使其对所有时延都满足方程式( 2 2 9 ) 。 最优整数基音延时确定后,在最优整数延时附近的3 4 到3 4 以步长1 4 进行 测试,内插归一化系数五,并搜索其最大值得到分数基音时延。分数基音延时确 定后,在给定段内插过去激励信号“o ) 计算得到1 ,0 ) 。内插用两个f i r 滤波器( s i n e 函数经过汉明窗截断得到) 进行的,一个截断在t 1 7 处用来内插( 2 2 5 ) 式中的相关 项,另一个截断在6 3 处用于内插过去的激励。该滤波器在过采样域的截止频率为 6 0 0 0 h z ,这意味着内插滤波器表现为低通频率响应。这样,即使基音延迟是整数 值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版蔬菜采摘与快速运输一体化服务合同
- 2025房地产合同数据安全与隐私保护及合规检查合同
- 2025年度大型矿山资源承包开发合作协议
- 2025版汽车音响配件批发合作协议
- 2025房地产租赁权转租合同补充协议
- 2025年度政府公文翻译服务合同
- 2025版纺织品行业节能减排项目合同
- 2025版信息技术项目上岗服务合同书
- 2025年新能源充电站租赁合同及运营维护服务协议
- 2025年智能家居玻璃配件购销合同模板
- EN1112标准(中文版)
- 产学研合作管理制度
- 卫生部《病历书写基本规范》解读(73页)
- 生物必修一课程纲要
- 南方332全站仪简易使用手册
- 人民调解员培训讲稿村级人民调解员培训.doc
- 高低压配电安装工程-技术标部分(共41页)
- 监理规划编制案例
- 图画捉迷藏-A4打印版
- 受限空间作业票
- 盘扣式外脚手架施工方案
评论
0/150
提交评论