(计算机软件与理论专业论文)rpeltp语音编解码算法研究与实现.pdf_第1页
(计算机软件与理论专业论文)rpeltp语音编解码算法研究与实现.pdf_第2页
(计算机软件与理论专业论文)rpeltp语音编解码算法研究与实现.pdf_第3页
(计算机软件与理论专业论文)rpeltp语音编解码算法研究与实现.pdf_第4页
(计算机软件与理论专业论文)rpeltp语音编解码算法研究与实现.pdf_第5页
已阅读5页,还剩65页未读 继续免费阅读

(计算机软件与理论专业论文)rpeltp语音编解码算法研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

独创性声明 咖j l | f i f l f f i fj i j 舯l f i 洲删 y 18 2 4 7 9 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研 究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得重迭由电太堂或其他教育 机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡 献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:衾_ 争、夸、 签字日期: 删年夕月2 眵日 学位论文版权使用授权书 本学位论文作者完全了解 重迭蜜壹太堂有关保留、使用学位论文的规 定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查 阅和借阅。本人授权 重庞邮电太堂一可以将学位论文的全部或部分内容编入 有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论 文。 ( 保密的学位论文在解密后适用本授权书) 姗虢铋燧名圈 签字日期:砂7 年 月力争日 签字日期: 卯f 年f 月夕彩日 重庆邮电大学硕士论文 摘要 摘要 语音在人类通信中占有核心地位。尽管在有线通信领域中已经出现 了廉价的宽带光纤,但在无线和卫星通信中仍不断要求节省信道带宽和 加强保密程度。另外有一种趋势是要将含有语音的应用集成到台式或便 携式个人计算机上,特别是在多媒体通信中,如语音邮件等。所有的这 些应用都要求将语音数字化,以便能在软件的控制下对它进行处理、存 储和传输。语音编码就是为了减小语音信号的编码速率,以便语音数据 能够有效地传输和存储。 语音编码是当前数字通信通信系统中的一个研究热点,从它的发展 历史来看,总共可以分为3 种:波形编码,参数编码,以及混合编码。 波形编码具有适应能力强、语音质量好等优点,但对带宽要求较高;参 数编码实现了低速率语音编码,比特率可压缩到2 k b i t s 4 8 k b i t s ,但语 音质量较差。直到8 0 年代,语音编码技术有了实质性的进展,产生了新 、 一代的压缩编码算法一一混合编码。它结合了波形编码高质量和参数编 码低速率的优点,在4 16 k b i t s 速率上能够得到高质量的合成编码。 r p e l t p 算法属于第一种编码类型,它既克服了波形编码对带宽要求高 的缺点,又确保了较高的话音质量。本文主要针对第三代移动通信系统 t d - s c d m a 双模( l c r g s m ) 中g s m 模式下语音编码的相关标准与要 求,在对r p e l t p 算法的编码原理进行了深入研究和分析后,按照 r p e l t p 算法的编码流程有针对性地在实现环节作了重点研究和设计。 在这些工作的基础上,基于软件工程的相关原则,结合该算法本身的编 码过程,对其进行了模块划分,包括g s m 预处理及l p c 分析。短时分 析预测和长时预测,r p e 编码,以及解码器的设计与实现。等等。最后采 用了c 语言对其予以了实现。经过软件仿真与实际板测,取得了良好的 编码效果和较高的通话质量。 关键词:语音编码,g s m 标准,r p e l t p 算法 重庆邮电大学硕士论文 a b s 仃a c t a b s t r a c t t h es p e e c hi sm em d s ti i i l p 0 i t a n ts e c t i o ni l l l eh l l m a nc o l 瑚m u i l i c a 6 0 璐s a v i i l gc h 锄e l b a r l d w i d m 觚de i l l l a n c i n gc o n 丘d 锄t i a ll e v e la r ed e m 肌d o dc o n s t a n t l y 访m ew i r e l e 豁趾d s a t e l l i t ec o m m u l l i c a l i o n sf i e l d s ,a l m o u g hm ec h e a pw i d eb 锄d 丘b e 塔l l a l v eb e 肌p r e s c i l ti i lm e 、hc 0 删枷c 撕。璐丘e l d s a n di ti sat e n d 肌c ym a t 吐l e 印p l i c 撕o i l s 谢ms p e e c ha r e i 1 1 t e 鲥o di i l t op e 瑁d n a lc 0 m p u t e 稻锄dp o n ;a b l ec o m p u t e 璐,a n de s p e c i a l l yi 1 1 _ t om u l t i i i l o d i a c o 删m l i l i c a l i o 璐,s u c h 硒s p e e c he - m a i le t c t h ed i 百t a ls p c hi sd e m a n d e di i la l lo f 吐l o s e 印p l i c a d o 璐m a ti t c a i lb ep r o c e 豁e d s t o r e d 锄d 地m s p o r t e dv i a 小硼鹏t t l es p e c c h c o d i n gi sa p p l i e dr rr e d u c i i 培c o d i n gr a t eo f 印e e c hs i g n a l 趾ds t 0 五n g 锄d 位m s p o r t i r l g s p e e c he 任- e 出v e 耻 s p e c c hc c l d i n gi sah o t s p o t 如r 廿l ed i 百t a lc o m m u i l i c a t i o n 町哦锄sr 铬e a r c l lv i 响gm e d e v e l 叩m e n to fm es p e e c hc o d i l l 岛t l l e r ea r ea j l l 】嗍:c o d 硒gm e n l o d s :w a v e f 0 h nc o d i l l 吕 p a r a m e t e rc o l d i n g 锄l dm i ) 【e dc o d i i 培w r a v e 南r i i lc o l d i n gl m st h em e r i to fg o o da d a p t 撕o n a :b i l i n 髑a n ds p e e c hq u “d 鼯,e t c ,b mi t 玳;e d sl a 玛e rb 锄d 诵d m ;p a r a m e t e rc o d i l l ga c i l i e v 钨 l o wr g c es p c hc o d i l 唱,m eb i tr 如i s 间u c e dt 02 k b i 以_ 4 8 k b i 以,b u t l cs p e e c hq u a d i 够i s w o r s e t h es p e e c h c o d j n gt e c h n o l o g yi sd e v e l o p e dm 砒e r i a n x 锄dan e w g 朗e r a 6 0 nc o m p r e s s c o d i i 培a 1 9 0 打t 1 1 i i l ,i e r n 议e dc o d i n g ,i sd e v e l o p e di 1 1 硷l9 8 0 s n l ei n i ) 【e dc o d i i l gc o m b i n e s l em 甜to f 1 el l i g hq 陇l l i d 岱o fw a v e 白n i lc o d m g 觚dm a to fl o wr a t eo f p a r a m e t e rc o 血1 吕 锄d m eh i g l l 删i 够c 0 m p o c o d i i l g i s 溅e v e da t m e 豫t c o f 4 _ 1 6 k b i 佻i 冲e l t pa l g o 咖珊 i sm e 丘l 镦c o d i n gt y p e ,趾di to v 日c o m 销m ef 龇no fl a 玛e rb 锄d 、i d 1w l l i c hw a v e f o m l c o d i n gh 笛,锄dm e 即o e c hq u 乏i l i t yi s 母黝t e e da tn l es 锄劬e h lt i l i sp a p e rb 嬲e do n s p c 。c hc o 曲唱s t 暑l 删a n dd 锄锄do f g s m m o d cw l l i c hi so n em o d eo f m e 吐啪g e l l e m :t i o n m o b i l e 删u 1 1 i c a l i o ns y s t c i nt d s c d m ad o u b l em o d 铬( l c 刚g s m ) ,1 e 咖l e m 饥t 撕o n 9 瞅i o ni sr e s e a r c h e d 锄dd e s i 印e d 笛ak 妒p o n a c c 0 础n g 幻t 1 1 ec o d i i 唱n o wo fr p e u p a l g o r i m i i l a f i e r 吐玲c o d i l l gp 血c i p l eo fr p e - l 1 pa 1 剃t 1 1 1 1 1i ss t l 碰e d 觚da i l a l y z e d c o m b i n 吨m ca 1 9 0 r i m mc 0 i d i l l gn o wi t s e l m em o d u l ed i v i s i o ni sd o n e ,硫l 幽gg s m p 静p c 髓s i i l 岛l p c 锄a l y s i s ,s h o nt e 衄锄a l y s i sf i l t i e r i r l 吕l 0 n gt e 肌p r e d i c t i o 玛i 冲e c o d i n g ,e t c ,b 弱e do nm e 旬n 1 1 e rw o r ka n dm ep r i n c i p l eo ft h es o f t w a 坞饥舀n e e r m g t h e a l g o m mi si r l l p l e m e n t e db ycl 町唱u a g ei i lm e d 硼b f t w a r es i n l u l a d o na n dh a r d w a 坞 e ) ( p e 咖e n tp v em a tm e9 0 0 dc o d i l l g 豫u l to ft 1 1 ea l g o r i t l l mi s l l i e v e da n dt h es p e e c h q u a l i t yi s 昏捌僦e e d k e y ,o r d s :s p e 。c hc o d i n g ,g s ms t a i l d a m ,r p e - u 甲a 1 9 0 枷埘 i i 重庆邮电人学硕士论文 目录 目录 摘要i a b s n a c t i i 第一章绪论1 1 1 论文选题背景1 1 2 语音编码研究现状1 1 3l 冲e l t p 算法的发展现状2 1 4 论文主要工作3 1 5 论文组织结构3 第二章全速率语音编码原理5 2 1 语音的数字化5 2 2 全速率语音编码的原理6 2 2 1r p e l t p 算法的性能6 2 2 2r p e l t p 算法的编码过程7 2 2 3r p e l t p 算法的解码过程8 2 3 小结9 第三章全速率语音编码的预处理及l p c 分析1 0 3 1 预处理的原理与作用1 0 3 1 1 偏移补偿1 0 3 1 2 预加重1 0 3 1 3 实现1 1 3 2 预处理设计说明1 1 3 3 线性预测分析1 2 3 3 1l p c 分析的过程。1 3 3 3 2 反射系数对数面积比的量化和编码1 4 3 3 3l p c 分析设计说明1 6 3 4 小结2 3 第四章短时分析滤波与长时预测2 4 4 1 短时分析原理及处理过程2 4 4 2 短时分析滤波的具体设计2 5 4 2 1 短时分析滤波的主调函数。2 6 4 2 2 对数面积比的解码2 8 4 2 3 内插对数面积比。2 8 i i i 重庆邮电大学硕士论文 目录 4 2 4 对数面积比转换成反射系数2 9 4 2 5 短时分析滤波函数3 0 4 3 长时预测分析原理及处理过程3 1 4 4 长时预测模块的研究与设计3 3 4 4 1 主要功能函数3 4 4 4 2 长时预测参数的计算函数3 4 4 4 3 长时分析滤波函数3 6 4 5 小结3 7 第五章r p e 编码3 8 5 1i 冱p 编码的处理过程3 8 5 1 1 加权滤波器3 8 5 1 2 基于i 冲e 坐标选取的自适应取样3 9 5 1 3 被选取的r p e 序列的a p c m 量化3 9 5 1 4 a p c m 反量化与l 冲e 坐标定位3 9 5 2r p e 编码的研究与设计4 0 5 2 1 主调函数4 0 5 2 2 加权滤波器4 1 5 2 3r p e 相位选择函数4 2 5 2 4 指数和尾数计算函数4 4 5 2 5a p c m 量化器4 4 5 2 6a p c m 逆量化器4 6 5 2 7r p e 相位恢复函数4 7 5 3 小结4 7 第六章解码器的设计与实现4 8 6 1r p e 解码4 9 6 1 1r p e 解码的原理4 9 6 1 2 长时合成4 9 6 2 解码端的长时预测5 l 6 3 短时合成滤波5 1 6 3 1 处理过程5l 6 3 2 实现描述51 6 4 语音信号的后处理5 3 6 4 1 处理过程5 3 6 4 2 模块描述。5 4 i v 重庆邮电大学硕士论 6 5 小结5 4 第七章仿真与实验。5 5 7 1 软件仿真5 5 7 2 实际板测5 7 7 3 小结5 8 第八章总结及未来的工作5 9 8 1 总结5 9 8 2 未来的工作5 9 蜀l 谢6 0 攻读硕士期间从事的科研工作及取得的研究成果6 l 参考文献6 2 v 重庆邮电大学硕士论文 第一章绪论 1 1 论文选题背景 第一章绪论 随着我国第三代移动通信系统t d s c d m a 大规模商用的逐步展开, t d s c d m a 和g s m 双模系统作为充分利用现有网络资源的有效手段, 其对语音编码技术也提出了更高的要求。r p e l t p 算法是一种经典的语 音编码算法,在第二代g s m 移动通信系统中得到了广泛的应用。而在 t d s c d m a 和g s m 的双模系统中,它仍然是g s m 模式下进行语音编码 处理的关键技术。本文正是在这一背景下,依托本人所参与的实验室( 重 邮信科3 g 研究院) 项目( t d s c d m al c r g s m 双模协议栈软件包,国 家科技型技术创新基金项目) ,参照g s m 语音编码标准,对r p e l t p 编 码算法的编码原理及过程进行了详细深入的研究。针对r p e l t p 语音编 解码算法自身的特点,以及t d s c d m a 和g s m 双模系统对语音编码的 特殊要求的基础上,本文有重点地认真分析和研究了它的实现过程,然 后依据软件工程的一系列优化原则对其进行了模块划分,并予以代码实 现,这些都为这一经典算法在下一代移动通信系统中的进一步应用打下 了良好的基础。 1 2 语音编码研究现状 随着信息技术的发展,作为主要通信方式之一的话音通信不断向数 字化方向发展。为了提高通信容量和质量,对话音编码提出的要求也越 来越高。不仅要求低码率、低延迟,而且要求有很高的话音质量。先进 的语音压缩编码的目标就是在尽可能低的比特率下,最大限度地提取语 音信号的特征信息,在接收端恢复尽可能清晰自然的语音。现在主要的 编码方法分为波形编码、参数编码和混合编码三种。其中,波形编码和 参量编码是两种基本类型。波形编码是将时间域信号直接变换为数字代 码,力图使重建语音波形保持原语音信号的波形形状。波形编码的基本 原理是在时间轴上对模拟语音按一定的速率抽样,然后将幅度样本分层 量化,并用代码表示。解码是其反过程,将收到的数字序列经过解码和 滤波恢复成模拟信号。它具有适应能力强、语音质量好等优点,但所用 重庆邮电人学硕士论文 第一章绪论 的编码速率高,在对信号带宽要求不太严格的通信中得到应用,而对频 率资源相对紧张的移动通信来说,这种编码方式显然不合适。脉冲编码 调制( p c m ) 和增量调制( m ) ,以及它们的各种改进型自适应增量调 制( a d m ) ,自适应差分编码( a d p c m ) 等,都属于波形编码技术。它 们分别在6 4 以及16 k b i t s 的速率上,能给出较高的编码质量,当速率进 一步下降时,其性能会下降较快。与波形编码不同,参量编码又称为声 源编码,是将信源信号在频率域或其它正交变换域提取特征参量,并将 其变换成数字代码进行传输。解码为其反过程,将收到的数字序列经变 换恢复特征参量,再根据特征参量重建语音信号。具体说,参量编码是 通过对语音信号特征参数的提取和编码,力图使重建语音信号具有尽可 能高的可靠性,即保持原语音的语意,但重建信号的波形同原语音信号 的波形可能会有相当大的差别。这种编码技术可实现低速率语音编码, 比特率可压缩到2 k b i t s 4 8 k b i t s ,甚至更低,但语音质量只能达到中等, 特别是自然度较低,连熟人都不一定能听出讲话人是谁。线性预测编码 ( l p c ) 及其它各种改进型都属于参量编码。计算机的发展为语音编码 技术的研究提供了强有力的工具,大规模、超大规模集成电路的出现, 则为语音编码的实现提供了基础。8 0 年代以来,语音编码技术有了实质 性的进展,产生了新一代的编码算法,这就是混合编码。它将波形编码 和参量编码组合起来,克服了原有波形编码和参量编码的弱点,结合其 各自的长处,力图保持波形编码的高质量和参量编码的低速率,在 4 16 k b i t s 速率上能够得到高质量的合成语音。多脉冲激励线性预测编码 ( m p l p c ) ,规划脉冲激励线性预测编码( r p e l p c ) ,码本激励线性预 测编码( c e l p ) 等都是属于混合编码技术。很显然,混合编码是适合于 数字移动通信的语音编码技术。 研究高性能的语音压缩编码方式是目前语音编码领域的研究热点之 1 3r p e l t p 算法的发展现状 r p e - l p c ( r e g u l a rp u l s ee x c i t a t i o n - l p c ) 是由e d f d e p r e t t e r e 和 p e t e rk r o o n 在19 8 5 年i e e ei c a s s p 年会上首先提出来的。19 8 6 年k h e l l i n gr h o j m a n n 和p w a r yr j s l u y t e r 等人在p k r o o n 提出的规则 脉冲激励编码的基础上,将它简化成实时算法,并用3 片d s p 芯片 ( m p d 7 7 2 0 ) 实现了编译码器,编码速率是l6 k b i t s 。以后他们与 2 重庆邮电大学硕士论文 第一章绪论 c ,g a l a n d ,m r o s s o 等人合作改进算法,加入了长时预测规则脉冲激励 ( l o n gt e r mp r e d i c t i o n l t p ) ,并使速率降为1 3 k b i t s ,形成了长时预测 规则脉冲激励( r p e l t p ) 编码方案。它的特点是算法简单,语音质量 达到通信等级,r p e l t p 在19 8 8 年被确定为泛欧标准全速率语音编码方 案,称为g s m 标准。 规则脉冲激励一长时预测编码器本质上是一种前向线性预测编码 器。它用一组间距相等、相位与幅度优化的规则脉冲代替余量信号,以 便使合成波形尽量接近原始语音信号。在g s m 方案中,直接用余量信 号的3 :1 抽取序列作为规则码激励信号,认为几个可能的3 :1 抽取序 列中能量最大的一个对原始语音波形产生贡献最大,其它样点的作用较 小可忽略。这就使要传送的余量信号样点数压缩了2 3 ,大大降低了编码 速率,同时这种算法非常简单,硬件便于实现。因此,在第二代移动通 信系统g s m 系统中,r p e l t p 语音编码算法得到了广泛的使用,这也使 得r p e l t p 算法成为目前应用最为成熟的语音编码方案之一。 1 4 论文主要工作 首先对语音编码的原理,特别是r p e l t p 算法的编码原理及其编解 码的过程作了认真、深入的研究,对它的整个编码特点进行了详细的分 析,同时还重点地在实现环节上对其予以研究,在此基础上结合软件工 程的原则对其进行了创新性的模块划分,对每一主要模块的接口、输入 输出参数、内部流程以及与其他模块的调用关系等关键部分都给予了详 细的说明。最后使用c 语言对其予以初步的实现,使其具有基本的语音 编解码功能。在实验室硬件组相关人员的配合与协助下,对实现的代码 进行了实际的板测以及人耳的主观测试,取得了较好的通话效果。当然, 由于时间所限,所实现的一些模块还需要进一步的优化和改进,以进一 步提高其编码效率。这也将是本论文下一步工作的一个重点。 1 5 论文组织结构 本文除了中英文对照的摘要外,全文共分八章。第一章是绪论,主 要是简单叙述论文的选题背景与意义,语音编码( 包括r p e l t p 算法) 的编码原理与发展现状,等等:第二章详细介绍了第二代移动通信系统 g s m 系统中所使用的全速率语音编码原理以及实现时的整个过程,为剩 重庆邮电大学硕士论文第一章绪论 下的章节作准备。从第三章一直到第五章,分别介绍和研究了r p e l t p 语音编码算法的整个实现过程中涉及到的每个主要模块,包括每个模块 的输入输出参数,与其他模块的调用关系,内部的详细流程,接口的返 回参数,所使用的存储空间及其他硬件要求,等等。第六章研究和讨论 了整个解码过程。由于解码过程与编码过程大体相反,并且解码器中所 用到的大多数模块与编码器相同,在文章的前面都已经有了详细的说明 和研究,因此解码过程的描述较为简单,只是把解码时单独涉及到的几 个模块放在一起作了介绍。第七章主要是对前面工作成果的测试。针对 话音编码的特殊性,测试分为两个步骤完成,即软件仿真测试与实际板 测( 主观测试) 。第八章总结了全文的工作,并对文中待解决的问题提出 了认真的思考,以及下一步的工作重点,为后期的研究作准备。 4 重庆邮电大学硕士论文 第二章全速率语音编码原理 第二章全速率语音编码原理 2 1 语音的数字化 在进行语音信号数字处理时,最先接触到并且也是最直观的是它的 时域波形。为了获取一段语音信号的时域波形,首先将语音用话筒转换 成电信号,再经a d 变换成为离散的数字化采样信号并存储在计算机内 存中,将此信号取出,用绘图仪或绘图软件即可描绘成时域波形。其中, l p f 为反混叠滤波( 或低通滤波) 。因为是先滤波,后作a d 转换,所以 这里的l p f 是模拟滤波器【。 语音处理功能结构图如图2 1 所示: t x d 1 ) ( 处理器 发送端 l 话音活性检测 枸 i 8 比特a 律到 | 一 f d t x 1 3 比特线性码 i 诿喜曲 控制 lb s s 侧 中 - - 语音编码器叫胁 | 和 操作 lp 1 互捆 i s l d 帧 l m s 侧 背景噪声估计_ 污、卜_ 一 二 信特 、 i 帧替代和弱化 , i 例日。1 - - 。_ _ _ _ _ _ i l i到8 比特a 律i i 二乏至兰一语音三码器卜_电 b s s 侧 嗍 , 控制 i 和 卜- _ s i u 。n 毗lo 一匝卜刚l 操作 f , 弋i ) - 叫舒适噪声生成 m s 侧 图2 1语音的数据化处理框图 重庆邮电大学硕士论文第二章全速率语音编码原理 ( 1 ) 8 位a 律p c m 码( c c i t tg 7 1 l 建议) ,抽样率为8 k h z ; ( 2 ) 13 位线性p c m 码,抽样率为8 k h z ; ( 3 ) v a d :话音活性检测标志,指示当前帧包含语音还是噪声; ( 4 ) 编码的语音帧,每帧2 0 m s ,2 6 0 b i t s ,速率为13 kb i t s ; ( 5 ) 静默描述帧( s i d ) ,即传输背景噪声参数的帧,每帧2 0 m s , 2 6 0 b i t s ,速率为1 3 kb i t s : ( 6 ) s p :话音标志,指示当前帧是有效语音帧还是s i d 帧; ( 7 ) 送到无线子系统的信息比特,2 6 0 比特; ( 8 ) 收自无线子系统的信息比特,2 6 0 比特; ( 9 ) b f i :坏帧标志,指示帧信息是否包含有效信息;( 如果损坏,则 进行帧替换) ( 1 0 ) s i d :静默描述帧标志。 ( 1 1 ) r a f :时间调整标志,表明s i d 帧在s a c c h 复帧中的位置。 2 2 全速率语音编码的原理 2 2 1r p e l t p 算法的性能 全速率语音编码( 即r p e l t p 算法) 已经在g s m 移动通信系统中 得到广泛使用。这是一种加入了长时预测的规则脉冲激励编码技术,其 特点是算法简单,语音质量较高( 达到通信等级) ,被确定为泛欧标准全 速率语音编码方案( 称为g s m 标准) 。它本质上是一种前向线性预测编码 器。它用一组间距相等,并且相位与幅度均已优化的规则脉冲代替余量 信号,以便使合成波形尽量接近原始语音信号。在实际使用中,我们直 接用余量信号的3 :1 抽取序列作为规则码激励信号,认为几个可能的3 : l 抽取序列中能量最大的一个对原始语音波形产生贡献最大,其它样点 的作用较小可忽略。这就就使得要传送的余量信号样点数得到很大程度 上的压缩( 压缩了2 3 ) ,大大降低了编码速率,同时这种算法非常简单, 硬件便于实现【2 】。 r p e - l t p 算法的编码净比特率为1 3 k b i t s ,加上信道抗误码编码后为 2 2 8 k b i t s ,当再加上其它信息码及保护间隔,信道传送速率为每话路 2 4 7 k b i t s 。其主观平均评分( m o s ) 达3 8 。g s m13 k b i t s 编译码方案抗 误码性能较好,编译码延时约为3 0 m s ,再加上信道编码及其它一些处理, 6 重庆邮电大学硕士论文第二章全速率语音编码原理 总延时约为8 0 m s 。r p e l t p 算法的优点在于运算量小。虽然它的码率较 高( 为13 k b i t s ) ,高于目前研究中的高质量低码率语音编码方案,但其 易于集成且实现的计算量较小,使它成为数字蜂窝移动通信标准的一种 优选编码方案【3 1 。 2 2 2r p e l t p 算法的编码过程 从整体上看,编码器分为五个组成部分,依次是预处理,l p c 分析, 短时滤波分析,长时预测和规则脉冲激励序列编码五个模块。 首先,输入的语音帧数据( 其由16 0 个信号取样点组成) 被送入预 处理模块,经过预处理产生一个无偏置信号,然后将它送入一阶预加重 滤波器,结果用来分析确定短时分析滤波器的系数。用这些系数构造逆 滤波器,滤波16 0 个信号取样点得到16 0 个点的短时残差信号。滤波器 参数( 反射系数) 变换成反射系数对数面积比删船。 在接下来的处理过程中,语音帧被分成4 个子帧,每个子帧包含4 0 个短时残差信号值。在对子帧处理之前,先根据当前子帧和以前的l2 0 个短时重构残差信号,估计和修改l t p 分析块中的长时分析滤波参数、 l t p 延迟和l t p 增益。4 0 个长时残差信号可以通过从短时残差信号中减 去4 0 个短时残差信号的估值得到,然后经过规则脉冲激励分析,由规则 激励分析完成r p e l t p 算法的基本压缩功能。r p e 分析的结果是,4 0 个长时残差输入被4 个13 脉冲长的候选子序列中的一个代替,子序列的 选择由r p e 的坐标位置来确定,对入选的子序列将采用自适应脉冲编码 调制( a p c m ) 算法进行编码,而幅度估值也将作为解码的边信息伴随 着其他信息一起被发送至解码端【4 1 。 同时,r p e 参数还将被传送给本地的r p e 解码和重构模块,产生一 个长为4 0 个样点的长时重构信号的量化值。将它与前一块的短时残差信 号估值相加,得到当前短时残差信号重构值。重构短时残差信号值送到 长时分析滤波器中,产生一个新的4 0 点短时残差信号供下一子帧使用, 从而最终完成环路反馈。 r p e l t p 语音编码算法的编码过程如图2 2 所示: 7 重庆邮电大学硕士论文 第二章全速率语音编码原理 预处理 l p c 分析t 熟波 长时预测 r p e 编码 斗信号 输出参数 图2 2 r p e l t p 语音编码器框图 2 2 3r p e l t p 算法的解码过程 r p e - l t p 算法解码部分的处理流程如图2 3 所示【5 】: r p e 解码 长时预测 短时综合后处理 滤波 信号 输入参数 图2 3 语音解码器框图 由上图可以看出,解码器主要由四个部分组成:r p e 解码、长时预 8 重庆邮电大学硕士论文 第二章全速率语音编码原理 测、短时合成滤波、后处理。大部分子模块算法已在编码器中作了详细 描述,只有短时合成滤波和后处理作为新模块加到解码器中。 解码器的结构基本上与编码部分的反馈环相同,用语音码重构短时 残差信号,然后依次将它送到短时合成滤波器和去加重滤波器中,最后 得到重构的语音信号并输出。 2 3 小结 本章认真分析了r p e l t p 算法的编码性能,以及该算法的编码过程 与相应的解码过程,并分别给予了详细的流程框图,为后续章节的研究 与实现提供了较为清晰的思路和参考。 后面的章节将陆续对这几个模块的处理过程和实现细节展开深入的 分析和研究,同时设计并给出每一模块的流程图,从而为最后的代码实 现作准备。 9 重庆邮电大学硕士论文第三章全速率语音编码的预处理及l p c 分析 第三章全速率语音编码的预处理及l p c 分析 3 1 预处理的原理与作用 在对语音信号进行数字分析处理之前,必须先进行语音信号的预处 理。预处理包括模拟语音的抗工频干扰、反混叠滤波、模数转换、去均 值及高频预处理。其中,抗工频干扰、反混叠滤波、模数转换由一块a d 芯片完成,数字信号处理的去均值和高频预加重由编码器来完成【6 】。 预处理是整个语音编解码器所有工作的第一步,也是整个编码器五 个模块中的第一个模块。其功能较为单一,但作用非常重要,主要处理 当原始语音信号中出现非零均值或非常低的低频噪声时所引起的麻烦, 这将直接影响整个后续编解码工作的成败。在本文中,根据它所需完成 的任务将其划分为两个主要的子模块,即偏移补偿和预加重。 3 1 1 偏移补偿 首先,用8 k h z 采样率对输入语音进行采样,从而得到原始语音信号 o ) 。其次,由于当语音信号中有非零均值或非常低的低频噪声出现时, 对于安静语音或低幅度清音较为麻烦【7 1 。因此,移去输入信号( n ) 中的 偏移,以产生一个无偏移信号品,( 刀) 。此处采用了陷波滤波器进行偏移补 偿,其算法如下: ,( 尼) = ( 尼) 一( 七一1 ) + 口勿砌- r ( 七一1 ) ,。 口勿砌:3 2 7 3 5 2 。l s 1j 偏移补偿实际上就是一个去均值的过程,其目的是滤除语音信号的 直流成分,从而产生无直流信号。由于该过程较为简单,此处不再赘述。 3 1 2 预加重 采用一阶f i r 滤波器进行高频预加重,得到信号j ( 刀) 。在a d 变换 后信号通过一个预加重数字滤波器,其目的是要提升高频部分,从而使 语音信号的频谱变得平坦,便于进行频谱分析或者声道参数分析【8 1 。预 加重过程如下: l o 重庆邮电大学硕士论文第三章全速率语音编码的预处理及l p c 分析 j ( 七) 。,( 七) 一6 p 砌水,( 七一1 ) ( 3 2 ) 6 p f 口:2 8 1 8 0 2 1 5 经过上述的预加重处理之后,语音信号的频谱已经变得较为平坦, 也使得接下来的l p c 分析变得更为方便。 3 1 3 实现 可以用一块a d 芯片实现信号的放大及增益控制,并完成抗混叠滤 波和模数转换等工作。然后编码器对由a d 之后得到的13 b i tp c m 线形 码信号( 已经是数字语音) s ( 刀) 进行去均值和高频预加重【9 1 。 3 2 预处理设计说明 预处理是整个编解码器的第一个过程,也是必不可少的一个重 要组成部分。它接受原始语音的16 0 个样点,从而产生并输出同等长度 的、已经经过处理的语音数据( 这些数据将供下一处理模块即l p c 分析 模块使用) 。 预处理模块功能虽然较为简单,但却是整个语音处理的一个必不可 少的重要环节,其效果将直接影响到语音编解码的整体质量,以及最后 合成语音的主观听觉。 预处理主要包括偏移补偿和预加重两个部分,而由于这两项功能都 较为简单,故本文将设计一个主要的功能函数( 其函数名在文中被设为 g s mp r e p r o c e s s ) 来执行这两项功能。编码端的主函数首先从语音文件 中读取l6 0 个原始语音样点,然后调用编码器的数据发送模块,数据发 送模块将编码数据发送至编码主函数,以便对16 0 个语音样点数据进行 编码,而编码主函数对语音进行编码的第一步就是调用预处理模块,以 完成对这16 0 个原始语音信号的预处理,完成后将得到的处理结果传给 下一模块。 原始语音s o 1 5 9 经过预处理后将被传入l p c 分析模块,以便供其 进一步处理。 另外,本文图中所涉及到的变量,函数名,接口参数等相关定义在 本文的需求分析与设计等阶段所产生的文档中已有详细说明,文中将不 再一一描述。 该模块完整的流程图如图3 1 所示: 重庆邮电大学硕士论文 第三章全速率语音编码的预处理及l p c 分析 3 3 线性预测分析 图3 1 预处理程序流程图 线性预测分析( l p c ) 的基本思想是,语音信号的每个取样值都能 够用过去若干个取样值的线性组合来逼近。通过使实际语音取样值和线 1 2 重庆邮电大学硕士论文第三章全速率语音编码的预处理及l p c 分析 性预测值之间的均方误差最小,来决定唯一的一组预测器系数。这里的 预测器系数就是线性组合中所用的加权系数【l0 1 。线性预测分析是目前进 行语音信号分析最有效和最流行的技术之一。它提供了一组简洁的语音 信号模型参数,这组参数比较准确地表达了语音信号的频谱幅度,而计 算量并不大。当线性预测分析技术用于语音编码时,利用模型参数可有 效地降低编码比特率。 3 3 1l p c 分析的过程 线性预测的关键就是要求出预测器的系数,在理论上需要求解下面 的方程组【1 1 】: 彳c f ( ) 一 彳凹( o ) 一 凹( _ ,一f ) = o l _ ,p( 3 3 ) c f ( f ) = 式中,e 。是正向预测误差功率,也可理解为误差的能量, 彳c f ( f ) ( f = o ,1 ,8 ) 即是待分析语音信号s ( 刀1 的自相关序列。为了求得预测 器的系数,必须首先算出彳c f ( f ) ( f = o ,1 ,8 ) 。一旦算出彳c f ( f ) ,则只要求 出上面的方程组就可以求出系数口,和e 。因此,从原理上说,线性预测 分析是非常直截了当的,但是,计算自相关序列彳c f ( f ) 是个比较复杂的 问题,这是因为求自相关序列涉及到集合平均,不好处理。而对于平稳 遍历的随机信号,通常可以用时间平均来代替集合平均。由于语音信号 具有短时平稳性,因此,为了便于工程上的计算和实现,我们可以从一 段语音信号序列来估计自相关序列彳c f ( f ) ( f = o ,1 ,8 ) ,从而计算出相应的 预测系数1 2 】。所以语音信号线性预测分析一般是按帧进行,每帧的长 度可取1o 3 0 m s 之间。在r p e l t p 算法中每帧长度取为2 0 m s 。 l p c 分析将语音信号j ( 胛) 的每l6 0 个样点( 2 0 m s ) 分为一帧,每帧 计算出8 个l p c 反射系数,( f ) ( 江l ,2 8 ) ,这里反射系数,( f ) ( 江1 ,2 8 ) 的变 化范围为一l ,( f ) l 。计算的步骤是先计算出s ( 刀) 的前9 个自相关函数 彳c f ( f ) ,其中, 9 彳c f ( f ) = s ( 以) s ( 刀一f ) f = o ,1 ,8 ( 3 4 ) 一- , 然后用s c h u r 迭代算法计算出前8 个反射系数,( f ) ,再转换成对数面 重庆邮电大学硕士论文 第三章全速率语音编码的预

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论