(电子科学与技术专业论文)基于dsp的g729语音编码的研究与实现.pdf_第1页
(电子科学与技术专业论文)基于dsp的g729语音编码的研究与实现.pdf_第2页
(电子科学与技术专业论文)基于dsp的g729语音编码的研究与实现.pdf_第3页
(电子科学与技术专业论文)基于dsp的g729语音编码的研究与实现.pdf_第4页
(电子科学与技术专业论文)基于dsp的g729语音编码的研究与实现.pdf_第5页
已阅读5页,还剩63页未读 继续免费阅读

(电子科学与技术专业论文)基于dsp的g729语音编码的研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕十学位论文 a b s t r a c t g 7 2 9s p e e c hc o d ei sp a s s e di n19 9 6b yi t u tb a s e do nc e l pm o d e sw h i c hu s e c o n ju g a t es t r u c t u r ea l g e b r a i cc o d ee x c i t e dl i n e a rp r e d i c t i o na l g o r i t h mt e c h n o l o g y i so n eo ft h em o s te f f i c i e n c yc o m p r e s s i o na l g o r i t h mo fc o d i n gr a t ea n ds y n t h e t i c s p e e c hq u a l i t y i tc a nb ew i d e l yu s e di nt h ef i e l do fi n d i v i d u a lm o b i l e c o m m u n i c a t i o n ,m u l t i m e d i ac o m m u n i c a t i o n ,i pp h o n e ,s a t e l l i t ec o m m u n i c a t i o n , i s d na n ds oo n b u ti ti sd i f f i c u l tt or e a l i z ei nr e a lt i m eb e c a u s eo ft h eh i g h a l g o r i t h m i cc o m p l e x i t y w i t ht h er a p i d l yd e v e l o p i n go fd s pt e c h n o l o g yi nr e c e n t d e c a d e s ,t h ec o m p u t a t i o n a lc a p a b i l i t yo ft h ec h i pi sg r a d u a l l yi m p r o v e ,a n dt h ec h i p c o s ti sr e d u c e d ,s ot h ed s ph a sb e c o m et h em a i nt o o l si nt h ef i e l do fs p e e c hs i g n a l p r o c e s s i n gg r a d u a l l y ,a n dm a k ei tb e c o m ep o s s i b l et or e a l i z et h em o r ec o m p l e x c o d e ca l g o r i t h mi nas i n g l e c h i p a tt h es a m et i m et h ea l g o r i t h mc a nb ee a s i l y u p d a t e d ,t h u sm a k e si tc a nb eu p d a t et h ef u n c t i o nw i t h o u tr e p l a c et h eh a r d w a r e t h i sp a p e ri n t r o d u c e dt h ea l g o r i t h ms t r u c t u r eo fg 7 2 9 ,i n c l u d i n gp a r to fe n c o d e a n dd e c o d e ,i tp u te m p h a s i so ns o m ek e yt e c h n o l o g i e so fg 7 2 9a l g o r i t h ms u c ha s l i n e a r - p r e d i c t i o n ,p e r c e p t u a lw e i g h t i n gv e c t o rq u a n t i z a t i o n ,a d a p t i v e c o d e b o o k s e a r c ha n df i x e d c o d e b o o ks e a r c h a n dd e s c r i b et h es t r u c t u r ea n dt h ew o r kt h e o r y o ft h et m s 3 2 0 v c 5 4 0 2d s p o nt h i sb a s i st h es y s t e mo fh a r d w a r ei s p r e s e n t e d , f o c u s e do nt h eo p t i m i z a t i o nm e t h o do ft h ec o d e ,u s et h ecs o u r c ec o d ep r o v i d e db y i t u t ,o p t i m i z e s t h e l a r g e ro p e r a t i o n a lq u a n t i t ym o d u l e so ft h es o u r c e c o d e d e s c r i b e dh o wt om a k et h eh a r d w a r ea n ds o f t w a r es y s t e mw o r ka saw h o l et o c o m p l e t et h er e a l t i m et e s t t h et e s ta b o u tt h eo p t i m i z e dc o d es h o w st h a t ,t h er e s u l t i s c o r r e c t ,t h es y n t h e s i z e ds p e e c hh a sb e t t e ri n t e l l i g i b i l i t y ,c o m p u t i n gd e l a yi s s m a l l e rt h a nt h a tt h er e q u i r e dm i n i m u md e l a yt i m e i tc a nb ei m p l e m e n t a t i o no n t m s 3 2 0 v c 5 4 0 2i nr e a l t i m e t h i sp r o v i d e sag o o dh e l pf o rt h ea p p l i c a t i o no fg 7 2 9 o nl o wp r i c e ,l o wp o w e r c o n s u m p t i o nd s p s k e yw o r d s :g 7 2 9 ;s p e e c hc o d i n g ;d s p ;c e l p ;m i xp r o g r a m i i i 湖南大学 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所 取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任 何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡 献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的 法律后果由本人承担。 作者签名: 铆曩日期:杪7 年夕月5 9 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意 学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文 被查阅和借阅。本人授权湖南大学可以将本学位论文的全部或部分内容编 入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇 编本学位论文。 本学位论文属于 1 、保密口,在年解密后适用本授权书。 2 、不保密酿 ( 请在以上相应方框内打“、”) 作者签名: 鸟,望日期:伽哆年y 月? 拥 聊签名:l 弘渴日期:力夕吵年) 月弘日 硕十学位论文 1 1 语音信号概述 第1 章绪论 语言是从千百万人的言语中概括总结出来的规律性的符号系统,是人们进行 思维、交际的形式。语言是人类特有的功能,它是创造和记载几千年人类文明史 的根本手段,没有语言就没有今天的人类文明。语音是语言的声学表现,是声音 和意义的结合体,是相互传递信息的最重要的手段,是人类最重要、最有效、最 常用和最方便的交换信息的形式。 语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科, 它是一门新兴的学科,同时又是综合性的多学科领域和涉及面很广的交叉学科, 是目前极为活跃和热门的研究领域。虽然从事这一领域研究的人员主要来自信号 与信息处理及计算机应用等学科,但是它与语音学、语言学、声学、认知科学、 生理学、心理学等许多学科也有非常密切的联系,是目前发展最为迅速的信息科 学研究领域中的一个,其研究涉及一系列前沿课题,且处于迅速发展之中,其研 究成果具有重要的学术及应用价值。语音信号处理需要有两个方面的知识作为基 础,除了数字信号处理外,还有语音学。语音学是研究言语过程的一门科学,它 包括三个研究内容:发音器官在发音过程中的运动和语音的音位特性;语音的物 理属性;以及听觉和语音感知。 目前对语音信号均采用数字处理,这是因为数字处理与模拟处理相比具有许 多优点。其表现为:( 1 ) 数字技术能够完成许多很复杂的信号处理工作;( 2 ) 通 过语音进行交换的信息本质上具有离散的性质,因为语音可以看作是音素的组 合,这就特别适合于数字处理;( 3 ) 数字系统具有高可靠性、廉价、快速等特点, 很容易完成实时处理任务;( 4 ) 数字语音适于在强干扰信道中传输,也易于进行 加密传输。因此,语音信号的数字表示是进行语音信号数字处理的基础【1 ,2 1 。 语音信号数字化的理论依据是我们熟知的采样定理,即只要采样频率足够 高,就可以用时域上周期取样的样点来表示一个带限信号。语音信号的离散表示 基本上可以分为两大类:波形表示和参数表示。波形表示仅仅是通过采样和量化 的过程保存模拟语音信号的“波形 ,而参数表示则是把语音信号表示成某种语 音产生模型的输出。为了得到参数表示,首先必须对语音进行采样和量化,然后 再进一步处理以得到语音产生模型的参数。语音模型的参数一般可分为两大类: 一类是激励参数;另一类是声道参数;如图1 1 所示。 基于d s p 的g 7 2 9 语音编码的研究1 j 实现 图1 1 语音信号的表示 1 2 语音编码技术的发展概况 语音压缩编码是语音数字处理最重要的一种应用。语音压缩编码的目的是 用尽可能低的比特率来获得尽可能高的合成语音质量。实现语音压缩编码( 特别 是中低速率) 的设备通常称为声码器。虽然光纤通信和微波通信等系统可以提供 很宽的频带,但在很多情况下仍然需要压缩语音编码速率以节省频带。一方面压 缩编码后可以在有限带宽的信道上传输多路语音,提高信道的利用率;另一方面 可以在窄带的模拟信道( 如短波) 上传输数字语音。特别是在军事通信系统等需 要复杂加密的应用场合,声码器具有不可替代的作用。此外,语音的数字存储、 语音应答等也是语音压缩编码的重要应用。在语音压缩编码技术中,线性预测、 矢量量化、码本激励等是最重要的集中实现技术。根据语音压缩编码的采样率, 可以分为窄带( 电话带宽3 0 0 3 4 0 0 h z ) 语音压缩编码、宽带( 7 k h z ) 语音压缩 编码和2 0 k h z 的音乐带宽压缩编码。窄带语音编码的采样率通常为8 k h z ,一般 应用于语音通信中。宽带( 7 k h z ) 语音压缩编码的采样率通常为1 6 k h z ,一般 用于要求更高音质的应用中,如会议电视。而2 0 k h z 宽带主要是适用于音乐数 字化,采样率高达4 4 1 k h z 。 18 7 4 年电话的发明可以认为是现代语音通信的开端。电话的理论基础是尽 可能不失真地传送波形,这种“波形原则”几乎统治了整整一百年。语音编码技 术的研究始于19 3 9 年,贝尔实验室的h o m e rd u d l e y 提出了一种全新的语音信 号传输方法,并研制成功了第一个声码器。这种声码器为减少语音信号中存在的 冗余,打破了语音信号原有的内部结构,以提取负载信息的参量加以传输,并用 这些参量在接收端重新合成语音,从而提出了v o c o d e r 的概念,这一技术包含了 其后出现的语音参数模型的基本思想,在语音信号处理领域具有划时代的意义。 4 0 年代后期,研制成功了将语音信号的时变谱用图形表示出来的仪器语谱仪, 为语音信号分析提供了一个有力的工具。语谱仪的研制成功对声学语音学的发展 曾经起过很大的推动作用。在语音信号分析研究的基础上,电话通信技术得到了 2 硕士学位论文 很大的发展,同时也开展了人机自然语音识别器。进入6 0 年代,语音信号处理 的研究工作取得了新的进展,其主要标志是1 9 6 0 年瑞典科学家f a n t 的著名论文 语音产生的声学理论的发表,它为建立语音信号数字模型奠定了基础。另一 方面,数字计算机的应用得到了推广。特别重要的是6 0 年代中期数字信号处理 的技术和方法取得了突破性进展,其主要标志是快速傅立叶变换算法的成功应 用。语音编码技术是伴随着语音的数字化而产生的,目前主要应用在数字语音通 信领域。语音压缩编码的目的是用尽可能低的数码率获得尽可能好的合成语音质 量,同时又使要编码过程的计算代价尽可能小,降低数码率的实质就是压缩频带 宽度,使得同一信道容量能传输更多路的信号,如果用于存储则只需较小的存储 容量;数码率低意味着算法的复杂度增加,延迟变大。所以语音压缩编码算法的 研究一直是在这个矛盾中向前发展。目前语音编码主要分为三类:波形编码、参 数编码和混合编码。直至7 0 年代中期除了p c m ( 脉冲编码调制) 和a d p c m ( 自 适应差分脉冲编码调制) 取得较好进展之外,中低比特率语音编码技术一直没有 大的突破。近些年来无线领域的个人用户量的快速增长以及v o l p 、卫星通信的 发展又一次掀起了语音编码的研究热潮。近几十年来,语音编码技术发展非常迅 速。以窄带语音编码为例,自2 0 世纪7 0 年代推出6 4 k b s p c m 语音编码国际标 准以来,已相继有3 2 k b sa d p c m ,16 k b sl d c e l p ,8 k b sc s a c e l p 等国际 标准推出。而地区性或业务性的标准也有不少,如第二代移动通信系统中的语音 编码,美国国防部制定的4 8 k b s 和2 4 k b s 保密电话标准等。 目前,在2 4 k b s 以上的编码速率,合成语音质量己得到人们的认可,并已 广泛应用。未来的研究重点是突破2 4 k b s 以下极低速率的语音编码技术和算法。 二十世纪八十年代后期,综合波形编码和参数编码的混合编码算法成为主 流,这种算法也假定了一个语音产生模型,但同时又使用与波形编码相匹配的技 术将模型参数编码,吸收了两者的优点。所谓混合编码有两层含义:激励的混合, 达到更精确的表示残差信号;编码方式的混合,综合波形编码和参数编码的优点, 从而获得更高的质量。这种编码方法的典型例子是c e l p t 3 】模型,它在比特率为 4 - 1 6 k b p s 时己经可以得到比其他算法更高的重建语音质量,而且以c e l p 为基 础的多种算法己成为国际标准,其中就包括本论文所研究的g 7 2 9 协议的 c s a c e l p 。但是在1 2 k b p 以下更低速率上,由于受各种手段的限制,还没有 比较成熟的编码方法。 1 3 语音压缩编码的国际标准 由于数字语音编码技术具有广阔的应用范围和良好的市场前景,从2 0 世纪 8 0 年代开始,国际上著名的通信研究机构和大学均大力开展高音质低码率语音 编码技术的研究,取得了大批成果,因此语音编码技术的标准化工作显得十分重 3 基于d s p 的g 7 2 9 语音编码的研究j 实现 要。国际电信联盟( i t u ) 在语音编码技术的标准化方面做了大量的工作,制订 了很多标准,并逐渐受到业界的认同。其中比较典型的有g 7 11 ,g 7 2 1 ,g 7 2 8 ,g 7 2 9 等标准【4 1 。 ( 1 ) g 7 11 标准 最早的语音编码方案是p c m 编码,它的码率是6 4 k b p s 。对语音信号按8 k h z 进行采样,再对每一个样本做8b i t 的标量量化虽然它的码率很高,但处理程序 简单,话音质量非常好,在电话网中广为使用。它被i t u t 定为( 3 7 1 1 标准 ( 2 ) g 7 2 1 标准 g 7 11 标准产生后,人们将大量的精力投向了语音压缩编码的研究。经过多 年的研究,科学家们提出了一种旨在消除语音信号样本间的相关性的线性预测编 码算法。它可以在基本保证音质的情况下,编码率有较大的压缩。利用当时还处 于雏形的线性预测方法,科学家们成功开发出了编码率为3 2 k b p s ( 相对p c m 码, 它被压缩了一半) 的增量调制a d p c m ( a d a p t i v ed i f f e r e n c ep c m ) 方案,音质略次 于p c m 编码,可懂度和自然度都不错,立即受到人们的青睐。它被i t u t 定为 g 7 2 1 标准。 ( 3 ) g 7 2 8 标准 低码率、短时延、高质量是人们期望的目标,波形编码的局限性,决定了其 编码率不可能降得太低,为了进一步降低编码率,必须选用参数编码和混合编码 技术。i t u t 于19 9 2 年公布g 7 2 8 标准,编码速率为1 6 k b i t s ,算法延时小于2 m s , 语音质量可达m o s4 分以上,与g 7 1 1 音质基本相当,主要应用于可视电话、 存储和转发系统、数字移动无线系统、数字插空设备、语音信息录音、分组化语 音等领域。 ( 4 ) g 7 2 9 标准 保持高音质就是要使合成语音和原始语音的均方误差始终小到不易察觉。 在此前提下,通过改进算法,达到进一步压缩编码率的目的。 c s a c e l p ( c o n j u g a t e s t r u c t u r ea l g e b r a i cc o d ee x c i t e dl i n e a rp r e d i c t ) 算法就是 该思路的历史产物。它实现了8 k b i t s 的码率,所达到的语音质量一点也不亚于 g 7 2 1 标准,但却比g 7 2 1 标准的编码率压缩了整四倍。i t u t 在19 9 6 年将 c s a c e l p 算法制定为g 7 2 9 标准。 1 4 语音压缩编码的实现和意义 随着科技的飞速发展,多媒体网络通信己成为我们生活的一部分,人们正在 进入数字化时代。作为数字化技术核心之一的数字压缩更是备受关注【5 1 。为什么 要将信号数字化呢? 因为数字信号易于存储和远距离传输,而且没有累积失真, 数字化存储的信号可高品质地被还原。但是未经压缩的数字化信号需要每秒更多 4 硕十学位论文 的比特数去存储或传输,这样势必增加成本。语音压缩的任务就是在保持一个可 以接受的逼真度损失的情况下采用尽可能少的比特数来还原语音,以减少存储和 传输的成本【6 7 1 。例如,电话话音一般采用8 0 0 0 样本秒的采样率,未压缩的比 特数为:8 0 0 0 样本秒幸1 2 比特样本= 9 6 千比特秒,而目前普通电话线路调制解 调速率为2 8 8k b s ,在北美地区用于声音信号的传输比特率为8 k b s ,这样,未 经压缩的9 6 k b s 就需要将电话的声音信号带宽拓宽几倍。所以只有用压缩的方 法才能保证数字化传输和存储的优点得以实现。 g 7 2 9 编码技术在中低速率上提供了语音编码方案,是目前语音编码算法中 最主要的方案之一,但它的计算复杂度和数据存储量过大,这使性能良好的语音 编码方案实时实现或实际应用中还存在许多困难。目前的语音压缩专用芯片价格 较高,并且采用语音压缩专用芯片的设备在信号处理的灵活性,功能扩展等方面 受到很大的限制,很难加入一些新的功能或者算法。而使用d s p 来自主开发实 现语音压缩算法却可以使这一成本大大降低,同时可以方便地实现算法的更新, 从而能够在不更换硬件的情况下实现功能的升级。如何在d s p 系统上实现算法 的移植、高效运行以及提出合适d s p 执行的算法是目前研究的焦点。目前的d s p 语音信号处理的应用主要是语音数据流传输、转换方面,广泛的应用在通信领域 的移动手持机、移动基站设备等。通用d s p 芯片的出现及其性能价格比的迅速 提高为各种实用化语音信号处理系统的实现铺平了道路。自8 0 年代初期d s p 芯 片问世以来,在2 0 余年的时间里,d s p 芯片得到了极为迅速的发展,其性能价 格比和开发手段等方面都有了长足进步。美国t i 公司在8 0 年代中期研制出的第 一代d s p 芯片t m s 3 2 0 1 0 和t m s 3 2 0 2 0 完成一次乘累加运算( 1 6 位,定点) 需 要2 0 0 n s 。第二代d s p 芯片t m s 3 2 0 c 2 5 完成一次相同的运算需要1 0 0 n s ,第三 代d s p 芯片t m s c 3 0 完成一次乘累加( 3 2 位,浮点) 运算只需要5 0 n s 而且片 内的r o m 和r a m 和片外可扩展的r a m 的容量都大大增加。而本论文所采用 的t m s 3 2 0 v c 5 4 0 2 的运算能力为每秒执行1 0 0 万条指令,则只需要1 0 n s 可以完 成一次乘累加。 1 5 本论文的主要研究内容 本文以i t u t 公布的g 7 2 9 协议和相关附录为依据,分析了编解码器的编解 码算法理论,设计了硬件处理平台,通过对软件进行调试及优化,保证程序了的 简洁、快速,降低程序的占用空间,使其可以在t m s 3 2 0 v c 5 4 0 2 上实时运行。 本文分为五章: 第1 章:绪论。简要介绍语音编码技术的基本原理、发展和实现方法,并阐 述本文研究课题的意义。 第2 章:介绍g 7 2 9 协议编解码器的原理及一些关键的算法。 5 纂于d s p 镌g 7 2 9 语蛮缡瓣憋鞣究与实瑗 第3 章: 第4 章: 第5 章: 余绍t m s 3 2 0 v c 5 4 0 2d s p 芯片的结构和整个系统的硬件设计。 研究了g 7 2 9 a 的c 语言源代码的组成,分褥其流程。重点研究了 如何用汇编优化和实现,使得其运算酎钟数减少,从丽可以在 t m s 3 2 0 v c 5 4 0 2d s p 上实时运行。 给出实验结果。 纛 硕士学位论文 第2 章g 7 2 9 协议 i t u t 在1 9 9 6 年3 月公布了g 7 2 9 建议的8 k b s 用对结构代数码激励线性 预测( c s a c e l p ) 语音编码方案。这个方案的特点是分析窗采用混合窗;l s p 参数采用二级矢量量化;以子帧为单位的码本搜索分为自适应码本搜索和代数码 本搜索;基音分析采用开环基音分析和自适应码本搜索相结合,而降低了运算量, 减少了基音的量化比特数,并提高了基音预测的准确度;代数码本算法简单,不 需要存储码本,回复音质清晰。在8 k b s 码率下合成音质不低于3 2 k b sa d p c m 的水平,算法延时1 5 m s 。 1 9 9 6 年1 1 月i t u t 相继公布了g 7 2 9 建议的附件a ( a n n e xa ) 和附件b ( a n n e x b ) 。附件a 主要减少g 7 2 9 的计算复杂度并可应用于多媒体语声和数据。而附 件b 主要为与建议v 7 0 一致而研究的g 7 2 9 最佳静音压缩方案,但仍以g 7 2 9 的原方案为基础【8 ,9 1 。 2 1i t u tg 7 2 9 概述 g 7 2 9 是对电话带宽的语音信号编码的标准,对输入的模拟语音信号用8 k h z 采样,1 6 b i t 线性p c m 量化。c s a c e l p 是基于码激励线性预测( c e l p ) 编码 模式,每8 0 个样点为1 个语音帧,对语音信号分析并提取各种参数( 线性预测 滤波器系数、自适应码本和固定码本中码本序号、自适应码矢增益和固定码矢增 益) ,把这些参数编码发送。参数编码的比特分配如表2 1 所示。 表2 18 k b sc s a c e l p 算法比特分配( 1 0 m s 帧) 参数码字子帧1子帧2每帧总数 线谱对 l 0 ,l 1 ,l 2 ,l 3 18 自适应码本时延 p 1 ,p 2 8513 基音时延奇偶检验p o11 固定码本序号 c 1 ,c 2 1 31 32 6 固定码本符号 s 1 ,s 2 44 8 码本增益( 阶段1 )g a l ,g a 2336 码本增益( 阶段2 )g b l ,g b 2448 总计8 0 在解码端,把收到的比特流恢复成参数编码,解码后得到各个参数,用自适 应码矢序号从自适应码本中得到自适应码矢,用固定码矢序号从固定码本中得到 固定码矢,分别乘以它们的增益按点相加后构成激励序列。用线性预测滤波器系 数构成合成滤波器。用所谓的自适应码本方法实现长时或基音合成滤波,计算出 合成语音后,用后置滤波器进一步增强音质。 7 基于d s p 的g 7 2 9 语音编码的研究j 实现 : !皇:一叶 发送比特流 l 兰兰墨些| - 矗甚蔷i 兰割兰兰竺竺卜 图2 1c s a c e l p 编码器的编码原理框图 2 1 1 编码 图2 1 给出编码原理框图。输入信号先经过高通滤波处理,每1 0 m s 帧作一次 l p 分析,计算l p 滤波器系数,这些系数转换为线谱对( l s p ) 并用两段1 8 b i t 矢量量化。激励信号用a b s 方法搜索,以原始语音与合成语音的误差知觉加 权最小为测度进行搜索,而知觉加权滤波器用未量化的l p 系数构造而成。知觉 加权的量是以保证输入信号的频响是平的而自适应调整。 激励参数( 固定的和自适应的码书参数) 每个子帧( 5 m s ,4 0 个样点) 确定 一次。量化的和未量化的l p 滤波系数用于第二子帧,而在第一子帧使用内插 ( i n t e r p o l a t e d ) 的l p 系数,根据知觉加权语音信号每1 0 m s 帧估计一次开环基 音延时。下面的操作每个子帧都重复进行。目标信号x ( n ) 是由通过加权合成滤波 器w ( z ) a ( z ) 滤过的l p 残差计算得到的。由l p 残差和激励之间误差滤波修改这 些滤波器的初始状态,这等效于从加权语音信号中减去加权合成滤波器的零输入 响应。计算加权合成滤波器的脉冲响应h ( n ) ,然后用目标x ( n ) 和脉冲响应h ( n ) 搜 索开环基音延时附近的值作闭环基音分析,分数基音延时分辨率1 3 样点间隔, 在第一子帧用8 b i t s 基音时延编码,在第二子帧用5 b i t s ,从目标信号中减去自适 应码书的贡献。新的目标信号x ( 万) 用于固定码本搜索寻找最佳激励,l7 b i t s 的代 数码书用于固定码本编码。自适应码本和固定码本的增益用7 b i t s 组合矢量量化。 最后,用确定的激励信号修改滤波器存储器。 8 硕士学位论文 2 1 2 解码 图2 2 给出了解码器原理框图。首先从接收码流中提取参数序号,解码这些 序号得到1 0 m s 语音帧对应的编码参数。这些参数是l s p 参数,两个分数基音延 时,两个固定码本矢量与两组自适应和固定码本增益,每子帧l s p 参数被内插 并转换为l p 滤波器系数,然后每5 m s 子帧按下面进行: ( 1 ) 自适应和固定码本分别乘以各自的增益加起来构成激励。 ( 2 ) 激励l p 合成滤波器重构语音。 ( 3 ) 重构语音信号经过后置处理,包括长时后置滤波、短时合成滤波和高通 滤波。 图2 2c s - a c e l p 解码器的原理框图 2 1 3 延时 这个编码器用10 m s 帧编码语音和其他声音信号。另外考虑将来输入的5 m s 语音,结果总的算法延时1 5 m s ,在实际编码中所有延时包括: ( 1 ) 编解码的处理时间。 ( 2 ) 在通信链路中的发送时间。 。 ( 3 ) 当组合其它数据和声音数据时的复合时延。 2 2 编码器原理 2 2 1 预处理 输入1 6 b i t s 线性p c m 语音信号,为避免处理中产生溢出和不必要的低频成 分,将输入样点都除以2 ,并通过一个截止频率为1 4 0 h z 的高通滤波器。这两者 结合起来,用日。,( z ) 二阶零点滤波器实现。 - 。, - ( z ) = 咝笔11 蒜9 0 5 9 婴4 6 5 z 筹0 斋9 114型024z-2 ( 2 ) iz 2 一lz ij 一叫+ 经巩,( z ) 滤波后的信号为s ( n ) ,在后面的处理中都用s ( n ) 表示。 2 2 2 线性预测分析和量化 用1 0 阶线性预测( l p ) 作短时分析,l p 合成滤波器定义为 9 基于d s p 的g 7 2 9 语音编码的研究j 实现 三:旦一 ( 2 2 ) 了2 百一 二二7 缈t054s掣-046cos(2nn),n=0,,翔,1999 3 , ,( 后) = j ( ,1 ) s o 一尼) ,后= o ,1 0 ( 2 5 ) ( 动= e x p 一昙( 华) 】,h ,1 0 ( 2 6 ) a i r ( 1i - k i ) = 一,7 ( 七) ,k = l ,1 0 ( 2 8 ) 1 0 硕十学位论文 曩,( z ) = 爿( z ) + z - l i 彳( z 。1 ) ( 2 9 ) g ( z ) = 彳( z ) 一z 一1 么( z - 1 ) ( 2 1 0 ) 可以证明,这些多项式的根在单位圆上,而且相互交替出现。其中f ( z ) 必有一 个根z = 一l ( w = x ) ,而g ( z ) 必有一个根z = 1 ( w = o ) 。那么以此定义新的多项式: 驰) = 等( 2 1 1 ) 驰) = 等( 2 1 2 ) 每个多项式有5 个共轭复根在单位圆上( e 士加) ,它们可以用下式表达: 互( z ) = 兀( 1 - 2 q ,z 。1 + z 以) i = l ,3 ,9 互( z ) = h ( 1 - 2 q i z q + z 之) t = 2 ,4 ,1 0 这里q i = e o s ( w j ) ,w ,是线谱频率而且满足顺序特性, 是l s p 系数在余弦域的表示。 由于两个多项式互( z ) 和e ( z ) 是对称和反对称的, 5 个系数即可。用下列递推关系很容易得到: ( 2 1 3 ) ( 2 1 4 ) 0 o 餍4 阶m a 预测器来预测当前帧的l s f 系数,计算和预测的l s f 系数的差用 二级矢量量化( t w o s t a g ev e c t o rq u a n t i z e ) 。第一级是l o 维v q ,用7 b i t s 编码( 1 2 8 个编号) ,l i 表示码本;第二级是将l o 维分裂为两个5 维的码本,l 2 表示较低 嚣5 维,l 3 表示较高的5 维,分剃震5 b i t s 编码。 要说明量化过程,从解码过程说明比较容易理解。接收到码本序号l l 、l 2 和l 3 ,从相应的码本中获得码矢量,那荪量化矢量中每个参数为对应码矢量中 参数的程: j :- i 三l ,锄) 十五乏犯2 ) ,黼如,5 ( 2 1 9 ) 【l 1 f ( 1 ) 十l 3 f ( 三3 ) , i = 6 ,1 0 这里l 1 ; 一,) t ,= 锺+ t ;一j ) 2 乏= 透+ 曩,+ 歹) z e n d e n d 其孛j 必最小距离。这个调整簧律两次,第一次j = 0 0 0 1 2 ,第二次j = 0 ,0 0 0 6 。调 整之后,当前帧m 的量化l s f 系数啦珥可以通过前几帧量化输出l ( m - k ) 的加权和 当前帧的量化输出j :m 得到: 魂汹慧g 一芝蠢;透黼+ 芝毛毒f ”妨 ( 2 。2 0 ) i = li = l 这里,癣是m a 预测器的系数。 g 7 2 9 里提供了两种4 阶的m a 预测器,其选择方式由l 0 比特给出指示。枣。 靛初始值茺毒= 耐1 1 ,k 0 ,计算得到毒之螽,要检查对应滤波器的稳定性,作 法如下: 1 2 硕士学位论文 ( 1 ) 系数是顺序递增的 ( 2 ) i f 也 0 0 0 5t h e n 碗= 0 0 0 5 ; ( 3 ) i f 啦+ l 一啦 - 1 5 2 ) o r ( 硝神 o 4 3 ) a n d ( f l a t 洒。= ( 2 3 0 ) l f l a t ( m - 1 ) , e l s e 如果子帧的内插频谱分类为平( f l a t = 1 ) ,那么加权因子y l = 0 9 4 ,款一0 6 ;如果分 类为斜( f l a t = 0 ) ,剿苁= 9 9 8 ,两死的值自适应于l p 合成滤波器的谐振强度,其 范围在o 4 到o 7 之间,如果出现强的谐振,则尼的值接近上界,根据当前子帧 连续两个l s p 系数寓接的最小距离准则达到自适应。 疋;。然m i n w , ,一弼。 f = l ,9(2。3mmtw。) j r 23 1 露幽然一l 一嘭 l2l ,乇, 用线性内插计算如的值: y 2 = - 6 0 d n i i 。+ 1 0 ,0 4 y 2 0 7 ( 2 3 2 ) 子帧中加权语音信号由下式给擞: s w = s ( 以) + 吩乃s ( n - i ) - 歹 a i y 2 s w ( n - i ) ,n = o ,3 9 ( 2 3 3 ) i = lt = 1 加权语音信号s 。( 以) 用于估计语音帧中的基音延时。 开环基音分析:为减少最佳自适应码本延时的搜索的复杂度,囱开环基音分 析得到乙,搜索范围限制在延时附近。每10 m s 帧作一次,开环基音估计用 加权语音信号j ,( 丹) 。先找三个最大的自相关函数: 爱蠢) = 葶,( 嚣城( n - k ) ( 2 。3 4 ) n = 0 在以下三个范围内寻找: i ;1 :8 0 , ,1 4 3 i = 2 :碡侥,7 9 i = 3 :2 0 , ,3 9 保留最大的r ( ) ( i = l ,2 ,3 ) ,然后归一化: 定,毽) :百堕一 ( 2 3 5 ) ( s 2 。、n 一) ) 瓣 n = 0 在较低的范围内的短延时作为三个归一化翻相关中的选中者,这样加权归一化翻 相关对廒较长的延时。下面的算法确定最好的开环延时t o ; 1 5 基于d s p 的( 2 7 2 9 语鸯缡妈酶磉究与实瑰 乙= t l 灭( 乙) = r ( t j 矿r ( 屯) o 。8 5 r ( 乙) 尺( 乙) = r ( 乞) = 乞 e n d 矿r ( 如) o 8 5 r ( 毛) 尺( ) = r ( 岛) 乙端t 3 e n d 这个过程将延时范曝分为三部分,有利于选较少的值,避免了基音的倍频。 2 。2 4 脉冲响应的计算 加权合成滤波器驴( z ) 叠( z ) 的冲激喻应j j i 研) 用于宦适应码本和固定码本的搜 索。每个子帧计算一次。脉冲信号经滤波器4 ( 乃) 后,再相继经1 囊( z ) 和1 j ( z 儿) 得到| 1 1 0 ) 。 2 2 。5 黉标信号的计算 自适应码本搜索用的目标信号x ( n ) 是从加权语音信号s 。( 咒) 中减去加权合成滤 波器形( z ) 五( z ) = 么( 衫苁) 【j ( z ) 么( 衫兄) 】的零输入响应。等价的过程( 也是建议推荐 的算法) 是:用l p 滤波器的残差r ( 嚣) 通过合成滤波器五( z ) 和加权滤波器的组 合,然艏决定子帧的激励。这些滤波器的初始状态由滤波残差和激励信号的差来 调整。这些滤波器的存储器的调整将在后面说明。 残差信号,积) 由下式给出: ,( 弹) = s ( 以) 一鑫, s ( n - o ,栉= o ,3 9 ( 2 3 6 ) 2 2 。6 自适应码本搜索 自适应码本参数( 或基音参数) 是延迟和增益。在搜索阶段,l p 残差扩展激 励使闭环搜索简单化。每一予帧( 5 m s ) 作一次自适应码本搜索。自第一子帧, 基音延时五在【1 9 _ 3 1 ,8 4 吾】范围,分辨率为影3 分数延时,在【8 5 ,1 4 3 】范围内是整数延 时。在第二子帧,延时互在【i n t ( 墨) - 5 j 2 ,i n t ( t t ) + 4 詈 范围内,分辨率为1 3 的分数延 时。这里蛾互) 是取分数延时霉的整数部分,这个范圈适合予墨跨在延时范围的 边的情况。 1 6 硕士学位论文 用闭环分析最小化

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论