(通信与信息系统专业论文)基于bf533的g729语音编码系统的研究和设计.pdf_第1页
(通信与信息系统专业论文)基于bf533的g729语音编码系统的研究和设计.pdf_第2页
(通信与信息系统专业论文)基于bf533的g729语音编码系统的研究和设计.pdf_第3页
(通信与信息系统专业论文)基于bf533的g729语音编码系统的研究和设计.pdf_第4页
(通信与信息系统专业论文)基于bf533的g729语音编码系统的研究和设计.pdf_第5页
已阅读5页,还剩68页未读 继续免费阅读

(通信与信息系统专业论文)基于bf533的g729语音编码系统的研究和设计.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浙江工业大学硕士学位论文 基于b f 5 3 3 的g 7 2 9 语音编码系统的研究和设计 摘要 语音编码是数字语音通信中的一项关键技术。近2 0 年来,随着固定电话和移动通信 的高速发展,语音压缩编码理论与技术也得到了长足的进步,并在很多领域获得了广泛的 应用。在目前的各种语音编码方案中,c e l p ( 码激励线性预测) 技术已成为最重要、最成 功的语音编码技术之一。i t u t 于1 9 9 6 年3 月公布了g 7 2 9 语音编码标准,标准使用 c s a c e l p ( 共轭结构代数码本激励线性预测) 编码方案。c s a c e l p 算法基于c e l p 编 码模型,同时摒弃了c e l p 计算复杂度高和存储量大等缺点,能提供较低码率、高质量、 低延迟的语音编码,是当前一种理想的编码算法。 1 9 8 2 年,首枚数字信号处理器( d s p ) i h i 世以及随后的飞速发展,为语音编码器的实现 和应用奠定了基础。如今,随着各种高速通用数字信号处理器芯片性能价格比的迅速提高, 各种新型语音编码算法理论已经突破计算机仿真的范畴,进入到实用阶段。论文所采用 a d s p b f 5 3 3 芯片是一款性价比很高的d s p 芯片,支持包扩g 7 2 9 在内的多种i t u t 推荐 的语音编码标准。 本论文首先详细介绍了当前主流的语音编码技术的基本理论,以此为基础深入研究和 阐述了g 7 2 9 语音编码算法的基本原理,并对算法的自适应码书搜索和固定码书搜索等关 键模块进行了优化和改进,降低了算法的运算量。其次,简要回顾了d s p 芯片的相关理论 知识和工程知识,重点介绍了a d i 公司b l a c k f i n 系列d s p 芯片的特点和技术,并详细研 究了a d s p b f 5 3 3 芯片的内部硬件结构和各种外设接口,并以a d s p b f 5 3 3e z - k i tl i t e 开 发板为硬件平台,提出了一套完整的语音编码系统的设计方案,包括系统硬件结构和系统 软件设计。然后,实现了语音编码算法源程序在开发板上的移植,并对现有程序进行了c 语言级和汇编语言级的优化。优化之后,编码速度提高1 3 倍之多,效果相当明显。最后, 进行了m a t l a b 仿真实验,结果证明优化后的程序代码较好的完成了编解码功能,这也基本 达到了预期的目的。 关键词:语音编码,矢量量化,l s p ,g 7 2 9 ,a d s p b f 5 3 3 浙江工业大学硕士学位论文 r e s e a r c ha n dd e s i g no fg 7 2 9s p e e c hc o d i n g s y s t e mb a s e do nb f 5 3 3 a b s t r a c t s p e e c hc o d i n gi so n eo ft h ek e yt e c h n o l o g i e si nt h ea r e ao fd i g i t a ls p e e c hc o m m u n i c a t i o n o v e rt h ep a s t2 0y e a r s ,谢mt h eh i 曲一s p e e dd e v e l o p m e n ti nt h ef i x e dl i n ep h o n ea n dm o b i l e c o m m u n i c a t i o n s ,t h et h e o r ya n dt e c h n o l o g yo fs p e e c hc o m p r e s s i o nc o d i n gh a v em a d eg r e a t p r o g r e s s ,a n da r ew i d e l yu s e di nl o t so ff i e l d s i nav a r i e t yo ft h ep r e s e n ts p e e c hc o d i n gs c h e m e s , c e l p ( c o d e e x c i t e dl i n e a rp r e d i c t i o n ) h a sb e c o m eo n eo ft h em o s ti m p o r t a n ta n dm o s t s u c c e s s f u ls p e e c h c o d i n gt e c h n i q u e s i n19 9 6 ,i t u tp u b l i s h e dg 7 2 9s p e e c hc o d i n gp r o t o c o l , w h i c hu s i n gc s - a c e l p ( c o n j u g a t es t r u c t u r ea l g e b r a i cc o d e - e x c i t e dl i n e a rp r e d i c t i o n ) c o d i n g a l g o r i t h m a l t h o u g hc s - a c e l pi sb a s e do nc e l pc o d i n gm o d e l ,b u to v e r c o m e sm a n yd e f e c t s , s u c ha sh i g hc o m p u t a t i o n a lc o m p l e x i t ya n dl a r g es t o r a g es p a c e 。c u r r e n t l y ,c e - a c e l pi sa n i d e a lc o d i n ga l g o r i t h m ,a n dp r o v i d e su s 谢ll o wb i tr a t e ,h i g h - q u a l i t ya n dl o wl a t e n c ys p e e c h c o m p r e s s i o nc o d i n g i n19 8 2 ,t h ef i r s td s p c h i pw a sp u to u t ,a n df o l l o w e db yar a p i dd e v e l o p m e n t ,w h i c hl a i da s o l i df o u n d a t i o nf o rt h ei m p l e m e n t a t i o na n da p p l i c a t i o no fs p e e c he n c o d e r n o w , b e c a u s ea l l k i n d so fg e n e r a l - p u r p o s ed s pc h i p sh a v ec o m ei n t ou s e ,w h i c hh a v eh i g hw o r k i n gs p e e d ,h i g h p e r f o r m a n c e ,b u tl o wp r i c e ,a n dl o wp o w e rc o s t v a r i o u sk i n d so fn e ws p e e c hc o d i n ga l g o r i t h m s a n dt h e o r i e sh a v ec o m eo u to ft h ea r e a so fc o m p u t e rs i m u l a t i o n ,a n da r ep u ti n t op r a c t i c a lu s e a d s p b f 5 3 3 ,w h i c hi su s e di nt h i sp a p e r ,i sah i g h l yc o s t - e f f e c t i v ed s pc h i p ,a n di sv e r y s u i t a b l ef o rt h er e a l t i m ei m p l e m e n t a t i o no fm a n yv o i c ec o d i n gs t a n d a r d sr e c o m m e n d e db y i t u t ,i n c l u d i n gg 7 2 9 f i r s t l y ,t h i sp a p e ri n t r o d u c e st h eb a s i ct h e o r yo ft h ec u r r e n tm a i n s t r e a ms p e e c hc o d i n g t e c h n o l o g y ,t h e np a r t i c u l a r l ys t u d y st h eb a s i cp r i n c i p l eo fg 7 2 9s p e e c hc o d i n ga l g o r i t h m ,a n d i m p r o v e ss o m ek e ym o d u l e s ,s u c ha sa d a p t i v e - c o d e b o o ka n df i x e d c o d e b o o k ,a i m i n gt or e d u c e t h ec o m p u t a t i o n a lc o m p l e x i t yo ft h eg 7 2 9a l g o r i t h m s e c o n d l y ,i tb r i e f l yr e v i e w st h et h e o r e t i c a l a n de n g i n e e r i n gk n o w l e d g eo fd s pc h i p ,a n dp u te m p h a s i so nt h et e c h n o l o g ya n dc h a r a c t e r i s t i c s o fb l a c k f i nf a m i l yd s p c h i p ,p r o d u c e db ya d ic o m p a n y ,t h e ni ts t u d yt h ei n n e rs t r u c t u r ea n d t h ev a r i o u sp e r i p h e r a li n t e r f a c e so ft h ea d s p - b f 5 33c h i p n e x t ,i tp u t sf o r w a r daw h o l es c h e m e f o rt h es p e e c hc o d i n gs y s t e m ,i n c l u d i n gh a r d w a r es y s t e md e s i g na n ds o f t w a r es y s t e md e s i g n ,a n d 浙江工业大学硕士学位论文 o nt h eb a s i so ft h ea d s p - b f 5 3 3e z k i tl i t ed e s k t o pe v a l u a t i o nk i t t h i r d l y ,i tc o m p l e t e st h e t r a n s p l a n t a t i o no fcs o u r c ec o d et ot h ee v a l u a t i o nb o a r d ,a n do p t i m i z e st h eo r i g i n a lc o d e a c c o r d i n gt ot h es t u d ya n dt h ea p p l i c a t i o no fo p t i m i z i n gs t r a t e g y t h er e s u l ts h o wt h a tt h e o p t i m i z a t i o no ft h es o u r c ec o d ei m p r o v e st h ee n c o d i n gs p e e db y13t i m e s f i n a l l y ,t h em a t l a b s i m u l a t i o nt e s tp r o v e st h ec o r r e c t n e s so ft h eo p t i m i z e dc o d e 。 k e yw o r d s :s p e e c hc o d i n g ,v e c t o rq u a n t i z a t i o n ,l s p , g = 7 2 9 ,a d s p b f 5 3 3 浙江工业大学 学位论文原创性声明 本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研究工作 所取得的研究成果。除文中已经加以标注引用的内容外,本论文不包含其他个人或 集体已经发表或撰写过的研究成果,也不含为获得浙江工业大学或其它教育机构的 学位证书而使用过的材料。对本文的研究作出重要贡献的个人和集体,均已在文中 以明确方式标明。本人承担本声明的法律责任。 作者签名:;l 弓夜 日期:萨汐听年r 月夕p 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留 并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本 人授权浙江工业大学可以将本学位论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 本学位论文属于 1 、保密口,在年解密后适用本授权书。 2 、不保密叼。 ( 请在以上相应方框内打“、”) 作者签名:;l 搪 剔磴氢q 具猢e l i ,月伽日 浙江工业大学硕士学位论文 第1 章绪论 1 1 课题研究的背景 语音是人类相互交流信息最直接、最方便、最有效工具,不但是人类获取信息的最重 要来源和利用信息的重要手段,也是现代通信系统中最常见的数据内容。随着通信技术, 特别是移动通信技术和互联网技术的快速发展,语音通信技术也在不断地更新和发展。 语音数字化通信是当前产业中发展最快、普及面最广的业务。在有线、无线通信以及 数字存储中,语音信号的数字化及其压缩技术在军事、民用领域中都有其重要的作用和意 义。 语音编码是数字语音通信中的一项关键技术。近2 0 年来,固定电话和移动通信的高 速发展,对通信信道使用率提出了越来越高的要求,为了压缩数字语音信号的传输码率, 使通信信道带宽能传输更多路的语音,节省存储空间,语音压缩编码理论与技术得到了极 大的发展,并在有线、无线电话的带宽语音信号、会议电视的带宽语音信号、数字高清电 视和高保真音乐的音频信号等领域有着广泛的应用【1 1 。此外,语音编码技术对话音存储、 语音识别和语音合成等技术都是直接相关的。 无线信道的频率资源是有限的,为了满足用户不断增长的需求量,通信的有效性要求 显得非常突出。提高有效性主要通过改进信源( 语音) 编码技术来完成的。尤其是第三代移 动通信的发展,对语音压缩编码算法提出了更高的要求,不但要求编码码率较低以增加系 统容量,而且要求合成语音音质较高以保证通话质量。 1 9 8 2 年首枚数字信号处理器( d i g i t a ls i g n a lp r o c e s s o r ,d s p ) i h - 世以及随后的飞速发展, 为语音编码器的实现和应用奠定了基础。语音编码技术的日趋成熟和新通信技术的不断发 展,对语音编码不断提出新的要求,迫切需要语音编码标准化。8 k b s 以上的语音编码技术 已经标准化,并进入实用阶段。低码率的编码标准处于发展之中,并且研究方向逐步转向 更低的码率。 与此同时,各种高速通用数字信号处理芯片的出现及其性能价格比的迅速提高,使数 字信号处理技术在各种实际领域中的普及应用成为可能,也使新型语音编码算法理论突破 了计算机仿真的范畴,进入到实用阶段。 即使在今天,光纤的使用使得有线通信的带宽变得更廉价,但是在有线通信以及移动 通信、卫星通信和掌上电脑的语音传送应用中,语音编码依旧扮演着十分重要的角色。 l 浙江工业大学硕士学位论文 1 2 研究目的和意义 在目前的各种语音编码方案中,c e l p ( 码激励线性预测) 技术已成为最重要、最成功的 语音编码技术之一。它是由美国人m a n f r e dr s c h r o e d e r 乘l b i s h us a t a l 于1 9 8 2 年提出的【2 】。 c e l p 的编码质量好于所有的1 6 k b s 编码器,甚至可与3 2 k b s 的c v s d ( 连续可变斜率增量调 制) 相媲美。目前,c e l p 编码算法已广泛用于低速语音压缩编码中。例如,美国联邦的 f e ds t d1 0 1 64 8 k b p sc e l p 标准,i t u t 所推荐的g 7 2 3 1 的6 3 k b p s 多脉冲最大似然量化 ( m p m l q f r l 5 3 k b p s 算术码本激励线性预测( a c e l p ) 标准【3 1 ,g 7 2 81 6 k b p s 低时延码激励线 性预测( l d c e l p ) 标准【4 】,以及g 7 2 9 共轭结构代数码激励线性预测( c s a c e l p ) 标准,北美 i s 5 4t d m a8 k b p s 矢量和激励线性预测标准( v s e l p ) 等等,它们使用的都是一定速率上的 c e l p 编码算法。但是c e l p 编码方法非常复杂,计算复杂度也非常高。正是由于其计算复 杂度高和存储量大等缺陷,使得理论上性能良好的编码方案在实时实现或实际应用中存在 一定困难t 。 论文所研究的g 7 2 9 语音编码标准,是i t u t 于1 9 9 6 年3 月公布的,该标准所采用的 c s a c e l p 算法是基于c e l p 编码模型的。此编码方案的主要技术指标是:在无误码的条件 下,语音的质量不得b l , 3 2 k b s 自适应差分脉冲编码调制的质量差;另外在3 帧删除的情况 下,对比无误码的3 2k b s 自适应差分脉冲编码调隹i l j ( a d p c m ) ,其平均评价得分( m o s ) 降低 少于0 5 。c s 。a c e l p 提供了较低速、高质量、低延迟的语音编码,是当前较理想的编码算 法。 c s a c e l p 语音编码可以广泛地应用于个人通信、分组语音通信( 如i pp h o n e ) 、数字卫 星通信、高质量移动无线通信、存储和检索、微波接力通信以及未来的综合业务数字通信 网( i s d n ) 。 当今,在各种通信设备中,实时的语音压缩编码通常在d s p 上实现。与采用超标量结 构或超长指令集的d s p ( ! t 1 t i 的c 5 0 0 0 和c 6 0 0 0 系列) 相比,b l a c k f i n 处理器在功耗、成本等 方面具有很大的优势。因此,在研究中采用的处理器是a d i 公司的a d s p b f 5 3 3 。a d i 公司 的b l a c k f i n 系列处理器在一个芯片和一个开发平台上融合了d s p 信号处理、r i s c 的控制处 理和视频处理功能,具有高度的并行处理和强大的d m a 能力,具有专用的视频指令和硬件 支持,并支持包括u c l i n u x 在内的嵌入式操作系统【5 1 。a d s p b f 5 3 3 属于b l a c k f i n 系列中的增 强型处理器,与之前发布的b l a c k f i n 处理器相比较它提供更高的性能和更低的功耗,并保持 了易用性和代码兼容的优点。b f 5 3 3 支持包扩g 7 2 9 在内的多种i t u t 推荐的语音编码标准, 并且具有强大的视频处理能力,一片d s p 芯片可以同时处理视频和语音编码,可以考虑占 浙江工业大学硕士学位论文 用尽可能少的计算资源和存储空间来实现g 7 2 9 语音编码的全部功能,以留下充足的资源用 来处理视频编码。 综上所述,本论文的研究具有重要的现实意义。此外,论文详细分析了g 7 2 9 语音编码 算法在b f 5 3 3 芯片上的实现过程。在对语音编码系统的功能进行了分析之后,提出了完整 的系统硬件结构和系统软件的设计方案,并对源程序进行了优化,积累了在b l a e k f i n 系列芯 片上进行语音编解码系统的开发经验。这对进行类似的系统设计和开发,或者系统的扩展 都具有重要的实践指导意义。 1 3 理论研究的现状和发展趋势 从1 9 8 0 年至今,在语音编码领域,已经做出了很多重要的进展。这些进展的取得主要 有下列原因【6 】: ( 1 ) 对语音产生机理和语音结构的更深入的理解。 ( 2 ) 对人的听觉系统的深入理解,利用人耳的掩蔽效应,提出了易于实现的理解加权 滤波器方案。 ( 3 ) 提出了更好的量化技术,特别是合成一分析的技术,使得重构语音的质量有显著 的提高。 ( 4 ) 数字信号处理器的广泛使用,为语音编码器的商品化打下了良好的基础。 通过近1 0 多年的时间,语音编码技术取得了突飞猛进的发展,出现了多个国际标准和 区域标准,已具备了比较完善的理论和技术体系。同时,随着高速信号处理器的诞生,多 种算法复杂、计算量很大的编码技术的实时化也变得容易起来,语音压缩编码进入了实用 阶段。 目前语音编码主要分为三类:波形编码、参数编码和混合编码。 波形编码:最早的语音编码系统采用波形编码方法,这种方法主要是基于语音信号的 波形,力图使合成语音与原始语音的波形误差最小。由于语音信号的全部信息都蕴含在原 始波形里,所以这种方法编码后的合成语音质量非常好,且适应能力强,抗信道干扰性能 好。主要的有以下的编码器:脉冲编码调制( p c m ) 、自适应增量调制( a d m ) 、自适应差分 编码( a d p c m ) 、自适应预测编码( a p c ) 、自适应子带编码( a s b c ) 、自适应变换编码( a t c ) 。 国际电报电话咨询委员会c c i t t ( 现已并入国际电信联盟i t u ) 于1 9 7 2 年制定的g 7 1 16 4 k b s 的脉冲编码调$ t j ( p c m ) 和i t u 在1 9 8 4 年公布的g 7 2 13 2 k b s 自适应差分脉冲编码调制 ( a d p c m ) 编码器标准等都属于这一类编码器【。 参数编码:参数编码始于1 9 3 9 年美国人h o m e rd u d e y 发明的声码器,它是根据语音信 浙江工业大学硕士学位论文 号的特征参数来编码,所以又叫“声码器技术”。声码器是根据发音模型,分析并提取语 音信号的特征参数,且只传送能够合成语音信息的参数,不需要再现原语音的波形。它是 以滤波器为主来构造语音产生模型,发送的只是滤波器的参数和相关的特征值,可以将比 特率压得很低,但合成语音质量不是很好。这种方法在低速率声码器中普遍采用。典型的 声码器有谱带式、共振峰式和按线性预测分析( l p c ) 所组成的声码器等【s 】。其中l p c 声码器 是以线性组合模型均方误差最小意义下逼近原始波形的方法提取参数,较好地解决了编码 速率和语音质量的问题,以其成熟的算法和参数的精确估计成为研究的主流,并己走向实 用。美国政府1 9 8 0 年公布的2 4 k t s 线性预测编码算法l p c 1 0 就是采用的这种方法。1 9 8 6 年, 美国第三代保密电话装置采用了2 4 k b s 的l p c 1 0 e ( l p c 1 0 的增强型) 作为话音处理方法。 混合编码:混合编码是近年来出现的一种新型的编码方法,这种方法在保留参数模型 技术精华的基础上,应用波形编码准则去优化激励信号,从而在4 8 9 6 k b p s 的码率上获得 了较高质量的合成语音,其代表是一类称之为“按分析合成”( a b s ) 的方法,由于采用的 激励信号模型不同,这类方法派生出多种新的编码方法,都能在9 6 k b p s 码率上获得较高的 话音质量。采用听觉加权技术,在闭环的基础上寻找主观意义上失真最小的激励矢量,典 型的方法有剩余激励线性预测编码( r e l p ) ,多脉冲激励线性预测编码( m - p c ) ,码激励线性 预测编码( c e l p ) 以及共轭代数结构码激励线性预钡o ( c s a c e l p ) 。 下图直观的显示了三类编码方法的编码速率和语音质量的关系。 鲫 峰 伽 辔 l24 8 1 6 3 26 4 编码速率:k b p s 图1 1 语音质量和编码速率 语音编码标准由于具有巨大的商业利益,因而其编码算法一直是通信和信号处理学科 中最活跃的研究领域之一。语音编码算法发展迅速,现在最明显的两个发展趋势是窄带话 音和宽带音频。宽带音频编码追求的是5 0 2 2 k h z 间高质量的音频信号编码,它对编码数据 率要求不是很严。而窄带话音编码恰恰相反,它追求的是低比特率甚至甚低比特率下的通 信等级质量,以降低数据率、节省带宽为主要目的【9 1 。在保证语音质量的前提下,进一步 4 浙江工业大学硕士学位论文 降低比特率,仍然是语音编码研究的主要焦点。可以预见,低码率、低延迟话音编码算法 是2 l 世纪通信、计算机网络、视频电话会议和远程教学系统等诸多应用领域的关键性核心 技术。同时,将会有更多的参量编码器进入应用领域,例如多带激励编码器,正弦变换编 码器,波形内插编码器等。 数字信号处理器是伴随着微电子学、数字信号处理和计算技术等学科的发展而产生 的,体现了这三个学科的综合科研成果。d s p 是一种特别适合于进行数字信号处理运算的 微处理器,其主要应用是实时快速地实现各种数字信号处理算法。其主要目的是在硬件上 和指令集上同时优化,并通过广泛采用并行技术来实现。与其它的微处理芯片相比,它最 大的优点是有专门的电路用于支持与数字信号处理相关的高精度和快速的数值运算。 美国模拟器件公司( a d i ) 推出的b l a c k _ f i n 处理器代表了一种新型1 6 1 3 2 位嵌入式处理 器,它们是专为满足当今嵌入式音频、视频和通信应用的计算要求和功率约束条件而设计 的。b l a c k f m 处理器在信号处理性能和功率利用效率方面取得了突破性进展,同时也造就 了一个基于s i m d 架构的全3 2 位r i s cm c u 程序设计模型。它提供了高性能和同类软件 目标,从而实现了硬实时信号处理任务与非实时控制任务之间资源的灵活分配。系统控制 任务通常可在要求苛刻的信号处理和多媒体任务的影响之下执行。 当前各种g 7 2 9 语音编码算法的实现方案中,所采用的d p s 芯片多数是t i 公司的 t m s 3 2 0 系y l j d s p 处理器。这一系y i j d s p 芯片的计算能力有限,仅能实现单一的语音编解码 功能,不能满足要求同时处理语音和视频信号的场合。与该系列处理器相比,b l a c k f i n 系列 d s p 芯片有很高的性价比,主频最高达6 0 0 m h z ,可以支持多路g 7 2 9 语音信号处理,这主 要取决于程序的优化程度,更重要的是b l a c k f i n 系y l j d s p 芯片具备强大的视频处理能力,能 实现业界最高性价比的h 2 6 4 编解码应用,因此完全可以在单d s p 芯片上同时完成语音和视 频的编解码。论文 5 】提出了一种基于b l a c k f i n 的双核处理器a d s p b f 5 6 1 的音频系统的设计 方案,双核协同处理语音信号,c o r e a 负责音频解码及输出,c o r e b 负责音频采集和编码, 双核之间通过共享固定内存单元的机制进行通讯,来协调完成各种操作。论文 4 6 1 在b f 5 3 7 上实现了g 7 2 9 编解码器,并在集成开发环境v i s u a ld s p + + 中对源代码进行优化,获得了比 较满意的结果。但是,两者都没有在一片d s p 芯片上实现多路语音信号的处理。虽然,论 文【4 6 】实现了对g 7 2 9 源程序的优化,并大大降低了在处理一路音频时,编解码程序所需的 循环次数,但是并没有真正的达到实时处理多路语音信号的目的。因此,论文切合实际情 况,在实验室现有的条件之下提出一个完整的g 7 2 9 语音编码系统的设计方案,并研究如何 对g 7 2 9 的源程序进行优化,以降低运算量,从而达到实时处理多路语音信号的目的。 浙江工业大学硕士学位论文 1 4 本文的研究内容和组织结构 本文主要研究的内容分为以下三个方面: ( 1 ) 论文首先详细介绍了当前主流的语音编码技术的基本理论,例如语音信号产生的 数学模型,语音信号的线性预测分析,语音信号的矢量量化,以及语音信号的压缩编码等。 接着,深入研究和阐述了g 7 2 98 k b p sc s a c e l p 语音编码算法的基本原理,其中重点研究 了此算法的线性预测分析、固定码书的构造和搜索、自适应码书的构造和搜索,以及矢量 量化,并对算法的自适应码书搜索和固定码书搜索等关键模块进行了优化和改进,以降低 算法的复杂度,达到g 7 2 9 实时实现的目的。 ( 2 ) 由于本论文的重点是实现基于b f 5 3 3 的实时语音编码系统,因此首先简要回顾了 d s p 的相关理论知识和工程知识,重点介绍了a d i 公司b l a c k f i n 系y m j d s p 的技术和特点,并 详细研究了b f 5 3 3 芯片的内部硬件结构和各种外设接口,以a d s p b f 5 3 3e z k i tl i t e 开发板 为硬件平台,研究其结构,并在此基础之上,提出完整的语音编码系统的设计方案,包括 系统硬件结构和系统软件设计。其中硬件系统主要由三个子系统组成,分别是语音采集 播放子系统、语音编解码子系统、数据发送接收子系统;而系统的软件模块也可分为三 个部分,分别是初始化程序、语音编解码程序,以及中断处理程序。 ( 3 ) 研究语音编码算法源程序在硬件开发板上的移植,以及源程序的优化。由于g 7 2 9 算法复杂,要求苛刻,因此为了能够达到所要求的实时处理多路语音信号的目的,必须对 现有程序的关键模块进行优化。主要考虑从以下两方面来入手:c 语言级的优化和汇编语 言级的优化。最后对优化后的程序进行仿真测试,并客观分析所得结果,证明优化后的程 序代码较好的完成了编解码功能。 本文的组织结构如下: 第l 章:绪论 介绍课题研究的背景、研究目的和意义、研究现状和发展趋势,以及本论文的研究内 容和组织结构。 第2 章:语音编码技术概论 详细研究语音编码的各种关键技术,其中包括语音信号产生的数学模型、线性预测编 码、矢量量化,以及加权滤波器等。 第3 章:i u t tg 7 2 9 语音编解码算法的研究和改进 主要对g 7 2 9 语音编码标准的编码原理和解码原理进行了深入的分析和归纳,其中包括 l p 分析和量化编码、开环基音分析、自适应码书搜索、固定码书搜索、增益量化、参量解 6 浙江工业大学硕士学位论文 码,以及信号后置处理等等,并对算法的自适应码书搜索和固定码书搜索等关键模块进行 了优化和改进,降低了算法的运算量。 第4 章:基于b f 5 3 3 的g 7 2 9 编码系统的实现 首先,简要回顾了d s p 芯片的相关理论知识和工程知识,并详细研究了b f 5 3 3 芯片的 内部硬件结构和各种外设接口,在此基础之上提出了语音编码系统的设计方案,包括系统 硬件结构设计和系统软件设计。然后,在v i s u a ld s p h4 5i d d e 中对c 源代码进行测试和 评估,发现编码程序和解码程序的执行效率都很低,不能满足系统对实时性的要求,须对 源程序进行优化。经过有针对性的优化之后,程序运行效率明显提高,远满足i t u u 标准 规定的延时要求。最后,进行m a t l a b 仿真实验,证明优化后的程序代码较好地完成了编解 码功能。 第5 章:结论和展望 总结全文,并提出接下来要完成的工作。 7 浙江工业大学硕士学位论文 第2 章语音编码技术概论 随着信息社会和通信技术的高速发展,频率资源显得愈加宝贵。因此,压缩语音信号 的传输带宽或降低电话信道的传输率,一直是人们努力追求的目标。而现代语音编码技术 自2 0 世纪8 0 年代发展至今,已经产生了一系列新型的语音编码技术,并在实现人们这一 目标的过程当中发挥了非常重要的作用,极大的推动了通信和信息技术的发展,是现代通 信发展史中的一个闪光点。本章将重点研究语音编码技术的基础理论。 2 1 语音信号产生的数学模型 语音即语言的声音,是语言符号系统的载体,它由人的发音器官发出,负载着一定的 语言意义。利用数字技术来模拟语音信号产生的系统称为语音信号产生的数学模型,或者 说,利用数字信号处理技术来实现发音器官的模拟。只有建立了语音信号产生的数学模型, 才能够用计算机定量地对语音信号进行模拟和处理。所以,语音信号产生的数学模型是进 行语音信号处理的基础。 根据人类语音的产生过程,人类的发声器官和发声过程可以模拟抽象为图2 1 所示的 模型【1 1 。该模型是当前使用最多的语音信号产生的数学模型,它综合考虑了声门、激励和 辐射等三方面的因素,是一个完整的离散时域语音信号产生的数字模型。 基音频率 声道参数 图2 1语音信号产生的数学模型 语音信号 语音生成系统分成三个部分。在声门以下称为“声门子系统”,它负责产生激励震动, 是“激励系统”;从声门到嘴唇的呼吸通道是声道,是“声道系统”;语音从声道辐射出去, 是“辐射系统”。 研究表明,发不同性质的声音时,激励的情况是不同的,一般可以分为两类:浊音( 有 浙江工业大学硕士学位论文 声语音段) 和清音( 语音的无声部分) 。因此,就把激励系统分成了浊音激励和清音激励两 个分支,按照浊音清音开关所处的位置来决定产生的语音是浊音还是清音,这种利用浊 音和清音激励发生器两者交替来模拟激励形式的改变,就是通常所说的二元激励。当开关 接在浊音位置时,激励信号由周期脉冲发生器产生周期冲激序列,序列周期为o ;当开关 接在清音位置时,激励信号由随机噪声发生器产生方差为l 的高斯白噪声序列。不断控制 清浊音开关、激励脉冲的周期以及噪声源强度,同时随着不同的发音改变滤波器特性,输 出的信号就是所要求的语音信号序列。 声门脉冲模型滤波器c - ( z ) 的作用是使浊音的激励信号具有浊音声门气流脉冲的实际波 形。声门波形的频率分析表明,其幅度频率谱按每倍频1 2 d b 的速率递减。滤波器g ( z ) 表 示如下: 1 g ( 力2 f 孑而( 2 - 1 ) 当g i ,9 2 都接近l 时,c - ( z ) 所产生的浊音信号频谱与声门气流脉冲的频谱接近。增益 因子么v 和a 材分别用于调节浊音信号的幅度和能量。 关于声道模型,目前最常用的有两种建模方法。一种是“声管模型 ,把声管视为由 多个等长的不同截面积的管子串联而成的系统,在语音信号的某一短时期内,声道可以表 示为形状稳定的管道。这是一种比较简单的声道模型。另一种是“共振峰模型 ,该模型 把声道视为一个谐振腔,共振峰就是这个腔体的谐振频率。由于入耳听觉的纤毛细胞就是 按频率感受而排列其位置的,所以这种共振峰的声道模型是非常有效的。一般来说,一个 元音用前三个共振峰来表示就足够了;而对于复杂的辅音或鼻音,大概要用到五个以上的 共振峰才行【1 0 1 。 声道模型坎z ) 给出了声道的传输函数。对于一般元音,可以用全极点模型来表示: y ( z ) = g ( 2 2 a ) 1 一a k z 以 k = l 其中为极点个数,g 是辐值因子,鲰是常系数。 而对于非一般的元音和大部分辅音,必须采用零极点模型来表示: r 6 r z 。 v ( z ) = 焉一 ( 2 2 b ) 1 一吼z 。一 七= l 声道的终端为口和唇,口唇的辐射在高频端较为明显,在低频端影响较小。辐射模型 浙江工业大学硕士学位论文 r ( z ) 可以认为是一阶高通滤波器,表示为: r ( z ) = r ( 1 一z 一) ( 2 3 ) 综上所述,一个完整的语音信号产生的数学模型可以三个字模型来表示,分别是:激 励模型、声道模型和辐射模型,其传输函数为: h ( z ) = g ( z ) y ( z ) r ( z ) ( 2 - 4 ) 其中,g 是就是声门脉冲模型滤波器;是声道传递函数,可以认为是共振峰全极 点模型;r 是辐射模型。对于声道参数,在一段较短的时间p 勺( 1 0 - - 3 0 m s ) 可近似认为是不 变的。因此,语音信号是一个局部平稳的随机信号,即具有短时平稳性。任何语音信号的 处理算法和技术都建立在短时基础之上的,即短时分析技术是语音信号处理的基础。 2 2 语音信号的线性预测分析0 l p a ) 语音信号处理的研究经历了几十年的发展,产生出了许多种处理技术和处理方法,其 中最强有力的分析方法之一就是线性预测编码( l p c ) 技术,或者称为线性预测分析技术 】【1 2 】。作为一种“按分析合成( a b s ) 的语音编码技术,l p c 广泛地应用在估计基本的语 音参数( 例如基音、共振峰、功率谱、声道面积函数以及用低速率传输和储存语音) 等方面, 并且已经成为了一种重要的技术。线性预测分析技术的重要性既在于它能够极为精确地估 计语音参数,又在于它的计算速度比较快【1 3 】。 2 2 1 线性预测分析的基本原理 根据语音信号产生的模型,语音信号酢) 可以用驱动信号或激励信号矾z ) ( 对于浊音 由脉冲序列来模拟,而对于清音由无规则白噪声来模拟) 通过一个具有稳定系统函数的数 字时变滤波器月( z ) 的输出来表示,如图2 - 2 所示。其中,当s ) 为确定性信号时,”( 拧) 为单 位冲激响应;当s ( ,2 ) 为随机信号时,“( 刀) 为白噪声。 “( 以) 时变滤波器 s ( 聍) i l 雕) 图2 - 2 语音信号s ) 的模型化 在基于参数模型的谱估计方面和系统辩识的研究中,常常假定系统的传递函数为有理 函数,即变量z 的有理分式。因此模型中的传递函数t - l ( z ) 写成如下的形式, l o 浙江工业大学硕士学位论文 1 + 岛z h ( z ) = g l ( 2 - 5 ) 1 一巳z 。 式中,系数吩,6 ,以及增益因子g 就是模型参数,而p 和g 是选定的模型的阶a 这样,信 号就可以用有限数目的参数构成的模型来表示了。 从数字滤波器的角度来看,月( z ) 是一个具有q 个零点和p 个极点的零一极点模型,称之为 自回归滑动平均( a l l t o r e g r e s s i v e m o v i n ga v e m g e ) 模型或a r m a 模型【1 4 1 。 而在语音信号的线性预测分析中,通常将日看作一个全极点滤波器,即假定b i = 0 , 此时在时域上就对应于自回归模型( a r t 模型) 。可以用下式来表示, 黔丽g2 忑g ) 式中彳( z ) = 1 膳配) ,是眉- ( z ) 的逆滤波器,一般称为预测误差滤波器。如果把式( 2 - 6 ) 变换 到采样的时间域,我们就得到了l p c 的差分方程 s ( 刀) = 馓( ,z ) + 乃s ( 聆一) ( 2 7 ) 即当前的输出值s ( 彩是由现在的输入样品的加权和过去输出样品的加权之和确定。因 此,在l p c i 拘分析中,问题表述为:给出信号s ( 刀) 的测量值,以便求出线性预测系数回,产1 , 2 ,p 。最后所得到的参量,就是系统函数酢) 参量的估计值。 如果吩表示回的估计,则误差或参差表示为 尹 p ( 刀) = s ( 聆) 一i ( 胛) = s ( 纷) 一乃s ( 门一_ ,) ( 2 8 ) 户l 其中;( 门) :pq s ( 行一) ,称为s ) 的线性预测值。现在可以用平均误差的最小化来确 j = l 定估计值,也就是 p e = e e 2 ( 功) = 耳 j ( 玎) 一叩( 刀一朋2 ) j = l 令删对于吩求偏导数,对妒1 ,2 ,p 为零,可以得到 p 仅,编( = ( f o ) j = i 式中: ( f ,j ) = e s ( n i ) s ( n 一) ) l l ( 2 9 ) ( 2 1 0 ) ( 2 1 1 ) 浙江工业大学硕士学位论文 r乏葶:篓2,;:(p-1)1r三al1=r三rn兰(1)rn(p-1)1 。2 。4 , l ( 1 ) ( o ) 心( p - 2 ) i la 2llr ( 2 ) l l : : 一 i i :ii :l 昭以 i& ( p - 2 ) ( 0 ) - j l a p jl 如( p ) j 浙江工业大学硕士学位论文 d 互= o - k :) e , 一。 上面各式中括号内的上标表示预测器的阶数,系数岛称为p a r c o r 系数( 部分相关系 数) ,也称之为反射系数,通常用于量化。l e v i i l s o n - d u r b i n 递归算法最终给出的解为乃- - 4 朋, j = o ,l ,p 。 2 2 2 线谱对( l s p ) 分析 线谱对又称为线谱频率( l s f ) ,是线性预测系数的另一种表示形式,同样可以用于估计 基本的语音特性。l s p 参数在数学角度上完全等价于其它的线性预测编码系数( 如l p c 系 数口,) 。近年来

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论