




已阅读5页,还剩75页未读, 继续免费阅读
(信号与信息处理专业论文)分布式电话调度系统语音编解码方案的研究及dsp实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 摘要 近年来,随着通信技术的迅速发展,语音压缩编解码技术也取得了突破性进 展。由于语音通信对数据带宽的要求越来越高,一系列国际组织的数据压缩标准 得到了广泛的应用,部分中低速码率的语音编解码技术已经标准化。在通信系统 中,语音编码技术决定了接收语音质量和系统容量,而v o i p 电话、多媒体通信、 综合业务数字通信和移动通信等多种业务的快速发展进一步提高了语音压缩编解 码技术的要求,降低传输码率、提高合成语音质量成为改进语音编码技术的关键。 目前,基于g 7 2 8 、g 7 2 9 等国际语音压缩标准的语音信号实时处理技术正逐 渐成为研究的热点领域,在诸多语音压缩标准中,基于共轭结构代数码激励线性 预测编码技术的g 7 2 9 语音编解码算法,具有8 k b p s 的编码速率、较低延迟和高 质量合成语音,在语音存储和语音传输领域得到了广泛的应用。但是该算法复杂 度较高,数据存储容量很大,对硬件设备有很多限制,如何在实际通信中实时实 现语音信号的编解码处理具有十分重要的意义。随着d s p 技术的发展,低成本、 低功耗和高性能的d s p 芯片为实时处理数字信号提供了必要条件,同时,在g 7 2 9 标准的基础上,需要对算法基于d s p 芯片的硬件系统进行大量优化工作,实现语 音信号压缩编码的实时处理。 本项目是基于c a n 总线分布式电话调度系统的一部分,主要研究基于d s p 的语音压缩编解码系统的实时实现,核心算法是i t u t 组织提出的q 7 2 9 标准共 轭结构码激励线性预测编码算法,核心硬件平台是基于t i 公司t m s 3 2 0 v c 5 5 0 2 芯片的语音信号处理系统。语音信号经过电话采集,模拟信号通过专用音频a d 转换器生成数字信号,然后在d s p 模块进行基于g 7 2 9 标准的压缩编码处理,将 压缩得到的码流通过串口送至接收端,在接收端进行解码处理,还原语音信号。 本文阐述了语音压缩编解码算法的基本原理,剖析了g 7 2 9 标准算法,并对该 方案从算法层面、编译器层面、c 语言及汇编语言层面给出了实时优化策略。通过 代码剖析工具测试结果显示,优化后的算法能够很好的完成g 7 2 9 算法的实时编解 码,合成语音质量的m o s 评分满足正常语音通信的基本要求,具有较好的听觉效 果。 基于c a n 总线的分布式电话调度系统可以用于网络音频视频信号传输、视频 电话会议等通信领域,而语音压缩模块的实现作为该系统的关键组成部分,也可 应用于i p 电话、计算机电话集成等诸多语音通信系统中,具有很好的参考和实用 价值。 关键词:语音压缩编解码,g 7 2 9 算法,d s p ,传输码率,合成语音 重庆大学硕士学位论文 i i 英文摘要 a b s t r a c t i nr e c e n ty e a r s ,w i t ht h er a p i dd e v e l o p m e n to fc o m m u n i c a t i o nt e c h n o l o g y ,t h e c o m p r e s s i o no fs p e e c hc o d i n gt e c h n o l o g yh a sa l s om a d eb r e a k t h r o u g hp r o g r e s s i n o r d e rt os a t i s f yt h eg r o w i n gn e e d so fi n t e n s eb a n d w i d t hd e m a n d ,as e r i e so f i n t e r n a t i o n a ld a t ac o m p r e s s i o ns t a n d a r d sh a v ew i d ea p p l i c a t i o n s ,a n ds o m ee n c o d i n g t e c h n i q u e sa tl o wr a t eo rm i d d l er a t eh a v eb e e ns t a n d a r d i z e da n di n d u s t r i a l i z e d t h ef a s t d e v e l o p m e n ti ns p e e c hc o m m u n i c a t i o nf i e l ds u c ha sv o i p ,m u l t i m e d i ac o m m u n i c a t i o n , m o b i l es p e e c hc o m m u n i c a t i o na n di s d nr e s u l t si nh i g h e rr e q u i r e m e n t sf o rs p e e c h c o m p r e s s i o nc o d e ct e c h n o l o g y a tp r e s e n t , t h er e s e a r c ho fr e a l - t i m ei m p l e m e n t 、历t l l g 7 2 8a n dg 7 2 9a l g o r i t h mi sg e t t i n gm o r ep r e v a l e n t i na c c o r d a n c e 、j ,i t l lc o n j u n c t i o ns t r u c t u r a la l g e b r ac o d ee x c i t i n gl i n e a rp r e d i c t i o n , t h eg 7 2 9a l g o r i t h mh a sb e e nw i d e l yu s e di ns p e e c hs i g n a lp r o c e s s i n g t h es y n t h e s i z e d s p e e c h 谢t l lg o o dq u a l i t y ,l o wb i tr a t ea n dt i m ed e l a yc a nb ea p p l i e di nm a n yf i e l d ss u c h a ss p e e c hs t o r a g ea n dt r a n s m i s s i o n h o w e v e r ,t h eh i g ha l g o r i t h mc o m p l e x i t y 晰廿l g 7 2 9r e s u l t si nd i f f i c u l t yo fr e a l - t i m ei m p l e m e n t o w i n gt ot h ea d v a n t a g eo fd s p t e c h n o l o g y ,t h ed s pc h i p s 谢t l ll o w - p r i c e ,l o w - c o n s u m p t i o na n dh i g h p e r f o r m a n c ec a n e f f i c i e n t l ys o l v et h ep r o b l e mm e n t i o n e da b o v e m e a n w h i l e ,i na c c o r d a n c e 诚t l lg 7 2 9 a l g o r i t h m ,t h e r ea l s on e e d sp l e n t yo fo p t i m i z a t i o nb a s e do nd s ph a r d w a r es y s t e ms oa s t or e a l i z es i g n a lc o m p r e s s i o ni nr e a l t i m ep r o c e s s i n g t h et a s ki so n e p o r t i o no fd i s t r i b u t e dp h o n es c h e d u l i n gs y s t e mb a s e do nc a n b u s t h e t a r g e t i st o d e v e l o p as p e e c h c o m p r e s s i o ns y s t e ma c c o r d i n g t oi t u - t r e c o m m e n d a t i o ng 7 2 9 ,a n dt h ek e yh a r d w a r eo ft h es y s t e mi st e x a si n s t r u m e n t so f t m s 3 2 0 v c 5 5 0 2 s p e e c hf r a m e sa r ec a p t u r e dt h r o u g hat e l e p h o n ea n dt r a n s f o r m e di n t o d i g i t a ls i g n a lb ya n a u d i oa dc o n v e r t e r t h ed a t as t r e a m sa r ee n c o d e di n t m s 3 2 0 v c 5 5 0 2i na c c o r d i n gt og 7 2 9a l g o r i t h ma n dt h eo u t p u td a t ai si nb i ts t e a m f o r m a t t h r o u g ht h ei n t e r f a c ed e v i c e ,t h ed a t as t r e a m sa r et r a n s m i t t e dt o t h er e c e i v e r f i n a l l yt h eb i ts t r e a m sw i l lb ed e c o d e d a n dc o n v e r t e di n t os y n t h e s i z e ds p e e c hs i g n a l t h ep a p e ri n t r o d u c e ss e r v e rp r e v a l e n ts t a n d a r d so fs p e e c hc o m p r e s s i o na n d d i s c u s s e ss o m ep r i n c i p l et h e o r ya b o u ta c o u s t i cs i g n a lp r o c e s s i n g t h r o u g hs t u d y i n ga n d a n a l y z i n gt h eb a s i ct h e o r yo fg 7 2 9a l g o r i t h m ,t h et a s km a i n l yc o n c e n t r a t e so nt h e o p t i m i z a t i o no fr e a l t i m ei m p l e m e n t ,i n c l u d i n ga l g o r i t h mo p t i m i z a t i o n ,c o m p i l e r o p t i m i z a t i o n , cl a n g u a g eo p t i m i z a t i o n ,a n da s s e m b l e rl a n g u a g eo p t i m i z a t i o n t h e i i i 重庆大学硕士学位论文 e x p e r i m e n tt h r o u g hc o d ep r o f i l e rs h o w st h a tt h es p e e c hc o m p r e s s i o ns y s t e mb a s e do n i m p r o v e dg 7 2 9p r o g r a mc a ne n c o d ea n dd e c o d et h es p e e c hs i g n a li nr e a lt i m e t h e m o ss c o r eo ft h es y n t h e t i cs p e e c hc a na c h i e v eb a s i cr e q u i r e m e n t so fn o r m a lv o i c e c o m m u n i c a t i o nw h i c hh a sa h i g hq u a l i t ya n dg e t sg o o dp e r f o r m a n c e t h ed i s t r i b u t e dp h o n es c h e d u l i n gs y s t e mb a s e do nc a nb u sc a nb ew i d e l yu s e di n n e t w o r ka u d i ov i d e os i g n a lt r a n s m i s s i o n ,v i d e oc o n f e r e n c ee t c a sa ni m p o r t a n tp a r to f t h es y s t e m ,t h es p e e c hc o m p r e s s i o nm o d u l ec a na l s ob ea p p l i e di ni pt e l e p h o n ea n d o t h e rs p e e c hc o m m u n i c a t i o n s y s t e m s ,w h i c hh a ss p e c i a lr e f e r e n c ea n dp r a c t i c a lv a l u e s k e y w o r d s :s p e e c hc o m p r e s s i o n ,g 7 2 9a l g o r i t h m ,d s p ,t r a n s m i s s i o nb i tr a t e , s y n t h e t i cs i g n a l i v 1 绪论 l 绪论 1 1 引言 语音信号处理是- - i 1 包含多个研究领域的综合学科,它不仅仅与计算机、通 信等学科联系紧密,而且涉及到语音学、神经生理学、数理统计学等其他学科知 识【l j 。计算机的高速发展为数字语音信号处理提供了良好的发展平台,自六十年代 以来,随着计算机和信息技术的飞速提高,数字信号处理技术也相继有了很大的 进展。近些年来,数字语音信号的处理建立在理论研究、具体实现和实际应用的 模式中迅速发展起来。随着信息技术的不断发展,尤其是网络技术的日益完善和 普及,语音信号处理技术正发挥着越来越重要的作用,并出现许多新的研究方向。 语音编码技术根据语音信号的基本特征,采用相关数字信号处理技术使语音 通信数字化。近几年,语音编码技术在数字通信系统、移动通信系统、计算机通 信等各个领域有广泛的应用,尤其是在高速发展的移动通信领域中,语音编码技 术有十分重要的作用。随着数字技术的飞速发展,数字业务量急剧增长,如何在 保证高质量语音的前提下采用最低码率来存储和传送数字语音信号,提高信道带 宽利用率和降低应用成本等技术成为语音信号处理领域的研究热点【2 】。 本课题通过对目前国际语音压缩编码标准进行对比分析,提出高效率、低算 法复杂度的优化编码方案,以t i 公司t m s 3 2 0 v c 5 5 0 2 为硬件平台,实时实现语音 信号的采集、压缩编码等处理,该课题对于个人移动通信、数字卫星系统、高质 量数字移动无线通信及i p 电话等领域中的语音信号处理有重要研究意义,为高质 量、低码率语音信号传输提供了有效途径。 1 2 课题来源及工程价值 本课题研究背景为指导老师所持有的分布式调度电话系统软件设计与开发项 目。基于c a n 总线的数字调度电话一期工程需要完成普通调度电话的所有功能, 同时实现语音数据通过c a n 总线进行的v o i p 通讯。其中,语音信号采集和压缩 编码成为系统语音处理的主体部分,在d s p 硬件系统上实时实现语音信号编解码 功能。 目前语音压缩处理算法已经比较成熟,也存在不同的码率压缩标准,然而, 由于语音压缩标准算法具有很高的算法复杂度和数据存储容量,并且对硬件要求 比较高,如何在d s p 芯片上实现语音信号的实时压缩编码处理是一个难点。 本项目课题采用共轭结构代数码激励线性预测语音编码,通过熟练掌握g :7 2 9 各项关键技术对算法进行改进和精简,在d s p 系统上实时实现语音的编解码功能。 该课题研究结果对语音编码技术基于d s p 的实时实现具有很强的实用价值,并且 重庆大学硕士学位论文 为语音压缩技术应用在数字信号处理技术的其他领域提供参考价值。 1 3 语音编码技术概述 语音编码属于信源编码,是将模拟语音信号转变为数字信号以便在信道中传 输。其目的是在保证一定算法复杂度和通信时延的前提下,占用尽可能少的通信 带宽,传送尽可能高质量的语音信号。语音编码技术一般情况下包括波形编码、 参数编码、混合编码三种类型。 波形编码是对语音信号的波形进行数字编码,在编码过程中保持语音信号波 形尽量与原始语音信号相同,在接收端还原出语音信号。波形编码对噪声抗干扰 能力强、合成语音质量比较理想,但是波形编码对数码率要求比较高,一般为 1 6 k b p s 一6 4 k b p s 。参数编码是通过提取语音信号的主要特征参数进行编码,在接 收端对参数进行相应的解码,重构语音信号。参数编码是根据听觉感知合成语音, 与波形编码不同的是,它对语音信号波形没有很高要求,另外,参数编码的数码 率要求没有波形编码要求高。混合编码方案是结合波形编码和参数编码两种方式, 基于语音波形和听觉感知的基本原理构造合成语音,一方面增加语音的自然度, 提高语音质量,另一方面,也满足了较低的数码率指标。 从最初的6 4 k b p s 标准p c m 波形编码器到现在4 k b p s 以下的参量编码器,语 音压缩编码在近期迅速发展。随着无线电话领域g s m 系统逐步替代传统的模拟无 线电话系统,移动通信由单纯的数据信息向多媒体方向的第三代移动通信系统模 式发展,高效优质的语音编码成为这些新式通信系统的基本关键技术之一。 1 4 语音压缩编码国际标准 随着语音通信和数据存储领域的迅速发展,高质量、低速率的合成语音编码 需求逐渐增加。由于各种运算、存储器件性能的日益提高和完善,目前已经开发 了多种成熟的语音编码算法,针对不同的应用,国际电信联盟( i t u ) 在语音编码 技术的标准化方面制定了很多标准,其中比较典型的包括g 7 1 1 ,( 3 7 2 3 ,g 7 2 6 , g 7 2 8 ,g 7 2 9 等标准,具体压缩标准对比情况如表1 1 所示。 表1 1i t u t 语音压缩编码标准对比 里尘! 皇! :! 堡q 翌p 璺堕! q 旦q 尘皇! 巳皇皇璺垒璺q 堕p 堡! ! ! q 翌墅垒望垒! ! ! 堂皇箜呈堕q 旦! ! 堕:! 算法 g 7 11 g 7 2 3 1g 7 2 6g 7 2 8 ( 3 7 2 9g 7 2 9 a 标准p c m m p c m l q v b r - a d p c ml d - c e l pc s - a c e l pc s a c e l p 传输 6 4 5 3 6 41 6 2 4 3 2 4 0 1 6 88 鱼奎坠匹 一 鉴虹兰坠笆坠笆鉴坠堕j 坠笆 2 1 绪论 r a m1502 k 2 k2 5 k2 k 适用公用低速多媒体数字通信无线通信 无线、室外移动、多媒 场合 通信网系统调制器卫星通信体通信 g 7 1 1 最早被i t u t 定为语音编码标准,码率为6 4 k b p s ,处理程序简单,语 音质量最佳,在电话网中使用广泛。( 2 7 2 1 标准采用线性预测算法,基本保证音质 的前提下,得到3 2 k b p s 的压缩码率,同时音质和自然度都比较满意,得到了普遍 认可。g 7 2 8 标准结合参数编码和混合编码技术,进一步降低编码速率至1 6 k b p s , 算法时延小于2 m s ,同时,语音质量的m o s 评分可以达到4 分以上。i t u t 在1 9 9 6 年提出( 2 7 2 9 语音压缩标准,基于改进的共轭结构码本激励线性预i 贝t j ( c s a c e l p ) 算法,进一步压缩码率至8 k b p s ,同时,合成的语音质量与g 7 2 1 标准相当,是目 前语音编码算法中最普遍接受的编码标准【3 】。 基于各种中低速率的编码方案,i t u t 提出的g 7 2 9 a 采用共轭结构码激励线 性预测编码基本理论,能够适合现代通信系统的要求,本文主要讨论g 7 2 9 a 算法 在d s p 的实时实现。g 7 2 9 标准算法压缩码率低、合成语音质量高并且应用范围 较广,但是该算法复杂度较高,在硬件设备中实现较困难,因此,为了满足d s p 的语音压缩编码实时性要求,需要对g 7 2 9 a 算法优化,对此,本文也提出了自己 的创新方法。 1 5 语音编码器性能标准 语音压缩编码为了实现语音质量较高、编码时延较小的低码率合成语音。表 征语音编码器的主要性能指标包括:合成语音质量、编码速率、编解码时延、算 法复杂度和重构语音质量【4 l 。这四个因素紧密相关,在不同的应用中侧重要求不同, 具体需要根据实际情况综合考虑上述指标。 码率大小是语音编码的首要指标,为了提高数字信号的传输效率,降低码率 重庆大学硕士学位论文 是语音压缩编码的主要任务。根据编码速率,通常编码器包括码率固定编码器和 码率可变编码器。编码速率用比特秒( b p s 或b i t s ) 表示,与采样速率和每个采样点 编码位数有关。 编解码延时是编码器性能的一个重要方面,主要包括:编解码过程产生的运 算延时、硬件处理延时和通信延时。在实时语音通信系统中,信号传输延时导致 语音信号失真,对正常通话产生很大影响。 算法复杂度一般指的是时间复杂度和空间复杂度,是决定硬件条件的关键因 素。等码率条件下,尽可能采用较高复杂度算法来提高合成语音质量;若保证相 同的合成语音质量,采用复杂度高的算法可以降低码率,二者对硬件要求都会相 应提高。 合成语音质量是编码器的一个重要指标,通过清晰度和自然度衡量合成语音 质量。清晰度表征语音的可懂程度,自然度衡量讲话人的识别效果。合成语音质 量的判定方法包括主观评价和客观评价两种方法。客观评价方法包括信噪比 s n r ( s i g n a lt on o i s er a t i o ) ,p s q m ( p e r c e p t u a ls p e e c hq u a l i t ym e a s u r e ) 等,适应于高 速率波形编码评价标准。主观评价方法是根据听者对语音的主观感知,按照既定 的失真语音质量等级对合成语音进行测评,主要包括平均意见得分m o s ( m a i n o p i n i o ns c o r e ) ,诊断满意度测量d a m ( d i a g n o s t i ca c c e p t a b i l i t ym e a s u r e ) 等,该方 法简单易行,评价符合主观感受,适合中低码率压缩标准算法。 上述诸多评价标准中,最常见的评价标准为m o s 评分测评,包括5 个质量等 级,一般的语音编码算法m o s 评分不低于3 0 ,称为合成语音质量,具有足够高 的可懂度,但自然度较低;3 5 分左右称为通信质量,重构语音质量有所提高,可 以正常通信,满足基本语音系统的通话要求;若合成语音质量满足m o s 分在 4 0 4 5 之间则达到了很好的满意度;具体各个等级标准如下表1 2 所示: 表1 2m o s 评分标准等级 t 如l e1 2s t a n d a r dl e v e l so fm o ss c o r e 4 1 绪论 1 6 本文的主要研究内容 本文介绍了基于t m s 3 2 0 v c 5 5 0 2 的g 7 2 9 a 语音信号压缩编码系统的设计与 实现。文章主要内容安排如下: 第一章:绪论,语音编码技术的概述以及语音压缩编码标准的介绍,阐述了 语音编码器的评价标准,论述了课题研究的来源和工程价值; 第二章:介绍了语音信号发生器模型,详细论述了语音编码c e l p 技术的理 论基础,分析了语音编码技术的关键理论技术,为设计语音信号编码方案提供理 论依据; 第三章:阐述了g 7 2 9 语音编码算法的基本理论,分析了g 7 2 9 a 语音编解码 原理,重点分析算法中的关键技术; 第四章:论述了数字信号处理系统的设计与开发基本方法,介绍了d s p 系统 的基本组成和开发流程,重点阐述了d s p 芯片的选择方案,为系统硬件设计提供 了理论依据; 第五章:详细介绍了语音信号压缩编码系统的设计与实现,给出了系统总原 理结构图和各个功能模块说明,阐述了硬件系统的设计方法; 第六章:具体论述了g 7 2 9 编解码算法优化的实现方案,对g 7 2 9 算法的关键 技术进行代码分析,提出了编译器级优化、c 语言和汇编语言级优化以及算法级优 化思想,给出了基于d s p 芯片的降低算法复杂度、提高代码运行效率的具体优化 方案; 第七章:语音采集与压缩编码处理系统的测试与结果分析,给出了语音采集 信号的调试结果,对算法优化后的程序执行结果作出比较,通过仿真波形与压缩 编码后合成语音m o s 评分结果,对编码器合成语音质量进行分析。通过系统性能 测试,进一步表明该系统可以实时实现语音采集与压缩编码的功能; 第八章:总结该项目课题中所作的工作,提出下一步需要进行的工作以及对 进一步研究语音编码系统实际应用的展望。 重鏖奎堂堡主堂垡笙奎一_ _ _ - _ _ _ - _ - _ _ - _ _ i _ _ _ _ - _ _ _ _ _ - - - - 一 6 2 语音信号c e l p 编码基础 2 语音信号c e l p 编码基础 2 1 c e l p 编码原理概述 g 7 2 9 标准采用c s a c e l p 算法,基于c e l p 技术理论基础,根据语音信号发 生器模型,采用共轭结构码激励线性预测编码的关键技术,合成语音信号,是目 前实现语音压缩编码算法的重要参考标准【5 】o 本节介绍了c e l p 编码系统的基本原 理,阐述了相关技术理论模型和编码合成语音的性能特点。 2 2 语音信号发生器的数学模型 语音信号发生器模型f 6 1 如下图2 1 所示,该模型采用数字信号处理技术模拟发 音器官,其中,系统参数与语音信号的产生有密切关系,选定一组参数,使系统 输出预期语音信号。 图2 1 语音信号发生器模型 f i g2 1m o d e lo fs p e e e hs i g n a lg e n e r a t o r 在上述模型中,输入语音信号类似于准周期脉冲序列或随机白噪声在线性时 不变系统的输出,语音信号发生器模型分为激励源模型、声道模型和辐射模型三 部分。 2 2 1 激励源模型 激励源分为清音和浊音,根据清浊音的判决门限来决定语音是浊音还是清音。 发清音时声道被阻碍形成湍流,使用均值为0 ,方差为l 的高斯白噪声模拟。浊音 可以用斜三角脉冲表示。因此,激励信号可以通过周期性的斜三角脉冲串来表示。 斜三角脉冲表达式为: 重庆大学硕士学位论文 扣c o s 印 c 。1 ) 咖) 十咖喏) 】 0e l s e ( l ,l n l + n 2 ) ( 2 1 ) 上式中,n 。为斜三角波上升部分时间,n :为下降部分时间, 个低通滤波器,基于z 变换的全极点模型如下: g ( z ) = 石再 其频谱特性相当于一 其中c 为常数。 斜三角脉冲串是单斜三角脉冲通过单位脉冲串激励后的结果, 可以表示为: ) = 南 ( 2 2 ) 其数学表达式 ( 2 3 ) 因此,整个激励模型可表示为: ) - g ( z ) ) 2 南石专可 ( 2 4 ) 2 2 2 声道模型 声道模型是由若干声管串联形成的系统,若管道模型包括n 节声管串联,其 系统函数为: 0 5 0 + t o ) 兀o + r k ) z - 2 矿( z ) =( 2 5 ) 其中,g 是声门处的反射系数,吼是常系数。除了该模型之外,还有其他声 道模型,例如整个声道被模拟为一个零极点的谐振腔模型等。 2 2 3 辐射模型 辐射模型表征为口唇端辐射,也称之为辐射效应。在高频阶段,口唇端辐射 较大,而在低频阶段,辐射效应比较弱,因此,辐射模型类似于一阶高通滤波器, 其辐射效应可以表示为: 尺( z ) = r o ( 1 一z - 1 )( 2 6 ) 由上可知,语音信号发生器模型可以表示为3 个子模型串联,传递函数 可表示为: ( z ) = u ( 三) y ( z ) 尺( 三)( 2 7 ) 2 语音信号c e l p 编码基础 2 3 语音信号线性预测分析 线性预测分析( l p c ) 目前已经成为估计基本语音参数的主要技术,被广泛用于 语音信号的分析方面。其中,基本语音参数包括基音、频谱、共振峰、声道面积 函数及存储语音低速率传输等诸多方面。在语音信号模型化的基础上,l p c 分析 方法将语音信号的当前抽样值用过去的若干个抽样值进行线性组合逼近,要求线 性估计值与实际采样值的平方误差和达到最小,从而得到唯一的一组预测系数。 2 3 1 语音信号模型化 信号模型化是把时间序列s ( 力) 转化为白噪声u ( 丹) 通过数字滤波器日( z ) 产生的 输出结果,数字滤波器( z ) 表示如下: 1 + 圭岛z t 日( z ) = g 掣一 ( 2 8 ) | - - 2 d i z 一1 式中,口,岛和增益因子g 为模型参数,输入信号模型化如下图2 2 所示: u 、i l , s t n ) h ( n ) 图2 2 信号s ( ,1 ) 模型化 f i g2 2m o d e l i n go fs i g n a ls ( 聆) 图2 2 中,模型输入信号为【,( ”) ,通过数字滤波器日( 刀) 后,模型化信号输出结 果为s ( n ) ,相应的z 变换可表示为: s ( z ) = h ( z 渺( z )( 2 9 ) 其中,时域信号输入与输出满足如下差分方程: d口 s ( ) = z a , s ( n - i ) + g 2 b ,”o - 1 ) ,b o = 1 ( 2 1 0 ) f = li - - - o 由上可知,模型参数估计是信号模型化的关键问题,对于时变信号,需要采 用逼近方法求解模型参数,实际中采用线性预测误差滤波方法实现模型参数的求 解。 2 3 2 线性预测误差滤波 线性预测方法的基本原理是对信号当前的采样值用过去若干个采样值线性逼 近,从而实现线性估测值与采用值误差平方和最小,该组线性预测参数即为滤波 器预测参数。线性预测过程主要通过线性预测误差滤波器实现,具体滤波过程如 9 重庆大学硕士学位论文 下图2 3 所示: 0 n ,el n j ( z ) 图2 3 线性预测误差滤波 f i g2 3l i n e a rp r e d i c t e de r r o rf i l t e r 上图中,输出信号“开) 为预测器的预测误差,是真实值j ( ,) 和预测值j ( 功之差: p ( 疗) :s ( 刀) 一;( 玎) :s ( 刀) 一兰口f s 。一f ) ( 2 1 1 ) j = l 式中,q 为一组线性预测器的系数,依据最小均方误差准则,实现线性预测的 最佳逼近效果,估测系数 ,( j ) 一圭口r ( - ,一f ) :o 括1 。 1 _ ,s p( 2 1 2 ) 口 e p = ,( o ) 一口,( d 2 3 3 语音信号的矢量量化 矢量量化技术( v e c t o rq u a n t i z a t i o n ) 是语音压缩编码技术的一个重要方面,其基 本思想是对于七维空间的任一输入矢量,搜索m 个量化矢量所构成的码书中码本距 离最近的码字,输入矢量的编码结果为该码字的序号,经过信道传输,在接收端 根据该序号从码本中找到对应的码字重构原始输入矢量。矢量量化的原理框图如 下图2 4 所示: 图2 4 矢量量化原理框图 f i g2 4p r i n c i p l ed i a g r a mo fv e c t o rq u a n t i z a t i o n 矢量量化器是根据实际效果,寻找适当的失真测度方法,构成最佳量化器系 统,从而减少算法的复杂度提高合成语音信号的信噪比。衡量矢量量化器的性能 2 语音信号c e l p 编码基础 指标主要包括:码本大小m ,信道传输的码率f ,每个样点所需比特数,以及矢量 量化的平均信噪比s n r 。 假定码矢量的下标表示为r 比特的数,则码本大小可表示为m :2 r ;若系统单 位时间内输入n 个矢量,码率大小为f = r * n ( b s ) ;输入的k 维矢量由七个信号采 样点构成,= r k ( b i t s a m p l e ) ;平均信噪比s n r 用于表示在单位时间内输入信号矢 量的平均能量与输入信号矢量相对于码本矢量平均失真的比值,其计算值可以通 过式( 2 1 3 ) 求解。 s n r _ 1 0 l g 垒蚓:!( 2 1 3 ) 2 4 感知加权滤波器 感知加权滤波处理是中低速率语音编码算法的一个重要方面。在线性预测 l p c 分析中,仅仅根据均方误差最小准则判定合成语音质量并不能得到最优解, 感知加权最小均方误差准则弥补了这方面的不足。在编码端语音合成时,感知加 权滤波器通过对误差做形变处理,在频谱共振峰处增大能量的分布,在频谱低估 区减少误差能量分布,对能量谱分布进行调整后能够屏蔽噪声干扰,有效提高合 成语音的主观质量。 在对误差信号进行感知加权处理过程中,基于线性预测分析,引入感知加权 滤波器( 门,其z 域表达式为: 1 + y 口;z f 职加蒜2 焘 亿 一 i = 1 上式中,感知加权滤波器表征值包括a i 和7 ,其中,a t 为线性估测系数,为 权重因子,决定共振峰区域信号误差的增加量。大量实验数据表明,在8 k h z 采样 频率下,) ,:0 8 较为合适。 基于g ;7 2 9 算法,感知加权滤波器的传递函数表示为: 晔) = 渊 ( 2 1 5 ) y 。,:用于调整感知加权滤波器传递函数的零极点,用于调整语音信号频谱共 振峰的升高和降低。 2 5 码激励线性预测编码 码激励线性预测( c o d ee x c i t e dl i n e a rp r e d i c t i o n ) 编码技术基于矢量量化( v q ) 方法编码,对语音信号编码时,通过对码本矢量的遍历搜索,找到对应的码激励 重庆大学硕士学位论文 矢量,使得该矢量与原始语音信号矢量的误差平方和最小。码激励矢量所对应的 序号经过信道传输到达接收端。在接收端,根据相同的码书,按照接收到的序号 找到相应的码激励矢量。c e l p 技术基于分帧编码处理,每帧的长度为2 0 m s 一3 0 m s , 再将每帧划分2 5 个子帧,码激励矢量的搜索范围缩小至每个子帧。c e l p 编码原 理图如图2 5 所示: 图2 5c e l p 算法原理图 f i g2 5p r i n c i p l ed i a g r a mo fc e l pa l g o r i t h m c e l p 算法基于语音信号线性预测模型,采用合理的激励信号和模型参数,合 成语音质量高,抗噪声性能好,适合在5 3 1 6 k b i t s 的中低码率语音压缩编码方面 的应用。 2 6 本章小结 本章主要介绍了c e l p 编码技术的基本原理,涉及到语音信号发生器的构造 模型,阐述了语音信号线性预测分析、误差滤波、矢量量化、感知加权滤波处理 等相关理论基础,详细描述了在语音编码应用中的c e l p 编码技术的主要性能特 点,为后期的课题研究提供理论基础。 3 基于g 7 2 9 语音编解码算法 3 基于g 7 2 9 语音编解码算法 3 1 引言 g 7 2 9 语音压缩编码算法采用共轭结构码激励线性预i 贝d ( c s a c e l p ) 模型,在 8 k h z 采样频率下,每帧长度为1 0 m s ,一帧包括8 0 个采样点,以一帧为单位对语 音信号进行分析并且提取基于c e l p 模型的相关参数,例如线性预测滤波器系数、 固定码本搜索、自适应码本搜索以及固定码本和自适应码本增益大小,提取的参 数进行编码,经过信道传输。其中,对参数进行编码的码字比特分布见于表3 1 所 利7 。通过信道传输后进行解码,恢复激励源与合成滤波系数,在短时合成滤波器 中激励源信号重构语音。c e l p 编码器模型见于图3 1 。 表3 1c e l p 编码参数比特分配情况表 a b l e3 1p a r a m e t e r sb i ta l l o c a t i o no fc e l pe n c o d e r 接收到的比特流 图3 1c e l p 编码器原理模型 f i g3 1p r i n c i p l em o d e lo fc e l p e n c o d e r 输出语音 重庆大学硕士学位论文 3 2c s a c e l p 编码原理概述 c s a c e l p 编码原理【8 】见于图3 2 。在预处理模块中,原始输入语音信号经过 高通滤波器处理,以一帧为单位进行线性估测分析,求解相应的l p 参数,同时, 将l p 参数转化为线谱对参数并进行矢量量化。采用分析合成搜索方法选择激励信 号,通过感知权重滤波器处理后根据感知权重失真度量准则使得重构语音信号与 原始语音信号的误差达到最小。最后,自适应调整感知权重的大小,从而进一步 改善输入信号的阶跃频率响应。 皇! ! ; 囤专兰蛔黼 l p c 信息l 。 输入语音信号经过截止频率为1 4 0 h z 的高通滤波器预处理和定标,处理后的 信号作为后续输入信号。在编码过程中,每4 0 个采样点构成5 m s 子帧,在予帧范 围内搜索码本参数,包括固定码本和自适应码本参数。以帧为单位估计开环增益 时延,线性预测分析后的残余信号经过权重合成滤波器矽( z ) j ( z ) 处理后,得到目 标信号。在目标信号工( n ) 与权重合成滤波器的冲击响应 ( 门) 的作用下,计算自适应 码本参数,包括基音时延和增益大小。目标信号x ( 玎) 减去滤波处理后自适应码本部 分得到新的目标信号f ( 玎) 9 在固定码本搜索中循环更新从而得到最佳码激励矢量, 最后,根据最优激励信号更新滤波器内存。 3 基于g 7 2 9 语音编解码算法 3 2 1 编码预处理 编码器的输入是1 6 比特p c m 信号,预先处理操作包括两部分:信号定标和 高通滤波。为了避免算法处理过程中的定点运算溢出问题,信号定标处理是一个 十分重要的环节。为了减少直流和低频分量的干扰,基于二阶零极点的高通滤波 器能够有效滤除信号频率少于1 4 0 h z 的低频或直流分量,高通滤波器的传递函数 、0 4 6 3 6 1 7 8 0 9 2 7 2 4 7 0 5 z 一1 + 0 4 6 3 6 3 7 1 8 z 一,、 1 - 1 【z j = = 一 j 1j l 1 9 0 5 9 4 6 5 2 1 + 0 9 11 4 0 2 4 z “ 、。 3 2 2 线性估测分析及量化处理 专= 一 ( 3 2 ) 一:= 一 l 彳1 + 懿z 一 一 j 上式中,量化后线性估测系数为a ,。对每一个语音帧采用3 0 m s 非对称窗的自 相关性大小进行短时预测处理,每帧包括8 0 个采样点,进行加窗处理并计算自相 关系数,根据l e v i n s o n 算法将自相关系数转化为线性估测系数,在l s p 域进行量 根据g - 7 2 9 标准建议,l p 分析窗由i 1 个汉明窗和 周期的余弦函数组成。l p 州:0 5 4 - 0 ,4 6 c o s 静删,“。,1 9 9 ( 3 3 ) 矽门5 1c 。萌二:2 。,2 3 9 3 3 i 、 1 5 9 。 ,( 七) = s ( 刀) j ( n - k ) k = o ,l o ( 3 5 ) ,r ( ( j | o ) ) = :1 w ,口0 0 。0 ( 州l r ( o 七) ) k :l ,10 ( 3 6 ) ,( j | ) = v ,口g ( 七) ,(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 合同书与协议书
- 2025 车辆买卖合同范本(标准版)
- 黑龙江省安达市四平中学2026届数学九年级第一学期期末统考试题含解析
- 2025转让股权合同 转让股权合同范本
- 山东省济宁市邹城市九级2026届八年级数学第一学期期末达标检测模拟试题含解析
- 浙江省湖州市实验学校2026届数学九年级第一学期期末考试试题含解析
- 2026届湖北省襄阳市老河口市七年级数学第一学期期末综合测试试题含解析
- 2025网约车租赁合同的模板范文
- 在线教育行业现状与未来展望研究报告
- 2025合同范本股权激励协议附带保密条款示例
- 2025年初级药师资格考试试题(附答案)
- 2025国企竞聘上岗与干部竞聘上岗笔试题及答案
- 人工智能与建筑产业体系智能化升级研究报告
- 武科大大学生手册考试内容及答案
- 集装箱吊装专项施工方案
- 2025年中国家用WiFi路由器行业市场全景分析及前景机遇研判报告
- 包覆拉拔法制备铜包铝、铜包钢双金属导线的多维度探究与展望
- 2025年领导干部任前廉政法规知识考试题库(含答案)
- 2025年山东省济宁市邹城市第十一中学中考二模数学试题
- 信息技术基础教程(WPS版)课件 第3章 Windows 10 操作系统的使用
- 小鹿斑比题目及答案
评论
0/150
提交评论