(信号与信息处理专业论文)数字语音在调幅广播信道中的传输的研究.pdf_第1页
(信号与信息处理专业论文)数字语音在调幅广播信道中的传输的研究.pdf_第2页
(信号与信息处理专业论文)数字语音在调幅广播信道中的传输的研究.pdf_第3页
(信号与信息处理专业论文)数字语音在调幅广播信道中的传输的研究.pdf_第4页
(信号与信息处理专业论文)数字语音在调幅广播信道中的传输的研究.pdf_第5页
已阅读5页,还剩48页未读 继续免费阅读

(信号与信息处理专业论文)数字语音在调幅广播信道中的传输的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 ( 3 , 7 2 3 1 和g , 7 2 9 是i t u t 推荐的语音编码标准其压缩率都很高高效的压缩意味 着信息“浓度”的增加,同时导致抗干扰能力的下降。当g 7 2 3 1 和g 7 2 9 应用于d a m 系统时,由于中、短波信道误码率较高,而且带宽又窄这就需要有一个效率很高的信 道编码,才能有效的保护信源数据,提高音质。通过对q 7 2 3 1 和g 7 2 9 和语音编码的研 究,发现其不同的编码参数对信道误码的敏感程度是不一样的。因此将有限的信道冗余 度用于保护重要的编码参数是提高信道编码效率的一个基本的原则。本文的主要工作就 是研究分析g 7 2 3 1 和0 , 7 2 9 语音编码的不同参数对信道误码的敏感度。 在本文的最后介绍了一个基于虚拟无线电思想的虚拟d a m 平台。这是一个用于协 助快速验证和测试d a m 系统研究的软件。 第l 章简要介绍了d a m 系统和中、低速率语音编码的基本原理,提出了本文研究 的课题。随后介绍了虚拟无线电的思想。 第2 章详细介绍了g 7 2 3 1 和g 7 2 9 语音编码的原理,并且比较了这两种语音编码算 法的异同。 第3 章采用人工引入误码的方法,计算了( 3 7 2 3 1 和( 3 7 2 9 语音编码的参数中的每一 个比特在受到误码干扰以后的还原语音信号的信噪比,分析了测试的结果得出了不同 参数对误码的敏感度。另外提出了一个对研究方法进行改进的考虑。 第4 章介绍了一个基于虚拟无线电思想的虚拟d a m 平台的开发需求,设计思路。 设计开发这个软件是为了能够快速的建立一个d a m 试验系统,用于协助验证测试d a m 系统中各个模块的研究结果。促使其不断完善。 第5 章对本文做了一个总结。 关键字:语音编码,( 3 7 2 3 1 ,g 7 2 9 ,误码敏感度,虚拟无线电 a b s _ c r a c t a b s t r a c t g 7 2 3 1a n d ( 3 7 2 9s p e e c hc o d e rb o t hr r ep u b l i s h e db yi t u - ta n dh a v eh i g hc o m p r e s s i o n r a t i o h i g hc o m p r e s sr a t i om e a n si n c r e a s eo ft h e “d e n s i t y ”o f t h ei n f o r m a t i o n ,a n dt h e r e f o r e 。 l e a d i n gd e g r a d eo f t h er o b u s l n e s so ft h ec o d e r b e i n ge m p l o y e db yd a m t r a n s m i t t i n gi nt h e m fa n dh f b a n d ,w h i c hh a sh i g h e rb i te r r o rr a t ea n dn a r r o wb a n d w i d t h ,( 2 7 2 3 1a n dg 7 2 9 r e q u i r em o r ee f f e c t i v ec h a n n e le n c o d i n gt ok e e pt h eh i g hs o u n dq u a l i t y a f t e rr e s e a r c h i n gt h e r u l e so f t h e s et w oc o d e r s i ti sf o u n d 也a td i f f e r e n tc o d e r p a r a m e t e r sh a v ed i f f e r e ms e n s i t i v i t i e s t ot h ec h a n n e le r r o ls op u tt h el i m i t e dc h a n n e lr e d u n d a n c yt o p r o t e c tt h em o r ei m p o r t a n t p a r a m e t e ri s ag o o dw a yt oi m p r o v et h ee f f i c i e n to ft h ec h a n n e lc o d i n g t h i sd i s s e r t a t i o ni s f o c u s e d o n t h es e n s i t i v i t i e s t o t h ec h a n n e le r r o r o f t h ec o d e r p a r a m e t e r so f g 7 2 3 1a n d ( 2 7 2 9 a tt h e1 a s tp a r to ft h i sd i s s e r t a t i o nav i r t u a ld a m p l a t f o r mb a s e do nt h ei d e ao f v i r t u a l r a d i ow a sd e s c r i b e d i nc h a p t e r1 t h et h e o r yo fd a m dm i d d l ea n dl o wb i tr a t es p e e c hc o d e rw a s b r i e f l y i n t r o d u c e d ,s u b s e q u e n t l yt h es u b j e c to f t h i sd i s s e r t a t i o na n d t h ev i r t u a lr a d i o i nc h a p t e r2 ,t h et h e o r yo fg ;7 2 3 1a n d ( 2 7 2 9w a sd e t a i l e di n 订o d u c e da n dac o m p a r i s o n w a sm a d eb e t w e e nt h et w o s p e e c hc o d e r i i l c h a p t e r3 ,b yu s i n gt h em a n u a l l ye r r o ri n t r o d u c i n gm e t h o dt h es n rf o rd e c o d i n g s p e e c hs i g n a lo f e a c he r r o r e db i tw a sc a l c u l a t e d b ya n a l y s i st h er e s u l to ft h ee x p e r i m e n tt h e s e n s n i v i t yw a sc o n c l u d e d i nc h a p t e r4 ,av i r t u a ld a m p l a t f o r mw h i c hw a sb a s e do nt h ei d e a lo fv i r t u a lr a d i ow a s i n t r o d u c e d t h i ss o f t w a r ew a sd e s i g n e df o rt e s t i n ga n dv e r i f y i n gt h er e s e a r c ho ft h ed a m s y s t e m i nc h a p t e r5 ,t h ec o n c l u s i o no f t h i sd i s s e r t a t i o nw a sm a d e k e y w o r d s :s p e e c hc o d i n g ,( 2 7 2 3 1 ,( 2 7 2 9 ,s e n s i t i v i t yt oc h a n n e le r r o r , v i r t u a lr a d i o i i i - 学位论文独创性声明 y 5 6 功船 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取 得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中 不包含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其 它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所 做的任何贡献均己在论文中作了明确的说明并表示了谢意。 关于学位论文使用授权的说明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学 位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。 本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外, 允许论文被查阅和借阅,可以公布( 包括刊登) 论文的全部或部分内容。论 文的公布( 包括刊登) 授权东南大学研究生院办理。 签名:鞋导师虢糊日鹏生p f 1 1d a m 简介 第1 章绪论 回顾无线广播的历史早在1 9 0 2 年美国人巴纳特i 史特波斐德成功地进行了第一次 公开的无线电广播试验。到1 9 2 0 年,美国的底特律、旧金山和匹兹堡等地开始出现了商 业无线电广播。 到了2 0 世纪末,电子信息技术“数字化革命”的大潮汹涌澎湃,许多技术领域都走 上了数字化的道路。如电信行业,数字程控交换机早在1 9 7 0 年代就已开始应用到1 9 9 0 年代更出现了i p 电话。数字化的视频技术也在蓬勃发展,数字影碟机( v c d d v d ) 走进 千家万户,数字电视广播也发展迅速。在这个轰轰烈烈的“数字化革命”大潮中,顺应 全面数字化的全球大趋势,无线广播也走上了数字化的道路。 欧洲的d a b ( 数字音频广播,即e u r e k a1 4 7 ) 属于高速、宽带、多路传输系统, 可以达到c d 环绕声音质自1 9 8 8 年公开演示以来,发展迅猛。但d a b 系统工作在l 和s 波段,需要占用新的频点。采用新的发射设各和的特殊接收机,影响了在国内的迅 速推广。新的d a m ( 数字调幅) 广播系统考虑到从模拟广播到数字广播的过渡阶段,直 接利用现有的中、短波发射机和信道,传输低码率信号,带宽很窄( 单边带4 5 k h z , 双边带9 1 0 k h z ) ,不仅可以达到f m ( 调频) 或c d ( 激光唱片) 音质还能实现与原 有模拟a m ( 调幅) 节目的同播,不占用新的频点,节省了频谱资源,相同覆盖范围的 d a m 广播所需的发射功率也比模拟a m 广播的小。接收机可采用现有的中、短波收音机 或新的数字收音机,其价格低廉。易于推广。因此将现有的a m 广播进行数字化改造, 是使a m 波段广播获得新生的一条必由之路。自1 9 9 0 年以来,3 0 m h z 以下频段中短波 广播的数字化问题逐渐成为各国广播电视技术研究中的一个重要课题。 为开发a m 波段的数字音频广播,欧洲成立了n a d i b ( 窄带数字广播) 机构e u r e k a 1 5 5 9 。1 9 9 7 年在德国柏林召开国际无线电展览会上,法国、德国和美国分别提出并展 示了各自的d a m 广播实验系统天波( s k y w h e ) 2 0 0 0 、r m 和v o a j p l - b 。1 9 9 8 年3 月在广州召开的d a m 广播世界无线电研讨会上,宣布世界性数字无线电组织( d r m ) 正式成立,其主要目的就是寻找最佳的d a m 系统,建立世界范围内通用的d a m 广播标 准,推广d a m 广擂技术。 作为国际电信联盟( i t u ) 的成员,欧洲的d r m 组织提出了“世界性数字广播( d r m ) 系统”,美国的爱比克数码o b i q u i t yd i g i t a l ) 公司提出了“3 0 m h z 以下频段的带内同频 数字声音广播( i b o cd s b ) 系统”,这两个系统的简要描述和测试结果就构成了2 0 0 1 年 4 月i t u 颁布的“3 0 m h z 以下频段的数字音频广播系统”的建议书( i t u rb s 1 5 1 4 ) 。 新的d a m 系统有许多优点,如保持现有中、短波广播的带宽( 例如9 k h z ) ,并能 达到f m 广播音质水平( 同时提供1k b s 的数据业务) ;而利用2 9 k h z 带宽,则能达 到c d 音质;可利用现有a m 广播电台的发射设备,并保持高效率;数字广播和模拟广 播能够同播,新的数字广播不影响已有的模拟广播:可以逐步实现由模拟a m 向数字 a m 过渡,利用标准的a m 短波接收机或附加数字接收器就可接收同播的模拟或数字节 目;数字化后可增加新的附加业务和数据传输。可以认为,与传统的模拟a m 广播系统 第1 章绪论 相比,d a m 广播具有优良的音频质量,能达到甚至超过模拟f m 广播质量;能改善系 统抗同频和相邻频带干扰的能力,可靠性大大提高;可以传输多媒体数据,包括文字、 数据、图形、静止图像和动画等信息i 在播放音频节目的同时能够传送数据;对现有模 拟a m 广播发射设备的改造成本根低,未来的数字收音机便于集成,价格低、耗电省。 d a m 系统之所以能具有以上这些优点,是由于采用了以下几项关键技术。 ( 1 )音频编码。大大降低信源的冗余度,压缩带宽,使高速音频码流能在a m 波 段的窄带信道中传输。现行的许多编码器可提供1 2 4 8 k b s 的高质量音频,经音频编码 后,窄带的a m 波段能够传输f m 、c d 音质的信号。现有的3 个d a m 广播实验系统 都采用了m p 3 编码,该标准为了与m p e g 1l a y e r 3 ( i s o i e c l l l 7 2 3 ) 向下兼容而未能 有大的改进。1 9 9 7 年1 2 月公布的m p e g - 2 先进音频编码( a a c ) 标准( i s o i e c1 3 8 1 8 - 7 ) , 音质更好,压缩比更高,且在采样率和复杂性上伸缩余地更大。 ( 2 )数字调制。法国天波2 0 0 0 系统采用欧洲d a b 系统的c o f d m 调制,将欲传 送的信息按频分复用( f d m ) 方式平均分配到多个子载波上,每个子载波的码元速率都 很低。这样,在多径传输环境中,每个码元只有- - , j , 部分遭受相邻码元的干扰,而大部 分仍能保持完好。当子载波数目很大时,仍可达到高速传输。系统在一个码元时间内, 各子载波有相同的调制方式,天波2 0 0 0 采用1 6 6 4 电平的正交调幅( q a m ) 。德国r m 系统和美国v o a j p l b 系统都采用单载波调制,借助自适应均衡、序列检测和信道估计 等技术,克服多径传播和信道畸变日l 起的码间串扰,但成本较高,技术有待完善。特别 是自适应均衡需要根据外部环境的变化调整内部参数,结构较复杂,但随着数字信号理 论和超大规模集成电路的发展,自适应均衡技术将广泛用于高速数据传输。 ( 3 )信道纠错。3 个d a m 广播实验系统采用卷积编码、k s 编码以及t c m ( 网 络编码调制) 、时间交织等信道纠错编码技术,来消除或减小多径效应、信道衰落及各种 干扰的影响,以降低误码率,满足性能指标要求。天波2 0 0 0 系统采用t c m ,6 4 1 6 q a m ) f m 系统和v o a j p l - b 系统采用卷积编码和r s 编码纠错,并采用时间交织和自适应均 衡技术来抵抗突发误码及减轻多径传播效应。 我国幅员辽阔,对内对外广播广泛使用a m 频段,现有大量大功率的中短波发射机 和广播台,广播界也一直希望能改善国内大量存在的传统模拟a m 广播的音质和传播质 量。虽然近年来国内f m 广播的副载波应用( s c a r d s d a r c ) 已有成果,d a b 也已试 播,但由于短波的全球即时覆盖性,d a m 广播仍有不可替代的优势。利用d a m 广播网, 使数字流便于加密,短波覆盖面大,紧急时刻可用于军事及国家安全数据传递:地面通 信网络瘫痪或拥塞时,可通过广播发送特殊命令和杀病毒软件等;可传送全球卫星定位 系统( g p s ) 的差分修正信号和传送标准时间及日期信号等。我国现有约3 亿台中、短 波收音机,其更新换代及出口将产生近千亿元的市场容量。因此,a m 广播系统的数字 化和产业化对我国具有特别重要的意义。 d a m 系统利用现有的中短波发射机和信道,而a m 广播的带宽很窄,在双边带的情 况下为9 1 0 k h z ,单边带只有4 5 k h z 。因此对于单边带系统,使用m p e g 1l a y e r 3 或 是m p e g 2 ( a a c ) 标准都不适合,只有采用更低码率的信源编码。当然码率的降低是 以牺牲音质为代价的。国际上对于中、低速码率的语音编码算法的研究已经相当成熟 国际电信联盟下属的电信标准化局( i t u - t ) 也发布了许多标准,其中1 9 9 6 年发布的 g 7 2 3 1 和g 7 2 9 性能优异并且已被广泛使用。 第1 章绪论 1 2 语音编码简介 1 2 1 技术分类 语音处理的研究与通信技术的发展密切相关。人们为提高通信系统的效率而研究语 音编码方法,为满足低码率的通信要求,而研究语音分析合成系统声码器。目的就 是要解决传输速率和语音质量的矛盾。最早的标准化语音编码系统是速率为6 4 k b s 的 p c m 波形编码器。到1 9 9 0 年代中期,4 8 k b s 的波形与参数混合编码器,在音质上己逼 近前者且己达到实用化阶段。根据语音编码的发展过程,我们把该技术归纳为以下3 类: ( 1 )波形编码( 或称为非参数编码) 波形编码是能够忠实地表现波形的编码方式它力图使重建的语音波形保持原语音 波形的形状,比如:脉冲编码调制( p c m ) 、自适应增量调制( a d m 或a m 编码) 、自 适应差分编码( a d p c m ) 、自适应预测编码( a p c ) 、自适应子带编码( a s b c ) 、自适应 变换编码( a t c ) 辞都属于这类编码器,分别在1 6 - - 6 4 k b s 的速率上能给出高的编码质量。 而当速率进一步降低时,其重建的语音质量就会急剧下降。这类编码器通常将语音信号 作为一般的波形信号来处理,所以适应能力强、话音质量好、抗噪声抗误码的能力也强, 但所需的编码速率高,其中6 4 k b sp c m 的语声质量已成为一个编码质量的参照标准。 ( 2 ) 参数编码( 或称为模型编码或声码化编码) 参数编码叉叫声码化编码。是根据声音的形成模型。将其变换成参数的编码方式。 其基本原理是在信源信号的频率域或其它正交变换域提取特征参数并将其变为数字代码 传输:接收端从数字代码中恢复特征参数,并由特征参数重建语音信号。这种方式往往 会利用某种语音生成模型提取语音特征参数在幅度谱上逼近原语音,以使重建语音信 号有尽可能高的可懂性,即力图保持语音的语义,但重建语音的波形与原语音信号的波 形却可能有相当大的区别。利用参数编码实现语音通信的设备通常称为声码器其典型 例子就是线性预测( l p c ) 声码器,这已被公认为是目前参数编码中最有效的方法,能 够在2 4 k b s 的低码率下获得清晰、可懂的合成音,并且易于硬件实现。这种方法的优点 是不但能极为精确地估计参数,而且计算速度比较快。另外通道声码器、共振峰声码器、 同态声码器以及多带激励( m b e ) 编码、余弦变换编码( s t c ) 等都属于语音参数编码。 由于参数编码是依据语声模型,重建清晰可识别的语声,而不注重波形的拟台t 所 以这类编码技术实现的是合成语声质量下的低速或极低速的编码。参数编码的优点是: 编码速率低,通常小于4 8 k b f s ,甚至可以低至6 0 0 b s 至2 a k b s 。缺点是:合成语音质量 差,特别是自然度较低,连熟人之间都不一定能听出讲话人是谁:另外,这类编码器对 讲话环境噪声较敏感,需要安静的讲话环境才能给出较高的可懂度:时延大。并且当码 率提高到与波形编码相当时,其语音质量也不如波形编码。 ( 3 )混合编码 混合编码,顾名思义就是将波形编码与参数编码结合而产生的一种编码方式,使语 音编码技术有了突破性的进展。其中提出了一些非常有效的处理方法,产生了新一代的 参数编码算法,构成了新一代的声码器。这种编码器既具备了声码器的特点( 利用语音 生成模型提取语音参数) ,又具备了波形编码的特点( 优化激励信号,使其与输入语音波 形相匹配) ,它采用线性技术构成声道模型,不只传输预测参数和清浊音信息,而是将预 测误差信息和预测参数同时传输在接收端构成新的激励源去激励预测参数构成的合成 滤波器,使得合成滤波器输出的信号波形与原始语声的信号波形最大程度地拟合,从而 第1 章绪论 获得自然度较高的语声。同时还可利用感知加权最小均方误差的准则使编码器成为一个 闭环优化的系统,从而在较低的比特率上能获得较高的语音质量。这种编码技术的关键 是:如何高效地传输预测误差信息。依据对激励信息的不同处理,这类编码主要有:多 脉冲线性预测编码( m p l p c ) 、规则脉冲激励线性预测编码( r p e l p c ) 、码激励线性预 测编码( c e l p c ) 、低时延的码激励线性预测编码( l d c e l p c ) 等。 混合编码克服了原有波形编码器与声码器的弱点。而结合了它们的优点,在4 1 6 k b s 速率上能够得到高质量合成语音。在本质上也具有波形编码的优点,有一定的抗噪声和 抗误码的性能但相对而言时延较大。 1 2 2 ( 3 7 2 3 1 和g 7 2 9 简介 g 7 2 3 1 和g 7 2 9 语音压缩编码是1 t u _ t 在1 9 9 6 年发布的两个语音编码标准 2 1 1 3 1 。这 两个标准都是采用线性预测合成分析编码和码本激励矢量量化技术,即混合编码的方 法。并且在多媒体通信中被广泛使用。 g 7 2 3 1 是一个双速率语音编码标准,其两种速率分别为6 3 k b s 和5 3 k b s ,适用于 低速率多媒体服务中语音信号的压缩。它作为完整的h 3 2 4 系列标准的一部分,是其中 语音编码建议,主要配合低速率视频编码h 2 6 3 标准。另外在i p 电话中,g 7 2 3 1 标准也 被用来实现实时语音编解码处理。 g 7 2 3 1 标准中的两种速率编解码算法的基本原理相同,只是激励信号的量化方法有 差别。对高速率( 6 3 k b s ) 编码器,其激励信号采用多脉冲最大似然量化( m p - m l q ) , 而对低速率( 5 3 k b s ) 编码器,其激励信号采用代数码激励线性预测( a c e l p ) 法量化。 g 7 2 9 标准是一个速率为8 k b s 的高质量语音编码算法。它也是h ,3 2 3 系列建议中有 关音频编码的标准。g 7 2 9 采用的是共轭结构算术码激励线性预测( c s a c e l p ) ,是一 种以c e l p 编码模型为基础的语音编码算法。1 2 7 2 9 在i p 电话网关中被广泛使用。 这两种算法都是采用把参数编码和波形编码结合起来所形成的混合编码。混合编码 有一个相同的处理过程:先进行线性预测分析,去掉语音的短时相关性,然后蒋用合成 分析法和感知加权均方误差最小准则分析出适于替代残差信号的堆佳激励信号,最后对 激励信号和线性预测参数进行编码传送。混台编码把激励模型和语音的时域波形结合到 了一起,从而改善了合成语音的质量。g 7 2 3 1 和g 7 2 9 的主要区别在于激励模型的不同。 1 3 虚拟无线电简介 1 3 1 软件无线电 软件无线电( s o f t w a r er a d i o ) 是1 9 9 0 年代初提出的概念。实际上是各种制式的无 线通信系统迅猛发展叉互不兼容而摆在通信专家面前的一个问题。随着高速数字信号处 理技术、高速微处理器技术和快速可编程技术的飞速发展,这一问题逐渐有了解决的可 能,这就是1 9 9 2 年5 月美国m i t r e 公司的j o em i t o l a 提出的软件无线电。其基本概念就 是把硬件作为无线通信的基本平台,把尽可能多的无线及个人通信功能用软件来实现1 4 。 软件无线电技术充分利用了嵌入在通信设备里的单片微机和专用芯片的可编程能 力同时提供一种通用的无线电台硬件平台,这样既能保证无线电台硬件结构的简单化。 又能使它和标准兼容,同时还可以很方便地增加新的功能。软件无线电的基本思想是: 将宽带a d 变换尽可能地靠近射频天线,也就是尽可能早地将接收到的模拟信号数字化, 第1 章绪论 最大程度地通过软件来实现电台的各种功能。软件无线电不仅可以与现有的其它电台进 行通信,它还能在异种电台系统之间充当“无线电网关”的作用,使得两者可以互联互 通。软件无线电的优势主要体现在以下几点: 系统结构能够实现通用,功能实现灵活,系统的改进和升级很方便; 提供不同系统互操作的可能性; 系统采用模块化设计思想,模块具有很强的通用性,能在不同的系统之间复用: 软件无线电中,软件的生存期决定了通信系统的生存期,一般而言软件开发周 期较短,能快速跟踪市场变化,成本也会降低。 软件无线电定义的结构是一个综合概念【4j ,它是基于宽带a d a 、高速d s p 芯片及 宽带天线等技术,以软件为核心的体系结构。 1 3 2 虚拟无线电 在软件无线电技术的基础上,美国m i t 又进一步提出了虚拟无线电9 1 ( v i r t u a lr a d i o ) 的概念。虚拟无线电与传统软件无线电的区别在于它不是由软件控制的专门数字硬件的 应用或者由d s p 芯片实现,而是从计算机体系的角度出发考虑充分利用工作站资源实现 软件无线电的。其通信设备的所有数字信号处理过程都在用户现有的工作站( 或者高速 p c 机) 上实现,它既能提供特殊功能也能实现传统功能。虚拟无线电最大的不同在于不 使用专门的数字处理硬件而是使用通用的计算机作为硬件平台,把模数转换部分尽可能 地靠近天线,以a d 变换作为软,硬件划分界限。由于目前技术水平的限制,一般采用多 频段硬件前端将r f 频段信号下变频到中频,然后对中频信号直接采样,再将采样结果送 到主内存中,之后的处理将全部在用户层软件中完成。虽然要达到d s p 芯片的数字信号 处理能力要求很高性能的通用计算机,其成本也相对较高,但是使用通用计算机来开发 又具有很多优势: 易于实验。工作站的容量和可编程环境均优于专用d s p 芯片,容易实现新算法 和新协议的信号处理。 开发快捷。用户可以很方便地通过更新设备驱动程序和升级软件来开发新设备 和增强现有设备的功能。 易与其它应用结合。虚拟无线电的研究将无线和其它应用的界限模糊化了,提 高了功能性和端到端的有效性。 能实现多种功能。软件模块中所有的信号处理不仅可以动态地分配信道和带宽, 也可以改变同一信道的调制和编码方式。这种结构有利于新标准的推广,可将 不同标准的通信系统构造在一起。 易于改进性能。由于工作站性能的不断提高,从而使虚拟无线电性能提高。工 作站内存和工作站处理器性能的增强可促使快速算法的实现;将信号处理与高 层应用结合,可优化系统;信号处理功能可动态地调节,当有空闲可用周期时, 可实现一些其它功能,如信道优化等。 采用计算机模拟有利于对d a m 系统中各功能模块算法的研究和改进,同时一个新 算法在经过计算机模拟之后又需要纳入整个系统以全面检验其对整个系统的影响。而鉴 于虚拟无线电的上述优点,因而非常适合于我们利用虚拟无线电的平台来所进行我们的 d a m 系统的模拟、仿真与开发。 第1 章绪论 1 4 本文研究的主要内容 1 4 1 问题的提出 在d a m 系统中由于保留了原有a m 系统的发射机和信道,因此其可用带宽就很窄, 双边带为9 - - - 1 0 k h z 单边带只有4 5 k h z 。因此在单边带的情况下就必须使用中低速率的 语音编码算法。g 7 2 3 1 和q 7 2 9 是i t u t 推荐的标准,已经得到了广泛的应用,技术发 展也十分成熟,因此非常适合在d a m 系统中单边带的情况下用作信源编码算法。 衡量一个编码算法优劣的指标主要有;编解码所还原的信号质量、编码速率、编解 码复杂度、编码时延、抗信道误码能力等。这几个因素往往相互制约。高效的压缩算法 即意味着信息“浓度”增加。随着信息冗余度减小,信息的抗干扰能力也降低了。当编 码后的语音数据经过信道的传输后往往会引入干扰,导致最终还原的语音信号质量下降。 g 7 2 3 1 和g 7 2 9 编码算法的设计初衷是用于多媒体通信。这种应用多采用分组网作为传 输平台,例如i p 网。而分组网往往能够保证极低的误码率,因而不至于对音质产生很严 重的影响。这也是这两种语音编码算法能够在i p 电话中被广泛使用的原因之一。 对于中、短波信道而言,影响其通信可靠性的最大问题就是多径衰落,当信道多径 传输中的路径数增加时,传输通道响应的幅度趋于r a y l e i g h 分布,而相位则趋近于【- n , 十n1 之间的均匀分布。时间和频率选择性衰落对中、短波传输的数字信号和通信系统误 码率的影响很大。虽然可以针对中、短波信道的传输特性,采用c o f d m 、自适应均衡、 时间( 或频率、空间) 交织、纠错编码等处理技术来抵抗多径衰落所产生的干扰,但是 误码仍然不可避免。这就必然会严重地影响最终的语音质量,因此必须采取措施对信源 编码数据进行保护。但是作为a m 广播的信道容量非常有限,只有有效地利用有限的冗 余度才能更有效地保护语音编码数据。这就必须考虑语音编码算法本身的结构特点。 对于( 3 7 2 3 1 和g 7 2 9 语音编码输出的码流,并不是每一位都携带有相同的信息量, 即不同比特的重要性不同。有鉴于此,一个很自然的想法就是把有限的冗余度加到重要 的比特上进行“重点保护”,而对那些不重要的比特则不保护。那么哪些比特是重要的, 哪些是不重要? 重要比特的重要程度又是多少? 回答这些问题就成了解决如何有效保护 语音编码这个问题的关键。这也就是本课题所要研究的重点。 1 4 2 研究结果 g 7 2 3 1 和g 7 2 9 属于信源编码,信源数据在信道中传输所可能受到的干扰主要有随 机误码干扰和突发误码干扰,而通过交织技术可以将突发误码干扰转变成随机误码干扰。 因此本文只研究随机误码干扰的影响。在对( 3 7 2 3 1 和g 7 2 9 语音编码算法进行研究分析 以后。针对其特点采用人工引入误码的方式。计算( 3 , 7 2 3 1 和g c 7 2 9 编码数据在未受误码 干扰情况下的还原语音信号帧与编码数据帧每一比特误码后的还原语音信号的信噪比, 并且计算了不同参数的平均信嗓比以及加权信噪比,结论是:编码数据中自适应码本增 益和自适应码本索引对误码最为敏感,l p c 谱参数次之,固定码本参数则最不敏感。 而为了快速、方便、有效地构建一个d a m 系统,本文在最后描述了一个基于虚拟 无线电思想的d a m 平台的系统结构和设计思路。该系统基于p c 机的w i l 】d o w s 2 0 0 0 x p 环境,通过一个外部配置文件进行描述,使用动态连接库( d l l ) 加载和运行d a m 系 统的不同模块。这种方式能够方便、快捷地更换处理模块,甚至改变系统结构,给d a m 系统的测试与完善提供了极大的帮助。 第2 章中、低速率语音编码 第2 章中、低速率语音编码 2 1声音的编码 2 1 1 声音 声音是一种非常普通的现象,因为我们时时刻刻都能听到它。那么声音到底是什么 呢? 从科学的角度讲:声音是媒介中的物理扰动。它作为一种由原子或分子的运动所产 生的压力波在媒介中传播。 声音可以被看作是一种波,虽然它的频率可以随时改变。和其它所有的波一样,声 音有3 个重要的属性:速度、幅度和周期。一个波的频率并不是一个独立的属性,它是 在一个单位时间里( 1 秒) 所产生的周期的次数。频率的单位是赫兹( h z ) 。 人的耳朵可以感觉到很宽的声音频率范围,通常是从2 0 h z 到2 2 ,0 0 0 h z ,随人们的 年龄和健康状况的变化而变化,这就是听觉频率范围。一些动物能听到更高频率的声音 ( 超声波) 。最知名的如狗和蝙蝠。 声音的幅度也是一个重要的属性。我们通过响度来感知它。我们感觉到声音是因为 空气分子撞击我们的耳膜并向它施加了压力。人耳对于声音强度的敏感程度依赖于频率。 试验表明人类对高频声音比较敏感这也是报警器的音调都很高的原因。 2 1 2 数字化语音 当声音传入麦克风,就变成了电压它在时间上和幅度上都是连续变化的,也就是 说,麦克风采集到的声音是一个模拟信号。对这个模拟信号进行抽样便得到了时间上离 散的信号,这些信号被称为样本;但是这些样本的幅度仍然是连续的,因此需要对样本 进行量化,得到幅度上离散的样本;最后再对这些样本的量化值进行编码至此我们就 得到了数字化的音频信号。 而语音信号可以认为是音频信号的一个子集,它是指人讲话所能发出的声音信号。 虽然人耳的听觉频率范围可以到达2 0 - - - 2 2 ,0 0 0 h z ,但是相比之下,人讲话时所能发出的频 率范围却要窄得多,通常在5 0 0 2 ,o o o v l z t 】。根据奈奎斯特抽样定理。对音频信号抽样所 需的抽样频率为8 k h z 。再对音频信号样本进行8 b i t 量化撮终得到6 4 k b s 的语音编码数 据。这就是语音信号的脉冲编码调制( p c m ) 。 8 b i t x 8 ,0 0 0 1 s = 6 4 ,0 0 0 b i t s ( 2 - ” 但是如果把音频样本以8 b i t 均匀量化所得到的音频数据的音质并不好,那是应为8 b i t 只有2 5 6 个量化级,对于音频信号来讲太粗糙了,会导致在回放时许多细微的声音变成 静音而导致失真。解决这个问题的一个很自然的想法就是增加量化级数,如采用1 2 b i t 或1 6 b i t 进行量化。这样固然能改善音质,但随之带来的另二个问题就是数据量的增加。 采用1 2 b i t 将增加5 0 ,达到9 6 k b s ;1 6 b i t 将增加一倍达到1 2 8 k b $ 。这就引入了一个 第2 章中、低速率语音编码 矛盾,如何才能以尽可能低的码率达到尽可能高的音质,就是语音编码所要解决的问题。 根据所用方法的不同,通常可以将语音编码分为3 类:波形编码,参数编码和混合 编码其特点我们已经在1 2 节简单介绍了。 2 2 语音的压缩 2 2 1 语音压缩的基本机理 为什么我们能够对语音信号进行压缩编码从而达到降低语音信号的比特率呢? ( 1 ) 利用语音信号的相关性 首先,从信源的角度出发,正如许多不同种类的信源一样,语音也是个相关信源, 因此经过采样和量化的信号样本之间还有很强的相关性,为了降低编码速率,人们就希 望尽可能多地去除语音样本之间的相关性。线性预测编码( l p c ) 就是一种用来去除语 音信号样本之间相关性的常用技术。语音是人类说话时通过声带、口腔、舌头等所组成 的发声器官所产生声波信号它具有自己所特有的统计特性。具体来说人类说话所发出 的声音可分为两大类,元音和辅音。在信号的波形上元音表现为具有一定周期性的信号, 而辅音则表现为随机分布的噪声特性。因此人类的发声模型可以用图2 1 来简单描述。 选择开关 圈2 1语音发生模型 语音信号中存在两种类型的相关性:一是样本之间的短时相关性。语音信号在某些 短时段中呈现出随机噪声的特性。在另一些短时段中,则呈现出周期信号的特性,其它 时段则是二者的混合。简而言之,语音信号的特征是随时间而变化的,只是在一短段时 间中,语音信号才保持相对稳定一致的特征,也就是语音信号的短时平稳性。二是相邻 基音周期之间存在的长时相关性。由于语音信号中的短时相关性和长时相关性很强,通 过减弱这些相关性。使语音信号之间的相关性降低然后再进行编码,这样就可以实现 语音压缩编码。降低比特率。例如差分脉冲编码调制( d p c m ) 就是利用了语音信号相 关性来降低比特率的。这里所指的语音信号的相关性,就是相邻样点之差很小,其包含 的信息量远小于抽样值本身,对差值编码而不是对抽样值本身进行编码这样所需的比 特率必然下降,这就是d p c m 能够降低比特率的原因。 ( 2 )利用人耳的听觉特性 另一方面,从信宿的角度出发,语音信号最终是通过人的耳朵来接收的,并产生神 经反射信号传递到大脑从而形成听觉。人耳能听到的频率范围大约是2 0 h z 到2 0 ,0 0 0 h z , 但是人耳对声音的敏感程度却不是一致的,这取决于频率。试验表明在安静的环境中人 母舻 第2 章中、低速率语音编码 耳对2 k h z 到4 k h z 的频率最敏感。而且。人耳具有听觉阐值,当一个声音小于阈值时, 人耳就听不见了。听觉闽值的存在暗示了有损音频压缩的可能性。只要把所有低于闷值 的音频样本删除就可以了。因为闽值与频率有关,所以编码器就需要知道任何时刻的声 音的频谱。它需要把声音信号从时域转换到频域。如果一个频率为,的信号小于这个频 率的闽值,那么这个信号就应该被删除。以外,还有两个人类听觉的特性也在音频压缩 中被使用,频率掩蔽( f r e q u e n c y m a s k i n g ) 和瞬时掩蔽( t e m p o r a l m a s k i n g ) “。 当个我们平时能听到的声音x ( 因为它足够响) 被一个相近频率的更强的声音所掩 蔽时就叫做频率掩蔽。这是因为更强的音源升高了它附近的阈值,结果导致x 被掩蔽( 处 于阈值之下) 从而听不见了。一个好的音频压缩方法应该能够发现这种情况并删除x 代 表的信号因为它已经不能被听见了。这是有损音频压缩的一种方法。在语音频谱中, 能量较高频段即共振峰处的噪声相对于能量较低频段的噪声而言不易被感知。 频率掩蔽与具体的频率有关,其变化从最低的可听的频率处到最高频率不等。因此 整个听觉频率范围被分成了一些临界带用来指示耳朵对于更高的频率的敏感度的衰退。 我们可以认为i 临界带作为一种测量的方法类似于频率。但是频率是绝对的,与人耳的听 觉没有任何关系,而临界带确是由人耳对声音的感知所决定的。从而得出了一种感知上 的对频率的统一测量。临界带的存在指出了另一个可行的有损压缩算法的设计思路。音 频信号首先被转换到频率域,其结果( 频谱) 再被分成一些与临界带尽量相似的予带, 最后每个子带内的信号被量化并且只要量化噪声在该临界带的阈值曲线之下则这个量化 噪声应该是听不见的。 瞬时掩蔽发生的情况是频率,处有一个很强的声音爿,在它之前或之后有个频率接 近( 或是相同) 的较弱的声音鼠如果它们之间的时间间隔很短,那么b 就听不见了。 瞬时掩蔽同样可以被利用来进行有损压缩的设计。 综上所述,听觉在频率上和时间上都不平坦,并且还具有掩蔽效应,因此在设计语 音编码算法时,可以利用人耳的这些听觉特性,引入一个感觉加权滤波器。在度量原始 语音与合成语音之间的误差时,设计一个频域感觉加权滤波器嘲来计算二者的误差。 感觉加权滤波器频率响应中的峰、谷值正好与语音谱中的相反。所以感觉加权滤波器的 作用就是使实际误差信号的谱不再平坦,而是有着与语音信号谱具有相似的包络形状。 这就使误差度量的优化过程与感觉上的共振峰对误差的掩蔽效应相吻台,产生较好的主 观听觉效果。以达到进行语音压缩编码,降低比特率的目的。 2 2 2 中、低速语音编码的原理 所谓中速率编码是指数码率为4 8 1 6 k b s 范围内的语音编码。其语音质量较好( 能 达到常用数字语音通信的质量要求) 、清晰度较高、自然度也能达到基本要求,但少许有 点失真,与语音特征有一定的关系。低速率压缩编码又称为声码器技术,其编码速率为 1 0 0 b s 4 8 k b s 。这种编码方式,语音质量比中速率编码要差,尤其是自然度比较差,难 以辨别出讲话人声音的特点。因为不同的人,讲话的语音特征不同,其语音质量也就不 同。研究结果表明,语音压缩编码的极限压缩率为8 0 1 0 0 b s ,在此范围内,只能传送句 子内容,而对讲话人不同的语音特征和情绪就分辨不出来了。 现代语音压缩编码大多数采用基于合成分析法的线性预测编码( l i n e a rp r e d i c t i o n a n a l y s i s b y s y n t h e s i sc o d i n g ) 方法,这是一种混合编码方法。线性预测技术就是用过去 样点的线性组合来预测当前样点。假如用j 俐代表原始语音信号,用线性预测的方法求 出预测器的系数西,构成线性预测逆滤波器,j m 通过该滤波器后就得到了去除短时相关 性的语音信号。再对其进行基音预测,建立基音逆滤波器,去除它的长时相关性后,就 第2 章中、低速率语音编码 可得到最后的残差信号。残差信号是完全随机、不可预测的部分。根据速率的不同要求, 可对残差信号采用不同的量化,从而得到不同的编码速率,让量化后的残差信号作为激 励信号依次通过基音滤波器与线性预测滤波器后,便得到了合成语音信号,见图2 2 。 图2 - 2语音生成模型示意图 语音编码的过程就是通过不断改变模型参数,使语音生成模型能更好地适应原始语 音信号。为此又引入了合成分析的概念。同时,利用人耳的听觉掩蔽效应,引入了感觉 加权滤波器。台成- 分析法的基本原理可以概括为:假定一原始信号可用一个模型来表示, 该模型又由一组参数来决定随着这组参数的变化,模型所产生的合成信号也不一样, 原始信号与合成信号之间的误差也随之而变化。为了使模型参数能更好地适应原始信号, 可以规定一个误差准则:误差越小,模型合成信号就和原始信号越接近。这样总能找到 一组参数,使误差晟小,此时这组参数决定的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论