(电力电子与电力传动专业论文)数字语音处理在dsp实验平台上的实现.pdf_第1页
(电力电子与电力传动专业论文)数字语音处理在dsp实验平台上的实现.pdf_第2页
(电力电子与电力传动专业论文)数字语音处理在dsp实验平台上的实现.pdf_第3页
(电力电子与电力传动专业论文)数字语音处理在dsp实验平台上的实现.pdf_第4页
(电力电子与电力传动专业论文)数字语音处理在dsp实验平台上的实现.pdf_第5页
已阅读5页,还剩48页未读 继续免费阅读

(电力电子与电力传动专业论文)数字语音处理在dsp实验平台上的实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

a b s t r a c t w i t ht h ed e v e l o p m e n to ft h em o d e r ne l e c t r i c a lt e c h n i q u e t h ev a l u eo ft h ea u d i op r o c e s s i n g b e c o m e si m p o r t a n t a u d i op r o c e s s i n gc a nb eu s e di n m a n yp l a c e si n c l u d i n gn e t w o r k ,t e l e c o m i n t e l l i g e n ti n s t r u m e n t i n d u s t r yc o n t r o la n d s oo n b u ta u d i op r o c e s s i n gh a sn o tb e c o m eas u b j e c t i nm a n ys c h o o l sf o rt h ei a c ko fe x p e r i m e n te q u i p m e n ta n ds k i l l e dt e a c h e r s t h i st h e s i sf o c u s e so nt h ei m p l e m e n to ft h ed i g i t a la u d i op r o c e s s i n gi nt h ed s p e x p e r i m e n t k i t 1 _ w 0p a r t sa r ed e s c r i b e di nt h et h e s i s ,o n ei st h et h e o r yo fd i g i t a la u d i op r o c e s s i n g ,a n dt h e o t h e ri st h ei m p l e m e n to fd i g i t a la u d i op r o c e s s i n gi nt h ee x p e r i m e n tk i t t h ef i r s tp a r to ft h ef h e s i sm a k e sab r i e fi n t r o d u c u o no ft h ea u d i op r o c e s st e c h n i q u e i n c l u d e s i t sh i s t o r ya n dt h ed i f f e r e n c et ot h ea n a l o ga u d i o t h et h e o r y , c l a s s e sa n ds t a n d a r d so ft h ea u d i o c o m p r e s si sd e s c r i b e di nt h ef o l l o w i n gp a r t s t h e d i g i t a lf i l t e ri st h eb a s eo ft h ea u d i op r o c e s s i n g , t h et h e o r ya n ds i m u l a t i o no fi i rf i l t e ra n df i rf i l t e ri sd e s c r i b e di nd e t a i l sa f t e rt h eb r i e fi n t r o d u c t i o n o fe a c hf i l t e r t h ea b o v e t h e o r yi si m p l e m e n t e d i nt h ed s p e x :p e r i m e n tk i t s ot h es e c o n dp a r to ft h et h e s i s i st h ed e s c r i p t i o no ft h ei n v o l v e dh a r d w a r ea n ds o f t w a r ea b o u tt h ee x p e r i m e n tk i t t h eh a r d w a r e i n c l u d e st h ei u n c t u r eo ft h ec h i p sa n dt h el n v o l v e db o r o m c o n t r o lc o d e s a tt h ee n do ft h es e c o n d p a r t t h es o u r c ec o d e so fi m p l e m e n t t h ep c m a l g o r i t h m s t h ea d p c ma l g o r i t h m s f i rf i l t e ra n d f i rf i l t e ri sp r e s e n t e da f t e rt h et h e o r i e so fd i g i t a la u d i op r o c e s sa n dt h ed s pe x p e r i m e n t k i t i nt h ee n do ft h et h e s i s ,as u m m a r yi sp r e s e n t e da n ds o m es u g g e s t i o n sa r ef o r w a r dt o i r e p r o v et h ee x p e r i m e n t k i t 【k e y w o r d s a u d i op r o c e s s i n g d i g i t a lf i l t e r , e x p e r i m e n tk i t ,d i g i t a ls i g n a lp r o c e s s o r 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文r 特别加以标注和致谢的地方外,论文巾不包含其他人已经发 表或撰写过的研究成果,也不包含为获得_ 尔南人学或其它教育机构的学位或证书而使用 过的材料。与我j 司工作的同志划本研究所做的任何贡献均已在论文一f ,作了明确的蜕l 刿 并表示了谢意。 研究生签名:日 期 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、固家图书馆有权保留本人所送交学位论文的 复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内 容和纸质论文的内容相一致。除神:保密期内的保密论文外,允许论文被查阅和i 借阅,可 以公布( 包括刊登) 论文的全部或部分内容。论文的公布( 包括刊登) 授权东南大学研 究生院办理。 d 弘 期:孑多护 戈4 参 0 。1 语音馋竣过程 0 绪论 语膏是人类区别于其它动物的撮显著的特点。对语音的储存和处理就自然的成为人类一直以米 的美好愿望。鼙蕨记录声膏魏设备来看就扶开始麓回音壁、唱片的蘩声撬、磁条的录营税垫l 褒在 的数字化的m p 3 播放器,这其中的记录技术也一鲞在飞速的变化中。 语齿处理程早期基本上全部采用模拟电路,但是由于数字化形式的记录和处理方式其毒无可舱 比的受活性和方便性的优点,在现代得到迅速的普及和发展。渐渐出现了数字他的专门芯片,献专 用d s p 芯片,到通用的d s p 芯片,数字化的程度越来越高。 瓣添啻静凳理竭撵遴疆蓑电子凌备逶常的发展方淘,罄模芋菝到数字,专- n 遥耀,硬件到较 牛。 图o 1 所示的魁热型的数字语音从信源到信宿传输的全过程。 图o 1 典型语音通信传输过程 胰强中可以羲出龚攀豹疆毒悖 羹过程惫旗了缀多方嚣,溅毫还无法嗣数字惫路取钱懿模搬电藩 的防混叠滤波和平滑滤波,又有全数字化的语音处联部分,当然也包括对语音的传输过糕。本论文 的讨论范围主要集中在垒数字化的语音处理部分,逡其中主要是语音的编码和解码,也包括了编码 的颈舱理、解碣的焉楚瑾部分。 0 2 数字滔音处理科1 0 2 0 3 l f 0 4 l 0 ,2 数字语音楚瑾实璐方式 避常的数字信号处理的实琥方法一般有以下几种: 1 、在通用的计算机( 如p c 机) 上霸软件( 弗f o r t r a n 、c 语言、m a u a b ) 实现; 2 、在通用计算机系统中加上专门的加速处理机实现: 3 、用透翅麴单片撬( 舞m c s ,5 1 、9 6 系列、8 0 x 8 6 系捌、a r m 等) 窭褒,这转方法霹瘸予 些不太复杂的数字信号她理,如数字控制领域; 4 、用通用的可编程d s p 芯片实现。与单片机相比,d s p 芯片具肖更加适合于数字信号处理的 软释和疆俘资源,霹蠲予复杂静数字信号簸瑾算法; 5 、用专用的d s p 芯片实现。在一些特殊的场合,要求的信号处理速度极高t 用通用d s pj 舔 片较难实现。侧如专用予f f t 、数字滤波、卷积、棚关等算法的d s p 芯片,遮神芯片将相应的馈 号处毽算法在蒋片肉部闱硬件实现,无需进行编程。 在上述几种方法中,第1 种方法的缺点是速度较慢,一般可用于揍本音频算法的模拟或者非实 靖豹滔啻编鼹弼;第2 辨秘第5 熬方法专髑性强,虚翅受到缀大的限剿,第2 秘方法也不便于系统 的独立运行;第3 种方法只适用于实现简单的d s p 算法;第4 种方法才使数字信号处疆的应用打 开了新的局面。 查翌奎兰堡主兰堡笙苎 o 2 2 数字语音处理系统 虽然数字信号处理的理论发展迅速,但在2 0 世纪8 0 年代以前,由于实现方法的限制,数字信 号处理的理论还得不到广泛的应用。直至t j 2 0 世纪7 0 年代末8 0 年代初世界上第一片单片可编程d s p 芯片的诞生,才将理论研究结果广泛应用到低成本的实际系统中,并且推动了新的理论和应用领域 的发展,可阻毫不夸张地说,d s p 芯片的诞生及发展对近2 0 年来通信、计算机、控制等领域的技 术发展起到十分重要的作用。 数字信号处理系统是以数字信号处理和通用d s p 芯片为基础,因此具有数字处理的全部优点: 1 、接e l 方便:d s p 系统与其他以现代数字技术为基础的系统和设备都是相互兼容的,与这样 的系统接口以实现某种功能耍比模拟系统与这些系统接口要容易很多; 2 、编程方便:语音处理系统中的可编程d s p 芯片可使设计人员在开发过程中灵活方便地对软 件进行修改和升级: 3 、稳定性好:d s p 系统以数字处理为基础,受环境温度以及噪音的影响较小,可靠性高; 4 、精度高:1 6 位数字系统可以达到1 0 。的精度; 5 、可重复性好:模拟系统的性能受到元器件参数影响性能变化比较大,而数字系统基本不受 影响,因此数字系统便于测试、调试和大规模生产: 6 、集成方便:d s p 系统中的数字部件有高度的规范性,便于大规模集成。 当然,数字信号处理也存在一定的缺点。例如,对于简单的信号处理任务,如与模拟变换线的 电话接口,若采用d s p 则使成本增加。d s p 系统中的高速时钟可能带来高频干扰和电磁泄漏等问 题,而且d s p 系统消耗的功率也较大。此外,d s p 技术更新的速度快,数学知识要求多,开发和 调试工具还不尽完善。 o 2 3 语音技术的应用场合 虽然d s p 系统存在着一些缺点,但其突出的优点已经使之在通信、语音、图像、雷达、生物 医学、工业控制、仪器仪表等许多领域得到越来越广泛的应用。 数字化语音技术主要应用在语音编码、语音合成、语音识别、语音增强、说话人辨认、说话人 确认、语音邮件、语音存储等方面。 0 3 本文研究的内容 本文研究的内容主要是在d s p 实验平台上对于语音压缩编码部分做一定的研究和探讨。所以 论文的研究主要在以下三个部分展开: 1 、d s p 实验平台的搭建; 2 、语音编码在实验平台上的实现; 3 、数字滤波在实验平台上的实现。 其中对数字语音处理的研究范围主要集中在如图o 1 所示的预处理、语音编码和语音解码三个 部分。 笙! 量至童塑塑 1 1 数字音频嘲 1 1 1 数字音频概念 第1 章语音编码 声音是机械振动的一种,其振动越强,声音就越大。话筒是把机械振动转换成电信号,模拟音 频技术中则以模拟电压的幅度表示声音强弱。 在计算机内,信息是用数字表示的。各种命令是不同的数字,各种幅度的物理量也是不同的数 字。语音信号也是由一系列数字来表示,称之为数字音频。 在数字音频技术中,用数字表示声音强弱的模拟电压,如0 5 v 电压用数字1 0 表示,2 v 电压 是4 0 表示。但是模拟电压的幅度,即使在一电平范围内,都可以有无穷多个,如1 1 v 、1 1 1 v 、 1 1 1 5 v 等。而用数字来表示音频幅度时只能把无穷多个电压幅度用有限个数字表示。因此把某一 幅度范围内的电压用一个数字表示,即称之为量化。 计算机内的基本数制是二进制,为此我们也要把声音数据写成计算机的数据格式,这称之为编 码,模拟电压幅度、量化、编码的关系举例如下表。 表1 1 模拟电压、量化和编码 电压范围( v )量化( 十进制数)编码( 二进制数) 05 o730 1 1 o 3 o 520 1 0 0 1 0 310 0 1 0 1 0 100 0 0 0 3 0 ,111 1 1 05 0 321 1 0 07 一o 531 0 1 0 9 一0 741 0 0 模拟声音在时间上是连续的,但以数字表示的声音是一个数据序列,在时间上却只能是断续的。 因此当把模拟声音变成数字声音时,需要每隔一个时间间隔在摸拟声音波形上取一个幅度值,这称 之为抽样。该时间间隔称为抽样周期。其倒数称为抽样频率。 由此看出,数字声音是一个数据序列。它是由模拟声音经抽样、量化和编码后得到的。计算机、 数字c d 、数字磁带( d p 汀) 中存储的都是数字声音。模拟数字转换器可以把模拟声音变成数字声音, 数字,模拟转换器可以恢复出模拟声音。 模拟声音在时间上是连续的,数字声音在时间上是断续的。数字音频的特点则是保真度好,动 态范围大。 1 1 2 音频采样 模拟音频信号是一个在时间和幅值上都连续的函数x ( ,) 。采样的过程就是在时间上将函数x ( t ) 离散化的过程。一般的采样是按均匀的时间间隔进行的。设这一时间间隔为r ,则取样后的信号为 x ( n r ) ,n 为自然数。 一3 一 查翌銮堂堡主耋照笙苎 援据奈奎耨特定理霹知,设连续信号善) 浆频港为力,瑷接榉澳蕊下糖群餐戮离散售号 x ( n t ) ,如果满足矿 s 五时,其中z 是截止频率,即,l 2 正或五_ 1 2 t 时,可以由x o r ) 完 全确定浚续信号x ( f 、: 石( ,) = r x ( n t ) e 2 删 潮毙,鬻可塞舞敦信号x ( n t ) 宠全确定频t 薯x ( t 1 : 啪参。著 当抽样频率祷于1 2 时,即 = 1 2 t ,称厶为奈奎新特频率。 人器能皈到镌声音的频率范雕太致范围在2 0 h z 一2 0 k h z ,因此声频躲质量与裔频信号啦频谱魏 国以及取样的时间间隔有关。 目前常见的啬频信号的频率范围大致如下:8 k h z 、1 1 0 2 5 k h z 、1 6 k h z 、2 2 0 5 k h z 、3 7 8 k h z 、 4 毒。 k h z 、4 8 k h z 等。翔聚采嗣更高熬采梯频率,逐霹班馥出附0 冁誊壤。爨鬻生涯孛,电话为 2 0 0 h z 一3 4 k h z ,调幅广播为5 0 h z 一7 k h z ,调频广播为2 0 h z l s k h z ,岗傈真音频信号为 2 0 h z 一2 0 k h z 。因此音频取样频率一般定在8 - 4 8 k h z 范匿内。常用的诲频取样频率如表2 所示。 袁 2 常爝黼音颏取稀颏率与嚣就精度获鼓螽宰瓣关系 【取样频率k h z 8l 1 1 0 5 l 1 62 2 0 54 4 14 8 |最佬糖发f b 8 l 8 l 6 1 6 1 6 8 数据率( k b s ) 6 4 8 8 2 2 5 6 3 5 2 83 5 2 87 6 8 从寝1 2 可以看出,取样频率越高,数字化后的音频质量越高,但其存储量也就越大,所以使 用释种敬样颧辜簧蒹j 羲落音质量鞠搐遂容豢。 。 。3 誊簇量纯 量化过程是将取车羊值在幅度上再进行离散化处理的过程。所有的取样值可能出现的范围被划分 成存袋多个小除箍豹集合,把冠楚落a 菜个爱鬣验躐鑫翡取榉值都赋予相同魏馕,翠量纯蘧。逶鬻 这个量化值用= 进制来袭示,用露位二进制码字可以表示2 4 个不同的量化电平。存储数字音频信 号的比特率为: j 2 嚣六( 黪穗) ,六是撼样攀( 擒样缈,嚣是每个样僵的 e 特数( b 特釉样) 。 表示取样值的二进制的位数为量化位数它反映各取样慎的精度,如2 位能袭示取样值的4 个 等级,8 位能反映2 5 6 个等级,典精度为诲频信号最大振幅的1 2 5 6 。量化位数越多,餐化值越接 近子取样值,蒜精凄越蕊,僵要求的信惠存储量趣大。声音信息豹通道数灌将款样篷记聚为疆淫 形( 单声道) 逐是两组波形( 双声道) 甚至更多组波形( 多声道) 。取样值存储撼可用下式表示: f b s v = :一 8 式孛,p 为取撵值存璐量( b i t s ) ,为取榉频攀( k h z ) ,b 为量化健数( b i t ) ,j 为声道数。 一茎:釜至篷塑登 我e l 应该研究的是减小 e 特率,减少存端蹩的方法,要想袋小j ,提攒公式,:嚣。f ,已捷 确定的,那么要减小i ,只能去减少b 。这就是f 霹章节中众多编码箕法秘括壤匏由来。 均匀量化就怒采用相等的量化间隔进行采样,也称为线性量化。用均匀摄化来量化输入信号时, 冤论黠大戆裁入僚号还是枣黪羚a 信号箨一箨采瘸耱露熬藿纯阀隔。霾我,要憨g 迳鹿福菠大静输 入信号。同时又满足精度高的要求,就需要增加样本的位数。 稚均匀蓬仡的基本思想燕对输入信号避 亍量仡时,天的输入信号采用丈的量化间隅,小的输入 傧号袋用小的量他闻膈,这梯就可以在满足糟度要求鲍j | l 擎况下使用较少的锭鼗来表示。其审采毒莩簸 入信号幅度和量化输出数据之间一般定义了两种对鹿关系,一种称为u 律压扩算法,另一种称为a 撵压扩算法。 采用不同的懿化方法,鬣化后的数据量也就不同。因此,可以说缴化也是一种压缩数据的方法。 1 。 4 音频编码 模拟音频信号经过取样、量化后,就要进行编码,所谓编码即是用二进制数表示每个取样的最 化值。如累取揲馕殛采取均键量化,又采用自然二遴囊i 表示,这釉编璐方法藏是躲冲缡玛调铡p c m ( p u l s ec o d em o d u l a t i o n ) 。p c m 是一种最简单、鼹方便的编码方法,p c m 是种米经压缩的数 宰音频信号,常常将它作为与其它编秘避行 t 较静一静参考信号。下强静鼗节中将会对语音鹩编褐 做详细论述。最艨,经过编码后的数字体号也就是数字音频信号。 5 音频文 牛格式 下表列出的媳常见的数字音频文件的格式 i 文转扩震皂谥鹾 i p c m 数据序列。 l t a i fa p p l e 计算机的渡形音频文件格式。 l m i d m ld | 文 牛格式。 | - r m i m i c r o s o f t 公词的m i d i 文件格式。它可以包括图片、标记和文本。 i t s n dn e x t 毒中算撬瓣潋形音鞭文箨捂式。 w a v m i c r o s o f t 公司的波音频文件格式。 i v o c c r e a t i v e 公司的波形音频文件格式。 1 2 语蠢绽码分类嗍 语音编鹃的强的在予匿缩数攒。在语音数据豹存储和传输中,数据压缩避茹须的。通常数器惩 缩造成音频质量的下5 嫠,计辣量的增加。语音编码属性可以分为四类,分别是比特速率,时延、复 杂性和质量。其中比特率是浯音编码很重要的一方面。比特速率的范围可斟是从保密的电话通信的 2 。4 k b f s 到6 4 k b t s 的& 7 t lp c m 缡码帮g7 2 2 宽带( 7 k h z ) 镊音缡妈器。因戴,太稻在实整数据 压缩时,要对语酱编码属性进行综合考虑。 语音编码方法归纳起来可越分成三大娄:渡澎编码参数编筠、混合编弱。波形编码怒尽量保 持输入波形不变+ 即重建的诳音信号基本上与原始语音信号波形相同,压缩比较低;参数编码是娑 求重建的信号听起来与输入语音一样,假其波形可以不同,它楚以话音信号所产生的数学横型为旗 越豹弹编褥方法,压绞比较高;混合缡羁怒练合了波形缡毽魄毫威譬潜力葶鞋参数缟鹚故麓压蟪效 率的混合编码的方法,这类方法也是目前低码率编码的方向。 一5 一 一一。一 查曼銮兰堡圭篓擅笙苎 1 2 波彩编码 波形编码就是根据语密信号的波形导出相应的数字编码形式,它会尽可能构造出包撬背景嗓声 在内的模拟波形、输出信号和褶证跟踪输入信号。波形编码的语音信息是波形,它的目标是让解弼 器恢复出的模拟信号在波形上尽量与编码前原始波形相一致,也即失真耍最小。波形编码的方法简 单,数羁率较褰,编玛率经g 。6 - 。8 4 k b f s 之阕,露中凝带的绽褥,重捣艇声音震量较裹。联以缡玛速 率较高。占用带宽较宽,比较适合有线传输。 波形编码方法主要包括非均匀爨化压扩注、差分脉码调制( d p c m ) 法、子骷编码。 菲均匀囊纯压扩涟 在p c m 编码中,语音信号的嘏大幅度影响量化信噪比。在编码位数一定的条件i - ,语音信号 的幅度越小,量l 七信唆比也就越差。因此,为了达到信噪比秘信号幅度无关的臻的,就鼗采用非均 匀量他的方法,压扩法藏是其中之一。在这种方法中,我们报据语音样值得非均匀分布的特点,设 法让量化阶距随着概率密度的减小而增大,或者说对大信号用大量化阶距,对小信号用小壤化阶距, 歇囊健曩讫售啜毙不隧德号抠度嚣变化。鳖诧蔻_ ;嚣对数墨数述行幅度援缩,鳃粥怎再蠲搬数函数遽 行幅度扩张。其效果是使量化器的信噪比对信号幅度不敏感。 非均匀压扩法编码叉分为a 撑和律谢种压缩方法。其中u 律是美国、日本、加拿大等国采川 豹一种歪缩律,焱律主要是欧i 筏徭静一稃疰缩津。 2 差分脉码调制( d p c m ) 法 蓑分膝冲缡码则是利鼹典型语蠢波形中抽样与抽拦之间的冗余米编码。匿为统计表明,提邻镪 音祥值之闻存在蓉很大的相关性,目# 从一个样值到搿一个相邻豹样值。由于这黧敷值为0 或取值微 小的概率很大,因而我们可用较少的码位来对差值进行编码,从而达到数据压缩的目的。在解码部 分,惫鼹蔹复瓣藩一样馕撂基穑上鸯鬟上当蔻的蓑毽繁号裁可以滚复出蚤夔静撵馕,这裁楚差分融礤 调制。 如鬃在d p c m 的基础上再采取自适应的措施,就形成了a d p c m 的方法( a d a p t i v ed p c m ) , 郑鱼遣应差分繇鸦调翻,还可遗一步压缩数据率。a d p c m 戆主要改逡在予它稳量纯器鞠颈测器都 是以自适应的方式 i 作的,量化器和预测器能根据输a 信号的统计特性自适应地处于最佳或接近最 佳的 :作状态。a d p c m 摄会在后续的章节中进 亍进一步论述。 增量调制d m 是又一种在语音波形中专门利用抽样与摘样之间冗余豹数字纯技术。襄际上,d m 是d p c m 的一个特殊情况,即差信号的每抽样仅使用1 比特。唯一的个比特仅指出差异抽样的极 睦,翅藏糖示爨了信号献上令接撂嚣始露臻鸯耩逐逢减少。霹戆入波形弱丈致运 爨在反馈避路中进行 构建的,当差异为正的时候通过上升个鹫化阶,城当差异为负的时馁,下降一个量化阶来进行。 用这n 张方法,输入信号被按照上升或下降的序列以娄似楼梯的方式来编码。反馈信号会向一个方向 上并鬟戮近 妥信号超过了输久信弩,同嚣寸囊馈会自爱方商遗荐矗至l 输入信号超避了近儆信号。强戴, 当跟踪输入信号时,d m 输出在输入波形附近来回跳动,运行通过平滑滤波器来精确的敷建输入信 号。葵特点裁是;俦输波特率低黔,信噪 l 裂逝p c m 菇;离谈码率环撬中,抗谖码性能嗽p c m 好, 即可靠性高:电路简单,无需帧同步。 3 子带编码 在子带翁筠( s b c :s u b b a n dc o d i n g ) 中,罄先采蓬一锺带遴滤波器,褥赣久信号瓣频谱分 成若干个频带,每个频带就是一个予带。为了降低比特率,对每个较窄的子带分配一个自适应d p c m ( a d p c m ) 编码器分别进行编码,最后将莠个子带编码器编好的码流复接起来送到对端。在接收 端,嚣将它们分谈、解弼,并囊台起来裱笺出原始敬输入信号。 出于量化器噪声在全部语音频带上不具有相同的可检测性,因此通过控制谮音信号频带范围中 熬量纯嚷声失巍,霹阻大大改善编码信号的质量。予带编码充分剥用了这一性族。首先,它把量饯 噪声限制在各个子带中,从而阻止了个子带的量化噪声引入到整个频带。其次它在每个子带中可 以使用独立的量化阶距,使低信号能量的予带使用较小的量化阶距,所产生的餐化噪声也相应的也 一6 一 。,。,。二i i ! ! i ;i i ! ! i i ! 二。;。一。一 较小;对于具裔较高能量的子带t 可以使用较大的量化阶距,从丽使量l 皂噪声的频谨与僖号的短时 频率楣甑配,这样就避免了能量较小豹频带内的输入信号被其他频段的鼹化噪声所遮盖。最后,根 据感性判断来分配各个子带中的比特数,使得在必须糟确保持膏调和元宵音带的拭振峰结构的较低 子崇中,每个搀壤强较多鳆l 将鼗来编码,嚣在滔考孛密褒摩攘音霸类经摩擦音瓣较赢予繁中,每 个样值用较少的比特数米编码。这样,在相同的数码率情况下,子带编码能获得明显由于全频带编 码的信号质量,域者说在相同的信号质量的愤况下,予带编码可以用明鼹低于频带编码的比特率来 传输。 ,2 + 2 参数绽鹞 参数编码又称声码器( v o c o d e r ) ,它是擞据声音的形成强疆模型米提取一缀参数,将这组参数 送到接收端,滔来导出语音,产生校拟声音,是一种褥生声音丽菲滠始波形静方法。根攒丸躲发声 机理,在编码端对语音信号进行分析,分解成有声音和无声音两部分。声码器每隔一定时间分析 次语誊,簧送一次分析| ! | 声道有,无声帮滤波参蛰。从话音波形接号中提取生成话蠹的参数,健用这 些参数通过话音生成模型霆构出话音。在话膏生成模型中,声道被等效成一个随时间变化的滤波器, 它由白噪声无声话音段激励,戏者由脉冲串有声话音激励。因此需要传送给解码器的信息 就是滤波器的蕺捂、菱声或不菱声戆标志程鸯声活毒的音苇瘸潮,荠羹每隔t o - 2 0 m s 更毅一次。 线形预测编码( l p c ) 声码器是参数编码的一种,它的编码方法和a d p c m 类似,采用线性j :l | 测来模擞声递特性,通过对时域抽样信号的糨关计算拇到预测系数,荐将预测系数转换成袭整个各 级联滤波嚣的反镕 系数,蒯用线毪代数方法求解n 维线性联立方程,求得n 个颓测系数,从雨由对 域信号数据获得声道的频域估计参数,参数按帧进行自适应调糍。编码比特率取决于预测器的阶数 n 秘每个参数戆囊忧糖发。经过多霉的研究器发,人们又对l p c 声码嚣手# 了大鬣的改进,握出混含 激励、瓶则激励铸l p c 声码器算法。 声码器编码后的码率可以做得很低,如12 k b s 、2 4 k b s ,产生的语音虽然可以听懂,但其质 量远远低予自然话音。瑷蕊鼗据率对舞高台袋话音豹臻量无漭予事,这是嚣为受至诿音生蔽模墅懿 限制。尽管它的音质比较低,但保密性好,可以削在保密性要求高的场台。 1 2 3 混合编码 溉台编羁的基本恐想楚将滚形编码鞠参鼗编羁鹣谯点结合起来。波形编鹞虽然可竣瓣馁毫话誊 的质墩,但在数据率低于1 6 k b s 的情况下,在技术上还没有解决音质的问题;而参数编码虽然可以 降到2 a k b s 甚至更低的数据率,但它的誊质根本不可能与自然话音捆提并论n 为了得到音质高、 数据率低的编码器,专家对编码进行了长粥研究,j 囊程中发现音质难游提高的原因不在蠢前的声邋 模型,而在于对该模型的激励信号的描述不够精确,为此出现了综台波馏编码和参数编码特点的滤 台编弱技术。 混台编码嚣采h j 合成分析( a b s ) 方法,它融 了波形编码器和声码器的长处,在非常低的比 特率( 4 6 k b s ) 下,也能提供较好的语音质量。典型的混台编码器有1 9 8 2 年提出的多脉冲线形弧 涮编粥( m p 。l p c ) 懿及1 9 8 4 年懿盘静玛本激裁线性强潮( c e l p ) 。m p - l p c 靛改进在于$ | 入了 矢量餐化( v q ) ,冲击序列来自一个码本,其复杂废高,码率低,可在4 8 96 k b s 的编码率上获 缛更麓质量的疆膏。 近年来有关模蟹激励信号的研究十分活跃,在教善质量、降低复杂度和减少编码延迟方面都提 出了许多新的方法,并迅速走向宴用。 一变壹盔兰堡圭鲎竺笙兰 1 + 2 4 其它相关披零嘲 随黄网络技术的发展,声音在网络上的传播也越来越普及。现在的i n t e r n e t 匙基于t c p i p 螅, 为了遥寝褒在稠络不毽定瀚对延鞠狭窄兹帮宽的蒋点,又有缎多薪豹方法提出了。 除了压缩编码技术,人们还成用许多其它节省带宽的技术来减少谱街所占带宽,优化网络资源。 a t m 和帧中继掰中静静费抑制技术可携连接中鲍静啻数据消除,但并不萎;嫡其它售息数据戆发送。 语音活动裣铡( s a d ) 技术则可戳用来动态的躁踪嗓音电平,并为这个噪音电平1 置一个享用的语 音检测阀值,使得语音,静音检测器可以动态匹配用户的背景噪声环境,并将静音捆制的可听度降到 最毒。为了置换撵霹络中翁誊攘癌号,这些信号不菇穿过网络,舒透翡鹜最声考在溺络的 ;壬一端疆 集成到信道中,以确保话路两端的语音质量种咱然声膏的连接。 新的编码分桥技术有非线形预测、多糙度时频分析技术( 子波分析技术) 、离阶统计分辑技术。 其发震方自主癸粲中在缀低速率语青编码,妇6 0 0 b s ,高傈真谮音编码强爱自适应多速率语音编码。 1 3 语音编码标壤 3 警叛编璃懿嚣秘謦隔稼雍茹3 】 隧凑计算桃及数字避髂系统鲢发展,数字音频编码技术越柬越得至4 重撬。当藏编码技术发展躲 一个重骚方向就是综合现有的编码技术,制定全球的统一标准,使信息管理系统其有普避的互操作 性并确保了未来的兼容性。国际上,对语音信号压缩编码的审议在国际电报电话咨询委员会( c c i t t ) 下设戆第十五磷究鎏进嚣,稳应静建议为g 系列,大雾枣盈酴奄售联黧( i t u ) 发表。 1 9 7 2 年首先制定了g 7 1 1 标准,数据率6 4 k b s ,取样频率为8 k h z ,使用a 律或者h 律p c m 编码标准。质鳖相当于1 2 比特的线性量化。同时它还规定了律和a 律之间的转换关系,它最常 用予数字电话的语音编璐中,j 龟辨还可瑁予可褫电话戏会议亳税的语音编码中,并置是可视电话戴 会议电视系统中必各的语音编解码能力。 1 9 8 4 年公奄了g 7 2 1 标准( 1 9 8 6 年修订) 。它采臻的是自适应差分脉冲编码( a d p c m ) ,数 据率为3 2 k b s ,采样频率间& 7 1 1 一致,为8 k h z 。a d p c m 避一种对中等音频质量信号进行压缩 编码的有效算法之一,他不仅适用于语音压缩,而且也适用于调频广播质量的音频压缩和c d 1 音 频压缭等应爱。 1 9 8 8 针对宽带语音( 5 0 7 k h z ) ,c c i t t 制定的g 7 2 2 编码标准,它的数搌率为6 4 k b s 。它 可用于综合业务数据网( i s d n ) 的b 通道上传输音频数据。& 7 2 2 标准将取样频率提高到1 6 k h z , 将新编弱麓模攮信号的高额陵扶3 k h z 提高翻7 k h z ,同时把低频疆获3 0 0 h z 下降登5 0 h z 。输出缡 码数据的速率可为6 4 k b s 、5 6 k b s 或4 8 k b s ,从而在不增加数码率的情况下改进了语音编码的质 量。g 7 2 2 能姆2 2 4 k b s 舱调频广援震量蠹频信号压缩为6 4 k b s ,它不但可避予语音缡秘,恧虽 还可硝于其它的音颁编码,还用于视昕多媒体和会议电视等。g 7 2 2 标准也能摊供数据搦入功能, 在保持总码率为6 4 k b s 冉勺条件下,可以插入多种速率的数据,这样所攒入的数据和音频码流一切形 藏总静瓣赉毙褥溺。 随衙公布的g 7 2 3 建议中码率为4 0 k b s 和2 4 k b s ,g 7 2 3 编码器蹶用线性预测分析和成技术, 对8 k b s 取样的6 比特精度的p c m 数字音频进行处理,以尽最减小实际语音与合成语音之间经听 觉翻校磊的差分信号静能餮为准j l i | 来进行编码。在g 7 2 3 稼准中疆供了两秘可选速率,分划为 52 7 k b s 和6 3 k b s 。和同样速率的其他语音编码器相比,这两种编码器都具有较高的语音质量,较 低的编鹦延时( 3 0 - 4 0 m s ) 。其中,5 2 7 k b l s 编码器只搜索一个激鼬码本,所以速度缀快,甄嚣的 存储空间也较小。 1 9 9 0 年公布了1 6 - 4 0 k b s 镶墩式a d p c m 标准g 7 2 7 。低码率、短延时、商质量是人们期望的 一g 一 为进一步降低语音压缩的码率,c c i i q 在1 9 9 2 年和1 9 9 3 年分别公布了浮点和定点算法的 g 7 2 8 标准,使用基于短延时码本激励的现行预测编码( l d - c e l p ) 算法,其速率为1 6 k b s ,带宽 限于3 4 k h z ,该算法延时小于2 m s ,语音质量和3 2 k b s 的g 7 2 1 标准相当,但比g ,7 1 1 或g 7 2 2 差得多。 1 9 9 6 年3 月,h u t 制定了使用共朗结构代数码激励线性预测( c s _ a c e u ) 的8 k b l s 语音编码 标准g 7 2 9 。同年1 1 月,又制定了简化版的g 7 2 9 a 。两者在编解码器的比特流一级完全兼容,可 以互通。 除此之外,还有一些被广泛应用的标准,如1 9 8 8 年欧洲数字移动通信g s m 制定的泛美数字移 动通信网的1 3 k p s 长时预测规则码激励( r p e l t p ) 语音编码标准。1 9 8 9 年北美蜂窝电话工业组 织( c t i a ) 公布的北美数字移动通信标准,它采用的是自适应码本激励。日本的数字移动通信标准 则是67 k p s 的v s e l p ( 矢量和激励线性预测) 。 下表以表的形式列出了常见音频编码算法平| i 标准。 表1 3 常见音频编码算法和标准 算法名称数据率标准应用质量 p c m均匀量化 u ( a )u 律 6 4 k b sg 7 1 1 a p c m自适应量化公共网 d p c m差值量化3 2 k b sg 7 2 1i s d n40 45 6 4 k b sg 7 2 2 配音 波形编码a d p c m自适应差值量化 5 3 k b sg 7 2 3 s b - a d p c m子带一自适应差值量化 6 3 k b s 参数编码 l p c线性预测编码2 4 k b s保密话声25 35 c e l p c码激励l p c4 8 k b s移动通信 v s e l p矢量和激励l p c8 k b s语音邮件40 37 r p e l t p长时预测规则码激励1 32 k b $l s d n l d - c e l低延时码激励l p c1 6 k b sg 7 2 8 混台编码c d5 o p m p e g多子带感知编码1 2 8 k b sg 7 2 9 a c 3感知编码音响5 o 在对音频编码的国际标准有所了解后,下面详细介绍两种常用音频编码标准的算法。 1 3 2g 7 1 1 a 律p c m 编码 g 7 1 1 语音的p c m 编码主要使用在电话通信线路上。在电话通信线路上研究语音过程是很 重要的。声音的三个要素是:音调、音强、音色。人耳对2 5 2 0 0 0 0 h z 的声音有反应。人们在谈话 中大部分有用信息在3 k h z ,但是,大部分有用的和可理解的信息的能量是在2 0 0 h z 到3 5 0 0 h z 之 间。因此,电信的传输线路上使用了带通滤波器,所提供的典型电话信道能运载3 k h z 带宽( 即3 0 0 3 3 0 0 h z ) 。根据奈奎斯特准则,a d 转换采样速率至少是信号最大频率的两倍,因此最小采样频 率应该是6 6 0 0 h z 。实际上采用的频率略高一点,达到8 k h z 。对采样后的音频信号采用非均匀量化 的方法进行量化,然后进行p c m 编码传输。 p c m 将模拟信号的抽样量化值变换成代码,即模拟信号经抽样、量化、编码后变成数字信号。 g 7 1 1 是将1 3 位p c m 码按a 律、1 4 位p c m 码按u 律转换8 位编码。目前我国采用容易实现的a 律1 3 折线压扩特性。 g 7 1 1 建议中把1 3 ( 1 4 ) p c m 码分割成1 6 段,各段长度不等,每段给1 6 个码字,总编码共训 2 5 6 个,这是一种较为简单的非均匀编量化器。编码器输入和输出的示意图如图11 。图中示意输 一9 一 都辨 囊 图1 1正输入码与a 律输出码的关系 下面介绍逐次比较型编码的原理:根据输入的样值脉冲编出相应的8 位二进制代码,除第一位 极性码外其他七位二进代码是通过逐次比较确定的。预先规定好一些作为标准的电流( 或电压) , 称为权值电流,用符号,。表示。l 的个数与编码位数有关。当样值脉冲到来后,用逐步逼近的方 法有规律地用各标准电流,。去和样值脉冲比较每比较一次出一位码,直到1 w 和抽样值逼近为止。 选用不同译码规律的国家之间,数据通路传送按照a 律译码信号。使用u 律的国家应进行转换, 建议给出了i j - a 、a - u 编码对应表。建议还规定,在物理介质上连续传送时,n o 1 位( 极一l 生位0 ) 在前,n o 8 位( 最低有效位) 在最后。 g 7 1 1 利用了语音幅度的统计特性压缩了近二分之一的数据,它早已广泛用于各种数字通信 中。 1 3 3g7 2 1 自适应脉冲编码调制a d p c m 0 7 】【0 8 】 这个建议提出了能和已有的p c m 数字电话网兼容的3 2 k b s a d p c m 算法。它用于6 4 k b s 的a 律或u 律p c m 到3 2 k b s a d p c m 之间的转换,实现了对p c m 信道的扩容。算法的技术指标如下: 1 、语音信号经a d p c m 编码后,客观测量s n r 应完全符台p c m 编码系统的指标要求( c c i t t & 7 1 2 、g 7 1 1 建议) ;主观听觉测试性能应非常接近p c m 质量。 2 、经过四次音频转换后,主观语音测试质量良好,其主观平均判分m o s 应大于3 5 以上: 3 、在信道误码率低于1 0 。的情况下能稳定工作; 4 、4 8 0 0 b s 的m o d e m 信号经过哩次解码后,其误码率应小于1 0 。5 - 1 0 。5 3 2 k b sa d p c m 编码器和解码器简化框图如图12 所示。 从图中可以看出编码器是将输入信号先经过p c m 转换,从数字输入信号中减去估计值,得到 差值信号d ( ) 。1 5 阶自适应量化器将d ( k ) 量化成4 位二进制值,( ) 。逆量化器从这4 位二进制 数中产生量化的差值信号d 。( t ) 。( ) 和估计信号s q ( k ) 相加得到重构信号s ,( ) a 自适应预测 器利用d q ( k ) 和s ,( ) 生成输入信号的估计值。 解码器则是包括一个与编码器反馈部分相同的结构,还有a 律或u 律的转换器,以及同步编码 一l o = ;亨1 蒋:= = = = _ = = = = 生塑芏堕墅l 一 用试图消除下一个a d p c m 编码的量化失真的方式调节p c m 输出,以实现同步编码调节。 a 编码器 b 解码器 图1 2 3 2 k b sa d p c m 编码器和解码器简化框图 下面对整个解码器及编码器的各部分进行说明: 1 输入输出接口 输入输出接口采用标准的a 律或u 律6 4 k b s p c m 信号。编码器的输入信号是6 4 k b s a 律或u 律p c m 编码。首先将其转换为标准p c m 编码。目前3 2 k b s a d p c m 别主要应用于扩充现有p c m 信道传输容量。即把两个3 0 路p c m 信号合并成一个2 4 8 k b s 的6 0 路a d p c m 信号,这是c c i i t & 7 6 1 建议的国际标准。因此,采用标准的6 4 k b l sp c m 作为a d p c m 系统输入接口是非常合理的。 标准6 4 k b s p c m 是经过对数压缩后的数字信号,它是不能直接进行一般算术运算。因此,在进入 a d p c m 编码前,必须把a 律p c m 码变成自然二进制码也称为线形p c m 码。在接收端,则是进 銮塑查堂

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论