已阅读5页,还剩53页未读, 继续免费阅读
(电路与系统专业论文)基于DAB系统的音频解码算法研究、移植与优化[电路与系统专业优秀论文].pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浙江大学硕士学位论文 摘要 数字音频广播d a b 是继a m 、f m 之后的第三代广播,d a b + 是该标准的升 级版本,它采用现代先进编码技术h e a a cv 2 音频编码算法进行编码,在保证 接收不低于c d 音质的同时,占用更少的频带资源,提供更高的压缩码率,并且 适合高速移动便携接收,为广播数字化进程奠定了基础。本文就是基于数字音频 广播d a b + 系统的基础上对其核心编码技术h e a a c v 2 音频编码算法进行研究, 移植和优化。 h e a a cv 2 是现在流行的最高效的数字音频压缩编码方式之一。在参考了 m p e g - 4 a a c 及其两次修订版本标准的基础上,在深入分析h e a a cv 2 编码算 法模块的基础上,将h e a a cv 2 算法与d a b + 的数据帧解码相结合,实现d a b + 系统的数据流解码。并且在3 2 位嵌入式c k m c u 上实现这一解码算法流程的移 植,并用本人改进的软件s i m d 技术对解码算法进行优化,以期达到预期的效果。 最后,对完成的和将来需要完成的工作进行了讨论,总结和展望,希望d a b + 系统及h e a a cv 2 音频压缩编码技术在国内外的发展有更加美好的前景。 关键词:d a b + ;h e a a cv 2 ;数字音频压缩编码;软件s i m d 技术 浙江大学硕士学位论文 a b s t r a c t d i 百t a la u d i ob r o a d c a s t i n g ( d a b ) i s t h et h i r dg e n e r a t i o nb r o a d c a s tf o l l o w i n gt h ea m , f mb r o a d c a s t , w h i c hi s u p d a t e dt od a b + ,t h a tu s e sh i g h l ye f f i c i e n tc o d i n g t e c h n o l o g yn a m e d h e - a a cv 2 d a b + r e c e i v e rr e c e i v e st h ea u d i od a t aw h i c hq u a l i t y i sn ob a dt h a nc d ,b u tt a k e su pl e s sb a n d w i d t ha n di sc o m p r e s s e di nah i g h e rr a t e e v e nm o r ei ti ss u i t a b l ef o rp o r t a b l e ,h i g h - s p e e dm o b i l er e c e i v e r d a b + m a k e s f o u n d a t i o ni nt h ed e v e l o p m e n to fd i 酉t a l b r o a d c a s t i n g t h i sp a p e rr e s e a r c h e s , t r a n s p l a n t sa n do p t i m i z e st h eh e a a cv 2a u d i oc o d i n ga l g o r i t h mb a s e do nd i g i t a l a u d i ob r o a d c a s t i n gs y s t e m h e a a cv 2a l g o r i t h mi so n eo ft h em o s tp o p u l a ra n dh i g h l ye f f i c i e n td i g i t a la u d i o c o d i n ga l g o r i t h m s a c c o r d i n gt ot h es t a n d a r do fm p e g - 4a a ca n dt w oa m e n d e d v e r s i o na f t e r , w ea n a l y z ec o d i n ga n dd e c o d i n ga l g o r i t h mo fh e - a a cv 2a n d i m p l e m e n tt h ed e c o d i n go f t h ea u d i od a t as t r e a mi nd a b + s y s t e m ,w h i c hi n c l u d e st h e a u d i od a t ao fh e a a cv 2 t h e nw et r a n s p l a n tt h ed e c o d i n ga l g o r i t h mi n t ot h e3 2 - b i t e m b e d d e dc p u :c k c o r ea n do p t i m i z ei tw i t ht h es o f t s i m dt e c h n o l o g yt h a ti i m p r o v e dt oa c h i e v et h ee x p e c t e dp e r f o r m a n c e f i n a l l y , w ec o n c l u d e d ,a n de x p e c t e dt h ew o r kt h a tc o m p l e t e da n dn o tc o m p l e t e d w e h a v ef a i t ht h a tt h ed a b + s y s t e ma n dt h et e c h n o l o g yo fh e - a a cv 2d i g i t a la u d i o c o d e ca l g o r i t h mh a v eab e r e ra n db e r e rf u t u r ea l lo v e rt h ew o r l d k e y w o r d s :d a b + ;h e - a a cv 2 ;d i g i t a la u d i od a t ac o m p r e s s i o n ;s o f f s i m d 浙江大学硕士学位论文 浙江大学研究生学位论文独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发 表或撰写过的研究成果,也不包含为获得逝江盘鲎或其他教育机构的学位或 证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文 中作了明确的说明并表示谢意。 学位论文作者签名:i 一彳喜 签字日期: 例。年月罗日 学位论文版权使用授权书 本学位论文作者完全了解逝江盘堂 有权保留并向国家有关部门或机 构送交本论文的复印件和磁盘,允许论文被查阅和借阅。本人授权逝姿盘堂 可以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影 印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名: 1 一名j 每 签字日期:砷f 口年孑月甲日 聊躲万瞬 签字日期:弘年3 月日 浙江大学硕士学位论文 1 绪论 1 1 数字音频广播( d a b ) 的发展 近年来,数字技术的飞速发展使得人们的生活品质有了显著的提高,这种生 活品质的提高表现在生活中的方方面面,从c d 、d v d 到h d t v ,从i p 电话、 i n t e m e t 电话到家电智能化等等,这种种迹象都表明了数字时代的来临。当然, 这仅仅是个开始,以后人们的生活中将会有越来越多的模拟技术被更加高效便捷 的数字技术所取代。与此同时,数据压缩技术、纠错编码技术、多媒体移动通信 技术的不断发展完善,射频的频带利用率更高,数字信号处理和数据传输更加可 靠,加上其他技术的日趋成熟,都为数字音频广播( d i g i t a la u d i ob r o a d c a s t i n g , d a b ) 迅速崛起提供了有利的条件,并迅速在世界各地推广开来。 数字音频广播( d a b ) ,是对数字化了的广播音频信号及各种数据图像信号进 行编码、调制、传输等处理,使接受端获得更高品质的广播收听效果及其他增值 多媒体数据服务的广播系统。d a b 是继模拟广播a m 、f m 之后的第三代广播。 与传统的模拟广播相比,d a b 具有抗噪声干扰、发射功率小,覆盖面积广、频 谱利用率高、适合高速移动接收等优点,并且以更高的压缩码率获得更好的音质 h 1 。总之,数字音频广播更加符合当代人的对高品质生活的需求。 d a b 技术起源于1 9 8 0 年的德国。当时,德国广播技术研究所正在研究地面 音讯广播技术,并将研究过程中的系统命名为d a b ,这就是世界上最早的数字 音频广播系统。1 9 8 5 年,d a b 开始在德国慕尼黑进行试播,并在当地取得不 错的反响。同年7 月1 7 日,e u r e k a 组织在欧共体1 7 国外长首脑会议上成立。1 9 8 6 年,德、英、法、荷、丹等国家政府及相关部门共同制定了e u r e k a 1 4 7d a b 标 准,这就是目前应用最为广泛的d a b 标准。1 9 9 4 年,e u r e k a - 1 4 7d a b 标准成 为了d a b 系统的国际标准n 2 。 世界上的d a b 系统大致可分为:欧洲e u r e k a - 1 4 7 、美国i b o c ( i n b a n d o n - c h a n n e l ) 及法国d r m ( d i g i t a lr a d i om o n d i a l e ) ,还有部分其他国家自行研制发 展的d a b 系统。而e u r e k a - 1 4 7d a b 标准一直被用来区分真正的d a b 广播与其 浙江大学硕士学位论文 他音频广播的标准。 今天,d a b 在欧洲大部分地区使用,并且正在世界其他地方推广和测试。 据w o r l d d a b 联盟的数据,全球已经开展了1 0 0 0 多项d a b 数字广播服务,主 要分布在英国、德国、加拿大、澳大利亚等4 0 多个国家。 2 0 0 3 年,由于数字移动电视标准的推出,诸如d v b h 和t - d m b ,其采用 更加高效的h e a a cv 2 编码方式,使得d a b 系统的编码算法受到空前的挑战, 毕竟d a b 系统的音频编码算法已经经历十几年的历史。h e a a cv 2 编码算法比 传统d a b 系统的m p e gl a y e r i i 编码效率高出4 到6 倍,却以更高的压缩编码 获得更好的音质效果。在这种形势下,d a b 系统开始了向d a b + 系统升级,并 将其中的核心音频编码算法更换为h e a a cv 2 编码算法,由此,d a b + 系统的 开发和研制逐渐在全世界展开。 在我国,d a b 技术的发展起步比较晚,即使到目前为止,也只有少数地区 在研究开发d a b 系统。2 0 0 6 年,国家广电总局宣布,将g y t 2 1 4 2 0 0 6 ( 3 0 m h z 3 0 0 0 m h z 地面数字音频广播系统技术规范作为中华人民共和国广播电影电视 行业标准,自2 0 0 6 年6 月1 日起开始实施。这标志着,我国数字音频广播的发 展进入到了一个新时代。此次出台的标准适用于固定和便携d a b 接收机,接收 高质量数字音频节目和其他多媒体数据业务等。现在,我国仅少数沿海地区获得 国家广电总局的批准进行e u r e k a 1 4 7d a b 系统的试播。 1 2 数字音频压缩技术及m p e g 编码标准简介 数字音频压缩技术是指对采样量化后的原始p c m 数字音频信号流,运用适 当的数字信号处理( d s p ,d i g i t a ls i g n a lp r o c e s s i n g ) 技术,在保证过程中所引入的噪 声和失真不会损失原有信息量,或者所造成的损失低到可忽略的前提下,尽可能 将音频信号的码率降低。同时,压缩编码存在相应的逆变换,称为解压缩或解码。 对数字音频压缩技术的研究是从7 0 年代初开始的,当时采用的是类似p c m 的b l o c k c o m p r e s s i n g 技术,该技术属于无损( 1 0 s s l e s s ) 压缩编码,是数字音频压 缩编码的开端,因此,编码效率较低。8 0 年代,数字信号处理( d s p ) 技术的广泛 发展和运用,使得提高数字音频压缩编码的算法复杂度和压缩码率成为可能,并 浙江大学硕士学位论文 且出现了一系列复杂的频域编码算法,编码音质有了质的飞跃。从8 0 年代末开 始,人耳的心理声学模型开始运用于各种数字音频压缩编码的算法中。这些编码 算法普遍利用心理声学模型中的掩蔽效应和临界频带等特性,对p c m 音频码流 采用子带编码和变换编码等高效编码技术进行编码。这一系列变化将无损压缩编 码技术推向了顶峰,使得数字音频压缩编码技术无论是音质还是压缩码率都达到 了空前的高度。9 0 年代开始,有损( 1 0 s s y ) 压缩编码开始成为数字音频压缩技术的 主流,压缩码率得到显著的提高,但这是以牺牲音质换来的。现在音频数据的压 缩率已经可以达到1 2 :1 甚至更高。对于现在人们所追求的高品质生活与音质享 受,在音质与压缩码率上选取平衡点,使得各种不同的编码方式满足人们不同方 面的需要就显得尤为重要,m p 3 、a a c 等数字音频压缩编码方式就应运而生h 鲥。 由上面数字音频压缩编码技术的发展可知,数字音频压缩编码技术可分为无 损( 1 0 s s l e s s ) 压缩及有损( 1 0 s s y ) 压缩两大类。有损压缩是指在压缩过程中丢弃了一 些次要数据,但还能实现较好的压缩效果。无损压缩是指压缩过程中不丢弃任何 数据,经压缩与解压缩编码之后能够得到与原始数据完全相同的解码数据。而按 照压缩方案的不同,又可分为时域压缩、变换压缩、子带压缩,以及混合压缩等。 m p e g ( m o v i n g p i c t u r e se x p e r t sg r o u p ,运动图像专家组) 于1 9 8 8 年建立,该 组织专门负责建立音视频标准,并且到目前为止编写了m p e g 1 、m p e g 2 、 m p e g 4 、m p e g 一7 以及m p e g 。2 1 等。下面只介绍与本文相关的标准m p e g 1 2 4 。 m p e g 1 的音频编码标准根据编码复杂度的不同分为三个层次 引,l a y e ri 、 l a y e ri i 、l a y e ri i i 。l a y e ri 采用简化的m u s i c a m 算法,典型码流为1 9 2 k b p s ; l a y e ri i 即m p 2 采用m u s i c a m 算法,其全称是掩蔽模式通用子带集成编码与 多路复用,典型码流1 2 8 k b p s ,l a y e ri i i 即m p 3 采用m u s i c a m 算法与a s p e c 算法相结合的混合编码方式,典型码流6 4 k b p s ,低码率却获得高品质音质,所 以成为了近十年网络上流传最为广泛的音频编码算法,到今天还受到很多人的喜 爱。m p e g 1 三个层次采用的算法复杂度逐层递增,压缩码率也随之递增,音质 却越来越好。m p 2 应用最为广泛的就是d a b 数字音频广播,自从d a b 产生至 今一直采用这一编码方式对其音频进行编码,直到h e a a cv 2 的产生才对其造 浙江大学硕士学位论文 成了一定的冲击,并取代它成为d a b + 的音频编码方式。 m p e g 2 分为后向兼容多声道音频编码方h ( m p e g 2b c ) 和高级音频编码方 h ( m p e g 2a a c ) 两种。m p e g 2b c 是对m p e g 1 的多声道扩展,同时,还- 9 m p e g 1l a y e ri 、l a y e ri i 保持兼容性。而m p e g 一2a a c 并不提供m p e g 一1 的 后向兼容性,却以更低的码率提供更好的音质效果。m p e g 一2a a c 采用感知编 码,利用听觉系统的掩蔽效应来减少压缩的数据,通过全局信号将分散到各个子 带中的量化噪声屏蔽掉p 1 。与m p e g 1l a y e ri i 相比,m p e g 2 a a c 在压缩比提 高一倍的前提下,提供更好的音质效果;而- 9m p e g 1l a y e ri i i 相比,m p e g 2 a a c 只需要7 0 的码率就可以提供- 9m p e g 1l a y e ri i i 相同质量的音质。 h e a a cv 2 就是在m p e g 2a a c 编码方式的基础上逐渐发展起来的,下一节将 会做专门的介绍。 m p e g 4 音频编码标准与1 9 9 9 年正式公布实施。与原来的m p e g 标准相比, 其对音频的低比特率编码进行了大幅度的强化,并以提供未来的交互式多媒体应 用为目标。m p e g 4 提供了除声音信号记录和广播的应用外的其他用途,如通信 和其他多媒体数据传输等 1 0 1 。 1 3h e a a cv 2 发展概述 1 9 9 4 年,f r a t m h o f e ri i s 、a t & t 、d o l b y 、s o n y 和n o k i a 等公司合作开发a a c 音频格式,以取代m p 3 的地位。在最初的基础上,a a c 技术经历了几次变革, 发展成为现在的h e a a cv 2 。1 9 9 7 年,a a c 成为了m p e g 2 音频标准的一部分; 1 9 9 9 年,添加了p n s 技术的改进a a c 被重新整理写进了m p e g 4 音频标准; 2 0 0 3 年和2 0 0 4 年,s b r 技术和p s 技术作为增补写进m p e g 4 标准,并且在2 0 0 3 年将a a c 中的l c 框架和s b r 技术相结合构成h e a a cv l 音频格式,第二年 将p s 技术加入进来构成了加入h e a a cv 2 音频格式。至此,h e a a cv 2 音频 格式才算正式实现,如图1 1 所示1 1 1 。 4 浙江大学硕士学位论文 p n s s b rp s 1 9 9 71 9 9 9 2 0 0 4 图1 - 1h e - a a cv 2 的发展历程 由a a c 的发展历程就可以看出,h e a a cv 2 音频格式包括三部分内容: a a cl c 框架、s b r 技术和p s 技术,如图1 2 所示n 卯。 图1 2m p e g 一4 h e a a cv 2 系列介绍 1 ) a a cl c ( l o wc o m p l e x i t yp r o f i l e ,a a c 低复杂度算法) a a cl c 是在m p e g 2a a c 中定义的,并被收入m p e g 4 的标准中。由于 在处理过程中简化了流程,去掉了预测模块和预处理模块,并且限制了t n s 滤 波器级数,所以,相比其他a a c 算法,a a cl c 对系统性能的要求最低。但这 却完全没有影响它的高音质,在大部分情况下,它在降低复杂度的同时,却可以 保持并不逊色的音质。因此,a a cl c 是现在使用最广泛的a a c 算法。 2 ) s b r ( s p e c t r a lb a n dr e p l i c a t i o n ,频带复制) 音频中的高频成分代表了声音的细腻度,在追求高品质音频的人们眼中,是 不可缺少的重要部分,但是由于心理声学模型,人耳对低频部分的音频信号更加 敏感,所以在传统的音频压缩编码过程中,通常舍弃高频信号,将其频带分配给 低频信号,这样的直接后果就是,由于高频信号的缺失,导致最后解压缩后的音 频信号变得沉闷、不明亮。因此高频重建技术发展势在必行,s b r 技术就是在 这样的情况下产生的。 s b r 技术是一种波形编码和参数编码相结合的混合编码技术。从高频重建 气 浙江大学硕士学位论文 技术来说,s b r 技术是一种“非盲式”重建方法。s b r 高频复制的理论是利用低 频信号和高频信号的相关性,使用低频部分的泛音复制高频部分的泛音。对于信 号的低频部分编码依然采用a a c 基础解码器,高频部分则从低频部分通过高质 量的变换算法进行有效重构。传输过程中,无须直接传输音频信号的高频部分, 只要传输低频部分的信号和s b r 控制信息,就可以在接收端对a a c 码流进行高 频部分的有效重构。 3 ) p s ( p a r a m e t r i cs t e r e o ,参数立体声) p s 编码技术是基于s b r 编码技术的框架,将全境选频和立体声环境重建技 术相结合的一种编码技术。它实际上是一种将立体声音频信号视为单声道音频信 号加上小部分立体声映象信息的参数来进行编码的先进技术。另外,p s 技术具 有后向兼容性,由于p s 数据在音频数据流的扩充数据域内,因此在不支持p s 技术的解码器上仍可以解出单声道信号。 1 4 论文内容意义结构 本课题研究的内容就是在现有的基础上解决d a b + 系统解码算法的移植优 化问题。需要强调的是本文不考虑d a b + 在空中传输码流的解调问题,只是单纯 研究解调后的音频数据帧的码流解码算法问题。d a b + 的音频数据帧实际上就是 在h e a a cv 2 码流编码算法的基础上添加超级帧头,并且在音频码流中添加了 r s 编码算法来实现纠错。因此,解决好d a b + 解码算法的移植的关键问题是: r s 解码算法的移植和h e a a cv 2 解码算法优化。 虽然到目前为止,关于d a b 系统、h e a a c v 2 算法和r s 算法的研究已经 很多,但是对于d a b + 系统与h e a a cv 2 算法由于相关专利权问题,其内部结 构及算法被d o l b y 等公司独占,没有完全开放。所以公开的研究还只是处于起始 阶段,本论文的研究可以在一定程度上促进d a b + 系统研究在国内的发展,并加 速d a b + 系统取代d a b 系统的地位,完成数字音频广播在国内的更新换代,使 人们获得更高的听觉效果,提高人们的生活质量。 本文的创新点和难点在于: 1 r s 解码算法和h e a a cv 2 解码算法的优化移植问题。 6 浙江大学硕士学位论文 2 优化过程中所使用的软件s i m d 技术的并行算法。 3 d a b + 系统在c k m c u 上的实现。 论文从第二章开始介绍d a b + 系统中所应用到的基本原理,其中包括 h e a a cv 2 编解码算法、r s 编码原理,以及心理声学模型和掩蔽效应等;第三 章详细介绍d a b + 系统的解码流程、码流结构等;第四章介绍并行算法软件s i m d 技术;第五章介绍基于中天c k m c u 进行的移植和优化;第六章为论文的总结 和展望。 1 6 本章小结 本章从d a b d a b + , $ 统的发展说起,介绍了数字音频压缩技术以及m p e g 技术标准的发展历程,并且提到了d a b + 系统音频压缩编码算法一一h e a a cv 2 编码技术的概况。然后介绍了论文的研究内容,创新点和技术难点,以及论文的 组织结构等。 渐江大学硕士学位论文 2d a b + 系统音频解码技术基本原理介绍 2 1h e a a cv 2 编解码原理 2 1 1h e a a cv 2 编码算法原理 由于h e a a cv 2 主要由a a cl c 框架、s b r 技术和p s 技术三部分组成, 因此在编码过程中,在a a cl c 核心编码器的基础上,根据需要添加s b r 模块 和p s 模块,就构成了h e a a cv 2 编码算法,如图2 1 所示。 输入p c m 音掣降混音h 热 叫降混音h 二乙 比 特 流 复 用 + 罱一 图2 - 1h e a a cv 2 编码算法 图2 - 1 是采用了3 g p p 的h e a a cv 2 编码的算法结构n 2 川“棚,其思想是在 a a c 核心编码器的基础上对p c m 音频数据的低频部分进行编码;对高频部分的 数据根据其与低频的相关性采用s b r 技术进行实现;而p s 技术则在低于3 6 k p b s 的低比特率的立体声信号数据编码中使用,利用立体声信号的相关性参数数据将 立体声信号进行编码。 如果输入的p c m 信号是立体声信号,并且音频编码模式为单声道模式,那 么数据首先进入的是降混音模块,将立体声信号转化为单声道信号。当然,如果 输入的信号本身就是单声道信号则可以跳过这一模块。然后,信号进入一个无限 脉冲响应( i n f i i l i t ei m p u l s er e s p o n s e ,i i r ) 重采样滤波器,该滤波器的作用是对与核 心编码器采样率不同的输入信号进行采样率的调整,使两者达到一致或者保持在 适合编码处理的最佳采样率。 然后信号根据需要分成两种情况。 由于s b r 模块和p s 模块都是在q m f 域下完成的,因此需要p s 工具时, 浙江大学硕士学位论文 信号会进入6 4 子带分析正交镜像滤波器( q u a d r a t u r em i r r o rf i l t e r ,q m f ) 组,完 成原始信号从时域到频域的变换,并得到能反映低频和高频相关性便于分析的子 带信号。p s 模块提取立体声参数,并将立体声信号进行降混音处理,变成单声 道信号。获取的立体声参数直接进入比特流复用。生成的单声道信号一方面送入 3 2 子带降采样合成正交镜像滤波器组,在进行频域反变换的同时进行降采样, 这样可以使a a c 编码器的滤波器组有更高的频率解析度,增进听觉掩蔽作用的 利用。然后,将信号送入a a c 核心编码器编码。另一方面,生成的单声道信号 进入包络估计模块,提取输入信号的频谱包络,s b r 相关模块用来分析信号的 高频带与低频带的之间的关系,采集一些导向信息。这种关于输入信号特征的采 集信息,加上频谱包络数据就形成了s b r 数据。a a c 核心编码器仅对信号的低 频带部分编码。编码后的数据和s b r 数据、p s 数据一起复用。 当不使用p s 工具时,那么原始的p c m 信号会直接输入到一个2 :1 的i i r 降采样,然后送入a a c 编码器。s b r 部分同使用p s 工具时的情况。 2 1 2h e a a cv 2 解码算法原理 编码后的音 频数据流 比 特 流 解 复 用 a a c 核心 解码器 s b r 数据 分析q 滤波器组 高频生成 包络调整; 高 低 频 带 合 并 参 数 立 体 声 合 成 p s 数据 合 成 q m f 滤 波 器 组 输出p 似 音频数据 图2 2h e a a cv 2 编码算法n 2 1 比特流首先会被分解成a a c 数据,s b r 数据和p s 数据。a a c 数据经过 a a c 核心解码器,输出一个时域低频信号,然后经过q m f 分析滤波器组转化为 频域信号。在频域,通过高频生成器,来重建频域的高频带信号,根据包络调整 器将包络调整到最佳匹配的状态。最终,低频和重建的高频信号在频域组合获得 9 浙江大学硕士学位论文 完整的输出信号。 如果使用p s 工具,那么根据得到的p s 数据,在频域将a a c 核心编码器输 出的单声道信号转换成立体声信号。然后进入q m f 合成滤波器组中进行频域反 变换和上采样。输出的结果就是一个采样率为的时域信号。 2 1 3h e a a cv 2 中a a cl c 核心解码算法模块分析 d a b + 系统的音频数据流中的s b r 数据和p s 数据分离以后,剩下的a a c 音频数据流的低频部分则通过a a cl c 核心解码器进行解码处理,其具体流程 如图2 3 所示1 0 1 。 图2 - 3h e a a cv 2 解码算法流程框图 1 1 无噪声解码 无噪声编码实际上就是h u f f m a n 编码。h u f f m a n 编码采用的变长编码技术, 按照数据出现的概率进行编码,出现频率高的数据用短码字编码,出现频率低的 数据用长码字编码,利用h u f f m a n 编码可以达到最优化编码。 在编码过程中的h u f f m a n 编码是对之前经过m d c t 变换和量化的数据进行 处理,以进一步减少尺度因子和量化后频谱数据的冗余。而h u f f m a n 编码本身是 无损压缩,可以在不损失音质的情况下进一步提高压缩码率。a a c 标准一共提 供了1 2 张h u f f m a n 码表,其中码表0 表示没有比例因子和量化数据传输。 这里h u f f i n a n 解码的任务就是根据传输的码字和码表信息找到相应的索引, 然后根据索引找到对应的两元组或四元组,并将对应的数据送到下一个模块中。 l o 浙江大学硕士学位论文 2 ) 反量化及比例因子解码 量化是降低比特率的主要手段,因此它是有损的压缩过程。在a a c 编码过 程中,量化采用的是一个非均匀量化。为了降低量化噪声,则采用比例因子来对 其进行噪声整形。比例因子就是一个用来改变在一个比例因子带的所有的频谱系 数的振幅增益值。使用比例因子是为了使用非均匀量化器在频域中改变量化噪声 的比特分配。而比例因子带则是根据人耳的听觉特性将频率分组,每个组对应几 个比例因子,这些组就是比例因子带。h u f f r a a n 解码会一直持续到这个段落里 所有的频谱值都被解完。一旦所有的段落都已经解码完成,这些解出的二元组或 者四元组数据就会和被解码的比例因子相乘并恢复成编码之前的样子。 反量化公式: x _ i n v q u a n t = s i g n ( x _ q u a n t ) ix q u a n tl 们(2-1) 其中x _ i n v q u a n t 表示反量化的结果,s i g n ( x ) 表示取x 的符号,x _ q u a n t 表示 量化结果。 比例因子解码: x r e s c a l 5 x _ i n v q u a n txg a i n ( 2 2 ) g a i n = 2 0 2 5 5 _ 8 一o 8 8 1 ( 2 3 ) 其中x r e s c a l 为应用了比例因子公式之后的值,g a i n 为增益,s f 为比例因子 值,s fo f f s e t 为一个常数,设为1 0 0 。 3 ) 联合立体声解码 联合立体声编码是一种空间编码技术,其目的是在不引入可闻误差的情况下, 去掉空间的冗余信息。m p e g 一4a a c 系统包含两种空间编码技术中间旁道 ( m i d s i d e ,m s ) 编码和声强耦合( i n t e n s i t y c o u p l i n g ) 编码。以上两种空间编码方 法可以有选择的结合起来使用,以适应不同的频率区域。 m s 立体声编码使用矩阵运算,因此也称为矩阵立体声编码( m a t r i x e ds t e r e o c o d i n g ) 。m s 立体声编码不传送左右声道信号,而是使用标准化的中央m ( m i d d l e ) 声道和边s ( s i d e ) 声道。m s 定义如式2 - 4 所示。因此m s 编码也称作“和 浙江大学硕士学位论文 差编码( s u m d i f e r e n c ec o d i n g ) 。 m = t l + r ,s = t l - r ( 2 4 ) 由式2 - 9 可以看出,当左右声道信号频谱相似性较好时,使用m s 编码能减 小一个声道的数据量,从而减少所需的比特数,当l ,r 正相似时,m 与l 能量 相近,s 能量远小于r 的能量;当l ,r 反相似时,s 的能量与r 能量相近,m 的能量远小于l 的能量。同时还可以看出,当l r 相差较大时,l r 双声道编 码与m s 编码均可。 m s 解码就是将m s 立体声编码转换为弧双声道编码,如式2 - 5 所示。 : 1i f m l t b j ( 2 5 ) 声强耦合编码是基于声道问的不相关性,在音频信号的高频部分,人耳听 觉系统主要不是信号本身进行定位,而根据临界频带滤波后的频谱包络进行定位。 因此可以将信号频谱分为包络和载波两部分,包络部分编码可以采用较高精度, 而载波部分经过对不同的声道进行组合后,使用耦合声道进行编码。因此在编码 时计算出参与祸合的声道频谱系数的平均值编码成耦合声道。这样减少了编码高 频部分所需的比特数,对高频部分的频谱系数进行了压缩。 4 ) p n s p n s ( p e r c e p t u a ln o i s es u b s t i t u t i o n ,感知噪声替换) 模块是一种以参数编码的 方式模拟噪声的模块。在判别出音频值中的噪声后,将些噪声不进行量化编码, 而是采用一些参数告诉解码器端这是某种噪声,然后解码器端将会对这些噪声用 一些随机的编码来制造出这一类型的噪声。 在具体操作上,p n s 模块对每个尺度因子带侦测频率4 k h z 以下的信号成分。 如果这个信号既不是音调,在时间上也无强烈的能量变动,就被认为是噪声信号。 其信号的音调及能量变化都在心理声学模型中算出。 在解码中,如果发现使用了哈夫曼表1 3 ,则表明使用了p n s 。 由于m s 立体声解码与p n s 解码互斥,故可以用参数m su s e d 来表明是否 1 2 浙江大学硕士学位论文 两个声道都用同样的p n s 。如果m su s e d 参数为l ,则两个声道会用同样的随机 向量来生成噪声信号。 p n s 的能量信号用n o i s en r g 来表示,如果使用了p n s ,则能量信号将会代 替各自的尺度因子来传送。 噪声能量编码同尺度因子一样,采用差分编码的方式。第一个值同样为全局 增益值。它同强度立体声位置值及尺度因子交替地放在一起,但对差分解码来说 又彼此忽略。即下一个噪声能量值以上一个噪声能量值而不是强度立体声位置或 尺度因子为标准差分解码。 随机能量将会在一个尺度因子带内产生n o i s e n r g 所计算出的平均能量分布。 5 ) t n s t n s 瞬态噪声整形用于控制一个转换窗口内的瞬时噪声形态。它是用一个 对单个通道的滤波过程来实现的。 传统的变换编码方案常常遇到信号在时域变化非常剧烈的问题,特别是语音 信号,这个问题是因为量化后的噪声分布虽然在频率域上得到控制,但在时域上 却以一个常数分布在一个转换块内。如果这种块中信号变化得很剧烈却又不转向 一个短块去,那这个常数分布的噪声将会被听到。 t n s 的原理利用了时域和频域的二元性和l p c ( 线性预测编码) 的时频对称 性,即在其中的任意一个域上做编码与在另一域上做预测编码等效,也就是说, 在一个域内做预测编码可以在另一域内增加其解析度。量化噪声产生是在频域产 生的,降低了时域的解析度,故在这里是在频域上做预测编码 在h e a a cv 2 中,t n s 的滤波器阶数被限制在1 2 阶以内。 6 ) 滤波器组与i m d c t 编码过程中,时域p c m 信号通过m d c t ( e 荔( 进的离散余弦变换) 滤波器组转 化为频域信号,以便后期对信号在频域进行各种编码处理。解码时,则是通过 i m d c t 滤波器组和加窗,叠加将音频数据从频域转换回时域。具体流程是将n 2 点频域信号通过i m d c t 转换为n 点时域信号,然后对时域信号前半窗进行去窗 浙江大学硕士学位论文 操作,最后叠加前一帧的信号得到当前新的时域样本信息。 i m d c t 公式 一= 号喜印硎 球o s ( 等( o ) ( 后+ 扣刀 ( 2 - 6 ) 其中n 为采样点索引值,i 为窗索引值,k 为频谱系数索引值,n 为窗函数 的长度,全为短窗n = 2 5 6 ( 2 4 0 ) ,其余情况为2 0 4 8 ( 1 9 2 0 ) ,1 1 0 = ( n 2 + 1 ) 2 由于长块的频域分辨率较高而短块的时域分辨率较高,故长块较适合相对平 稳的时域信号,而短块较适合变化相对较快的时域信号。长块长度为2 0 4 8 ( 1 9 2 0 ) 个点,短块长度为2 5 6 ( 2 4 0 ) 个点。 a a c 用到两种窗函数,分别为k a i s e r - b e s s e l 类( r d 3 d ) 窗和正弦窗。 使用k b d 窗时,w i n d o w = 1 。 窗如下定义:s h a p e k b d 一一,( 刀) = 形( p ,口) 】 p = 0 n | 2 y f 形7 ( p ,口) 】 d 脚( 咒) = ,o ,z 了n n - - 1 - - | 矽7 ( p ,口) 】 p = 0 v 2 ( p ,口) 】 ( 2 - 7 ) ,i n ,l 删 ( 2 8 ) 其中w t 为k b 核心窗函数,定义如下 n ,口) = 其中 i o x = k = 0 r o i7 泓 l i o z a i4 ,n = 2 0 4 8 ( 1 0 9 2 ) 口= i6 ,n = 2 5 6 ( 2 4 0 ) 1 4 ,o 即了n( 2 9 ) 7 2 u 哆j ( 2 - 1 0 ) ( 2 1 1 ) 浙江大学硕士学位论文 k b d 窗如图2 _ 4 所示。 图2 4k b d 窗函数 w i n d o w _ s h a p e = o ,使用正弦窗。正弦窗定义如下。 一一( 加s ;n ( 号( 刀+ 扣疗 譬 一一( 刀) = s i n ( 号( 刀+ 争) 孚,z 正弦窗如图2 - 5 所示。 o ( 2 - 1 2 ) ( 2 1 3 ) i 盯冷( 鬣盯卿b 印 1 蚕2 - 5 正弦窗函数 对应于四种不同的窗序列进行不同的加窗变换,仅有长块 ( o n l y _ l o n g _ s e q u e n c e ) ,长起始块( l o n g _ s t a r t _ s e q u e n c e ) ,八短块 ( e i g h t _ s h o r ts e q u e n c e ) ,长结束块( l o n g _ s t o p _ s e q u e n c e ) 。 在加窗完成后得到的时域信号值z 经过前后窗相互叠加计算,得出最后的 p c m 值: 。“。= z ,+ z h ,o ,z i n , n = 2 0 4 8 ( 1 9 2 。) ( 2 1 4 ) 1 5 浙江大学硕士学位论文 2 2r s 编码原理 随着数字技术的成熟和广泛应用,在传输过程中数据的丢失,出错在所难免, 因此,需要一种能够对这种传输错误进行检测和纠正。纠错编码技术就是在这样 的背景下迅速发展起来的。r s ( r e e d s o l o m o n ,里德所罗门) 编码是典型的纠错 编码技术,它具有很强的纠错能力,可以纠正随机错误和突发错误,在通信系统 中具有广泛的应用。近些年来,r s 编解码通常都在通用的硬件平台( 在d s p 、单 片机) 上用c 和汇编编程软件实现。下面简单介绍r s 编码原理及相关的数学理 论基础。 在纠错编码的数学理论中,通常把以二进制表示的一个数据串看成一个多项 式。例如二进制数字序列1 0 1 0 1 0 1 1 ,可以表示成: f ( x ) - a 7 x 7 + 口6 x 6 + 口5 x 5 + 口4 石4 + 口3 x 3 + 口2 x 2 + 口l x + l =x7+x5+x3+x+l(2-15) 式2 - 1 中的x i 表示数据串中二进制数的位置,系数a i 表示二进制数的值,取 值为0 、1 则代表该位上的二迸制数为0 或者为1 。 由于r s 编码是建立在g f ( g a l o i sf i e l d ,伽罗华域) 中运算的,所以先简单介 绍一下g f 域理论。 伽罗华域g f ( 2 m ) 表示有2 m _ - - n 个符号 0 ,0 l 0 、旺1 、0 l 2 、仪盹, z n - i = 1 ) , 则域中的每个元素都可以用o l 0 、0 【1 、 1 2 、0 【m 。1 的和表示,其中仪为本原多 项式p 的根,而伽罗华域中每个元素都可以通过他本身对本原多项式p 求模 取得。 本原多项式p 的特性是 ( x 2 加1 + 1 ) m o d p ( x ) = 0 ( 2 1 6 ) 因此本原多项式p 通常是固定的,并可以查表得到,如表2 - 1 所示。 表2 - 1 部分本原多项武 m p g ) 1 + 尉 1 + r o l + 科 l + o 1 6 浙江大学硕士学位论文 61 + 刘o 1h0 威 8、- + 亡+ 0 斗0 七 伽罗华域中的运算规则: 1 ) 加减法运算相同,都是将两个操作数以二进制方式表示,然后进行模2 运算或者说是异或运算。 2 ) 乘法运算是将两个操作数的指数相加然后模r n 1 运算。 3 ) 除法运算是将两个操作数的指数相减然后进行模r n 1 运算。 例如:m = 3 ,本原多项式p g ) = l + 列,g f ( 2 3 = 8 ) 中的8 个元素表示如表2 2 所示。需要注意的是i f , 是舯1 + 甜= 0 的根,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初一生物上学期教学计划
- 六年级语文阅读理解训练(一)-说明文阅读
- 全国新高考1卷英语试题
- 兰大《税收会计》20秋平常作业1
- 内蒙古自治区医疗卫生机构药品备案采购网上操作手册
- 公司销售制度培训心得
- 借款汽车抵押合同范本(22篇)
- 光缆单盘测试记录表
- 企业团队文化建设方案
- 2026 小儿自闭症语言启蒙课件
- 智能网联汽车概论 课件 4-1 认知智能网联汽车操作系统
- 清单控制价编制与审核方案
- 钱币发展演变与钱币文化
- 2023年副主任医师(副高)-眼科学(副高)考试历年高频考点参考题库带答案
- 贵州医科大学考博英语真题
- 《眼科学》课件-温医大-视神经及视路疾病
- 浙江省教师资格认定体检标准
- 四百米障碍完整的教案
- 轻钢龙骨硅酸钙板防火墙施工方案
- 《材料分析测试技术》全套教学课件
- 2021一级消防工程师继续教育考试石油化工类答案
评论
0/150
提交评论