(微电子学与固体电子学专业论文)dolbyac3解码器的c语言实现和验证.pdf_第1页
(微电子学与固体电子学专业论文)dolbyac3解码器的c语言实现和验证.pdf_第2页
(微电子学与固体电子学专业论文)dolbyac3解码器的c语言实现和验证.pdf_第3页
(微电子学与固体电子学专业论文)dolbyac3解码器的c语言实现和验证.pdf_第4页
(微电子学与固体电子学专业论文)dolbyac3解码器的c语言实现和验证.pdf_第5页
已阅读5页,还剩70页未读 继续免费阅读

(微电子学与固体电子学专业论文)dolbyac3解码器的c语言实现和验证.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 根据大型项目硬件设计t o p - d o w n 的设计流程,考虑到d o l b ya c 3 解码的高 度复杂性,直接设计d o l b ya c 3 硬件解码器比较困难。因此本论文用c 语言对 d o l b ya c 3 解码器成功的进行了系统级设计和验证,为硬件解码器的设计奠定 了良好的基础,也增强了v l s i 设计中心在数字音频领域的科研能力。 f d o l b ya c 3 是一种高效灵活的数字压缩标准,d v d 和美国数字电视的音频都采用 、d o l b y a c 3 标准,另外在卫星数字广播,数字演播室,家庭影院,娱乐媒体设备等 领域也得到广泛应用。d o l b y a c 一3 支持多种音频模式:i + i ,1 o ,2 0 ,3 0 ,2 1 , 3 1 ,2 2 ,3 2 支持4 8 k h z ,4 4 1 k h z ,3 2 k h z 的采样频率,比特流速率支持从3 2 b p s 到6 4 0 k b p s 的多种比特流速率,a c 3 采用利用人耳的掩蔽效应的先进的感觉模型 编码,保持了极高的音质,又极大的压缩了数据 1 。j r 本文详细介绍了d o l b ya c 3 的特点,帧格式,应用的领域,编码流程和解码流 程,在深入分析解码流程的同步和错误检测,解包b s i ,指数解码,比特分配,尾数 的处理,去耦合,重新矩阵处理,频域到时域的反变换,窗口叠加和相加,向下混 合,p c m 输出等模块的基础上用c 语言对a c 3 解码器做了系统算法设计和验证 先用c 语言做系统级的设计和验证己成为各设计公司设计大型项目的必要流程 c 语言系统设计和验证为接下来的硬件设计提供了坚实的基础和可靠的依据 r 因为无论通过i n t e r n e t 还是d v d 等各种光碟都无法直接得到a c 3 音频文件, 我通过i n t e r n e t 查找到a c 3 解码器的标准测试v o b 文件,从v o b 文件进行音频 提取得到a c 3 为后缀的a c 3 文件该a c 3 文件是编码的比特流文件,是5 1 的编 码格式,各声道的声音为声道的英文名称,该文件通过我设计的解码器生成正确 的p c m 格式的文件声音有强烈的现场感和方向感验证了解码器系统设计的正 确 、? 同时本文对a a c ,m p 3 ,肝e g 4 音频的特点,采用的技术,应用也做了介绍。1 关键字:d o l b ya c 3 ,解码器,感觉编码, 分配u c 程序,复合前向后向自适应比特 v , , a b s t r a c t a c c o r d i n gt ot o p d o w nd e s i g np r o c e s s o fb i gh a r d w a r ed e s i g np r o j e c t a n de x t r e m ec o m p l e x i t yo fd e c o d i n gp r o c e s sm a k ei ti m p r a c t i c a lt od i r e c t l y d e s i g nd o l b ya c 3d e c o d i n gh a r d w a r e ,t h a t i s w h y id e v o t e dm y s e l ft o s u c c e s s f u ll yd e s i g n i n gd o l b ya c 3d e c o d e ri ns y s t e ml e v e l t h es u c c e s s f u l d e s i g no ft h i scl a n g u a g ed e c o d e rg i v e sav e r yg o o df o u n d a t i o nf o rf u r t h e r d e s i g no fh a r d w a r ed e c o d e r ,e n h a n c i n gd e s i g na n dr e s e a r c hc a p a b i l i t yo f v l s ic e n t e ri nd i g i t a la u d i of i e l d d o l b ya c 3i sah i g h l ye f f i c i e n ta n df l e x i b l ed i g i t a la u d i o c o m p r e s s i o ns t a n d a r d ,a d o p t e di nd v da n da m e r i c a nh d t va u d i os y s t e m s , w i d e l yu s e di ns a t e l l i r ed i g i t a lb r o a d c a s t ,d i g i t a ls t u d i o ,h o m et h e a t r e a sw e lla se n t e r t a i n m e n te q u i p m e n t s i ts u p p o r t saw i d ev a r i e t yo fa u d i o m o d e :1 + 1 ,1 o ,2 0 ,3 0 ,2 1 ,2 2 ,3 2 s a m p l ef r e q u e n c i e so f4 8 k h z ,4 4 1 k h z 3 2 k h za r ea 1 1s u p p o r t e d b i tr a t ec a nb ea sl o wa s3 2 k b p s ,a n da sh i g h a s6 4 0 k b p s t h eu s eo fp e r c e p t u a lc o d i n ge x p l o i t i n gt h em a s k i n ge f f e c t e n s u r e sh i g hq u a li t ya n dg r e a tc o m p r e s s i o nr a t i o f e a t u r e s ,f r a m es t r u c t u r e ,a p p i i c a t i o n s ,d e c o d i n gp r o c e s sa n d e n c o d i n gp r o c e s so fd o l b ya c 3a r ea l lp r e s e n t e di nd e t a i l s d o l b ya c 3 d e c o d e rs y s t e ml e v e li m p l e m e n t a t i o na n dv e r i f i c a t i o nh a v eb e e n p a s s e d ,w h i c hi sb a s e du p o ng o o du n d e r s t a n d i n go fs y n c h r o n i z a t i o na n d e r r o rd e t e c t i o n ,u n p a c kb s i ,e x p o n e n t sd e c o d e ,b i ta l l o c a t i o n ,m a n t i s s a s p r o c e s s ,d e c o u p l i n g ,r e m a t r i x i n g ,i n v e r s et r a n s f o r m ,w i n d o w o v e r l a p a d d ,d o w n m i x i n g ,p c mo u t p u to fd e c o d i n gp r o c e s s d e s i g na n d v e r i f i c a t i o ni ncl a n g u a g ea r en o we s s e n t i a ls t e p si nd e s i g n i n gc o m p l e x h a r d w a r ef o rm a n yh a r d w a r ed e s i g n i n gc o m p a n i e s s u c c e s s f u ld e s i g n a n d v e r i f i c a t i o ni ns y s t e ml e v e lf a c i l i t a t ef u r t h e rd e s i g na n dg i v el a t e r d e s i g n e rs o u n df o u n d a t i o na n dg u i d a n c ea n dc o n f i d e n c e a u d i of i l ei na c 3f o r m a ti sn o ta v a i l a b l ee i t h e rv i ai n t e r n e to rl a s e r d i s kl i k ed v d ,av o bf i l ei n t e n d e df o rt e s t i n ga c 3d e c o d e rh a sb e e ng o t , f r o mw h i c ha u d i of i l ei n5 1a c 3f o r m a ti se x t r a c t e d d e c o d i n gt h i sa u d i o f i l eb i t he x e c u t a b l e f i l eg o t f r o m m y p r o g r a m p r o d u c e sp c m f i l e ,w eo b t a i n c o r r e c th i g hq u a l i t ys o u n dw h e np 0 4f i l ei s p l a y e d - u - f e a t u r e s ,c o n f i g u r a t i o na n da p p l i c a t i o no fa r c ,m p 3 ,a n dm p e g 4a u d i o a r ea l s oi n t r o d u c e di nt h i sp a p e r k e yw o r d s :d o l b ya c 3 ,d e c o d e r ,p e r c e p t u a lc o d i n g ,cc o d e ,h y b r i d b a c k w a r d f o r w a r da d a p t i v eb i ta l l o c a t i o n - u l 附件三 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名:墨:鱼兰日期:力彩年矿月勰 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名墨枝_ i x l -签名蕴兰冬导师签 日期: d o l b ya c 一3d e c o d e ri m p l e m e n t a t i o n a n dv e r i f i c a t i o n i n ! ! ! ! ! ! ! ! ! 第一章引言 在我和另一位同事完成立体声数字功放的数字部分f p g a ( 现场可编程门阵 列) 设计( 该设计包括s p d i f 接口,超取样数字滤波器,噪声整形,p w m 处理四 个主要部分) ,并用d v d 的同轴数字音频输出作为输入,该设计后接功率驱动和 功率输出测试时的过程中发现d v d 上d o l b ya c 3 格式的5 1 声道的信号听起来 音频效果不仅是前,后,左,右的声源定位鲜明,上下的音场也清晰可辨用来播 放空战片或太空漫游科幻片时,极富动感与魅力,尤其以小音量播放电影的动态 强音时,音响效果依然富于刺激和临场感在音频领域的应用增长迅速,潜力巨 大。决定深入研究d o l b ya c 3 解码。 d o l b ya c 3 是杜比实验室开发的一种感觉数字音频编码技术,它在编码效率, 声音质量,通用性方面是空前的,它从1 9 9 2 以来在电影院里提供多声道数字声 音,在1 9 9 4 年开始用在双声道d b s ( 数字广播系统) ,它显示出的提供多声道数 字环绕的能力己在消费电子领域产生了轰动,它被选为提供美国1 9 9 7 开始的 h d t v 广播的环绕声 1 。 正如许多已宣布和潜在的应用证明,d o l b ya c 3 是不同寻常的通用,它不是 一个刻板的方案,它是灵活的处理,容许诸如波特率及声道数量身定做以适合特 定的应用。所有的变化是基于相同的工作原理,但同时保证了各格式的兼容及对 将来需要的可扩展性 1 。 更重要的是,d o l b ya c 3 既保持了优良的声音质量,又有不同凡响的数据效 率。它使用少于单声道c d 的数据表示多声道环绕声,而声音质量满足听众的要 求,这要归功于杜比实验室二十多年致力于音频系统信号处理的经验。 a c 一3 的设计最大的利用了人的听觉掩蔽效应,它将每个声道的音频谱分成不 同的根据人的听觉的选择性优化的窄频带。它使陡峭的过滤噪声时噪声在频率上 和被处理的声音信号很接近,在没有信号掩蔽噪声时减少或消除噪声,原始信号 的声音质量能被主观的保持,在此关键方面,如d o l b ya c - 3 的感觉编码是有选 择性的强大的降噪形式 1 。 在d o l b ya c 一3 ,比特在频率带内分配,一个内建的听觉掩蔽模型容许编码器 改变其频率选择性以使每个频带的音频信号都用足够的比特来描述,以保证噪声 被全部掩蔽。a c 一3 决定怎样从一个共有的比特池里分配到各个声道,例如某个 声道的强信号掩蔽另一声道的噪声 d o l b ya c 一3 的先进的掩蔽模型和共有的比特池安排是其惊人的频谱效率的主 要因素。更重要的是其他编码系统使用相当的数据来运载对解码器的指令,a c 一3 用更多的传输比特来表示声音,也就意味着更高的声音质量。 从技术的角度讲,a c 一3 能处理2 0 比特动态范围频率在2 0 h z 到2 0 k h z 的数 字音频信号,低音效果声道覆盖2 0 到1 2 0 h z 。采样频率支3 2 k h z ,4 8 h z ,4 4 1 h z 的采样频率,数据速率最低是用于单声道的3 2 k b p s ,最高是6 4 0 k p s ,所以能满足 多种需要。典型的应用是3 8 4 h z 的5 1 声道格式,1 9 2 h z 的双声道格式 1 。 根据杜比公司的网页可知,全世界有七家研制成功d o l b y 公司认证的a c - 3 解码器,中国还没有,而d o l b y a c - 3 解码器的应用在d v d ,美国的h d t v ,卫星数 字广播,家庭影院,数字演播室等领域广泛应用,潜力很大。研究自主知识产权 的解码器可以改变国内没有自主知识产权的d o l b ya c - 3 解码器,依赖进口的尴 尬局面。增强开发各种数字多媒体解码器的能力。 d o l b y a c 一3 是灵活高效的数字音频压缩方法,解码过程非常复杂,根据大型 项目自顶向下的设计理念,本项目是设计和验证d o l b y a c 3 解码器的算法,即对 项目进行系统级设计和验证,为接下来的硬件设计提供指导和依据 第二章重要数字多媒体音频码简介 随着数字音频和网络多媒体及电子产业的迅猛发展,数字多媒体音频得到日 益广泛的应用,各种数字多媒体音频格式产生了。本章介绍在数字音频领域得到 广泛应用,潜力巨大的4 种数字音频码:h a t ,m p 3 ,m p e 6 4 音频,d o l b ya c 一3 21 m p e g 一2 先进音频码( a a c ) 2 简述 a a c 代表音频码的实际发展水平,它能够包含多达4 8 个声道,1 5 个低音加 强声道,1 5 个内嵌数据流并有多语言功能。它提供优于m p e g - 2 第三层的压缩率。 试验证明它能在9 6 k b s 时提供的声音质量稍优于第三层在1 2 8 k b s 和第二层在 1 9 2 k b s 提供的声音。a a c 在保持c d 声音质量的前提下有1 6 :1 的压缩率 它恰当的结合了高编码增益和极大灵活的特点,应用领域广泛。采样频率介于 8 k 和9 6 k 之间,支持l 至4 8 个声道,此方案适合音频的将来发展。与大家熟知 2 d o l b ya c 一3 d e c o d e ri m p l e m e n t a t i o na n dv e r i f i c a t i o ni ncl a n g u a g e 的m p e g 一2 第二层相比,在相同语音质量的情况下,此编码的数据少一半。 推动a a c 的原动力是为向环绕信号找到一种高效的编码方案,例如现在影院 使用的5 声道系统( 左,右,中,左环绕,右环绕) 。虽然在m p e g 一2 已有此类 信号的算法,但由于技术和历史的原因最优效率远未达到。因此给定的目标是大 幅降低所需的数率 m p e g 一2a a c 的特征 1 实现了高的压缩率 2 编解码的灵活 3 基于目标的编码功能允许和声音视频的交互作用,使在移动环境中的交互应 用成为可能 4 应用的压缩方法 h u f f m a n 编码 量化和比例缩放 m s 矩阵 强度立体声系统 耦合声道 后向自适应预测 时间噪声整形( t n s ) 改进型离散余弦变换 增益控制和复合型滤波器组 5 可缩放的采样频率外形 无预测 无耦合声道 d o l b ya c 一3d e c o d e ri m p l e m e n t a t i o na n dv e r i f i c a t i o ni ncl a n g u a g e 增益控制 复合滤波器组 t n s 限于1 2 个系数,限于6 k z 带宽 m p e g 一2a a c 的配置 可升级的声音和音乐编码:用于不同的传输方法,例如数字广播 多媒体流控制其他多媒体:如同步和开关 表达控制:控制显示,声音和其他输出 用户接口控制 图象控制:控制物体位置,透明效果,和使用者的互动 返回声道控制:控制返回声道( 方法,数据率,协议等) 条件接近管理:权限管理和控制 e p g 显示和控制:电子程序指导和控制 外廓管理:为选择性改变的客户的外廓 资源管理:客户使用的资源( 存储介质,数字接口,和其他外设) 移动设施的多样性:( 如p d a ,笔记本,手提工作站) 关于可利用资源 无线网络的多样性:关于网络协议,带宽,可靠性等 船e g 一2a a c 的应用 广播 基于内容的存储和检索 数字删广播 数字电视机顶盒和d v d 4 d o l b ya c - 3d e c o d e ri m p l e m e n t a t i o na n dv e r i f i c a t i o n i ncl a n g u a g e 娱乐报道组 移动多媒体 实时通讯 i n t e r n e t 上的音频和视频流 演播室和电视台的后加工 虚拟会议 无线发送的声音 由于a a c 的高效,a a c 是任何数字广播系统的首选。a a c 已被用于d i e d 系统,d r m 是一个致力于形成单一数字广播标准的国际联盟。由于a a c 的杰出的表现,它将 在因特网上的高品质音频的传播方面扮演重要的角色。 2 2 m p e g 音频第三层 2 简述 1 9 8 7 年i s o i e c 设计了一个强有力的算法i s o - m p e g 音频第三层( i s o1 3 8 1 8 - - 3 ) ,通过使用m p e g 音频编码,在不损失声音质量的情况下,能将数据减少到 c d 的十二分之一。基本上这是通过感觉编码实现的。 通过利用立体声效果及限制声音带宽,该编码方案能在更低的比特率下达到 可接受的声音质量。m p e g 第三层是m p e g 家族中最强大的成员。对给定的声音质 量,它需最低的比特率,即在给定的比特速率下,达到最好的声音质量 利用m p e g 能达到如下的压缩率 1 :4 第一层( 对应于3 8 4k b p s 的立体声信号) 1 :6 1 :8第二层( 对应于2 5 6 1 9 2k b p s 的立体声信号) 1 :1 0 1 :1 2 第三层( 对应于1 2 8 i 1 2k b p s 的立体声信号) 的情况下仍保持c d 的声音质量。对广播应用中每声道6 0 k b p s 的低比特率编码, i t u r 推荐m p e g 一3 d o l h ya c - 3d e c o d e ri m p l e m e n t a t i o na n d v e r i f i c a t i o ni ncl a n g u a g e 声音质量带宽模式比特率 压缩率 电话 2 5k h z单声道8k b p s9 6 :1 好于短波 4 5k h z 单声道 1 6k b p s4 8 :1 好于a m 收音机 7 5k h z单声道3 2k h p s2 4 :1 类似f m 收音机 1 lk h z 立体声 5 6 6 4k b p s2 6 2 4 :i 接近c d 1 5k h z立体声9 6k b p s1 6 :l c d 1 5k h z立体声 1 1 2 1 2 8 k b p s 1 4 1 2 :l m p 3 的特征 在第一和第二层的改进包括: 减少混叠第三层规定一种处理姗c t 值的方法以除去由于第一和第二层滤 波器组的交叠带引起的多余 非均匀的量化第三层量化器在量化之前使输入变为3 4 次方以在量化器值 范围内提供连贯的信噪比,解码器的量化器使输出为4 3 次方使 值重新线性化 数据值的熵编码肝e g 第三层采用i k i f f 雌n 编码量化的采样值以达到更好的 压缩率 比特库的使用第三层比特流的设计更好的适合压缩数据变化的长度的特 点,象第二层一样,第三层处理音频数据以1 1 5 2 个采样值为一 帧,和第二层不一样,代表采样值的编码了的数据不必装进比特 流中的固定长度的帧里,编码器能适当的赠比特到比特池里,也 能从比特池里借比特数据 噪声分配而不是比特分配第一和第二层使用的比特分配方法只是就是近似 量化噪声到固定的比特数,第三层编码器使用噪声分配反复循环,在这个循环里 量化器以原来的方法变化,量化噪声被实际计算并分配到每个子带。 肝3 的配置 设计为自适应的表示方案,提供给低比特率的应用,非常适合移动多媒体应用 固定单项通讯通道服务的补充 6 d o l b ya c 一3d e c o d e ri m p l e m e n t a t i o na n dv e r i f i c a t i o n i n c l a n g u a g e 该系统可配置为一个发源点,一个单项传输通道和许多终端用户的一个少数到 多数的系统 能平衡质量,表现力,价格 m p 3 的应用 数字音频广播( e u r e k ad a b ,w o r l d s p a c e ,a r i b ,d r m ) i s d n 传输高质量音频 用于广播的档案的存储 i n t e r n e t 流( m i c r o s o f tn e t s h o w ,a p p l eq u i c k t i m e ) 便携式声音系统( m p m a n ,m pl a y e r 3 ,r i o ,l y r a ,y e p pa n do t h e r s ) 计算机上音乐文件的存储和交换 2 3m p e g - 4a u d i 0 2 m p e g - 4 是m p e g ( 运动图象专家组) 开发的i s o i e c 标准1 4 4 9 6 ,它建立于三 个方面的成功之上 数字电视 交互图象应用 交互多媒体 m p e g 一4 提供标准化的技术元素,促成了三个领域的生产,分配和内容访问 范例的整合。a a c ,也就是先进音频编码是m p 3 最强的竞争对手,a a c 利用了 m p e g 一2 ,d o l b yd i g i t a l ,及a t & t 的感觉音频编码。公正的实验室测试了a a c 并认为它品质高,它要求的带宽比m p 3 还低,但个典型的实现比m p 3 多3 0 到4 0 的m i p s 简述 m p e g - 4 便利了多种应用,从可理解的讲话到高品质多媒体语音,从自然语 音到合成的语音,它特别支持以下语音信息的高效表示: 讲话信号:声音编码能通过利用声音编码工具以2k b i t s 到2 4k b i t s 实现 7 d o l b ya c - 3d e c o d e ri m p l e m e n t a t i o n a n dv e r i f i c a t i o ni ncl a n g u a g e 合成语音:可扩展的t t s 编码器比特率在2 0 0b i t s 到1 2k b i t s 之间,允 许文本作为输入来测试产生可理解的合成语音 广泛的音频信号:变换编码技术支持广泛的音频信号,从极低的比特率到高品 质信号。由于该功能,大范围的比特率和带宽都被支持。它始于比特率6 k b p s 和 低于4 k h z 的带宽,它也包括从单声道到多声道的广播质量音频。此外a a c ( 有些 修改) 是应用于m p e g 一4 统一音频标准的高质量音频编码方案,即将来的“全球多 媒体语语言”。由于它的高性能,a a c 是任何数字广播系统的首选 m p e g - 4 音频的特征 它支持高效数据压缩 声音质量和表现力的平衡可通过调整编码和解码的复杂度,空间分辨率,时间 分辨率和质量来达 基于内容的编码使能了和事物的相互作用 附加的功能如对语音信号的速度控制和调节 附加的功能如与比特率,带宽,错误健壮,复杂度有关的可扩张性 元素的互动,物体同步,改善的码效率 改善的时间随机访问,基于内容的可收缩性,辅助数据容量 与m p e g - 2 的兼容性 版权保护和用户交互 音频和视频及其它信息的下载 多点操作,对信息丢失和错误的健壮 对多个并发数据流的编码 m p e g 一4 音频的配置 m p e g 一4 提供了多个协议子集以使在不同的应用中m p e 6 4 都得到最优化应 d o l b ya c - 3d e c o d e ri m p l e m e n t a t i o n a n dv e r i f i c a t i o ni ncl a n g u a g e 用。在同一时间为了保持最大的互有性,协议子集的数量保持的尽可能低。m p e g 一4 提供以下协议子集: 讲话语音协议子集通过一个参数语音编码器,一个c e l p 语音编码器和一 个文本到语音接口。 合成语音协议子集有能力以很低的比特率提供声音和语音 可缩放语音协议子集一个语音协议子集的超集,适合为如i n t e r n e t 和数 字电视等不同的传输方法提供可升级的语音和音乐编码 重要音频协议子集是以上三个编码的超集,包含用于自然语音和合成语音 的工具 高质量音频协议子集包含c e l p 语音编码和低复杂度的从c 编码。可扩展编 码由a a c 的可扩展编码完成,错误弹回的比特率语法可以任选 f 氐延迟语音协议子集一包含参数和c e l p 语音编码,低延迟从c 编码及文本到 语音接口 自然语音协议子集包含m p e g 一4 中的除合成编码外的一切自然语音编码工 具 移动语音网络协议子集包含低延迟和可伸展的a a c 目标类型,如t w i n v q 和b s a c ,此协议子集致力于使用非m p e g 语音编码算法及高质量语音编码能力扩 展通讯应用。 即e g 一4 音频的应用 广播 基于内容的存储和检索 数字a m 广播 数字电视机顶盒及d v d 娱乐报道 d o l b ya c 一3d e c o d e ri m p l e m e n t a t i o na n dv e r i f i c a t i o ni ncl a n g u a g e 移动多媒体 实时通讯 网络上的音频和视频流 演播室和电视台的后制作 虚拟会议 无线分配的音频传送 2 4d o l b ya c 一3 2 简述 a c 一3 是一个灵活的声音数据压缩技术,能够使许多声道格式编码成低比特 流,支持从单声道立体声到六个独立声道的许多格式。a c - - 3 比特流容许4 8k h z 4 4 1 k h z ,或3 2k h z 的采样频率,支持数据流速从3 2k p s 到6 4 0k p s a c 一3 编码技术已被高级电视系统委员会采纳为美国的高清晰度电视的音频 标准,它也用在消费媒体( 激光碟d v d ) 和直接卫星广播。目前有十多家半导 体制造商致力于a c 一3 解码芯片 a c 一3 的特征 向下混合 声音响度控制 后向兼容性 完整的动态范围控制系统 高分辨率频谱包络编码 复合前向后向自适应比特分配 复杂度适中,非常高的编码增益 l o d o l b ya c - 3d e c o d e ri m p l e m e n t a t i o na n dv e r i f i c a t i o n i ncl a n g u a g e 利用耦合技术避免了极端信号要求时的比特不足情况 低的终端到终端延迟模式 a c 一3 的配置 a c - 3 比特流中可嵌入相关服务,包括为视觉损坏者的( 可视场景的语音简述) , 听觉损坏者的( 带增强可理解性的对话) ,解说词,及第二立体声节目 提供了一个条件访问的方法 数据广播 声音翻译 跟辅助媒体的同步 a c 一3 的应用 用于有线电视的消费电子设备 通过卫星的数字广播 预先录制的媒体 c d 播放机 数字演播室和家庭影院 。,j 固体录音机 娱乐媒体和电影院的环绕系统 消费电子( 光碟,d v d ) 第三章d o l b ya c - 3 概貌 d o l b ya c 一3 是杜比实验室开发的的第三代数字音频压缩标准,在d v d ,家庭 影院,美国的数字电视等许多领域得到广泛的应用。它能压缩从l 到5 1 个音频 声道的p c m 信号成3 2 k p s 一6 4 0 k p s 的比特流,音频数据一般压缩到原始数据的 d o l b ya c - 3d e c o d e ri m p l e m e n t a t i o na n dv e r i f i c a t i o ni ncl a n g u a g e i i o 。许多潜在的和宣布的应用测试证明了d o l b ya c 3 是不同寻常得通用。它 可根据特定的应用选定比特率和声道数,所有的类型采用相同的原理,但保证了 格式间的兼容性和对将来需求的扩展性。d o l b ya c 3 同时有高的声音质量和优异 的比特效率的特点,例如,它用少于单声道c d 音频的比特率传输多声道环绕声, 而声音质量满足听者的要求,这要归于d o l b y 实验室二十多年基于怎样感知声 音来开发信号处理系统的经验。 3 1d o l b ya c - 3 概述 3 1 1a c - 3 的动机 d o l b ya c _ 3 数字音频压缩标准在1 9 9 4 年1 1 月被采用为a t s c ( a d v a n c e d t e l e v i s i o ns y s t e m sc o m m i t t e e ) 采纳为标准。数字音频压缩的目的是产生音 频信号的最少数字表示,使它解码以后听起来和初始声音一样。典型应用如图 3 - 1 ,图3 - 2 和图3 - 3 所示 1 。 n h 5 m s 咖 日鲥 t 阳f i s m 话s b n a c - 3e e o d 盯 e q u i p m t 。 e 1 埘目 喇3 - e 的 r e c e 嘶叩 荆曲 c - 3 腑村 e q 咖n 目i 图3 - 1d o l b ya e 一3 用于卫星音频传输的应用 1 2 d o l b ya e 一3d e c o d e ri m p l e n e n t a t i o na n dv e r i f i c a t i o ! ! ! ! ! 竺壁! 堕 图3 - 3b o l b ya c 3 在电影院的应用 a c 一3 e n c o d e r 将5 1 声道的信号多于5 m b p s ( 6 声道 * 4 8 k h z * 1 8 b i t s = 5 1 8 4 m b p s ) 的p c m 信号变成3 8 4 b p s 的比特流,解码后又 变为原来的5 1 声道音频节目 3 1 2a c 一3 编码原理 1 a c 一3 编码器接收p c m 信号并产生跟标准一致的比特流,解码后产生 满足特定应用的音频信号。a c 一3 算法通过粗略的量化音频信号的频域表 示实现了高的编码效率( 输入和输出的比特率之比) 。图3 - 4 是编码过程 简图。编码的第一步将音频信号的一系列p c m 时间采样转为一系列频率 系数块,这是通过分析滤波器组完成。单一的频域系数用二进制指数表 示成二进制指数和二进制尾数,一组指数编码成信号频谱的粗略表示一 即频谱包络,该频谱包络被核心比特分配程序使用来决定对每个尾数分 配的比特数。六个音频块的编码的频谱包络和粗量化的尾数格式化为 a c 一3 帧。a c 一3 比特流是一系列a c - 3 帧。 d o l b ya e - 3d e c o d e ri m p l e m e n t a t i o na n dv e r i f i c a t i o ni n cl a n g u a g e 真实的a c - 3 编码器比图二所示的要复杂的多。 p c mt j m e s a r n d i e s 图3 4a c 一3 编码器的简略框图 3 1 3a c - 3 解码原理 1 图3 - 5a c 一3 解码器的简略框图 解码过程基本上和编码过程相反,解码器如图3 5 所示必须同步编码的比特 流,检查错误并拆卸各种数据如频谱包络和量化的尾数,比特分配程序运行结 果用于拆分和反量化尾数。频谱包络解码产生指数,指数和尾数反变换到时域 1 4 d o l b ya c 一3d e c o d e ri m p l e m e n t a t i o na n 81 竺! ! ! ! 堕! 竺! ! ! ! 竺! ! ! 壁 产生解码的p c m 时间采样。 3 2d o l b ya c - 3 的语法 1 3 2 1 同步帧 图3 6a c 一3 同步帧 i 刊刊刮刮。剖叫m 一 z 图3 7d o l b ya c 3 音频块的结构 a c 一3 串行编码的音频数据流是由一系列同步帧( 如图3 6 ) 组成,每个 同步帧包含六个编码的音频块( a b ) ,每个音频块代表2 5 6 个新的音频采 样,每帧头部的同步信息( s i ) 包含用于保持和获得同步的信息,s i 后的比 特流信息( b s i ) 包含描述编码的音频服务的参数,编码的音频块后是辅 助数据域( a u x ) ,个附加的c r c 字位于s i 的开头,它的使用是任选的。 d o l b ya c 3 音频块的结构如图2 - 7 所示 3 2 2 语法规范的语义 接下来的伪代码描述了比特流内信息到达的次序,该代码粗略的基于 c 语言语法,为方便读而简化。对大于1 比特的比特流元素,比特的顺序 是要么最高位先( 对数值) ,要么左位优先( 对比特域值) ,比特流中的 元素用粗体表示,语义元素用其它字体表示 3 2 3 语法规范 连续的音频比特流包含一系列同步帧,各比特流元素的详细描述由于篇 幅略去。可从a c - 3 的标准文档获得 1 : 同步帧包含s y n i n f o 和b s i ,六个编码的a u d b l k , a u x d a t a ,e r r o r c h e c k 每个比特六元素和其长度在下面的伪代码中列出。注意比特流元素到达是在 时间上是最高位先,或最左位先 s y n i n f o - - s y n c h r o n i z a t i o n i n f o r m a t i o n 一b s i - b i t s t r e a mi n f o r m a t i o n d o l b ya c - 3d e c o d e ri m p l e m e n t a t i o na n dv e r i f i c a t i o n i ncl a n g u a g e d o l b ya c 一3d e c o d e ri m p l e m e n t a t i o n a n dv e r i f i c a t i o ni ncl a n g u a g e ! ! ! 堕! ! 二! ! ! ! ! ! ! ! ! 型! ! ! ! ! ! ! ! ! ! ! ! ! ! :! ! ! ! ! ! 竺! ! ! ! ! ! ! 竺! ! ! ! ! 2 l d o i b ya c - 3d e c o d e ri m p l e m e n t a t i o n a n dv e r i f i n a t i o ni ncl a n g u a g e a u x d a t a a u x i l i a r yd a t a e r r o r c h e c k e r r o rd e t e c t i o nc o d e 3 2 4 比特流限制 如下的限制加于a c - 3 编码器编码的比特流,这些限制使制造的解码器的输 入存储缓冲更小。 1 音频块0 和块l 之和不得超过帧长的5 s 2 第五块的尾数和辅助数据之和不得超过帧长的3 s 3 第0 块必须包含所有的必要信息以正确的解码 4 每当c p l i n u 的状态从关变为开时,所有的耦合信息包含在耦合开始的音 频块里 第四章关键技术介绍 1 4 1 变换滤波器组 将音频自时域变化到频域的过程需要把音频分成5 1 2 样本的重叠块对每 2 5 6 个新的音频样本来说,从2 5 6 个新样本及2 5 6 个以前的样本组成1 个5 1 2 样 本块,每个音频样本表示在2 个音频块中,所以处理后的样本数目比开始时加了l 倍块的重叠是必要的为了防止可听见音频块引起的缺陷每5 3 3 m s 组成一些新 的音频块6 块为l 组,被编码成1 个a c 一3 同步频 4 1 1 窗函数 在变换到频域之前,对5 1 2 个时间样本的音频块加窗,加窗运算包括5 1 2 点的 d o l b ya e 一3d e c o d e ri m p l e m e n t a t i o na n dv e r i f i c a t i o ni ncl a n g u a g e 音频块同5 1 2 点的窗函数矢量相乘窗函数在它中心的数值为1 0 ,往两侧逐渐减 小。到端点几乎为零窗函数的形状是使在解码器中的重叠相加过程将得出没 有分块缺陷的重建音频窗函数的形状还决定滤波器组中每个单独滤波器的形 状 4 1 2 消除时间分割混迭的变换 分析滤波器组是基于快速傅立叶变,采用的特殊变换是“奇数堆叠 的”( o d d l ys t a c k e d )“时间域消除混迭”( t i m e d o m a i n a l i a s i n g c a n c e l l a t i o n ) 简写为( t d a c ) 变换这种特殊的变换很有利,它能1 0 0 地除去分 块过程中引入的冗余度输入t d a c 变换的是5 1 2 个加窗的时域取样点,输出是 2 5 6 个频域系数 4 1 3 瞬态现象地处置 当存在极端地时域瞬态现象时 一个脉冲,例如响板咔嚓声( c a s t a n e t c l i c k ) ,有可能量化误差( 瞬态想象的频率系数粗糙量化引起的) 因时域的撕裂 ( t i m es m e a r i n 。g ) 变成能听到的在编码音频块中的量化误差将在整个音频块中 出现在脉冲之前重现的那部分量化误差可能听得见量化噪声的时域撕裂通过 改变在执行的变换长度可能会降低,不是实行单个5 1 2 点变换,而是一对2 5 6 点 的变换即一组是前2 5 6 个加窗样本另一组是后2 5 6 个加窗的样本编码器中的瞬 时检测器决定何时改变变换长度降低变换长度将防止量化误差的蔓延扩展的 时间超过几

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论