(电路与系统专业论文)基于ATJ2097的多媒体播放器的研究[电路与系统专业优秀论文].pdf_第1页
(电路与系统专业论文)基于ATJ2097的多媒体播放器的研究[电路与系统专业优秀论文].pdf_第2页
(电路与系统专业论文)基于ATJ2097的多媒体播放器的研究[电路与系统专业优秀论文].pdf_第3页
(电路与系统专业论文)基于ATJ2097的多媒体播放器的研究[电路与系统专业优秀论文].pdf_第4页
(电路与系统专业论文)基于ATJ2097的多媒体播放器的研究[电路与系统专业优秀论文].pdf_第5页
已阅读5页,还剩67页未读 继续免费阅读

(电路与系统专业论文)基于ATJ2097的多媒体播放器的研究[电路与系统专业优秀论文].pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着计算机技术、微电子技术和数字信号处理技术的迅速发展,各类消费电子 产品发生了革命性的变化,引发新技术、新产品层出不穷。特别是m p e g 音、视频 数据压缩标准的推出,各种便携式多媒体播放器相继问世,已成为消费电子产品新 的增长点。 本论文设计了一款多媒体播放器试验样机,它采用炬力公司生产的a t j 2 0 9 7 芯 片为核心芯片,实现音、视频解码与硬件电路的控制,用三星公司的k 9 k l g 0 8 u o m 型n a n df l 劬m 咖o r y 实现数据存储,用i a r 开发环境,作为软件开发平台实现软 件各个模块程序的编写与调试。该多媒体播放器具有如下特点:具有u s b2 o 接口, 可实现播放器与计算机的数据传送:能够存储一定量的音、视频文件,如m p 3 , w m a ,a m v 等格式,且能实现多媒体音视频格式播放:硬件成本相对较低功耗低。 关键词:m p e g ;多媒体播放器:a ”2 0 9 7 硕士学位论文 m a s t e r st h e s l s a b s t r a c t a c 0 0 r d i n g 耐t l lt h e 唧i dd e v e l o p m e l l to f 廿l ec o m p u 衙e c h n 0 2 0 9 y ,m i c r o e l e c 圩( m i c s t e d h n o l o g ya n dd i 百t a ls i g n a l sd i s p o s et e d m o l o g y ,a 1 1k i n d so f m m e r c i a ld o c t r o n i c p m d u c t sw c r ec h 柚g e dr 州o l u t i o n a c a u s en e wt c c h n 0 1 0 9 ya l l dn e wp r o d u c t s 锄e 唱e d i ne l l d l e s s l y ti i lp a n i 叫盯,m es c tu po fm em e p ga u d i o ,m p e gv i d e o 。o m p r e s s s t a i l d a r d ,m a k es e v e r 缸o fp o r t a b l em e d i ap l a y c rc o m 髓o u t ,l l a l 、伧b e e i lai 删s d l i n gp o i n t o ft h ec c 舢e r c i a le l e c t r o n i cp m m l c t s t h em e s i si st l l ed e s i 印c do fa p o t a b l em e d i ap 1 1 y 髓n p l o y e do n t 1 1 es o l u t i o no fa a t j 2 0 9 7c h i pf 而ma c t i o n ss e m i 。0 n d u c t o rc o ,l t d ,a c f u a l i s et h ea u d i o ,“d c oc o m p r c s s a i l dh a r d w a r ec 打c u i tc o n n - o lc e t l 仃a l i s c d ,t a l ( et h ek 9 k i g 0 8 u o ms u m s u l l gn a n df 1 a s h m e f l l o q f o rd a t as t o r a g e ,a d 叩ti a ra sm es o 舳,a r ed “d o p m e n tp l a t f o 订n ,r e a l i z e dm e s o r w a r ee a c hm o d u l ep r o c 础舶ec o m p i l a t i o n 觚dm ed c b u g 罂田a sm ep r 印壮a t i o n p r o c e s s 1 km e d i ap l a y e fh 嬲m ef o l l o 谢n gc h a r a 曲耐s t i c s :w j t l lu s b2 oi n t e r f k e , p l a y e rc 锄b er e a l i z e dd a t at r a n s m i s s i o nw i mc o m p u 船r ;i tc 姐s t o r e dm 柚yk i n d so f d i g i t a la u d i os t a n d a r d s ,s u c ha sm p 3 ,w m a ,a m 、e c t 柚dc 蚰a c h i e v e dm e d i a m u s i ca n d v i d e op l a yf b n i l a t ;廿i eh a r d w a r ei sc o s t - 1 e s sa i l dl o wp o w e rc o n s 咖叩t i 伽 k e yw o r d s :m p e g ;m e d i ap l a y 盯: a t j 2 0 9 7 硕士学位论之 m a s t e r st h e s l s 华中师范大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究工作 所取得的研究成果。除文中已经标明引用的内容外,本论文不包含任何其他个人或 集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在 文中以明确方式标明。本声明的法律结果由本人承担。 作者签名:日期:砷。智年石月岁日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权 保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借 阅。本人授权华中师范大学可以将本学位论文的全部或部分内容编入有关数据库进 行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时授权 中国科学技术信息研究所将本学位论文收录到中国学位论文全文数据库,并通 过网络向社会公众提供信息服务。 作者签名:缮、 日期:卅g 年月r 日 导师签名爿叩 日期:扣留年月j 日 本人已经认真阅读“c a l i s 高校学位论文全文数据库发布章程”,同意将本人的 学位论文提交“c a l i s 高校学位论文全文数据库”中全文发布,并可按“章程”中的 规定享受相关权益。回壶逾塞握銮卮溢卮! 旦圭生i 旦二生i 旦三生筮盔三一 作者签名:兰誊 日期:峙年月r 日 导师签名! 吞r 日期:c 一毡年月j 、日 硕士学位论文 m a s t e r st h e s i s 第一章绪论 1 1m p e g 国际标准发展概况 1 1 - 1 关于m p e g 从上世纪7 0 年代人们着手开发数字电视起,人类进入了全新的多媒体数字信息 时代。由于数字化的音频、视频信号数据量非常巨大,不仅需要硬件技术快速地发 展,而且对通信网络的传输和多媒体数据的处理也提出了很高的要求。为此,国际 标准化组织i s o 和国际电信联盟i e c 建立了一个致力于制定有关活动图像压缩标准 的组织,这就是活动图像专家组州p e g ( m o v i n gp i c 恤ee x p e ng r o u p ) 【i j 。m p e g 既是代表活动图像专家组,又代表这个组织制定的标准,也可以是一类运动图像压 缩算法的称谓【2 j 。m p e g 专家组成立于1 9 8 8 年,由9 家公司和一所大学所组成,现在 属于i s o i e c 信息技术联合技术委员会第2 9 研究组的第1 1 工作组( i s o i e c j t c i s c 2 9 九v g l l ) ,负责有关活动图像、音频及其组合的压缩、解压缩、处理和编码等 方面的技术标准和方案的制定 3 l 。 m p e g 标准其实是将音频信号和多媒体信号数字化,使数据转换成较小位数组 成的分组,以便于计算机系统网络上不失真的传输,以及个人数字媒体的便于携带 和播放,并能够在最后实时精确地进行解压缩,使压缩过的数字媒体还原成高保真 的原始信号【4 】。m p e g 标准虽然规定了声音和电视图像的编码和解码过程,并提供 了解码器的测试方法,但没有对所有内容都作严格规定,尤其是对压缩和解压缩算 法1 5 】。这样,既保证了解码器能对符合m p e g 标准的声音及电视图像数据进行正确 的解码,又给m p e g 标准的具体实现留有很大余地,人们可以不断地改进编码和解 码算法提高声音和活动图像质量。到目前为止,已经正式发布成为国际标准的m p e g 系列标准有:1 9 9 1 年批准的m p e g 1 ( i s o i e c1 1 1 7 2 ) ,1 9 9 4 年批准的m p e g 2 ( i s 0 i e c1 3 8 1 8 ) ,1 9 9 9 年批准的m p e g _ 4 ( i s o i e c1 4 4 9 6 ) ,2 0 0 1 年批准的m p e g 7 等系列国际标准【6 】。 1 1 2m p e o l 标准及其应用 m p e g 1 是第一个m p e g 标准,作为数字存储媒体的运动图像和伴音的编码标准 的部分,用于高至1 5 m b i 讹的数字存储媒体的活动图象和相应的音频编码【7 j 。 m p e g 。1 压缩标准是用来直接播放来自c d 。r o m 或类似的光学存储设备和磁存 硕士学位论文 m a s t e r st h e s l s 储介质( 包括磁带在内) 的音视频格式的数据。m p e g 1 音频支持采样率为3 2 k h z 、 4 4 1 k h z 、4 8 k h z 的单声道( m o n o ) 及双声道( s t 朗a n dd 恤lm o n o ) 编码模式,并 利用心理声学模型来控制音频信号的量化编码【引。m p e g 1 共有三个不同层次的音频 压缩算法:l a 婵i 、l a y e r i i 和l a y e ri i i ,它们对应不同的要求,具有不同的复杂度 和不同的压缩效率。其中,l a v e ri 是m u s i c a m 算法的简化方案,主要用于编码速 率为1 9 2 k b p s 的应用场合,l a y e r i i 的目标编码速率为1 2 8 k b p s ,已被用于d a b 和v c d 的伴音编码,l a y 盯i i i 算法最为复杂而压缩性能最好,目标编码速率为6 4 k b p s ,压缩 比可达l :1 2 0 1 9 】。所谓的m p 3 就是m p e g 国际标准音频第三层编码、解码算法( m p e g 1 l a v e ri i i ) 。它采用高质量音乐信号自适应谱感知熵编码( a s p e c ) 算法,压缩数据 流的速率为3 2 3 3 2 k b i t s ,在每声道数据速率为6 4 k b i t ,s ,压缩比在l :1 0 一l :1 2 时, 接近c d 音质,它主要针对于低速率音频传输的应用,特别适合应用于i s d n 网络传 输和存储【1o 】。 使用m p e g 一1 的压缩算法,可以把一部1 2 0 分钟长的电影压缩到1 2 g b 左右大小。 数字视频信号的压缩比为l 1 2 0 1 2 0 0 ,压缩后的码率为0 9m b p s 1 5 m b p s ,平均 码率为1 1 5 9 m 1 ) s 。图像分辨率为3 5 2 像素( 水平) 2 8 8 像素( 垂直) p a l 制【l 。 活动图像的清晰度为2 5 0 线( 水平) 。数字音频信号的压缩比为l 6 1 8 ,压缩后的 码率为1 9 2 k b p s 2 5 6 k b p s ( 双声道立体声传送) ,定为v c d 光盘数字视频压缩的标 准。 1 1 3m p e g 2 标准及其应用 m p e g 2 是m p e g 针对数字电视技术提出的,标题为“通用的运动图像和音频编 码( g 铋谢cc o d i n g o f m o 诵n g p i c t u l 髂a n da u d i o ) 。m p e g 2 和m p e g 1 都具有 三层编码结构,并具有向上和向后的兼容性。m p e g 2 音频标准( i s1 3 8 1 8 3 ) 相对 于m p e g 1 音频标准有两个扩展【l 习: 支持多声道音频编码。包含5 1 声道配置功能,同m p e g 1 立体声译码器向后兼容。 支持低采样频率( l s f ) 。包括1 6 ,2 2 0 5 2 4 l ( 1 z ,s ,提高了低比特率时的编码效率。 m p e g 2 标准的开发工作于1 9 9 4 年截止。1 9 9 4 年初,验证试验表明:一些不与 m p e g 1 向后兼容的新的音频编码算法在编码效率上有明显改进。由此产生一个新 的m p e g 音频编码标准:m p e g 2a 蛔l c e da u d i oc o d i n g ( a a c ) 。从c 是针对立 体声以及多信道信号的第二代音频编码方案。支持的采样频率为8k h z 9 6 k h z ,音 频信道数最多可达6 4 个。m p e g 一2a a c ( i s1 3 8 1 8 7 ) 标准的开发工作于1 9 9 7 年截 i t 。 硕士学位论文 哇a s t e r st h e s l s m p e g o 陆式主要应用在d v d s v c d 的制作( 压缩) 方面,同时在一些高清晰 电视广播( h d t v ) 和一些高要求视频编辑、处理上面也有广泛的应用。为进一步 提高图像清晰度,m p e g 2 采用减少数据压缩比的方法。它的视频信号压缩比为 i 3 0 l 5 0 ,压缩后的最高码率为1 6 m b p s ,平均码率为6 2 2 m b p s 。图像分辨率为7 2 0 像素( 水平) 5 7 6 像素( 垂直) p a l 制【。活动图像的清晰度提高到5 0 0 线( 水 平) ,达到广播专业级标准。数字音频信号的压缩方法仍采用m p e g - l 标准中的第2 层( l a ) 的方法,可对a c 3 、d t s 等5 1 声道传送。定为d v d 播放机标准。 1 1 4m p e 制标准及其应用 m p e g 一4 的初衷是针对视频会议、视频电话的超低比特率编码,但是随着高性能 集成电路芯片的不断出现和对多媒体信息的应用要求由播放型转向基于内容的访问、 操作型【l 列。m p e g 一4 的目标被定位于:支持多种多媒体应用( 主要侧重于对多媒体信 息内容的访问) ,可根据应用要求不同来现场配置解码器。m p e g 4 标准突破了 m p e g 1 、m p e g - 2 标准的局限性,支持基于a v 对象的景物描述及交互性,可集成 多个具有不同属性的对象,适合于各种不同的网络。它可以在很窄的带宽条件下,利 用帧重建技术,压缩和传输数据,以求使用最少的数据获得虽佳的图像质量【i 州。 m p e g 4 标准音频部分包含一系列编码算法,适合各种不同的应用。从低至2 k b ,s 的 低速语音编码到每信道大于等于6 4 k b s 的高质量音频编码,m p e g 4 尽皆包含【1 7 】。 1 1 5m p e 0 7 标准及其应用 m p e g 7 正式名为多媒体内容描述接口( m u l t 妇。d i ac o n t 髓td e s 耐p t i o ni n t e r f h c e ) 【l 针。目标在于创建一个多媒体内容的描述标准,这种描述与多媒体信息的内容本身 在起,支持用户对其感兴趣的各种资料进行快速有效的检索,它可以加到任何类型 的多媒体资料上,不管多媒体资料的表达格式与压缩方式如何,只要加上了这种标准 化的描述多媒体数据就可以被索引和检索了。 现在还有很多音频压缩算法,例如:美国杜比实验室开发的数字音频编码系统 ( a c 3 ) ,s o n y 公司的m i n i d i s k 系统等等,但目前最流行的编码算法是m p e g 算 法。 1 2m p 3 播放器的发展及现状 1 9 9 5 年,m p 3 格式( 即m p e g 1l a y 盯i i i ) 的数字音乐开始在网上传播,原先 的m p 3 音乐播放主要是通过类似“w i n a 蜘p 的播放软件进行的,在一定程度上方 便了广大的计算机使用者和音乐爱好者,但这种不可脱离p c 机的音乐播放方式也为 ! : 硕士学位论文 m a s t e r st h e s l s 人们欣赏音乐带来了不便。于是,1 9 9 8 年8 月,美国d i 锄柚d 公司和韩国的s a e h a i l 公司率先推出了m p 3 随身听,正式启动了m p 3 数码播放器的市场【1 9 l 。 发展至今,m p 3 播放器功能已有迅速的提高,应用领域也得到了很大的扩展。 首先,m p 3 播放器的通信方式已从p c 并口的n o m l a ll 发展到支持热插拔的u s b 接 口,通信速率从1 0 0 k b s 达到4 0 0 l 龇5 0 0 k b 拈,成倍地缩短了上下载时间【2 0 1 。其次, m p 3 播放器除播放m p 3 音乐外,还可播放w m a ( w i n d o w sm e d i aa u d i o 压缩倍数 l 2 0 ) 等格式的数字音乐。有些生产厂家还使用g 7 2 6 标准的a d p c m 语音编码或 m p 3 硬件编码器增加录音功能。此外,一些电子产品也嵌入了m p 3 播放器的功能, 如手机、p d a 、车载音响和数码相机等, 目前,市场上的m p 3 播放器的主要指标为:内置存储器容量为( 1 2 8 m 4 g ) b y t e : 播放音乐格式为m p 3 删m a 等;录音时间17 l l ( 1 2 8 m b ) 3 5 h ( 2 5 6 m b ) ;支持播放 速率3 2k b p s 3 2 0 k b p s ( m 3 ) ,“k b p s 1 9 2 k b p s ( w m a ) ;输出频率范围2 0 h z 2 0 k h z ;信噪比9 0 d b :耳机输出功率5 m 、斗5 m w ;支持多文件显示;支持a m v a v i 等格式的视频播放;u s b l 1 2 o 通信接口;调频收音机和数字录音功能等1 2 1 1 。 1 3 主流m p 3 解码芯片的比较 m p 3 解码芯片是m p 3 播放器的核心组成部分,其作用是对m p 3 等格式音乐 文件进行解码。m p 3 解码芯片的性能好坏,是决定m p 3 音质表现优劣的因素之一。 众所周知,m p 3 音频格式是一种有损压缩的格式,优质的解码芯片将会尽可能解析 好音乐文件,输出高品质的音乐。下面,我们就目前主流的m p 3 解码芯片作简单的 介绍。 1 飞利浦m 】: 飞利浦的m p 3 解码芯片以其强大的功能,突出的音质表现向都是高端产品 的首选。其芯片成本也是m p 3 解码芯片中最高的,算得上是比较高贵的“芯”了。 飞利浦的m p 3 解码芯片主要包括s a a 7 7 5 x 系列和p n x o l o x 系列。其中s 从7 7 5 x 是最常见的飞利浦系列解码芯片,s a a 7 7 5 0 拥有7 3 m i p s 的2 4 位d s p 和3 2 位a 州 r i s c 处理器,具备可编程d s p 架构,可以支持多种音乐格式解码,支持解码速率 为8 k b p s 3 2 0 k 1 吣s ,高达9 0 血信噪比,兼容多种e q 音效,支持l i n e i n 、扩展卡 以及其他主流m p 3 解码芯片特性。 2 美国s i 舯a t e l 【2 3 1 : s i 鲫a t c l 常见的解码芯片是s i 缈a t d3 4 1 0 和s j 舯a t e l3 5 l o 3 5 2 0 。s i 舯a t c l3 4 l o 是比较成熟的解决方案,其价格低廉、具有良好的程序移植、通用的固件升级以及 4 硕士学位论支 m a s t e r st h e s j s 超强的稳定性。s i 舯a t e l3 5 2 0 可用于m p 3 播放机、语言学习机、自动点唱机和 m p 3 以及c d 随身听。它是进一步的升级版,支持许多新特性。比较典型的是支持 传输速度达到4 8 0 m b p s 的h i s p e e d 高速u s b 2 o ,在大容量m p 3 之中,高速u s b 已经变得越来越有用。 s i 鲫a t e l 现在的主力产品就是2 0 0 5 年初推出的,用以抗衡飞利浦p n x 0 1 0 6 的 3 6 0 0 系列芯片。该芯片处理器基于2 0 0 m h z 的a r m 9 2 6 e j s 架构,除了支持多种 音频格式,在视频方面还可支持m p e g 4 ,h 2 6 4 解码和w m v 9 等视频格式,三星 z 5 就采用了此芯片。 3 韩国t d c l l i 口s 【2 4 】: t e l c l l i p s 是韩国众多m p 3 播放器生产厂商选用的解码芯片生产商,是比较有潜 力的解码芯片,占据中高端市场。其主要解码芯片包括t c c 7 3 0 7 3 l 7 3 l y 和t c c 7 2 x 。 该芯片属于a r m 型主控,以a r m ( 精简指令集c p u ) 为核心,软件编写灵活, 只要进行简单编程即可扩展其功能( 如支持f l a c a p e 无损音频格式、u s bh o s t 等) 。而且t e l c c 越p s 还可通过提高c p u 主频和规格来达到和d s p 型主控一样或更 快的速度,但是晶体管数量会更多,成本会更高一些。t c c 系列最大的问题在于信 噪比较差。 4 ,国产( 珠海) 炬力方案( a t j 2 0 9 7 ) : 炬力的a t j 2 0 9 7 芯片是一款对国产芯片发展业来说,具有革命意义的i c 产品。 因为其优秀的功能,扩展性能以及相对低廉的价格,帮助众多m p 3 厂商( 如纽曼、 蓝魔、昂达、台电等) ,打通了市场的脉络,从而将超值的产品带到普通消费者的 身边【2 5 1 。 a t j 2 0 般系列主控芯片属于s o c ( d s p + z 8 0 ) 型主控芯片,以d s p ( 数字信 号处理器) 为核心、主频可达到4 8 m h z ,能以2 4 帧秒的流畅度播放炬力专有的 a m v 格式视频,并且支持全格式视频和s w f ( n a s h 动画) 转换。a t j 2 0 9 7 高达 2 4 b “的解码量化位数,已经超出普通c d 的标准( 1 6 b i t ) ,在音质上,该芯片表现 细腻,还原性好,最大程度上忠实原声,尤其在低频方面弥补了其他m p 3 方案不 足低频偏硬、刚性有余、弹性不足【2 6 1 。 a t j 2 0 9 7 能够支持的内存达4 g b 。就这一点来说,目前主流的彩屏m p 3 能够 搭载比普通m p 3 产品更大的内存,这也意味着装载更多的资料,其中可以包括视 频、图片、文本、音乐、数据等等。而在电源支持方案方面也有所增强,除了支持 主流的锂电池之外,还增加了对1 幸a a 、2 枣a a 、2 事a a a 三种电源方案,对于制造 厂商,可以更加自由的搭配供电方案,以适应不同的市场需求,而消费者也可以根 s 硕士学位论文 m a s t e r st h e s l s 据自己的实际需求选择针对的产品。另外,a t j 2 0 9 7 还增加了对u s b 2 o 高速传输 接口的支持,这样的升级相比a t j 2 0 8 5 来说,可谓是一个飞跃,因为在m p 3 大容 量时代,高速的传输接口尤其重要,而且由于u s b 解码芯片集成于i c 芯片之内, 更是将成本进一步降低。最后,相比其他厂商的i c 芯片,a t j 2 0 9 7 还有一大功能 就是支持其他类型的储存卡扩容,如主流的s d 卡,m p 3 制造厂商只需增加s d 卡 插槽,用户就可以根据自己的实际需要,增加不同容量的s d 卡产品,这无疑给众 多预算不多的用户提供了良好的解决方案 2 7 1 。 1 4 论文内容安排 随着人们对随身视听要求的不断提高,m p 3 随身听的功能也在迅速扩展,这 使得m p 3 市场具有广泛的开发前景。基于此背景,本论文研制出了一款基于a t j 2 0 9 7 芯片的多功能多媒体播放器。 论文主要安排如下: 第一章,绪论:简要介绍了m p e g 音,视频标准,m p 3 播放器的发展,历史与 现状。 第二章,音视频的解码原理:详细介绍了m p e g 1l a v c ru i 音频及a m v 视频 的解码原理,为后续章节打下理论基础。 第三章,系统硬件的设计及实现:介绍了核心控制芯片a t j 2 0 9 7 的结构特点。 并确定了系统设计的功能需求,包括主要功能、外围接口等并对器件的选型和核心 控制芯片与芯片的接口设计及实现作了详细地介绍。 第四章,系统软件的设计及实现;从设计需要出发,分析得出系统的软件整体 方案,接着,按照系统结构的划分,对各个模块软件流程进行了详细地阐述。 第五章,系统调试与实验:介绍了各个界面的设计实物图与系统调试,包括基 本功能调试和外围设备测试等。 第六章,结论与展望。 6 硕士学位论之 m a s t e r st h e s l s 第二章音视频解码原理 2 1m p e g 1 l a y e r 音频解码 音频解码的基本原理是利用代码中的一些应用参数,解出压缩码流中的数据元 素,然后把这些数据元素按照已知的规则进行解码,再把所得的信息进行一系列的 运算处理,最后得到数字音乐的输出 2 8 l 。 2 1 1m p 3 音频比特流格式 音频信号被压缩成m p 3 格式后都被打包成帧的格式,各帧( f r 姗e ) 是相互独 立的小块,如图2 1 所示,每一帧包括固定的1 1 5 2 个p c m 采样剧2 9 1 。 i i 帧,帧2帧n 幽2 1m p 3 数据结构图 m p e g 1 标准1 1 1 7 2 3 中规定了标准的m p 3 帧格式,每帧可分为头信息,检错信 息,音频数据和辅助数据。如图2 2 所示。每一帧的前4 个字节为帧的首部,由帧同 步信号和其他与音乐相关数据组成,包括位速率,采样率和立体声模式等。循环冗 余校验部分( c r c ) 是可选的,音频数据部分,包括边带信息( s i d ei n f o n i l a t i o n ) 和主数据( m 抽d a t a ) 。最后还包括辅助数据部分。 i头信息c r c 字边带信息主数据辅助数据 i l 3 2 位 o 位或1 6 位 13 6 位或2 5 6 位 ( 长度不定) 蚓2 2m 3 帧结构图 ( 1 ) 头信息 头信息共3 2 位,8 个字节,包含帧同步信息和一些文件的状态信息。其内部结 构及各位的具体含义如表格2 1 【3 1 l 所示: 7 硕士学位论文 m a s t e r st h e s l s 表2 1m p 3 帧头信息结构 字段名位数含义 s ”c w o r d :同步字 1 2 全l ,用于帧同步 i 抵:算法标识符2 l l :矗d p e g 一1 :l o :m p e g - 2 ; 0 l :r e s e n 刨:o o :m p e g _ 2 5 l a y e r :层号 20 0 :未定义;0 i :l a y e ri i i : 1 0 :h y 盯i i ;1 1 :l a y 盱i p r o t e c t i o n _ b i t :保护位l o :帧中包含检错数据 b i 劬l t e :比特率 4 表示编码数据的比特率 f r e q u 印c e 2 表示采样频率 p a d d i n g ;填充位 l 1 :表示要加大文什头的存储 容量以调整编码的平均比特 率: p r i b a t e 1 保留 m o d e :模式位 20 0 :立体声双声道;o l :联台 立体声;1 0 :般声道i1 1 :单 声道 m o d ee x t s i o :模式扩展位2 联合立体声中模式选择 c o p 如g h t ;版权 l o :表示此m p 3 有版权;1 :表 示没有版权 。五g 曲l c o p y :原始流复制品 lo :此文件为拷贝文件;1 :此 文件为原版 e i n p h 船i s :增强 2表示去加重的方法0 0 :没有; o l :5 0 ,1 5 毫秒;1 0 :保留;1 l : c c i r r j 1 7 ( 2 ) 检错信息 检错信息共1 6 位,当头信息中的p r o t 州。小b i t 为o 时,编码流中将加入这1 6 位校 验信息。检错采用1 6 位循环校验。如果解码时检测出错误,则停止该帧的播放,静 音一帧,或重复播放前一帧,以跳过错误帧。 ( 3 ) 音频数据 音频数据是m p 3 帧的主要部分,可以划分为边带信息和主数据两部分。 边带信息分单声道和双声道两种,单声道为1 3 6 位,双声道为2 5 6 位。用于对音 频数据作进一步的说明。边带信息部分包含了在解码主数据时需要的信息。这些信 息包括:在霍夫曼解码时码表的选择信息和重建比例因子所需要的信息。由于在 m p e g 1 l 惯i 数据流中使用了比特池( b i tr e s e r v o i r ) 技术【埘。因此,在边带信息 硕士学位论文 m a s t e r 。st h e s i s 中还包括了主数据从何处开始的信息。 主数据中包含的数据有缩放因子、霍夫曼( h u f h n a n ) 数据及附加数据。这些 字段在主数据中有固定的格式,以双声道为例,如图2 3 所示。每帧主数据的长短 可以根据霍夫曼码字的时变特性而变化,如果某一帧中的主数据区中存在空闲比 特,则这些比特可以允许其后续帧用来放置主数据。因此,某一帻的主数据可以分 散到多个帧的主数据区中。通过读取边带信息中的一个长度为9 比特指针数据,可 以找到主数据的开始。霍夫曼解码后输出的数据是经过重量化的频域样本值和缩放 因子结合就可以进行反量化处理。 图2 3 双声道中帧数据的结构 ( 4 ) 辅助信息 包含编码中的辅助信息,和一些用户自定义的数据。 2 1 2m p e g - ll a ”rm 解码原理 m p e g 1 l a y 盯i i i 解码器结构框图如图2 4 所示1 3 3 】: 编码看的pcm音频采样点 图2 4m p e g ll a y e r i 解码器结构框图 图2 4 中,在输入端首先将己编码数据流输入解码器,按规定的语义进行比特流 分解,恢复出各种信息,并对量化样值进行霍夫曼解码。根据分解码流得到的频带 比例因子、总增益、窗口类型等信息,对霍夫曼解码后的量化值进行逆量化。在逆 映射中,先由离散余弦变换( i m d ( 玎) 重建子带亚采样信号,再经合成子带滤波器 恢复音频信号。 9 硕士学位论文 m a s t e r st h e s l s m p e g 1 l a y e ri i i 解码流程如图2 5 所示【蚓: 图2 5m p e g - l l a y e r i 解码流程图 由图2 5 可知,m p e g 1 l a y e ri i i 解码主要过程包括:帧同步和边带信息解码、 霍夫曼解码、反量化、立体声解码、反锯齿、i m d c t 和子带合成运算等。 在解码过程中,m p 3 格式码流首先通过数据流解包得到模块每帧的同步字和帧 头信息,并通过对起始位置信息的解析获得实际一帧的音频数据,对头标的分析可 以获得各相应解码信息,同时分离边带信息和主数据。边带信息数据通过解码可以 得到霍夫曼解码信息和反量化信息,主数据可以根据霍夫曼解码信息解码出量化前 数据,量化前数据结合量化信息就可以得到频域的数据流。结合帧头的立体声信息, 对反量化结果进行立体声处理后,再经过变换域的计算,通过混叠处理、i m d c t 、 子带综合就可以得到原始音频信号,即p c m 码。 1 帧同步及帧头信息的读取 m p 3 数据流的同步以帧为单位,每一帧的帧头都包含同步信息,这个同步信息 是连续的1 2 个1 组成的同步字:什1 11 1111 111 11 。在进行解码时,也是以帧为 单位在数据流中搜索同步字,若搜索到一帧便开始解码。先是提取帧头信息,然后 是边信息及主数据。 帧头信息中包含采样率、比特率、填充位等主要信息。比特率和填充位信息用 来确定每帧的帧长。在得到每帧的帧头信息之后,该帧的帧长可由( 2 1 ) 式来确定。 l e n g t h = ( 1 4 4 0 袖i 仃a t e s + s 锄p 丘e q s ) + p a d d i n gb i t ( 2 1 ) 1 0 硕士学位论文 m a s t e r st h e s l s 其中:b i 仃a t 船代表比特率;s a m p 雠q s 代表采样率;p a d d i n g i t 代表填充位的值。 2 边带信息解码 边带解码把辅助信息从位流中抽取出来,供解码相关帧的内容试用。待解码的 辅助信息有:主数据起始指针,缩放因子分配信息,频率行分区信息,霍夫曼编码 表选择字,反量化系数和窗选择字等。这部分编码数据在双声道m p 3 中占3 2 字节。 3 霍夫曼解码 解码器的主要任务是要通过霍夫曼解码和反量化,恢复频域样本,然后从频域 变换到时域,输出时域样本。在霍夫曼编码时,编码器选用不同的霍夫曼树,根据 数据本身,找出能得到最小码数长度的霍夫曼树进行编码。因此,解码时也必须选 择恰当的霍夫曼树进行解码,然后遍历该树获取每一个帧数据的能量值,得到最后 的解码值。 解码流程如图2 击所示: n 图2 6 霍夫曼解码流程 在霍夫曼解码之后,用比例因子反量化得到实际的频谱能量值。从零到奈奎斯 特( n y q u i s t ) 的整个频率范围被分为几个区域,每个区域用不同的表进行编码。区 域划分是以最大量化值为依据的,量化值被分为大值区( b i gv a l u ez o n e ) ,小值区 ( c o u n tv a l u ez o n e ) 和零值区( z e r 0z o n e ) 三个部分,对于大值区和小值区采用 硕士学位论文 m a s t e r 。st h e s i s 不同的编码策略,大值区每两个绝对量化值被转换为一个霍夫曼码字,而小值区每 个量化值得绝对值不超过l ,因此可以四个绝对量化值转换为一个霍夫曼码字。因 为一般大值区占用的比特数较多,为了进一步提高大值区霍夫曼码编码效率,将其 细分为r e 西o n0 ,r e 百o nl ,酒0 n2 三个区域,允许每个区域选择不同的码表,而 二个区域的边界也不是固定的,在编码时,根据数据块特性查表决定。 不同块( g 瑚n u l e ) 及区域的霍夫曼码表选择信息可以从音频位流的边带信息 ( s i d eh i 南m l a t i o n ) 中解码得到。 4 反量化 反量化基于前面步骤中所得到的霍夫曼解码数据( 记为i s ( j ) ) 、缩放因子信息及 边信息,得到输出值削) ,这一过程是下一步合成滤波器的输入。 反量化的目的是重建编码时经过m d c t 变换输出的频域样本值。在进行m d c t 变换时,针对不同信号为同时得到较好的时域和频域分辨率定义了2 种不同的窗长: 长窗的块长为1 8 个样本,短窗的块长为6 个样本,对于不同的窗类型采用不同的公 式以恢复5 7 6 个频率线的真实值。 公式( 2 2 ) 给出了数据的反量化公式: 4 皇一r ) 【r ( j ) = s i 印( i s ( j ) i i s ( j ) | - 十2 4 。) ( 2 2 ) 对于长窗,反量化公式中的系数a 和b 如下: a = 百o b a l g a i n 【g r 】一2 1 0 8 + s u b b l o c k g a i n 【w i n d o w s 离】 ( 2 3 ) b = s c i l e f a c m u l t i p l i e r 幸s c a l e 一s 【f c h 】【s f b w i n d o w 】 对于短窗,反量化公式中的系数a 和b 如下: a = 班o b a l g a i n 【f 】一2 1 0 ( 2 4 ) ( 2 5 ) b = s c “e 警一m 鬯i p l i 盯:【8 c ,? 缸一l 【乒】【曲】【s 内】 ( 2 6 ) + p r e n a 虹乒】奉p r c t 槲s f b 】 在上面的反量化公式中,x 嘶) 是反量化恢复的样值,i s ( j ) 为霍夫曼解码得到的量 化值。全局增益西o b a lg a i n 是每声道中的全局常数, 2 l o 是一个系统常数,用来 保证合适的量化步长,同时也保证量化步长编码过程中不会出现全l 而扰乱同 步字。s c a l e f a cl 和s c a l e f a cs 对应缩放因子解码中所得出的长短窗的缩放因子。当 运用短窗时,蜘l b b l o c kg a 抽变量对应子带中更细的量化。s c a l e f _ a cm u l t i p l j e f 为2 帖或 1 ,取决于是否把边信息部分的s e a l e f ks c a l e 分别设置为o 或1 。p r e t a b 【s f b 由m p e g 1 2 硕士学位论文 m a s t e r st h e s i s 标准确定,用于放大子带中频率较高的部分。p r e f l a g 和p r e t a b 只在长窗中有效。p r e f l a g 是高频预加重标志,p r e t a b 【s f b 】用来查表得出每个缩放带的预加重值。 5 立体声解码 m p 3 中音频头标中与立体声相关的信息有2 比特的模式( m o d e ) 位和2 比特的模 式扩展( m o d ee x t e 璐i o n ) 位,其含义如表格2 2 和表格2 3 所示: 表2 - 2 立体声信息 模式位含义 o0 立体声 ol 联合立体卢 1o双声道 1 l 单声道 表2 3 立体声模式扩展信息 模式扩展位强度立体声m s 立体声 oo o f fo f f 0l饥o f f loo f ro i l llo i lo i l m p 3 中的联合立体声包括m s 立体声和强度立体声,与纯立体声( s t e r e 0 ) 编码 方式不同。立体声( s t 部e o ) 编码中需要独立传送左右信道样本。双声道等效为两 个单声道,可用于传送两个独立信号( 如双语节目) 。这样,m p 3 标准通过使用2 个比特的模式信息,提供了音频位率以及编码质量的折中处理,保证了两声道情况 下编码方式的灵活选择余地。 如果使用了联合立体声模式,那么频谱在量化后,还需进行立体声处理。在m p 3 中使用两种立体声模式,m ,s 立体声( m s 咖) 和强度立体声( i m e n s i t ) ,s t 咖) 。 两种模式可以单独使用,也可以联合使用。切换信息由头标中的模式位( m o d e ) 和 模式扩展位( m o d ce x t 吼s i o n ) 决定。 m s 立体声使用公式( 2 7 ) 来解码左右声道数据,m ;在左声道,s ;在右声道: l ;:堕拿r ;:堕罩 2 。 2 ( 2 7 ) 强度立体声用公式( 2 8 ) 、( 2 9 ) 、( 2 1 0 ) 来获得左右声道数据: 硕士学位论文 l 讧a s t e r st h e s l s =li+rt(2-8) i s m t i o 曲= t 觚( 去毒i s p o s 咖) ( 2 9 ) l ;2l t 拳鼍r ;2 l ;事去 。2 ,。, 根据m o d c 和m o d e 麟t a 面o n 的值可以确定何时应用m s 立体声和强度立体声解 码公式。 6 子带反锯齿 子带反锯齿即混叠消除处理,主要用于减少在编码过程中,子带滤波器产生的 锯齿效应。子带反锯齿运算需要对每一个子带分界点进行8 次蝶形运算,每一个蝶 形运算包括四次乘法和两次加减法。 7 i m d c t 变换 混叠消除后就进行i m d c t ( i i l v e f s em o d i f i e dd i s c - 咖c o s i n et r a l l s f o 1 1 ) 变换, i m d c t 是m d c t 的逆变换。由于编码时,在进行量化之前进行了m d c t ,把输入的 音频信号从时域变换到了频域,以便于进行后续的处理。现在我们要进行的是解码, 信号在进行l m d c t 变换时仍然是频域信号。为了能够使音频信号在播放器中实时播 放,需要对他们进行处理,同时由于m d c t 本身具有压缩的功能,所以要对它们进 行解压才可以得到原来的信号,也就是要进行i m d c t 变换。 对i m d c t 的输出值需要根据不同的块类型,即b l 咄t y p e 不同的值,使用不同 的窗函数进行加窗运算。 1 ) b l o c k - :【) ,p 踟( 1 0 n gw i n d 0 w ) z ;= x 闽 未( i + 圭) i = o ,3 5 ( 2 - 1 1 ) 2 ) b l o c k _ 1 y p

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论