(电路与系统专业论文)嵌入式终端中MP3功能的研究与实现[电路与系统专业优秀论文].pdf_第1页
(电路与系统专业论文)嵌入式终端中MP3功能的研究与实现[电路与系统专业优秀论文].pdf_第2页
(电路与系统专业论文)嵌入式终端中MP3功能的研究与实现[电路与系统专业优秀论文].pdf_第3页
(电路与系统专业论文)嵌入式终端中MP3功能的研究与实现[电路与系统专业优秀论文].pdf_第4页
(电路与系统专业论文)嵌入式终端中MP3功能的研究与实现[电路与系统专业优秀论文].pdf_第5页
已阅读5页,还剩53页未读 继续免费阅读

(电路与系统专业论文)嵌入式终端中MP3功能的研究与实现[电路与系统专业优秀论文].pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

东南大学坝jj 论文 摘要 随着现代通信技术的发展,数字声音作为一种存储、处理和传输高保真声音的方法,在消费 电子、通讯等众多领域已得到广泛应用,与之相关的数字音频压缩技术电得到了充分的发展,在 数字音频压缩技术中m p 3 ( m o v i n g p i c t u r e e x p e r t s g r o u p ,a u d i ol a y e r3 ) 以其优异的性能而得到 广泛的应用。与此同时,以手机、p d a 为代表的嵌入式终端类产品的普及率也越来越高本文的 主要目标是研究如何在此类产品中实现m p 3 ,以丰富产品的功能。 在嵌入式终端中实现m p 3 主要有两种方法:软件解码方式和硬件解码方式,软件解码方式要 求处理器的处理能力较强,一般应用于高档产品中,硬件解码方式对处理器要求不高,但需要专 门的慢什解码芯片的支持。本文主要训f 究在以m o t o r o l a 公司的m c 6 8 v z 3 2 8 为核心处理器的嵌入 式终端中实现m p 3 功能,在深入研究了各种嵌入式终端中m p 3 的实现方法,并比较其优缺点和 实州范同后,选择了使用硬件解码方式在目标系统中实现m p 3 功能。硬什解码芯片采用a t m e l 公司的基于5 1 内核的s o c 芯片a t 8 9 c 5 i s n d l c ,在此芯片的基础上构成一m p 3 模块,m p 3 模 块采用m m c 卡来存储m p 3 文什,并通过u s b 平桌面p c 机进行文件的同步。目标系统通过u a r t 串口来控制m p 3 模块的运行,并通过x m o d e m 协议实现两部分间的文俐- 传输。 系统的实现包括两个部分:硬件电路和软件系统,重点在软件系统部分,主要包括调试环境 的建立、m p 3 解码的实现、m m c 卡存储系统和u s b 系统。在论文的附录中给出m p 3 子系统的 硬件原理图。 关键词:m p 3 ,战入式终端,a t 8 9 c 5 i s n d l c ,m c 6 8 v z 3 2 8 啄南大摹顽士论文 a b s t r a c t a l o n gw i t ht h ed e v e l o p m e n to fm o d e mc o m m u n i c a t i o nt e c h n o l o g y , d i g i t a la u d i oi su s e da s a m e t h o dt os t o r e ,p r o c e s sa n dt r a n s m i th i g hf i d e l i t ys o u n d ,w h i c hi sw i d e l yu s e di nm a n yf i e l d s l i k e p u b l i ce l e c t r o n i cp r o d u c t s ,t e l e c o m m u n i c a t i o ne t c a n dt h ea s s o c i a t e dd i g i t a la u d i oc o m p r e s s i o n t e c h n o l o g i e s a r ea l s o h i g h l yd e v e l o p e d m p 3 i st h em o s tp o p u l a ro n ei nv a r i o u s d i g i t a la u d i o c o m p r e s s i o nt e c h n o l o g i e sa c c o r d i n gi t se x c e l l e n tn a t u r e a tt h es a m et i m e ,e m b e d d e dt e r m i n a lp r o d u c t s l i k em o b i l ep h o n e ,p d aa r ew i l d l ys p r e a di np u b l i c ,t h em a i ni d e a li nt h i sm a s t e r st h e s i si st os t u d yh o w t oi m p l e m e n tm p 3f e a t u r ei ne m b e d d e dt e m f i n a lp r o d u c t s t h e r ea r em a i n l yt w om e t h o d st oi m p l e m e n tm p 3f e a t u r ei ne m b e d d e dt e r m i n a l :s o f t w a r ed e c o d i n g a n dh a r d w a r ed e c o d i n g ,s o f t w a r ed e c o d i n gm e t h o dm a i n l yu s e di nt o pg r a d ep r o d u c t ,b e c a u s ei t sn e e da p o w e r f u lp r o c e s s o r , h a r d w a r ed e c o d i n gd on o tc a r et h ep r o c e s s i n gc a p a c i t yo fm a i np r o c e s s o r ,b u ti t s n e e dad e d i c a t e dc h i pt op r o c e s sa u d i od e c o m p r e s s i o n t h i sp a p e rm a i n l yd or e s e a r c hi ni m p l e m e n t a t i o n m p 3f e a t u r ei nt a r g e ts y s t e m ,w h i c hi sb a s e do nm o t o r o l am c 6 8 v z 3 2 8p r o c e s s o r , a f t e rs t u d y i n ga n d c o m p a r i n gd i f f e r e n tm e t h o d so fi m p l e m e n t a t i o nm p 3f e a t u r ei ne m b e d d e dt e r m i n a l ,w ec h o o s e h a r d w a r ed e c o d i n gm e t h o dt oi l n p l e m e n tm p 3f e a t u r ei nt a r g e ts y s t e m ,t h eh a r d w a r ed e c o d i n gc h i pw e u s e di sa t 8 9 c 5 1 s n d l c ,w h i c hi sm a d eb ya t m e lc o m p a n y , t h ea t 8 9 c 5 1 s n d l ci sas o cc h i pb a s e d o n51c o r e ,w eu s et h i sc h i pt of r o mam p 3m o d u l e ,t h em o d u l eu s em m cc a r dt os t o r em p 3f i l e sa n d e x c h a n g ef i l e sw i t hn o r m a lp ct h r o u g hu s bt h et a r g e ts y s t e mc o n t r o lm p 3m o d u l et h r o u g hu a r t s e r i a lp o r t ,m a de x c h a n g ef i l e sw i t hx m o d e m p r o t o c o lb e t w e e nt a r g e ts y s t e ma n dm p 3m o d u l e i m p l e m e n t a t i o no f t h es y s t e mi n c l u d et w op a r t s :h a r d w a r ec i r c u i td e s i g na n ds o f t w a r es y s t e md e s i g n t h en l a i nw o r ki si ns o f t w a r es y s t e md e s i g n ,i n c l u d i n gd e b u ge n v i r o l m r e n t ,m p 3d e c o d i n g ,m m cc a r d s t o r a g ea n du s bs y s t e n r t h eh a r d w a r ec i r c u i ts c h e m a t i ci sl i s t e di na p p e n d i x k e y w o r d s :m p 3 ,e m b e d d e dt e r m i n a l ,a t 8 9 c 5 1 s n d i c ,m c 6 8 v z 3 2 8 学位论文独创性声明 本人声明:所早交的学位论文是我个人在导师指导下进行的研究:j :作及取得的研究成果。尽我所 知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果, 也不包含为获得东南大学或其他教育机构的学位或证书而使用过的材料。与我一同:l 作的同志对 本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。 签名群 i 关于学位论文使用授权的说明 i :1 期:0 口畔 岁z 尔南人学、中国科学技术信息研究所、国家图二日馆有权保留本人所送交的学位论文的复e n 件和电 f 文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容 相一致c 除在保密期内的保密论文外,允许论文被查询和借阅,可以公布( 包括刊登) 论文的全 部或部分内容。论文的公布( 包括刊登) 授权东南大学研究生院办理。 签名: 东南大学倾十论文 i 1 研究背景 第一章序论 m p , b ( m p e ga u d i ol a y e r3 ) 是采用国际标准m p e g ( m o v i n gp i c t u r e se x p e r t sg r o u p ,动态 图象专家组) 中的第三层音频压缩模式,对声音信号进行压缩的一种格式,mpeg 声音压缩算法 是一种通用的声音编码技术,它对音源的性质没有作任何假发,而是利用人耳的听觉特性对声音进 行疗i 缩。一方面,去除声音信号本身的相关性:另一方面,去除声音信号中人耳不可感知的部分。 其基本理论就是去除节目源中人耳听觉闽以外的所有信号,并将大信号掩盖r 的小信号也加以除 左,这样实际记录的信息量就比压缩前小得多,其压缩比可在1 0 :1 9 6 :l 之间”7 。m p 3 以其音质 好压缩比高而在数码音乐领域占有及其重要的地位,成为目前最为普及的音频压缩格式。 信息终端类产品包括智能手机、电子词典、p d a ( p e r s o n a ld i g i t a la s s is l a n t ,个人数字助 理) 等信息家电和行业应用手持信息设备等产品,此类产品的拥有量随着社会经济的发展而不断扩 火,具备m p 3 功能业已此类产品的发展趋势之一。 信息终端类产品属丁嵌入式系统,在嵌入式系统中,m p 3 的实现方法分为软件和硬什两大类。 软什实现方法及利用软件来实现m p 3 的解码,解码后的数据信号经d a c ( d i g i t a l a n a l o gc o n v e r t e r , 数模转换) 处理后变为音频模拟信号,因m p 3 在解码过程中需要消耗处理器大量的运算能力,要 完成m p 3 的实时解码,处理器的运算能力必须大于5 m i p s 如在嵌入式系统中运行其他任务的同 时进行m p 3 解码则必须使用系统主频较高的高性能处理器才能胜任,如m o t o r o l ad r a g o n b n lm x l 、 i n t e lp x a 2 5 0 等。 硬件解决方案分为专用解码芯片解决方案、基1 - d s p ( d i g i t a ls i g n a lp r o c r s s o r ,数字信号处理 器) 的解决方案平单片s o c ( s y s t e m o n c h i p ,片上系统) 方案三大类。在用专州解码芯片来实现 m p 3 的方案中,需要一控制处理器的配合来完成系统的功能,专用解码芯片只负责m p 3 的解码, 输入的m p 3 数据由控制处理器提供,输山数据经音频d a c 后变为音频模拟信号,基于d s p 的解 决方案和专用解码芯片的解决方案类似,只不过用d s p 处理器来实现m p 3 的解码。在这两种实现 方法只涉及到m p 3 的解码问题,对于其他一些问题,如m p 3 存储空间、m p 3 文件的同步方式等都 没有考虑,按目前的标准,m p 3 的存储空间一般大于6 4 m b y t e ,为此必须对系统采用一种合适的 方法进行扩容,而m p 3 的同步一般采用u s b 方式,这对没有u s b 控制器的处理器( 如6 8 v z 3 2 8 等) 必须外挂u s b 控制芯片来完成,从而使系统的复杂性增大。 单片s o ( :方案为近期才出现的一种m p 3 解决方案,其把土控处理器、d s p 或解码芯片雨i 其他 辅助功能模块集成在同一:占片上,自成体系,增加少量元件就能构成一完整的m p 3 捅放器,其典 型代表为a t m e l 的a t 8 9 c 5 1 s n d l c ,该芯片以5 l 内核为基础,内部集成了m p 3 硬件解码模块, 并提供了完备的支持功能如m m c ( m u l t i m e d i a c a r d ,多媒体卡) 控制器、u s b 控制器等模块,可 方便地应用在p d a 、车载音频等系统中来实现m p 3 功能。 以m o t o r o l ad r a g o n b a l l6 8 v z 3 2 8 和c i r r u sl c g i c 的e p 7 2 n 为代表的3 2 位中低档处理器以其高 的性价比在信息终端产品中有着广泛的应用,如何在以此类处理器为核心的系统中实现m p 3 功能 是本论文的主要目标,如6 8 v z 3 2 8 的处理能力在3 3 m h z 的主频下为54 m i p s l 4 ,在理论上是可以 进行m p 3 的实时解码,但解码过程几乎耗尽处理器的处理能力,即在m p 3 解码时停止其他一切功 能,如a c e r 的一款型号为s 1 0 的p d a ,其采用m c 6 8 v z 3 2 8 为主处理器,在进行m p 3 音乐播放时 其他功能被禁l ,这种处理方式使其适用性受到很大的影响。要想改变这种状态有两种方法可以使 川,一、使用高性能的处理器来重新设计嵌入式系统;二、在原系统中增加硬件解码电路来实现 m p 3 功能。第一种方案投入犬,设计周期跃,而采用第二种方案可以保护原有的研发投入又缩短 了产品的丌发周期,所以本论文主要研究m p 3 的硬件解码方式。 要在以m c 6 8 v z 3 2 8 或其同档次产品为核心处理器的信息终端中增加m p 3 功能必须首先解决以r 二个问题: 一、m p 3 文件的解码。解码可分为软件解码和硬件解码两种方式。因m c 6 8 v z 3 2 8 的系统主频只 1 第一章序论 有3 3 m i z ,如采用软件解码方式会耗尽其处理能力,采用外接专用的m p 3 芯片来完成解码功能为实 现m p 3 的首先方案。 :、存储容量的扩充。信息终端的存储容量般为几兆剑十儿兆字节之间,而要使m p 3 功能具 有实际意义,其存储空间一般要在3 2 m b y t e 以上。可采用n a r df l a s h 或存储卡来扩充其容量。 三、m p 3 文件的同步方式。信息终端必须具备一种高速的和p c 机进行数据传输的手段,以进 行m p 3 文件的更新。u s b 垌i1 3 9 4 这两种方案司供选择,考虑到p c 机都支持u s b ,所以采川u s b 传 输方式。 因m c 6 8 v z 3 2 8 的处理能力有限,如采用软件解压的方式,则系统的开销太大而使其他应用程 序不能执行,因而使其应用受到一定的限制,所以最佳方案是采用专用m p 3 芯片来实现解码过程, 同时m c 6 8 v z 3 2 8j 甚片无u s b 接口模块,必须选择适当的u s b 接口芯片来实现u s b 功能。经过 研究和论证后决定使用a t m e l 公司新近推出的一款基于5 1 内核的m p 3 播放芯片a t 8 9 c 5 1 s n d l 米 完成功能的扩充,此芯片内建一m p 3 硬件解码模块,并同时支持u a r t 、u s b 和m m c 卡,可作 为一m p 3 功能模块挂接到m c 6 8 v z 3 2 8 ,通过u a r t 控制m p 3 模块的动作,m p 3 文件存放于m m c 内,通过u s b 来进行文件的更新。 1 2 主要工作 本课题的主要内容是研究如何在嵌入式终端中实现m p 3 功能,这是作者在东大集成电路系统 一r 程有限公司实习期间所面临的一项:f 程殴计任务,其主要内容是在以m c 6 8 v z 3 2 8 为核心处理器 的信息终端中实现m p 3 功能,本人以此为契机广泛研究了嵌入式终端中m p 3 的实现方法,主要包 括m p 3 的基本原理、分析各种实现方法的优点和缺点以及其实用范围,并选择一个切实可行的方 法应用住r 程没计任务中。 】3 论文的结构 本文的重点是论述嵌入式终端中m p 3 功能的研究与实现,首先在第二章中对m p 3 的产生与发 展及其基本:t 作原理进行简要的说明,对各种实现方法进行分析,并根据:| _ :程发计任务的特点选择 一合适的实现方法。第三章对所选用的设计方法进行总体的概述,具体包括硬件电路的设计与实现, 软仲开发环境的建立等。第四章详细介绍了具体的功能实现过程,主要包括系统中m p 3 解码、文 t 1 :i ! r , j 存储、文件的同步等问题的实现细节,并列系统的性能进行测试和评估。因系统所涉及的知 识点比较多,除m p 3 的基本原理在第二一章单独说明外,其他知识点如x m o d e m 协议、m m c 卡原 理、f a t 文t 1 系统和u s b 原理等,都在具体实现时分别进行简要的说明。 2 东南大学硕:p 论文 第二章m p 3 概述 2 1 音频压缩技术及其发展 数字技术的出现与应用为人类带来了深远的影响,人们如今己生活在一个几乎数字化的世界之 中,而数字音频技术则称得上是应用最为广泛的数字技术之一,c d 、v c d 、d v d 等早已走进千家 万户,数字化j 一捕正在全球范围内逐步得到开展,正是这些与广大消费者密切相关的产品及应用推 动了数字音频压缩技术得以产生和发展。 音频压缩技术指的是剥原始数字音频信号流( p c m 编码) 运用适当的数字信号处理技术,在 不损火有用信息量,或所引入损失可忽略的条件r ,降低( 压缩) 其码率,也称为压缩编码。它必 须具有相应的逆变换,称为解压缩或解码。音频信号在通过一个编解码系统后可能引入大量的噪声 平| :| 一定的失真。 数字信号的优势是显而易见的,而它也有自身相应的缺点,即存储容量需求的增加及传输时信 道容量要求的增加。以c d 为例,其采样率为4 41 k h z ,量化精度为1 6 比特,则1 分钟的立体声 音频信号需占约1 0 m 字节的存储容量,也就是说,一张c d 唱盘的容量只有1 小时左右。是不是 所有这些比特都是必需的呢? 研究发现,直接采用p c m 码流进行存储和传输存在非常大的冗余度。 事实上,在无损的条件下对声音至少可进行4 :1 压缩,即只用2 5 的数字量保留所有的信息口】。 闻而,为利用有限的资源,压缩技术从一出现便受到广泛的重视。 一般来讲,可以将音频压缩技术分为无损( 1 0 s s l e s s ) 压缩及有损( 1 0 s s y ) 压缩两大类,而按照 压缩方案的不同,又可将其划分为时域压缩、变换压缩、子带压缩,以及多种技术相互融合的混台 乐缩等等。各种不同的压缩技术,其算法的复杂程度( 包括时间复杂度和空间复杂度) 、音频质量、 算法效率( 即压缩比例) ,以及编解码延时等都有很大的不同。各种压缩技术的应用场合也因之而 并不相同。 ( 1 ) 时域压缩( 或称为波形编码) 技术是指直接针对音频p c m 码流的样值进行处理,通过静 音检测、非线性量化、差分等手段对码流进行压缩。此类压缩技术的共同特点是算法复杂度低,声 音质量一般,压缩比小( c d 音质 4 0 0 k b p s ) ,编解码延时虽短( 相对其它技术) 。此类压缩技术一 般多j = | = | 于语音压缩,低码率应用( 源信号带宽小) 的场合。 ( 2 ) 子带压缩技术是以子带编码理论为基础的一种编码方法。子带编码理论最早是由c r o c h i e r e 等于1 9 7 6 年提出的。其基本思想是将信号分解为若干子频带内的分量之和,然后对各子带分量根 据其不同的分布特性采取不同的压缩策略以降低码率。通常的子带压缩技术和下面介绍的变换压缩 技术都是根据人对声音信号的感知模型( 心理声学模犁) ,通过对信号频谱的分析来决定子带样值 或频域样值的量化阶数年1 1 其它参数选择的,因此又可称为感知型( p e r c e p t u a l ) 压缩编码。这两种 压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应 增加。一般来讲,子带编码的复杂度要略低于变换编码,编码延时也相剥较短。 由于在子带压缩技术中主要应用了心理声学中的声音掩敞模型,因而在对信号进行压缩时引入 了大量的捌:化噪声。然而,根据人类的听觉掩敞曲线,在解码后,这些噪声被有用的声音信号掩蔽 掉了,人耳无法察觉;同叫由于子带分析的运用,各频带内的噪声将被限制在频带内,不会对其它 频带的信号产生影响。因而在编码时各子带的量化阶数不同,采用了动态比特分配技术,这也正是 此类技术压缩效率高的主要原因。在一定的码率条件f ,此类技术可以达到“完全透明”的声音质量 ( e b u 音质标准) 。 予带压缩技术目前广泛应用于数字声音节目的存储与制作和数字化广播中。典型的代表有著名 的m p e o 一1 层i 、层i i ( m u s i c a m ) ,以及用于p h i l i p sd c c 中的p a s c ( p r e c i s i o n a d a d t i r es u b b a n d c o d i n g ,精确自适应子带编码) 等。 ( 3 ) 变换压缩技术与子带压缩技术的不同之处在于该技术剥一段音频数据进行“线性”的变换, 对所获得的变换域参数进行量化、传输,而不是把信号分解为儿个子频段。通常使f l j 的变换有d f t 、 d c t ( 离散余弦变换) 、m d c t 等。根据信号的短时功率谱对变换域参数进行合理的动态比特分配 3 第二章m p 3 概述 可以使音频质量获得显嵩:改善,而相应付出的代价则是计算复杂度的提高。 变换域压缩具有一些不完善之处,如块边界影响、预回响、低码率时声音质量严重下降等。然 而随着技术的不断进步,这些缺陷正逐步被消除,同时在许多新的压缩编码技术中电大量采用了传 统变换编码的某些技术。 在音颓压缩标准化方面取得巨大成功的是m p e g - 1 音频( i s o i e c l l l 7 2 3 ) 。在m p e g 一1 中, 别音频压缩规定了三种模式,即层l 、层i i ( 即m u s i c a m ,又称m p 2 ) ,层i i i ( 又称m p 3 ) 。由 于在制订标准时对许多压缩技术进行了认真的考察,并充分考虑了实际应用条件雨i 算法的可实现性 ( 复杂度) ,因而三种模式都得到了广泛的应用。v c d 中使用的音频压缩方案就是m p e g 一1 层i ; 而m u s i c a m 由于其适当的复杂程度和优秀的声音质量,在数字演播室、d a b 、d v b 等数字节目 的制作、交换、存储、传送中得到广泛应用;m p 3 是在综合m u s i c a m 和a s p e c 的优点的基础上 提出的混合压缩技术,在当时的技术条件下,m p 3 的复杂度显得相对较高,编码不利于实时,但 由于m p 3 在低码率条件下高水准的声音质量,使得它成为软解压及网络广播的宠儿。可以说, m p e g l 音频标准的制订方式决定了它的成功,这一思路甚至也影响到后面将要淡到的m p e g t 2 和 m p e g 一4 音频标准的制订。 2 2m p 3 原理及其实现方法 m p e g 的全称是m o v i n g p i c t u r e se x p e r t sg r o u p ( 即动态图像专家组) ,由1 s o ( i n t e r n a t i o n a ls t m m a r d s o r g a n i z a t i o n ,国际标准化组织) 与i e c ( i n t e r n a t i o n a l e l e c t r o n i c c o m m i t t e e ) 于1 9 8 8 年联合成立,致 力丁运动图像( m p e g 视频) 及其伴音编码( m p e g 音频) 标准化:l = :作。m p e g 共有4 个版本,其中前 两个版本m p e g - - 1 和m p e g - - 2 应用比较广泛,而m p e g - - 4 虽然己推出近两年,但有关它的应 用却直到最近才活跃起来,m p e g - - 7 则是属于未来的标准。 m p e g - - l 标准( i s o i e c l l l 7 2 ) 制定于1 9 9 2 年,是针对1 5 m b p s 以下数据传输率的数字存储 媒体运动图像及其伴音编码设计的国际标准,主要用于在c d - - r o m ( 包括v i d e o - - c d 、c d - - i 等) 存储彩色的同步运动视频图像。 在音频压缩标准化方而取得巨大成功的是m p e g 一1 音频( i s o i e c l l l 7 2 3 ) 。在m p e g 1 中,对 音频乐缩规定了三种模式,即层i 、层i i ( 即m u s i c a m ,又称m p 2 ) ,层i i i ( 又称m p 3 ) 。 m p 3 的全名是m p e g a u d i ol a y e r 3 ,简单的说就是一种声音文件的压缩格式。1 9 8 7 年德国的研 究机构i i s ( i n s t i t u t ei n t e g n e r t es c h a l t u n g e n ) 开始着手一项声音编码及数字音频广播的计划,名称叫做 e u r e k a e u l 4 7 ,即m p 3 的前身。之后,这项计划由i i s 与e r l a n g e n 大学共同合作,开发出一套非 常强大的算法经由1 5 0 国际标准组织认证之后,符合i s o - m p e ga u d i ol a y e r - 3 标准,就成为现 在的m p 3 。 i s o m p e g 音频压缩标准里包括了三个使用高性能音频数据压缩方法的感知编码方案 ( p e r c e p t u a lc o d i n gs c h e m e s ) 。按j ! c i 压缩质量( 每b 1 t 的声音效果) 和编码方案的复杂程度分别是l a y e r l 、l a y e r2 、l a y e r3 。所有这三层的编码采用的基本结构是相同的。它们在采用传统的频谱分析 和编码技术的基础上还应用了子带分析和心理声学模型理论。也就是通过研究人耳和大脑听觉神经 剥音频失真的敏感度,在编码时先分析声音文件的波形,利用滤波器找出噪音电平( n o i s el e v e l ) , 然后滤去入耳不敏感的信号,通过矩阵量化的方式将余下的数据每一位打散排列,最后编码形成 m p e g 的文件。而音质听起来与c d 相差不大。 m p 3 的好处在于大幅降低数字声音文4 - i :的容量,而不会破坏原来的音质。以c d 音质的w a v e 文什米说,如抽样分辨率为1 6 b i t ,抽样频率4 4l k h z ,声音模式为立体声,那么存储1 秒钟c d 音 质的w a v e 文件,必须要用1 6b i t + 4 4 1 0 0 h z 4 2s t e r e o = 1 4 1 1 2 0 0 b i t ,也就是相当于1 4 1 12 k b i t 的存 储容量,存储介质的负担相当大。不过通过m p 3 格式压缩后,文件便可压缩为原来的1 1 0 到1 1 2 , 每1 秒钟的m p 3 只需大约1 1 2 1 2 8 k b i t 就可以了。 具体的m p e g 的压缩等级与压缩比率参见下表1 1 【2 j : 4 东南大学硕= l 论文 表l1 m p e g 编码等级压缩比率数字流码率 l a y e r l 1 :43 8 4k b i t s l a y e r2 l :6 1 :81 9 2 2 5 6k b i t s l a y e r3 l :1 0 1 :1 21 2 8 1 5 4k b i t s m p 3 格式的文件有一个有意思的特征,就是可以边读边放,这也符合流媒体的最基本特征。也 就是说= | | 放器可以不用预读文件的全部内容就可以播放,读到哪里播放到哪里,即使是文科有部分 损坏。虽然m p 3 可以有文件头,但对于m p 3 格式的文件却不是很重要,正冈为这种特性,决定了 m p 3 文件的每一段每一帧都可以单独的平均数据速率,而无需特别的解码方案。于是出现了一种 r l t v b r ( v a r i a b l eb i t r a t e ,动态数据速率) 的技术,可以让m p 3 文件的每一段甚至每一帧都可以有 单独的b i t r a t e ,这样做的好处就是在保证音质的前提下最大程度的限制了文件的大小。这种技术的 优越性是显而易见的,但要运_ e | j 确实是一件难事,因为这要求编码器知道如何为每一段分配b i t r a t e , 这对没有波形分析的编码器而言,这种技术如同虚i 殳。正是如此,v b r 技术并没有一出现就显得 光彩夺日。 听觉模型的导入:专家们通过k 期的声学研究,发现人耳存在遮敲效应。声音信号实际是一种 能量波,在空气或其他媒介中传播,人耳对声音能量的多少即响度或声压最直接的反应就是听到这 个声音的大小,我们称它为响度,表示响度这种能量的单位为分贝( d b ) 。即使是同样响度的声音, 人们也会因为它们频率不同而感觉到声音大小不同。人耳最容易听到的就是4 0 0 0 h z 的频率,不管 频率是否增高或降低,即使是响度在相同的情况下,大家都会觉得声音在变小。但响度降到一定程 度时,人耳就听不到了,每一个频率都有着不同的值。 响1 度1 d b l 1 人耳可听最小晌度盐线 - , 0 1o20 412g 6 1 02 0 频率 k h z ) 图1 1 听觉中响度与频率之间的关系2 】 可以看到这条曲线基本成一个v 字型,当频率超过1 5 0 0 0 h z 时,人耳的会感觉到声音很小,很 多听觉不是很好的人,根本就听不到2 0 0 0 0 h z 的频率,不管响度有多大。当人耳同时听到两个不 同频率、不同响度的声音时,响度较小的那个也会被忽略,例如:在白天我们很难听到电脑中散热 风扇的声音,晚上却成了噪声源,根据这种原理,编码器可以过滤掉很多听不到的声音,以简化信 息复杂度,增加压缩比,而不明显的降低音质。这种遮敝被称为同时遮蔽效应。但声音a 被声音b 遮敞t 如果a 处于b 为中心的遮蔽范围内,遮蔽会更明显,这个范围叫临界带宽。每一种频率的临 界带宽都不一样,频率越高的临界带宽越宽。 第二章m p 3 概述 对音频的压缩理沦,是从研究人耳的听感系统开始的,首先第一个特点是人耳对各频率的灵敏 度是不同的,在2 k 4 k 频段,很低的电平就能被人耳听到,其他频段时,相对要高一点的电平才 能听到,这就是说在听觉阂值以下的电平可咀去掉,相当于压缩了数据。第二个特点就是频率之间 的掩敲效应,其实就是指人耳接收信号时,不同频率之间的相:巨干扰。当电平高的频率点和电平相 对来说较低的不同频率点同日j 出现时,电平低的频率点的声音将听不到。因为人耳的灵敏度不一样, 所以不同频率点的掩蔽程度是不一样的。低丁掩蔽蒯值的信号将不编码,高于掩蔽蒯值的信号将重 新分配量化比特值,实施压缩,这是m p e g 能得到较高的压缩比,又能保证音质的重要原冈。第 二个特点是指短暂掩敝效应,指在一个强信号之前或之后的弱信号,也会被遮献掉。这样利用人耳 的感觉特性,对数据流本身进行压缩,做到既能降低码流,又能通过科学的压缩方法提高码流的效 率,而义不影u 向音质本身。完全了解了人耳的特性后,就会知道人耳实际上可看成一个多频段的昕 感分析器,在接收端的最后,它对瞬间的频谱功率进行了重新分配,这就为音频的数据压缩提供了 依据。 m p e g 一1 的压缩技术方案是子带压缩,子带分割的实现是通过时频映射,采用多相正交分解 滤波器组将数字化的宽带音频信号分成3 2 个子带;同时,信号通过f f t 运算,对信号进行频谱分 析;子带信号与频谱同步计算,得出对各子带的掩敞特性,由于掩蔽特性的存在,减少了对量化比 特率的要求,不同子带分配不同的量化比特数,但对于各子带而言,是线性量化。另上c r c 校验 码,得到标准的m p e g 码流。在解码端,只要解帧,子带样值解码,最后进行频时映射还原, 晟后输出标准p c m 码流。其原理方框图如图1 2 所示口】: 图12m p e g 声音编码原理 l 、面详细介纠层i 、层儿、层i i i 的具体方案。 1 、层i : 时频映射:数字的多相正交滤波器组把信号分成3 2 个子带信号,因为层t 是均匀的划分,所以每 个子带频宽为2 4 k 3 2 = 6 2 5 h z 。这种划分与关键频宽段的概念不一样,在低端只有一个子带6 2 5 h z , 这样对低频的量化比较简单,容易引起低频端的量化误差。 心理声学模型:使用5 1 2 个点的f f t 变换得到信号的短时频普功率信息,输出的r b 平和时频映射 的子带样值同步计算,得到每个子带的掩蔽闽值。最后将该子带的最大信号,掩蔽闽值率输入给量 化器。 量化编码:首先检测每个子带的样值,找到最大相对值,并且将它6 比特量化,对该子带米 讲i i l l 比例冈子a 通过最小化噪音掩蔽值,由比例因子扶定动态量化比特数,将该子带值样值线性 量化。量化比特麴用一个4 位码来描述,4 位码可以用来描述2 4 = 1 6 b i t ,最大1 6 b i t 的量化。比例 因子用6 位码来描述,最大2 6 = 6 4 的子带样值的系数。这样每个子带用的量化比特数和每个子带的 最大样值都在m p e g 的码流里,在接收端荐按照这些信息还原原信号的幅值。 帧形成:每- i n 的开始都有一个同步的信息,还有c r c 的循环冗余纠错码。帧是m p e g 1 处 理的最小单元,一帧信号处理3 8 4 个p c m 的样值,因为要检测每个样值的大小后,才能开始处理, 所以延时时间3 8 4 4 8 k = 8 m s 。一帧相当于8 m s 的声音样本。一个子带所得码流的结构如表1 2 所示 东南大学硕士论文 表1 2 同步头 c r c 比特分配信息 比例因子样值数据 1 2b i t 同步一个子带 2 0 b i t 系统 1 6b i t 4 b i t 线性描述6 b i t 线性描述 样值对应 信息 3 2 个p c m 输入样值 2 、层i i 时频映刳:和层i 类似,不同之处在。每个子带不是均匀频带宽,因为人耳低频时的灵敏度在7 0 0 h z 以后急剧降低。与之相关的一个概念叫关键带宽,因为在同样的掩蔽值时,低频有窄的带宽,而高 频端则有较宽的带宽。这样在按关键带宽分割时,低频取的带宽窄,即意味着对低频有较高频率 分辨率,在高频端时则相对有较低一点的分辨率。这样的分配,更符合人耳的灵敏度特性,可以改 善对低频端压缩编码的失真。但这样做,需要较复杂一些的滤波器组。 心理声学模型:和层i 类似,但是使用的f f t 精度高一些,是1 0 2 4 点的f f t 运算方式,提高了频 率的分辨率,得到原信号的更准确瞬间频谱特性。 量化编码:和层i 类似。但是层l i 的帧长度码流是层i 的三倍,所以层i i 允许每个子带有二个连 续的比例园子,但编码时用一、二个或者三个,由它们之间的差别来定。子带内有三个比例因子, 这就意味着带内再进行动态比特分配,更增加了m p e g l 的压缩率。 帧形成:和层1 不一样的是,描述比特分配的比特位数是不一样的。在低端子带用4 位码来描述, 相对低端子带量化比特数最大为2 4 = 1 6 b i t ,在中间子带用3 位码描述,相对中间子带比特最大为 2 3 = 8 b i t ,高端子带用2 位码来描述,相对最大比特为2 2 = 4 b i t ,这种分频率不同而比特率不一样的 做法,也是关键带宽的应用。层i i 的帧码流是1 1 5 2 个p c m 的样值,这样层i i 处理的延时时间 - 1 1 5 2 4 8 k = 2 4 m s 。这样对层的精确度为2 4 m s ,而对于层i 来言,精确度为8 m s ,如果用于编辑 的话,层i 更精确。层i i 标准码流信号如表13 所示 表13 i 司步头 c r c 比特分配比例因子子带样值码 低频端4 位码描述三个子带样值 1 2 b i t 同步码 1 6 b i t 中间频端3 位码描述 6 比特线性 对应9 6 个p c m 2 0 b i t 系统信息码量化 高频端2 位码描述 输入样值 3 、层i 层i i i - l 层i i 更为复杂,它使用了多相正交滤波器组之外,还使州了d c t 变抉滤波器纲,提高频率 的分辨率,还应用了预测心理声学模式,使用更为复杂的量化用i 编码,允许不同的帧码流。这样对 i i i 层而言,需要更快的数字信号处理器才能达到实时编码的要求。另外还使用了一些新的方案: 1 ) 用冗余字节以作为缓冲用,因为有些音乐小节是无法将其按限定的码率来编码的,否则会损 失其音质。为了保证其质量就需要用较高的码率。在m p 一3 的码流中就增加了一些冗余的字= 宵,以 便在需要的时候可以在短时间内提到较高的码率。 2 ) i l i 中还采用了h u f t i n a n 编码进行无损压缩,这就更进一步降低了数码率,提高了压缩比, 据估计,采用h u f f m a n 编码以后,可以节省2 0 的码率。 例如:经过分析,3 2 个子带的1 6 个子带的最高样值电平如表l4 所示 表l4 子带1 1 2 3 1 4 5678901 l 1 2 1 3 1 41 51 6 专d b 产 081 21 0 6 2 l o6 03 52 01 523531 如表中第8 个子带有一个强度为6 0 d b 的1 k h z 信号,通过心理声学模式计算出它的掩蔽闽值,在 7 第= 章m p 3 概述 整个第八子带都有掩蔽效应,其门限为3 5 d b ,这样本子带的信噪比j , js n 6 03 52 5 d b ,因而5 b i t 分辨率就足够了。同样,这种掩蔽也存在于邻近的子带中,在第8 1 3 ,和第5 7 子带都有掩蔽效 应,只是信号频率离得越近,掩蔽效应就越严重,离得越远,效应越弱。由它决定的掩蔽值第七段 是12 d b ,在第9 段是1 5 d b ,这样,对第七段的电平1 0 d b 1 2 d b ,所以第7 子带全部不编码,而第9 段的信噪比s n 是3 5 1 5 ( d b ) = 2 0 d b ,因而用4 b i t 分辨率就足够了。这样第七段忽略不编码,第 八段子带5 b i t 线性量化,第九段子带4 b i t 线性量化,这样就完成了码流的压缩。 东南大学硕= l :论文 第三章m p 3 系统软硬件开发平台的构建 3 1 总体设计方案 整个项目由两个部分构成:主系统和m p 3 子系统,主系统的的处理器采用m o t o r o l a 公司的 m c 6 8 v z 3 2 8 ,其主频为3 3 m h z ,采用u c l i n u x 操作系统,主系统内存由8 m b y t e 的f l a s h 和 1 6 m b y t e 的s d r a m 构成,m p 3 子系统核心处理器采用a t m e l 公司的a t 8 9 c 5 1 s n d l c ,其为 一专用m p 3 处理器,子系统主要包括m p 3 解码,m m c 卡、u s b 传输和u a r t 串口等几个功能 模块。系统结构如图3 1 所示: 幽3 1 系统结构框图 主系统和m p 3 子系统之间通过u a r t 串口进行通讯,由主系统控制通过u a r t 串口来控制子 系统的运行,如m p 3 歌曲的选择、播放、停止以及m p 3 音乐文件的删除等。因m p 3 子系统的 m m c 卡可以提供比较大的存储空间,一般为3 2 m b 或6 4 m b ,而且u s b 模块提供了高速的文件 同步方式,即m m c 卡可以通过u s b 模块实现署桌面p c 机问进行便捷高速的文件传输,为了提 高m m ce 和u s b 模块的利用率,使以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论