




已阅读5页,还剩55页未读, 继续免费阅读
(通信与信息系统专业论文)基于arm9的网络mp3播放器的研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大连理工大学硕士学位论文 摘要 m p 3 是一种高质量音乐压缩标准,采用m p 3 压缩的数据量可以缩小到1 1 2 ,音质 却没有多少损失。由于m p 3 音乐的较小数据量和高质量的播放效果,使其在网络上传 输得以实现。网络m p 3 系统可广泛应用于星级宾馆的客房音乐系统、长途巴士、旅客 列车以及3 g 手机等领域。随着网络m p 3 设备的不断发展,网络m p 3 将应用于越来越 多的消费领域,并具有良好的经济效益和社会效益。 本文是在a r m 9 的硬件平台上设计与实现了网络m p 3 播放器。网络m p 3 播放器采 用t r o l l t e c h 公司开发的q t 编程语言编写,利用q t 的网络类编写网络下载模块;利用开 源的高质量m p e g 音频解码库m a d 对m p 3 文件进行解码,生成p c m 数据;利用o s s 音频驱动程序处理p c m 数据,实现本地和网络下载的m p 3 音频文件的播放。 本文的主要工作如下: ( 1 ) 详细介绍了音频压缩技术和嵌入式系统相关知识。分析了m p 3 编解码原理,并 针对a r m 9 特点进行了m p 3 解码库的选择,使其能高效率地对m p 3 音频文件进行解码。 ( 2 ) 在主机上建立了网络m p 3 播放器开发所需要的交叉编译环境以及q t e 编程开 发工具,并建立了硬件开发平台。 ( 3 ) 研究了o s s 音频驱动程序的特点,并根据所选的硬件平台,编写了其音频驱动 程序。 ( 4 ) 在a r m 9 的硬件平台上完成了桌面系统q t o p i a 和网络m p 3 播放器的移植。 ( 5 ) 在网络m p 3 播放器软件设计中,代码顶层使用符合q t 特点的c 抖语言对播放 器进行用户界面设计。用户可以操作触摸屏来对m p 3 文件进行下载、选择、播放、暂 停和音量调节。 关键词:m p 3 播放器;$ 3 c 2 4 1 0 ;q t ;嵌入式l i n u x ;a r m 9 大连理工大学硕士学位论文 r e s e a r c ha n di m p l e m e n t a t i o no fa nn e t w o r km p e g 一1l a y e ri i ia u d i o p l a y e rb a s e do na r m 9 p l a t f o r m a b s t r a c t m p 3i sah i g h - q u a l i t ym u s i cc o m p r e s s i o ns t a n d a r d 田1 ed a t aq u a n t i t yc o m p r e s s e db y m p 3 啪r e d u c et o 1 1 2w i t hl i t t l el o s so fs o u n dq u a l i t y m p 3m u s i ch a sa c h i e v e d t r a n s m i s s i o no nt h en e t w o r kb e o a u s eo fi t ss m a l ld a t aq u a n t i t ya n dh i g h - q u a l i t yp l a y i n ge f f e c t n e t w o r km p 3s y s t e mc a na b r o a d l ya p p l yt ot h ef i e l do fg u e s tr o o m sm u s i cs y s t e mo fh i 【g h l e v e lh o t e l ,l o n g - d i s t a n c ea u t o b u s ,p a s s e n g e rt r a i n sa n d3 gm o b i l et e l e p h o n e w i n ln e t w o r k m p 3s y s t e mc e a s e l e s s l yd e v e l o p i n g ,n e t w o r km p 3s y s t e mm o r ea n dm o r ea p p l y st o c o n s u m p t i o nf i e l d sa n db r i n g se c o n o m yb e n e f i ta n ds o c i e t yb e n e f i t a nn e t w o r km p 3p l a y e ri sd e s i g n e da n di m p l e m e m e di nt h ea r m 9h a r d w a r ep l a t f o r m i nt h i st h e s i s 1 1 1 en e t w o r km p 3p l a y e ri sd e v e l o p e dw i t ht r o l l t e c h sq tp r o g r a m m i n g l a n g u a g e s n e t w o r kc l a s so fq ti su s e dt ow r i t en e t w o r kd o w n l o a dm o d u l e t h ek g h - q u a l i t y o p e ns o u r c em p e ga u d i od e c o d e rl i b r a r ym a d i sa p p l i e dt od e c o d em p 3f i l e sa n dg e n e r a t e p c md a t a p c md a t ai sp r o c e s s e db yo s sa u d i od r i v e rp r o g r a mt or e a l i z ep l a y i n g d o w n l o a d e dm p 3a u d i of i l e si nl o c a la n dn e t w o r k t h em a i nc o n t r i b u t i o n so ft h i st h e s i si n c l u d e sa sf o l l o w s : ( 1 ) i n t r o d u c ei nd e t a i lt h ea u d i oc o m p r e s s i o nt e c h n o l o g ya n dr e l a t i v ek n o w l e d g eo f e m b e d d e ds y s t e m ,a n a l y z em p 3e n c o d i n ga n dd e c o d i n gp r i n c i p l ea n dc h o o s et h em p 3 d e c o d i n gl i b r a r ya c c o r d i n gt ot h ef e a t u r eo fa r m 9 ,w h i c he n a b l e si tt od e c o d em p 3a u d i o f i l e sw i mh i g he f f i c i e n c y ( 2 ) 1 1 1 ec r o s s c o m p i l e de n v i r o n m e n tn e e d e db yt h ed e v e l o p m e n to fn e t w o r km p 3p l a y e r i se s t a b l i s h e da n dt h eh a r d w a r ed e v e l o p m e n tp l a t f o r mi sp u tu po nt h eh o s tc o m p u t e r ( 3 ) r e s e a r c ho nt h ef e a t u r e so fo s sa u d i od r i v e ra n dp r o g r a mt h ea u d i od r i v e ri n a c c o r d a n t ew i t ht h es e l e c t e dh a r d w a r e ( 4 ) mt r a n s p l a n to fd e s k t o ps y s t e mq t o p i aa n dn e t w o r km p 3p l a y e ri sc o m p l e t e do n t h ea r m 9h a r d w a r ep l a t f o r m ( 5 ) i nt h et o pc o d el e v e l ,c + + w h i c hi si nl i n ew i t hq tc h a r a c t e r i s t i c si su s e dt od e s i g n t h eu s e ri n t e r f a c ef o rt h ep l a y e ri nd e s i g no fn e t w o r km p 3p l a y e r ss o f t w a r e u s e r sc a n o p e r a t et h et o u c hs c r e e nt od o w n l o a d ,c h o o s e ,p l a y ,p a u s ea n da d j u s tv o l u m eo fm u s i cf i l e s k e yw o r d s :m p 3p l a y e r ;$ 3 c 2 4 1 0 ;q t ;e m b e d d e dl i n u x ;a r m 9 一i i i 大连理工大学学位论文独创性声明 作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究 工作所取得的成果尽我所知,除文中已经注明引用内容和致谢的地方外, 本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请 学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献 均已在论文中做了明确的说明并表示了谢意。 若有不实之处,本人愿意承担相关法律责任。 学位论文题目:基王巡鲍圜络迦三搔趑墨鲍珏究生塞趣 作者签名:弦甾丝趁 日期:冱金年l 月卫日 大连理工大学硕士研究生学位论文 大连理工大学学位论文版权使用授权书 本人完全了解学校有关学位论文知识产权的规定,在校攻读学位期间 论文工作的知识产权属于大连理工大学,允许论文被查阅和借阅。学校有 权保留论文并向国家有关部门或机构送交论文的复印件和电子版,可以将 本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、 缩印、或扫描等复制手段保存和汇编本学位论文。 学位论文 作者签名 导师签名 大连理工大学硕士学位论文 1 绪论 1 1 音频压缩技术介绍 现阶段,各类型的信息以爆炸性的速度迅速膨胀,这就涉及到信息的传输和存储问 题。在目前存储资源和传输带宽有限的情况下,如何对信息进行有效的压缩,是一个十 分重要的研究方向。信道和信源是信息传输中的两个重要环节。信道编码主要解决信息 传输的可靠性问题,即尽量使处理后的信号适于传输,在传输过程中不出错或尽量少出 错。信源编码主要解决信息传输的有效性问题,通过对信源的压缩、加扰、加密等一系 列处理,力求用最少的数码传递最大的信息量。 近几年来,数字音频信号在很多领域得到了广泛的应用。使用数字音频方式来处理 和传输信号有很多优点,包括信号传播中不易受到干扰、容易复制、易于保存等,并且 可对数字信号进行特殊的处理,如混音、量化等。数字音频信号的格式一般是脉冲编码 调制( p c m ,p u l s ec o d em o d u l a t i o n ) 形式。为了达到c d 的音质,每秒需传送1 4 m b i t s 的信息量,若以一首四分半钟的歌曲估计,需要至少4 5 m b y t e 的空间来存储,在网络传 输中传输速度要求更高。因此,对于音频信号的有效压缩至关重要。 音频压缩有一套非常丰富的算法理论,音频压缩技术1 1 1 根据数据有无损失可分为无 损( l o s s l e s s ) 压缩及有损( l o s s y ) 压缩两大类: ( 1 ) 有损压缩是指在压缩过程中丢弃了一些次要数据,但还是能实现比较好的压缩 效果,具有代表性的此类音频标准有w m a 、m p 3 、o g e c v o r b i s 等。 ( 2 ) 无损压缩是指压缩过程中不丢弃任何数据,经压缩解压后能够得到与原始文件 完全相同的解码文件,具有代表性的此类音频标准有f l a c 、a p e 等。 按照压缩方案的不同,又可将其划分为时域压缩、子带压缩、变换压缩以及多种技 术相互融合的混合压缩等。 ( 1 ) 时域压缩( 或称为波形编码) 技术是指直接针对音频p c m 码流进行处理,通过静 音检测、非线性量化、差分等手段对码流进行压缩。时域压缩技术主要包括g 7 l l 、g 7 2 2 、 a d p c m 、l p c 、c e l p 等。 ( 2 ) 子带压缩技术是将信号分解为若干子频带内的分量之和,然后对各子带分量根 据其不同的分布特性采取不同的压缩策略以降低码率。子带压缩技术目前广泛应用于数 字声音节目的存储与制作和数字化广播中。主要有m p e g 1 层i 、层i l 、层i i i 。 基于a r m 9 的网络m p 3 播放器的研究与实现 ( 3 ) 变换压缩技术是对一段音频数据进行变换,对所获得的变换域参数进行量化、 传输,而不是把信号分解为几个子频段。通常使用的变换有d f t 、d c t ( 离散余弦变换) 、 m d c t ( 改进的离散余弦变换) 等。 1 2 嵌入式系统的发展概述 1 2 1 嵌入式系统的定义 嵌入式系统被定义为:以应用为中心、以计算机技术为基础、软件硬件可裁剪、适 应应用系统对功能、可靠性、成本、体积、功耗严格要求的专用计算机系统闭。嵌入式 系统的最大特点是其所具有的目的性和针对性,即每一套嵌入式系统的开发设计都是有 其特殊的应用场合与特定功能,这也是嵌入式系统与通用的计算机最主要的区别。另外, 嵌入式技术与实时性有着天然的联系。由于嵌入式系统是为特定的目的而设计的,且常 常受到空间、成本、存储、带宽等条件的限制,因此,它必须最大限度地在硬件上和软 件上“量身定做”以提高效率,这样的结果增强了系统的实时性。 1 2 2 嵌入式系统的发展历史与现状 1 9 7 1 年,i n t e l 公司推出了有史以来第一颗微处理器4 0 0 4 ,嵌入式系统的概念也随 之出现,而此时的嵌入式系统大多都不采用操作系统,它们只是为了实现某个控制功能, 使用一个简单的循环控制对外界的请求进行处理,是计算机的一种应用形式。 世界上第一个应用的嵌入式系统可以追溯到1 9 6 0 年代中期的阿波罗导航计算机 ( a p o l l og u i d a n c ec o m p u t e r ) 系统,用来完成阿波罗飞船的导航控制。纵观嵌入式技术的 发展历史,大致经历了以下四个阶段【3 】: ( 1 ) 无操作系统的嵌入式算法阶段 这阶段的嵌入式系统是以单芯片为核心,通过与某些监测、指示和控制设备相配 合来实现特定的系统功能。在没有操作系统支持的情况下,管理者通过编写汇编语言来 控制整个系统运行的流程。该系统的主要特点是系统结构和功能都相对单一,针对性强, 无操作系统支持,几乎没有用户接口。 ( 2 ) 简单监控式的实时操作系统阶段 这一阶段的嵌入式系统主要以嵌入式处理器为基础,以简单监控式操作系统为核心。 这类系统的特点是:处理器种类繁多,通用性较弱;开销小,效率高:一般配备系统仿 真器,具有一定的兼容性和扩展性;用户界面不够友好,主要用来控制系统负载以及监 控应用程序运行。 大连理工大学硕士学位论文 ( 3 ) 通用的嵌入式实时操作系统阶段 该阶段的嵌入式系统以通用型嵌入式实时操作系统为标志。其主要特点是:嵌入式 操作系统能运行于各种不同类型的微处理器上,具有良好的兼容性;操作系统的内核精 简、效率较高,并且具有高度的模块化和可扩展性:支持文件和目录管理,具备多任务 处理和网络接入功能;支持图形用户界面,具有丰富的应用程序接口,使嵌入式应用程 序的开发更为简便。 ( 4 ) 以i n t e m e t 为标志的嵌入式系统阶段 随着通用型嵌入式实时操作系统的发展,面向i n t e m e t 网络和特定应用的嵌入式操 作系统正日益引起人们的重视,成为重要的发展方向。嵌入式系统与i n t e m e t 的真正结 合、嵌入式操作系统与应用设备的无缝结合代表着嵌入式操作系统发展的未来。 到目前为止,嵌入式系统已在国防、国民经济及社会生活等领域中普及应用,迄今 为止,微处理器、微控制器产量达到l o 多亿片,远远大于个人计算机通用台式机。世 界嵌入式系统硬件和软件开发工具市场价值约2 0 0 0 亿美元,嵌入式系统带来的工业年 产值达一万亿美元,随着全球信息化的发展,嵌入式系统市场将进一步增长。我国信息 化与全面小康社会建设对嵌入式系统市场提出巨大需求,信息家电产品年需求量几亿 台,每一类数字化家电产品都有千万台市场需求量,工业控制用嵌入式系统有百十万台 套需求量,商用嵌入式系统需求量几百万台,我国己有集成电路及p c b 印刷电路板产 品的大批量生产能力,出口的嵌入式应用产品亦将逐步增长,在全球市场也可占有一席 之地,到2 0 0 5 年我国嵌入式计算机将创造干亿元的效益,嵌入式计算机是信息产业新 的经济增长点。 1 2 3 嵌入式系统的发展趋势 以信息家电为代表的互联网时代嵌入式产品,不仅为嵌入式市场展现了美好前景, 注入了新的生命;同时也对嵌入式系统技术,特别是软件技术提出新的挑战。这主要包 括:支持日趋增长的功能密度、灵活的网络联接、轻便的移动应用和多媒体的信息处理, 此外,当然还需对付更加激烈的市场竞争。 ( 1 ) 嵌入式应用软件的开发需要强大的开发工具和操作系统的支持 随着因特网技术的成熟、带宽的提高,i c p 和a s p 在网上提供的信息内容日趋丰富、 应用项目多种多样,像电话手机、电话座机及电冰箱、微波炉等嵌入式电子设备的功能 不再单一,电气结构也更为复杂。为了满足应用功能的升级,设计师们一方面采用更强 大的嵌入式处理器如3 2 位、“位r i s c 芯片或信号处理器d s p 增强处理能力;同时还 基于a r m 9 的网络m p 3 播放器的研究与实现 采用实时多任务编程技术和交叉开发工具技术来控制功能复杂性,简化应用程序设计、 保障软件质量和缩短开发周期。 ( 2 ) 联网成为必然趋势 为适应嵌入式分布处理结构和应用上网需求,面向2 1 世纪的嵌入式系统要求配备标 准的一种或多种网络通信接口。针对外部联网要求,嵌入设备必需配有通信接口,相应需 要t c p i p 协议簇软件支持;由于家用电器相互关联( 如防盗报警、灯光能源控制、影视 设备和信息终端交换信息) 及实验现场仪器的协调工作等要求,新一代嵌入式设备还需 具备i e e e l 3 9 4 、u s b 、c a n 、b l u e t o o t h 或i r d a 通信接口,同时也需要提供相应的通信 组网协议软件和物理层驱动软件。为了支持应用软件的特定编程模式,如w e b 或无线 w e b 编程模式,还需要相应的浏览器,如h t m l 、w m l 等。 ( 3 ) 支持小型电子设备实现小尺寸、微功耗和低成本 为满足这种特性,要求嵌入式产品设计者相应降低处理器的性能,限制内存容量和 复用接口芯片。这就相应提高了对嵌入式软件设计技术要求。如,选用最佳的编程模型 和不断改进算法,采用j a v a 编程模式,优化编译器性能。因此,既要软件人员有丰富经 验,更需要发展先进嵌入式软件技术,如j a v a 、w e b 和w a p 等。 ( 4 ) 提供精巧的多媒体人机界面 嵌入式设备之所以为亿万用户乐于接受,重要因素之一是它们与使用者之间的亲和 力,自然的人机交互界面,如司机操纵高度自动化的汽车主要还是通过习惯的方向盘、 脚踏板和操纵杆。人们与信息终端交互要求以g u i 屏幕为中心的多媒体界面。手写文字 输入、语音拨号上网、收发电子邮件以及彩色图形、图像已取得初步成效。目前一些先 进的p d a 在显示屏幕上已实现汉字写入、短消息语音发布,但离掌式语言同声翻译还 有很大距离。 1 3 嵌入式操作系统概述 随着集成电路规模的不断提高,涌现出大量价格低廉、结构小巧、功能强大的c p u , 给嵌入式操作系统提供了丰富的硬件平台,进而促进了嵌入式操作系统的蓬勃发展。嵌 入式操作系统【4 1 ( e m b e d d e do p e r a t i n gs y s t e m ,e o s ) 是一种支持嵌入式系统应用的操作系 统软件,是软硬件资源的控制中心,负责嵌入式的全部软、硬件资源的分配、调度工作, 控制、协调并发活动,使整个系统变得高效。 嵌入式操作系统具有以下特点1 5 】: ( 1 ) 具备一般操作系统最基本的功能,如任务调度、同步机制、中断处理和文件功 能等。 大连理工大学硕士学位论文 ( 2 ) 可装卸性。开放性、可伸缩性的体系结构。 ( 3 ) 强实时性。可用于各种设备控制。 ( 4 ) 统一的接口。提供各种设备驱动接口。 ( 5 ) 操作方便、简单、提供友好的图形界面g u i 。 ( 6 ) 提供强大的网络功能,支持t c p i p 协议及其它协议,提供t c p u d p i p p p p 协 议支持及统一的m a c 访问层接口,为各种移动计算设备预留接口。 ( 7 ) 强稳定性,弱交互性。 ( 8 ) 固化代码。在嵌入系统中,嵌入式操作系统和应用软件被固化在嵌入式系统计 算机的r o m 中。辅助存储器在嵌入式系统中很少使用。 ( 9 ) 对硬件有良好的适应性,也就是良好的移植性。 比较有影响力的系统有:w i n d o w s c e 、v x w o r k s 、嵌入式l i n u x 和l lc o s i i 等。 ( 1 ) v x w o r k s v x w o r k s 操作系统是美国w i n d r i v e t 公司于1 9 8 3 年设计开发的一种实时操作系统。 v x w o r k s 拥有良好的持续发展能力、高性能的内核以及友好的用户开发环境,在实时操 作系统领域占据一席之地。它以良好的可靠性和卓越的实时性被广泛地应用在通信、军 事、航空、航天等对实时性要求很高的尖端技术领域。 ( 2 ) | c o s 和p c o s i i p c o s i i 是由美国入j e a nj l a b r o s s e 开发的实时操作系统内核,其全部核心代码只 有8 3 k b 。它只包含进程调度、时钟管理、内存管理和和进程间通信与同步等基本功能, 而没有包括i o 管理、文件系统、网络等额外模块。 ( 3 ) w i n d o w s c e m i c r o s o f t 公司的w i n d o w s c e 是为有限资源平台设计的多线程、完整优先权、多任 务的操作系统。它的模块化设计允许它对掌上电脑以及专用工业控制器的用户电子设备 进行定制。操作系统的基本内核大小至少为2 0 0 k b 。 ( 4 ) 嵌入式l i n u x 嵌入式l i n u x 现在有许多版本,包括强实时的嵌入式l i n u x ( r t l i n u x ) 和一般的嵌入 式l i n u x 。其中r t - l i n u x 把普通l i n u x 任务优先级设为最低,而所有实时任务的优先级 都高于普通任务的优先级,以达到既兼容通常的l i n u x 任务,又保证强实时性能的目的。 另一种常见的嵌入式l i n u x 是i i t c l i n u x ,它针对没有m m u 的处理器而设计。它不使用 虚拟内存管理技术,对内存直接访问,所有程序中访问的地址都是实际的物理地址。它 专门为嵌入式系统做了许多小型化的工作。 一0 一 基于a r m 9 的网络m p 3 播放器的研究与实现 1 4 本文的主要工作内容 随着i n t e m e t 技术和电子技术的飞速发展,嵌入式设备在各领域的应用越来越广泛。 m p 3 作为高质量音乐压缩标准,已经给音频产业带来了具大的冲击。m p 3 技术使音乐 数据压缩比率大,回放质量高。如c d 格式的音乐数据压缩成m p 3 格式,音效相差无 己,但大小至少可压缩1 2 倍。由于m p 3 音乐的较小数据量和近乎完美的播放效果使其 在网络上传输得以实现。网络m p 3 系统可广泛应用于星级宾馆的客房音乐系统、长途 巴士、旅客列车以及语音会议和语音教室等公共语音广播应用领域。相信随着网络m p 3 设备及系统工程化过程的不断推进,网络m p 3 将应用于越来越多的消费领域,并将产 生积极的经济效益和社会效益。本研究课题以市场为导向,成果可以直接应用于生产, 增加国民收入,亦可提高国内企业的竞争力,具有重要的研究价值。 本文在研究m p 3 编解码原理和嵌入式系统开发技术的基础上,提出了一套满足要求 的低成本的嵌入式网络m p 3 播放器的解决方案。通过对系统的功能需求分析以及市场 上主流处理器的功能和性能分析,选择了s a m s u n g 公司的$ 3 c 2 4 1 0 处理器和开源的高 质量m p e g 音频解码库m a d 、嵌入式l i n u x 操作系统分别作为系统的硬件和软件开发 平台。 本文内容安排如下: 第一章是绪论部分。主要是对论文的背景,如音频压缩技术介绍、嵌入式系统的发 展历程、嵌入式操作系统等做了简单介绍。 第二章是m p e g 0 1 a u d i ol a y e r 3 音频编解码算法。详细论述了m p 3 编解码算法的原 理以及编解码的主要过程和各个模块的处理方法。 第三章是系统开发平台的构建。主要介绍了嵌入式操作系统开发所用到的软硬件开 发工具、嵌入式l i n u x 操作系统以及系统平台的构建。 第四章是网络m p 3 播放器的设计与实现。首先通过对网络m p 3 播放器各个功能模 块进行分析设计,然后软件编写网络m p 3 播放器实现对本地和网络f 口下载播放m p 3 音频文件。 第五章是系统功能的测试。对开发的网络m p 3 播放器网络下载功能和系统资源使用 率以及m p 3 音频文件播放音质效果进行测试。 最后,对论文进行了总结和展望。 大连理工大学硕士学位论文 2m p e g - 1 a u diol a y e r 3 音频编解码算法 2 1m p e g - 1 a u diol a y e r 3 编解码算法概述 m p 3 就是采用国际标准m p e g 中的第三层音频压缩模式,对声音信号进行压缩的一 种格式,中文也称”电脑网络音乐。m p e g 中的第三层音频压缩模式比第一层和第二层 编码要复杂得多,但音质最高,可与c d 音质相比。m p e g o l 音频压缩标准是第一个高 保真音频数据压缩标准。除了a c 3 之外,其他的音频压缩算法只适用于语言( 如码激励 线性预测c e l p ) 或只有中等的压缩质量( 如自适应差分脉冲编码调a d p c m ) 。m p e g - 1 音频压缩标准虽然是m p e g 1 标准的一部分,但它完全可独立应用。 为保证其普遍适用性,m p e g 1 音频压缩标准具有以下特点【6 】: ( 1 ) 音频信号采样频率可以是3 2 k h z ,4 4 1 k h z 或4 8 k h z 。 ( 2 ) 压缩后的可比特流支持单声道模式、双一单声道模式、立体声模式和联合立体 声模式4 种模式。 ( 3 ) 压缩后的比特流具有预定的几种比特率之一。此外,m p e g 1 音频标准也支持用 户使用预定的比特率之外的比特率。 ( 4 ) m p e g 1 音频标准提供三个独立的压缩层次,使用户可在复杂性和压缩质量之间 权衡选择。 ( 5 ) 编码后的比特流支持循环冗余校验c r c ( c y c l i cr e d u n d a n c yc h e c k ) 。 ( 6 ) m p e g 1 音频标准还支持在比特流中载带附加信息。 2 2m p e g - 1 a u diol a y e r 3 编码算法 m p e g 1 a u d i ol a y e r 3 压缩编码器【7 - 9 1 的原理方框图如图2 1 所示。编码过程是这样 的:以单声道而言,m p 3 的一个编码框包含11 5 2 个音频采样信号( 一个编码框相当于2 个块,每个g r a n u l e 包含5 7 6 个音频采样信号) ,每个采样点为1 6 位。m p 3 编码时,首 先将原始输入的1 6 - b i tp c m 采样点经过滤波器组分析( f i l t e rb a n ka n a l y s i s ) ,转换成3 2 个等频宽的子频带信号( s u b b a n ds i g n a l s ) ,然后通过修正离散余弦转换o v l d c t ,m o d i f i e d d i s c r e t ec o s i n et r a n s f o r m ) ,将每个子频带信号再细分为1 8 个次频带,然后根据第二心 理声学模型( p s y c h o a c o u s t i cm o d e li i ) 所提供的音频信号信遮比( s m r ,s i g n a l - t o - m a s k r a t i o ) ,对每一个子频带信号做位分配及量化编码,最后只要将编码后的数据依照 m p e g 1 定义的位串形式输出即可。 基于a r m 9 的网络i v l p 3 播放器的研究与实现 ( 频信p c m ) 息。眄习。 。 非线性 比 。l 子带i 。i 一。,i 。 ,b - l 7 量化与 【。一l 一比特率 特 控制 流 格 式 jk 及 纠 错 1 0 2 4 个采 心理 样值的 - 4 声学 边信息 f f t 模型 编码 图2 1m p e g i a u d i ol a y e r 3 编码流程图 f i g 2 1 f l o wc h a r to f m p e g - 1 a u d i ol a y e r 3e n c o d e r 流 2 2 1 混合多相滤波器组 混合多相滤波器【1 0 - 1 1 ( h y b r i dp o l y p h a s e f i l t e rb 锄k ) 的作用是将输入的时域p c m 码流 转化为分为若干子带的频域值。混合多相滤波器组是由多相滤波器组( p o l y p h a s ef i l t e r b a n k ) 和m d c t 滤波器组合而成的,如图2 2 所示。 图2 2 子带滤波器组与m d c t 滤波器 f i g 2 2 s u b - b a n df i l t e rb a n ka n dm d c tf i l t e r m p e g - 1 a u d i ol a y e r 3 使用多相滤波器来做信号的子频带分析,当音频信号输入多 相滤波器之后会被转成3 2 个等频宽的子频带信号。每输入3 2 个p c m 信号做一次滤波 一8 一 大连理工大学硕士学位论文 组分析,然后可以得到3 2 个输出( 每一个子频带有一个结果) ,由于一个编码框有1 1 5 2 个p c m 信号,所以共需要3 6 次的子频带分析。 m d c t 滤波器【1 2 1 对多相滤波器组造成的滤波缺陷作出补偿,和多相滤波器一同构成 混合滤波器,混合滤波器可以针对信号特性进行较好的匹配( 比如依赖于信号特性的长 短块转换) 。m d c t 滤波器将3 2 个子带中每一个子带的信号在频域上进一步划分,长块 进行1 8 点( 1 8 个频域采样点) 的m d c t 变换,短块进行6 点( 6 个频域采样点) 的m d c t 变换。 长块是指对1 8 个采样点进行一次m d c t 变换的一组采样值。在相同的频域范围内, 由于长块的采样值更多,所以会有更高的“频域分辨率”。而相对的,由于是对1 8 个点 进行运动平均凹硼玎i n ga v e r a g e ) 的原因,在时间上变化的处理就不如短块( 只有6 个点) 来得及时,准确,所以会有更低的“时域分辨率”。每一个子带的1 8 个频域采样值组成 的长块被m d c t 滤波器转化成为l8 个频域系数,总共得到3 2 8 = 5 7 6 个频域系数( 也要 频率线) 。每个系数代表了在4 8 k h z 采样率下的4 1 6 7 h z 的带宽。相邻的转换窗会有5 0 的重叠,所以窗的长度为3 6 个采样点。 短块有更高的时域分辨率,即对短时间变化较大的声音能有更精确的拟合能力。每 个子带被转化为6 个频域参数,总共得到3 2 x 6 = 1 9 2 个频域系数( 也叫频率线) ,每个系 数代表了4 8 k h z 采样率下的1 2 5 h z 的带宽。同上,相邻的转换窗会有5 0 的重叠,所 以窗的长度为1 2 个采样点。 窗框的选择是依据第二心理声学模型分析信号特性之后所得到的信息,在一般信号 稳定的情形下,使用长窗框提供最细的频谱分辨率,然而当子频带信号变动大时,需变 化窗框长度以提供较精细的时间分辨率,以控制前回音噪声不被人耳察觉。 2 2 2 心理声学模型 m p e g 1 a u d i ol a y e r 3 之所以能够达到高压缩率并维持一定的声音质量,最主要的 是原因是它采用了心理声学模型【1 3 1 6 】来仿真人耳的听觉。利用人耳听觉感知上形成的掩 蔽效应所得到的掩蔽门坎曲线决定各个子带所容许的最大量化误差,使得量化后的失真 能不被人耳听觉感知。m p e g 1 a u d i ol a y e r 3 提供了两个心理声学模型,对于任一层都 可使用。其中第一心理声学模型较为简单,适用于高传输率。第二心理声学模型则比较 复杂,在较低传输率的情况下,也能维持较好的声音质量。此两模型都要先将信号经傅 立叶频谱变换,再对应到临界频带,并区分出单频及非单频成分,依其所在的频率位置 与强度大小,分别计算掩蔽门坎曲线,而整合成整体掩蔽门坎曲线,并对应成每个子频 带信号编码时所需的位数。入耳的听觉特性:人耳对信源的掩嗓能力与信号的能量大小、 一9 一 基于a r m 9 的网络m p 3 播放器的研究与实现 信号的频率位置以及信号的特性都有关系。能量大的信号能掩蔽较大的噪音、非单频信 号的掩噪性要比单频信号的好,而高频信号的掩蔽效应比低频信号的要强。此外,掩噪 能力也与噪声的频率位置以及噪声发生的时间有关。对于同一信号而言,对高频噪声的 掩噪能力优于低频,对其后发生的噪声的掩噪能力要优于其前发生的噪声。 而心理声学模型应用在m p 3 的目的是使得m p 3 编码变换所造成的声音质量损失是 “不可察觉的。m p 3 编码是一种有损编码,这是因为要想让m p 3 文件方便传输、携带, 文件必须缩小。关键的问题在于,如何使得在文件缩小的同时还能最大程度地保证声音 质量。从m p 3 的普及程度来看,m p 3 编码很好的做到了这一点。而这里的关键技术就 在于心理声学模型的引入。心理声学模型是大量听觉实验的结果抽象出来的一种算法。 它的核心在于对输入的一组采样值计算出可允许即不可察觉的量化误差。 ( 1 ) 临界带( c r i t i c a lb a n d 又称为临界频带) 临界带是指用噪声产生人刚好能听到的某个频率时,噪声的频带宽度,也就是说仅 有频率分量落入某个临界带中时,人才能感受到这个频率。人的耳朵能感受许多不同的 频率,也即入耳的听觉频谱可划分成为不同的i 临界带,在相同的临界带中人的听觉感知 能力是相似的,即觉得在这一范围内的声音频率是相似的。这样,在大量实验后,在2 0 h z 到2 0 k h z ( 人的听觉上下限) 之间就划分出了2 5 个不同的临界带。临界频带频谱如图2 3 所示。 霄 毛 专 善 磊 竺 墨 芑 。 图2 3 临界频带频谱 f i g 2 3 c r i t i c a lb a n ds p e c t r u m 大连理工大学硕士学位论文 ( 2 ) 绝对听觉阈值 在不同频率下人耳能察觉到的响度是不一样的,如果在2 0 h z 到2 0 k h z 之间某一频 率对应的响度值太低,人耳就不能听到,人耳刚好能够听到的这一响度值被称为绝对听 觉阈值。绝对听觉阈值的频谱如下图2 4 所示。 二、 里 复 至 l 童 们 f 怕昏糟n c y0 1 z ) 图2 4 绝对听觉阈值 f i g 2 4 a b s o l u t e n e s sa c o u s t i ct h r e s h o l d ( 3 ) 掩蔽效应( m a s k i n ge f i e c t ) 掩蔽效应简单的说是指原本人耳能听到的声音因为声音信号间的互相影响而变得听 不到了。掩蔽效应是人耳听觉系统的一个重要特性,正是因为这个效应的存在,使得 m p 3 编码去除了大量的人耳察觉不到的信息,因此声音信号编码在大幅度缩减后还能保 证人耳几乎察觉不到的音质损失。掩蔽效应分为两种,时域掩蔽和频域掩蔽。 时域掩蔽( t e m p o r a lm a s k i n g ) 时域掩蔽是指两个声音信号因为在时间上的相邻性而发生掩蔽效应。时域掩蔽又分 为三种:前掩蔽( p r e - m a s k i n g ) 、同时掩蔽( s i m u l t a n e o u sm a s k i n g ) 和后掩蔽( p o s t m a s k i n g ) 。 分别对应于原始信号对于干扰信号所处的三种不同位置,如图2 5 所示。 基于a r m 9 的网络m p 3 播放器的研究与实现 5 0d5 01 0 0 ;d5 01 0 0 m s1 5 0 2 0 0 i t i m ea f t e rm a s k e ro n s e t :d e l a y t i m e 图2 5 时域掩蔽 f i g 2 5t e m p o r a lm a s k i n g 图2 5 表示了一个m a s k e r 信号对于在它前面的信号,和它同时的信号,在它之后的 信号的影响强度。同时掩蔽部分,声音信号将被掩蔽。后掩蔽比前掩蔽的时间更长,影 响更大。由图2 5 可见,后掩蔽对信号的影响时间持续了超过1 6 0 m s ,而前掩蔽仅持续 了2 0 m s 。 频域掩蔽( f r e q u e n c ym a s k i n g ) 频域掩蔽效应指的是在具有相邻频域的信号也会发生掩蔽效应。一个声音信号如果 它的声压超过了绝对听觉阈值,则将会被人耳听到,但如果跟它频率相近而声压更大的 声音信号存在,则将可能会变得不可察觉,如下图2 6 所示。 从图2 6 中可以看到绝对听觉阈值( t h r e s h o l di nq u i e t ) 、没有被掩蔽的声音信号 ( n o n - m a s k e ds o u n d ) 、掩蔽信号( m a s k e r ) 、掩蔽阈值( m a s k i n gt h r e s h o l d ) 、被掩蔽的声音 信号( m a s k e ds o u n d ) 。可以看到,掩蔽信号改变了入耳能够听到的听觉阈值,只有高于 掩蔽阈值( m a s k i n gt h r e s h o l d ) 的声音才可以被听到,低于掩蔽阈值的声音人耳不能察觉。 于是m p 3 的心理声学模型将丢弃不可昕到的紫色声音信号,而对于可以听到的绿色声 音信号仅对其在掩蔽阈值以上的部分进行编码,使得编码效率大大提高。 矾g器臣鲁_2_一厶b) 大连理工大学硕士学位论文 旷1 0 。 fr e q u e n c y ( h z 】 嘲26 额域掩蔽 f i g2 6f r e q u e n c y m 舾k l n g ( 4 ) 心理声学模型i j 的处理流程 对输入的1 1 5 2 个信号的每一半进行一个1 0 2 4 点的f f i ,选择两半中最低的个 掩蔽闽值作为此子带的掩蔽闽值。 每个频率线均被映射到其对应的临界频带j :。 计算乐音指数。 使用个定义好的扩展函数来计算每个声音信号对相邻临界频带的掩蔽效应。 计算每个子带最终的掩蔽闽值。 计算每个子带的信掩 g ( s m r ,s i g n a l - t o - m a s kr a t i o n ) 井将信息传递给量化器。 223 量化 量化的m p 3 采用的是非均匀量化 1 7 - 1 8 ( n o n u n i f o r mq u a l i z a t i o n ) 。这里的非均匀指的 是量化的时候是一种非线性的量化关系,m p 3 压缩采用的公式如下。 ( 扣h i n t ( ( 罢凳篓) 。”_ 0 0 9 4 6 ) 犯1 ) 菌p)jn|a;jlsa在宅no 基于a r m 9 的网络m p 3 播放器的研究与实现 其中i x ( i ) 是量化前的频域响度,可以看到它和输出的量化值i x ( i ) 是非线性关系,n i n t 指四舍五入地取整数,s t e p s i z e 是要调整的量化步阶,可由下式求得: s t e p s i z e = s y s t e m c o n s 幸l n ( s f m )( 2 2 ) 其中 一誊i 而n x r ( o ( 2 ) ( 2 3 ) 量化主要的时间复杂度在于高整量化步阶,由于其输出不能高于1 4 ( 哈夫曼量编码 表最大值) + 8 1 9 1 ( 哈夫曼编码最
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 养殖金融投资合作创新创业项目商业计划书
- 智能家居场景识别与控制大模型创新创业项目商业计划书
- 农畜产品品牌农产品品牌保护创新创业项目商业计划书
- 2025年工具钳工(初中高级)证考试练习题库(含答案)
- 物联网智能设备故障诊断创新创业项目商业计划书
- 电脑硬件降噪创新创业项目商业计划书
- 现场急救知识培训的意义
- 2025年消费与零售行业食品行业可持续发展报告
- 2025年工业互联网平台入侵检测系统数据挖掘与分析优化研究
- 2025年教育行业投资并购风险控制与整合策略报告001
- 高职计算机专业《Python程序设计》说课课件
- 2024年小学六年级上册体育教案全册
- 宣传片拍摄保密协议(2024版)
- 医疗设备采购招标投标文件格式
- 离婚协议书与离婚协议书
- 房屋出租委托协议
- 加装电梯业主同意协议书
- 医疗器械经销商管理
- 非居民金融账户涉税信息尽职调查管理办法
- 拓扑优化教学课件
- 孕期营养需求指南
评论
0/150
提交评论