已阅读5页,还剩66页未读, 继续免费阅读
(控制理论与控制工程专业论文)基于dsp的音频编解码系统的设计与算法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
武汉理工大学硕士学位论文 摘要 m p e g 活动图像专家小组 是i s o i e c 的一个工作小组 负责制定有关活 动图像 音频及其组合的压缩 解压缩处理等方面的技术标准 m p e g 一1l a y e r 3 m p 3 是m p e g 一1 国际音频标准 i s o d c e1 1 1 7 2 的第三层编 解码算法 它具有压缩比高 声音还原质量好 算法复杂度适中等优点 利用这种标准制 作的m p 3 格式的音乐在数字音频的存储 互联网上的多媒体音视频传输等领域 得到了广泛的应用 基于以上背景 论文通过研究 分析 提出了基于d s p 的音频编解码系统 的设计与算法研究这一研究课题 本课题的主要目的是 以n 公司的c 5 0 0 0 系 列通用型d s p 芯片 t m s 3 2 0 v c 5 4 0 2 为核心 完成系统硬件平台的设计与实现 研究m p 3 的编 解码算法以及其在该硬件平台上的d s p 实现 整个系统的硬件 平台包括d s p 核心模块 f l a s h 存储器 音频c o d e c u s b 通信等模块 该 系统通过u s b 接口同p c 机通信 下载m p 3 格式的数据流 并将其存储在f l a s h 中 然后由d s p 读取f l a s h 中的m p 3 数据流 完成解码工作 并通过c o d e c 播放 同时可以对d s p 进行其它编 解码算法的软件编程 实现多种数据流格 式的音频编 解码 具有很强的软件升级的灵活性 整个课题研究完成的主要工作包括 其一 经过原理图设计 p c b 设计 p c b 制板到主芯片及其它元器件的焊接等步骤 完成了对m p 3 解码系统硬件平台的 设计与实现 详细介绍了硬件平台中各功能模块接口的硬件调试方法 针对容 易出现的问题进行了研究分析 开发了系统的驱动及应用程序 其二 对m p 3 编 解码算法的基本原理及编 解码的过程进行了详细的分析和研究 重点研 究了m p 3 的解码算法 并对算法中的h u f f m a n 解码模块以及i m d c t 变换模块 进行了改进 优化 通过从p c 机模拟实现到d s p 芯片编程实现 在1 1 公司的 d s p 集成开发环境c c s 2 0 中进行软 硬件的联合调试 完成了基于d s p 的m p 3 解码算法的设计与实现 关键词 m p e g 编解码 d s p m p 3 武汉理上人学硕士学位论文 a b s r r a c t m p e g m o v i n gp i c t u r ee x p e r t sg r o u p i saw o r k g r o u po fi s o i e cr e s p o n s i b l e f o rp r o p o s i n gt h et e c h n o l o g ys t a n d a r do fm o v i n gp i c t u r e s a u d i oa n dt h ec o m p r e s s i o n a b s t r a c t i o n a n de x t r a c t i o no ft h e i rc o m b i n a t i o n m p e g 1l a y e r 3 m p 3 w h i c hh a s t h eh i 曲c o m p r e s s i o nr a t i o g o o d r e s t o r i n gq u a l i t y f o rv o i c ea n di m m e d i a t e c o m p l e x i t y i st h et h i r dl a y e re n c o d i n g d e c o d i n ga l g o r i t h mo ft h ei n t e r n a la u d i o s t a n d a r d i s o i c e1 1 1 7 2 m p 3m u s i cm a d eb a s e do nt h i ss t a n d a r di sw i d e l yu s e di n t h ef i e l d so fd i g i t a la u d i or e s t o r a t i o na n dm e d i aa u d i o v i d e ot r a n s m i s s i o ni ni n t e r n e t b a s e do nt h ea b o v eb a c k g r o u n d t h r o u g hr e s e a r c h i n ga n da n a l y z i n gw ep r o p o s e d t h er e s e a r c ht o p i cb a s e do nt h ed e s i g na n da l g o r i t h mo fa u d i oe n c o d i n g d e c o d i n g s y s t e m t h ep u r p o s eo ft h i st o p i ci s c o m p l e t i n gt h ed e s i g na n dr e a l i z a t i o no ft h e w h o l es y s t e m sh a r d w a r ep l a n em a i n l yr e f e r st ot h ea l l p u r p o s ed s pc h i po ft i c o m p a n y sc 5 0 0 0s e r i e s t m s 3 2 0 v c 5 4 0 2 r e s e a r c h i n g0 1 1m p 3 se n c o d i n g d e c o d i n g a l g o r i t h ma n dt h ed s p r e a l i z a t i o no ni t sh a r d w a r ep l a n e t h ew h o l es y s t e m sp l o n e i n c l u d e sm i n i m u ms y s t e mo fd s p f l a s hs t o r a g e a u d i oc o d e ca n du s b c o m m u n i c a t i o n e t c t h es y s t e md o w n l o a d st h ed a t as t r e a mo fm p 3f o r m a tt h r o u g h t h ec o m m u n i c a t i o nb e t w e e nu s bi n t e r f a c ea n dp c s t o r e st h e mi nf l a s ha n dt h e n r e a dt h em p 3d a t as t r e a mi nf l a s hb yd s p f i n i s h e sd e c o d i n ga n dp l a y sw i t hc o d e c m o r e o v e r t h es y s t e mc a na l s 0p r o g r a mf o rt h eo t h e re n c o d i n g d e c o d i n ga l g o r i t h m s f o rd s p r e a l i z e st h ea u d i oe n c o d i n g d e c o d i n gf o rv a r i o u sf o r m a to fd a t as t r e a ma n d h a sav e r yg o o df l e x i b i l i t yf o ru p d a t i n gs o f t t h ew o r ko ft h ew h o l et o p i ch a sd o n ei n c l u d e st h ef o l l o w i n g f i r s t l y a c c o r d i n g t ot h ed e s i g no ft h e o r yd i a g r a ma n dp c ba n dt h ep r o c e s s i n go fm a k i n gp c bt ot h e m a i nc h i pa n dt h ew e l d i n go fo t h e rd e v i c e s f i n i s h e st h ed e s i g na n dr e a l i z a t i o no f h a r d w a r ep l a n ef o rm p 3d e c o d i n gs y s t e m a n di n t r o d u c e si nd e t a i la b o u tt h eh a r d w a r e d e b u g g i n gm e t h o df o re v e r ym o d e li nt h eh a r d w a r ep l a n e i l l u m i n a t e st h ep r o b l e m s t h a te a s i l yc o m e sa c r o s sa n dd i s p l a y ss o m ep a r to ft h ed e b u g g i n gp r o g r a m s e c o n d l y a n a l y s e s a n dd o e sr e s e a r c h e sf o rt h eb a s i c p r i n c i p l e o ft h e p r o c e s sf o r e n c o d i n g d e c o d i n gm p 3 w ef o c u so nt h ed e c o d i n ga l g o r i t h mf o rm p 3 i m p r o v ea n d i i 武汉理上大学硕士学位论文 o p t i m i z et h eh u f f m a nd e c o d i n gm o d e la n dt h ei m d c tc h a n g i n gm o d e l f r o mt h e s i m u l a t i o no np ct ot h ep r g g r a m m i n gr e a l i z a t i o no nd s p c h i p w ed e b u gf o rb o t h 鲫d s o f t w a r ea n dh a r d w a r ei nt h ed s p a s s e m b l ed e v e l o p i n ge n v i r o n m e n to fc c s 2 0b yt i c o m p a n ya n dc o m p l e t et h ed e s i g na n dr e a l i z a t i o no fm p 3d e c o d i n ga l g o r i t h mb a s eo n t h e d s p k e yw o r d s m p e ge n c o d e d e c o d e d s p m p 3 1 1 1 武汉瑗王大学矮童 学位论文 1 1 课题概述 1 1 1 课题研究的背景 第1 章绪论 伴随羞国际互联髓 信息产渡的飞遮发展 数字技术的出现与应麓为人炎带 来了深远魏影穗 天键如今已璧溪农一令兄乎数字证的整暴之中 嚣数字镑频 按零翔蘸褥上是痤趸羲为广泛黪数字技寒之一 c d v c d 等莩毫走遗子窳万户 数字毒艺广播正在垒球范蠢内逐步褥捌开展 同时 与之程关的数字音频挺鼷技 术也得到了充分的发展 数字音频压缩技术指的是对原始数字音频信号流 p c m 编码 运用适当的 数字信号处理技术 在不损失脊阁信息最 或所引入损失可忽略的条件 f 降 低 压缩 其码率 也称为压缩编码 它必须具有相应的逆变换 称为锵压镏 成解码 为什么要压缩呢 数字音频是对模拟声音信号镣秒上千次酶采样 然后把每个样俊按一定的魄 特数量铯 最矗得至4 栝准豹数字裔颧瓣秘浚 对c d 音质静售号来谫 簿移器 4 4 1 0 0 次戆采襻 每令撵篷楚1 6 魄姆豹嚣弦 瑟立落声c d 毒矮筵号 宅簿秒 貔羁流是4 4 i k x l 6 x 2 1 4 m b i t s 送释藏豹码流窝容量 对予数字哲频麓存赣 处理和传输提出了很高的要求 对鬻频压缩的研究 是扶研究入耳豹昕感系统 开始的 首先第一个特点是人鲜对备频率的灵敏度是不同的 在2 k 4 k 频段 很低的电平就能被人耳听到 其他频段时 相对要高一点的电平才能听剥 这 就是说在听觉阂值以下的电平可以去摊 相当于压缩了数据 第二个特点就是 频率之间的掩蔽效应 其实就是指人群接收信号时 不同频率之间的相互干扰 当电平高的频率点和电平相对来说较 氐的不同频率点同时出现时 电平低的频 率点的声音将听不到 因为人耳的爱敏度不一样 所以不同频率点的掩蔽稷度 是不一样的 低子掩蔽阕僮黪馁跨姆不编码 裹予掩蔽阙值的信号将囊巍分酝 量铯篦褥傻 实藏压绫 这是醚溉g 簸霉至l 鞍毫熬压缀篦 又簸缳涯鸯凌豹霾 武汉理l 人学硕士学位论文 要原因 第三个特点是指短暂掩蔽效应 指猩一个强信号之前或之后的弱信号 墩会被遮蔽掉 这样测瘸入耳的感觉特鼗 对数据流本身进行题缠 徽到骶能 转低褥滚 又麓逶过稀攀戆压缠方法捷菇弱滚懿效率 瑟又不影稳音矮率蜜 完全了解了入耳豹特散衙 就会知道入耳实际上可看成一个多频段的昕感分析 器 在接收端的最后 它对瞬间的频谱功率进行了重新分配 这就为音频的数 据服缩提供了依据 隧黄i n t e r a c t 和多媒体技术的迅猛发展 对音频数据压缩的研究和应用也正 蓬赣发震起来 人键郝程获投夔磅究帮矛发爨有裹藏垂缤毙戮及离震量声音还 琢盼编 解码算法 溺时 各种数码娱躁消费产品也越来越受到人们酌关注 它热有的便携性 娱球性 和经济性等优点更是受到人们特别怒年轻人的狂热 追捧 于是各种新型的消费类数码产品层出不穷 最具代表性的就是一便携式 m p 3 播放器 它有着极大的市场前景 并逐渐朝着低价格 赢性能的方向发展 零谂文懿疆究谋逶 鏊予d s p 豹音频编麟璐系统瓣最诗与算法疆究 正爰在这 个鹜景下提出来酶 1 1 2 课题研究的目的及意义 传统的m 略播放器是以硬件解码方案为主的 它们采用专用黪啻频解码芯 篾 蠹接凌r a p 3 解璐嚣法霾纯蘩葱片孛 然惹配合躅逮静控铡 显示及逶售电 路完成整个播放器的系绞设计 髫翦m p 3 髂码芯片的晶牌主黉霄p h i l i p s s i g m a t e l t e l e c h i p s 和s u n u s 每一个品牌都有多款解码芯片可供选择 而且价 格也因品牌和芯片本身不同而不同 但是 总体来说专用的音频解码芯片的价 格遥是比较昂贵 而敷算法的固化对以后的软件升级也不利 掰默此种硬件解 璐方案兹疆藏器存在卷侩格裹鼓及舞级灵滔髓差瓣弊臻 予楚 我翻结合蜜鼯议及当前出现豹掰技术 提出了馥d s p d i g i t a ls i g n a l p r o c e s s o r 即数字信号处理器 为核心c p u 构建硬件平台 并基于d s p 实现m p 3 的软件解码算法的研究课题 此种m p 3 解决方案是以软件解码为主并兼顾软件 升级特性的一种全新r a p 3 解决方案 它的性价比以及软件升级凝活性都大大优 予倦绫的硬传麟码豹r a p 3 攒敖器 本文就怒隧j 避秘方案来宠戏熬令r a p 3 撵敖器 鹣设谤的 为什么要选择d s p 作为核心c p u 来构建硬件平台昵 2 武汉理j 大学硕士学位论文 i t 领域的科技成果普遍的应用于视音频领域大大地推动了视音频科技的进 步 其中d s p d i 西t a ls i g n a lp r o c e s s o r 即数字信号处理器 在音频领域内的应 用就是一个很好的例子 传统的模拟视音频产品如今逐渐退出 采用数字化技 术及其相应产品已呈不可抵挡的趋势 数字化的视音频产品必将涉及将类比信 号转换成数字信号后加以传输的问题 而在这种转换的过程中需要做大量的数 学运算 因此必须选择运算快速的微处理器才能完成实时 r e a l t i m e 的数字信 号处理 而市面上的微处理器有成百上千种 各有其特色及对应的应用场合 d s p 以其特有的优势更加适合于完成上述任务 本课题研究的目的就是以当今非常热门的数字信号处理器 d s p 为核心 c p u 构建目前比较流行的数码消费品 便携式m p 3 播放器 首先完成整个系统 的硬件平台设计与实现 然后在硬件平台上设计和实现m p 3 的解码算法 研究的意义在于 以高性能的d s p 芯片为核心c p u 设计全新的硬件平台 提出一套实用的音频编解码系统解决方案 并在该硬件平台上完成m p 3 解码算 法 实现便携式r a p 3 播放器的主体功能1 1 2 音频压缩技术的发展和现状 对音频压缩技术的研究和应用由来已久 如a 律 u 律编码就是简单的准瞬 时压扩技术 并在i s d n 话音传输中得到应用 对语音信号的研究发展较早 也 较为成熟 并已得到广泛应用 如自适应差分p c m a d p c m 线性预测编码 l p c 等技术 在广播领域 n i c a m n e a ri n s t a n t a n e o u sc o m p a n d e da u d i o m u l t i p l e x 准瞬时压扩音频复用 等系统中都使用了音频压缩技术 1 2 1 音频压缩算法的分类及典型代表 音频压缩算法分很多种 如图1 1 所示 一般来讲 可以将音频压缩技术分 为无损0 0 s s l e s s 压缩及有损 1 0 s s y l 压缩两大类 而按照压缩方案的不同 又可将 其划分为时域压缩 变换压缩 子带压缩i i 以及多种技术相互融合的混合压缩 等等 各种不同的压缩技术 其算法的复杂程度 包括时间复杂度和空间复杂 度 音频质量 算法效率 即压缩比例 以及编解码延时等都有很大的不同 各种压缩技术的应用场合也因之而各不相同 武汉理工人学硕士学位论文 音 频 压 缩 方 法 码臣 ir 码邑 r 白适应变换编码a t c l 子带编码 一 1 时域压缩 或称波形编码 技术 时域压缩技术是指直接针对音频p c m 码流的样值进行处理 通过静音检测 非线性量化 差分等手段对码流进行压缩 此类压缩技术的共同特点是算法复 杂度低 声音质量一般 压缩比小 c d 音质 4 0 0 k b p s 编解码延时最短 相 对其它技术 此类压缩技术一般多用于语音压缩 低码率应用 源信号带宽小 的场合 时域压缩技术主要包括 2 7 1 1 a d p c m l p c c e l p 以及在这些技 术上发展起来的块压扩技术如n i c a m 子带a d p c m s b a d p c m 技术如g 7 2 1 g 7 2 2 a p t x 等 2 子带压缩技术 子带压缩技术是以子带编码理论为基础的一种编码方法 予带编码理论最早 是由c r o c h i e r e 等于1 9 7 6 年提出的 其基本思想是将信号分解为若干子频带内的 分量之和 然后对各子带分量根据其不同的分布特性采取不同的压缩策略以降 4 缩 缩 压 压 损 损 有 无 厂 iiillj lll lll 武汉理工大学硕十学位论文 低码率 通常的子带压缩技术和下面介绍的变换压缩技术都是根据人对声音信 号的感知模型 心理声学模型 通过对信号频谱的分析来决定子带样值或频域 样值的量化阶数和其它参数选择的 因此又可称为感知型 p e r c e p t u a l 压 缩编码 这两种压缩方式相对时域压缩技术而言要复杂得多 同时编码效率 声音质量 也大幅提高 编码延时相应增加 一般来讲 子带编码的复杂度要略低于变换 编码 编码延时也相对较短 由于在予带压缩技术中主要应用了心理声学中的声音掩蔽模型 因而在对信 号进行压缩时引入了大量的量化噪声 然而 根据人类的听觉掩蔽曲线 在解 码后 这些噪声被有用的声音信号掩蔽掉了 入耳无法察觉 同时由于予带分 析的运用 各频带内的噪声将被限制在频带内 不会对其它频带的信号产生影 响 因而在编码时各子带的量化阶数不同 采用了动态比特分配技术 这也正 是此类技术压缩效率高的主要原因 在一定的码率条件下 此类技术可以达到 完全透明 的声音质量 e b u 音质标准1 子带压缩技术目前广泛应用于数字声音节目的存储与制作和数字化广播中 典型的代表有著名的m p e g 1 层l 层i i m u s i c a m 以及用于p h i l i p sd c c 中 的p a s c p r e c i s i o n a d a p t i v es u b b a n dc o d i n g 精确自适应予带编码1 等 3 变换压缩技术 变换压缩技术与子带压缩技术的不同之处在于该技术对一段音频数据进行 线性 的变换 对所获得的变换域参数进行量化 传输 而不是把信号分解 为几个子频段 通常使用的变换有d f t d c t 离散余弦变换 m d c t 等 根 据信号的短时功率谱对变换域参数进行合理的动态比特分配可以使音频质量获 得显著改善 而相应付出的代价则是计算复杂度的提高 变换域压缩具有一些不完善之处 如块边界影响 预回响 低码率时声音质 量严重下降等 然而随着技术的不断进步 这些缺陷正逐步被消除 同时在许 多新的压缩编码技术中也大量采用了传统变换编码的某些技术 有代表性的变换压缩编码技术有d o l b y a c 2 a t t 的a s p e c a u d i o s p e c t r a lp e r c e p t u a le n t r o p yc o d i n g p a c p e r c e p t u a l a u d i oc o d e r 1 3 1 等 武汉理t 大学硕士学位论文 1 2 2m p e g 音频压缩技术的发展 现状及算法标准 m p e g m o v i n g p i c t u r e se x p e l sg r o u p m 是动态图象专家组织的英文缩写 这 个组织始建于1 9 8 8 年 是致力于建立和制定视频和音频压缩标准的国际组织 该组织于1 9 9 2 年正式推出了具有1 5 m b i t s 比数据传输率的数字存储媒体运动图 像及其伴音的m p e g 1 的标准草案 即i s o i e c l l l 7 2 于1 9 9 3 年正式通过 该 标准规定了数字音视频编码的国际标准 主要包括三个方面 系统 视频和音频 视频压缩仅仅包含画面信息 音频压缩包含声音信息 系统实现音频和视频的 同步 所有播放m p e g 视频压缩数据和音频压缩数据所需的时钟信息都包含在 系统流中 其中音频编码可以独立使用 今天我们所泛指的m p e g x 版本 是指一组由i t u i n t e r n a t i o n a l t e l e c o m m u n i c a t i o n su n i o n 和i s o i n t e r n a t i o n a ls t a n d a r d so r g a n i z a t i o n 制定 发布的视频 音频 数据的压缩标准 m p e g 的制订者们原先打算开发四个版本 m p e g 1 一m p e g 一4 以适用于不 同带宽和数字影像质量的要求 后由于m p e g 一3 被放弃 所以现存只剩下三个 版本 m p e g l m p e g 2 和m p e g 4 目前 m p e g 已经完成了m p e g 1 m p e g 2 m p e g 4 第一版的音频编码等方面的技术标准 正在制定m p e g 4 的第二版 m p e g 一7 及m p e g 一2 1 的音频编码技术标准 q 总体来说 m p e g 在 这三个方面都优于其他压缩 解压缩方案 首先 由于在一开始它就是作为一 个国际化的标准来研究制定 所以 m p e g 具有很好的兼容性 其次m p e g 能 够比其他算法提供更好的压缩比 最高可达2 0 0 1 更重要的是 m p e g 在提供 高压缩比的同时 对数据的损失很小 1 m p e g 一1 音频标准 m p e g l 音频标准写在1 8 0 i e c1 1 1 7 2 1 6 标准的第三部分 简称i s o i e c 1 1 1 7 2 3 规定 1 应用 直接播放数据传输率为1 5 m b i t s 的c d r o m 记录载体为光盘和磁存储介质 包括磁带 磁盘 的非交错音视频格式的数 据 以支持与v h s 质量相当的影音光盘v c d v i d e oc o m p a c td i s c 其声 音有一路立体声输出活两个声道分别存储原唱和伴唱 武汉理j 人学硕士学位论文 用于数字声音广播 d a b 的源编码 用于低比特率的音频传输的应用 如1 s d n 宽带网传输 特别是目前在因特 网上盛行的m p 3 m p e gl a y e ri l i 由于m p 3 传输速度快 应用范围广 音质满足要求 已成为热门的娱乐资源 2 特点 支持采样率为3 2 k i i z 4 4 1 k h z 4 8 k h z 的单声道 m o n o 双声道 d u a l m o n o 及立体声 s t e r e o 等编码模式 利用以掩蔽效应为基础的心理声学 模型控制声音的量化 编码达到不低于3 2 k b i l 砖比特率的数据流 用层表示三个不同层次的心理声学模型算法 分别为l a y e ri l a y e ri i 和 l a y e ri i i 对应着不同的比特率 编码器的复杂程度随之加深 l a y e rl 又称之m p l 音频 声音文件扩展名为 m p l 或 m p a 采用 m u s i c a m m a s k i n gp a t t e r n u n i v e r s a ls u b b a n di n t e g r a t e dc o d i n ga n d m u l t i p l e x i n g 的简化算法 复杂度最低 压缩比4 1 相对c d 激光唱片 音频比特率 压缩后的比特率预计为3 2 4 4 8 k b i t s 目标为1 9 2 k b i v s l a y e rl i 又称之为m p 2 音频 声音文件扩展名为 m p 2 或 m p a 其算法较 l a y e ri 复杂 去除了更多的冗余度 压缩比为6 1 压缩后的比特率预计 为3 2 3 8 4 k b i t s 目标为1 2 8 k b i t s l a y e r1 1 1 又称之为m p 3 音频 声音文件扩展名为 m p 3 或 m p a 其算法 最为复杂 压缩比为1 2 1 相对c d 激光唱片音频比特率 压缩后的比特 率预计为3 2 3 2 0 k b i v s 目标为6 4 k b i t s 2 m p e g 一2 音频标准 m p e g 2 6 音频是在1 9 9 4 年1 1 月为数字电视而提出的 其发展分为3 个阶 段 第一阶段是对m p e g 1 增加了低采样率 有1 6 k h z 2 2 0 5 k h z 及2 4 k h z 第二阶段是对m p e g 一1 实施了向后兼容的多声道扩展 将其称为m p e g 2 b c i s o i e c1 3 8 1 8 3b a c k w a r dc o m p a t i b l e 支持单声道 双声道 立体声 和多 声道 环绕声 等编码 并附加 低频加重 扩展声道 从而达到5 声道编码 第三阶段是后向不兼容 当不能被m p e g i 音频解码器译码 将其称为 m p e g 一2a a c 先进音频编码 a d v a n c e da u d i oc o d i n g 采样率可低至8 k h z 而高于9 6 k h z 范围内的1 4 8 个通道可选的高音质音频编码 武汉理 i 大学硕士学位论文 1 9 9 7 年m p e g 2a a c 成为一个国际标准 i s o i e c1 3 8 1 8 7 也将成为 m p e g 4 音频标准的核心 应用 m p e g 2 主要用于数字电视 适用于数据比特率从8 k b i t s 的单声道电话的音质到1 6 0 k b i f f s 的多声道高质 量的全音域音频编码 用于d v d 图像清晰度可达到5 0 0 线 音频效果可提供2 路立体声声道和 高质量的5 1 声道环绕立体声 2 特点 m p e g 2b c 分为3 层 相应的预计达到的比特率分别为 l a y e ri 3 2 2 5 6 k b i t s l a y e ri i 和l a y e ri i i 8 1 6 0 k b i t s 兼容性强 a m p e g 2b c 的多通道兼容性 m p e g 2 数据格式的基本内容与m p e g 1 等同 解码器完全兼容于m p e g 1 编码器 即使数据流分为两部分 一 路用于双声道立体声而另一路是多声道环绕声 b 反之 m p e g 1 解码器也能接收到m p e g 一2b c 的音频数据流中的全部 通道信息 是因为m p e g 2b c 的向下混合左右声道的兼容性矩阵的作 用 c 由于m p e g 1 和m p e g 2 音 视频的合成处理遵循着m p e g 标准的系统 规范 所以m p e g 1 音频可以与m p e g 一2 视频合成使用 也可以将 m p e g 2b c 音频与m p e g 一1 的视频合成使用 d m p e g 2 a a c 可替代m p e g 层i l i m p 3 m p e g 2a a c 采用了m p e g 1 层i i i m p 3 同样的基本编码模式 仅在一 些细节上增加新的编码工具 3 m p e g 4 音频标准 m p e g 4 是以 各种音 视频媒体对象的编码 为标题 m p e g 4 第一版于1 9 9 8 年1 2 月成为一项通用的国际标准1 6 i s o i e c1 4 4 9 6i v 第二版于1 9 9 9 年1 2 月完成 其第三 四版于2 0 0 1 年开始制定 1 应用 m p e g 一1 及m p e g 2 标准为图像和伴音 或者说为广播电视领域的数字化奠 武汉理i 人学硕士学位论文 定基础 但满足不了迅速发展的多媒体应用的要求 在1 9 9 3 年开始了能够实现 数字电视的制作 分配和内容的融合 交互式图形应甩以及交互式多媒体的标 准制定 m p e g 一4 的宗旨是避免出现众多的 专有的 互不兼容的格式和播放机 的方法 而提出一整套能够满足 包括实时通信 监视和移动多媒体等大量应 用的要求 2 特点 m p e g 4 标准化自然音频的编码数据比特率为2 k b i t s 6 4 k b i t s 为获取到所有比特率下的高音质 m p e g 一4 音频定义了三类编码模式 分别 是 a 低比特率的参数化编 解码器 b 中间比特率的码激励线性预测 c o d ee x c i t e dl i n e a rp r e d i c t i v e 缩写为 c e l g 编 解码器 c 高比特率的编 解码器 包含m p e g 2 a a c 和矢量量化编码在内的时间 频率 t i m et of r e q u e n c y 缩写为t f 编 解码器 4 m p e g 一7 音频标准 在信息社会中 可以利用的视听信息形式越来越多 如图像 音频 语音 3 d 模型及图形等 而手段不仅是记录一存储一重放 尤其是网络的出现 特别 是因特网服务 各项服务项目种类和大容量数据库等基于内容服务需求的快速 增长 引发了对视听信息内容的检索 交换及传递的迫切要求 1 9 9 6 年开始对m p e g 7 1 6 标准的制定 m p e g 7 称为 多媒体内容描述接口 m u l t i m e d i ac o n t e n td e s c r i f p t i o i l n t e r f a c e 主要是描述多媒体素材内容的通用 接口的标准化 m p e g 7 本质上与m p e g 1 m p e g 2 及m p e g 4 不同 后三者 是论述音视频具体的编码 而前者是促进数据元的互操作性 通用性和数据管 理灵活性 因此m p e g 7 的目标是产生一个描述多媒体内容的标准 支持对多 媒体信息在不同层面的解释和了解 从而将其依据用户需求而进行传递和存取 它不同于其它的m p e g 音频 不是针对某个具体项目应用 例如m p e g 一4 是用 于低比特率语音编码 而m p e g 7 典型应用有 建立音频档案 库 从互联网 和档案中提取和恢复音频文件和数据 提供视听信息的描述 例如用于对所需 视听素材进行检索 即检查寻找图书 资料 为了适应人们在因特网上能够很快的搜索到所需要的内容 m p e g 7 多媒体 武汉理工人学硕士学位论文 接口应能支持 m p e g 7 可完成人耳听觉感知需要的内容 频率轮廓线 音色 和声 频率 特征 音调 音域 振幅包络 时间结构 即声音特性 音头持续时间及 音尾 文本内容 如通过唱一首歌曲的开始歌词或发出一篇文章开始一段 的文字或声音近似值 即唱出歌曲的旋律或发出一种声音效果 即可以搜索 到相应的全部原型声音或文本 支持数据音频 如c d 唱片 m p e g 1 音频格式 模型音频 如磁带介质 m p e g 一4 的s a o l 及m i d i 包括一般m i d l 及k a r a o k e 格式 5 m p e g 一2 1 音频标准 m p e g 一2 1 1 3 j 标准 i s o i e c 2 1 0 0 0 的正式名称是多媒体框架 其制订工作 于2 0 0 0 年6 月开始 m p e g 2 1 将创建一个开放的多媒体传输和消费的框架 通 过将不同的协议 标准和技术结合在一起 使用户可以通过现有的各种网络和 设备透明地使用网络上的多媒体资源 m p e g 2 1 中的用户可以是任何个人 团 体 组织 公司 政府和其它主体 在m p e g 2 1 中 用户在数字项的使用上拥 有自己的权力 包括用户出版 发行内容的保护 用户的使用权和用户隐私权等 m p e g 2 1 包括7 个基本要素 数字项声明 d i g i t a li t e md e c l a r a t i o n 数字 项识别和描述 内容处理和使用 知识产权管理和保护 终端和网络 内容表 示 事件报告 数字项是m p e g 2 1 框架中的基本单元 它由资源 原数据 m e t a d a t a 和结构共同组成 是一个带有标准化的结构化数字对象 要素中的 资源包括了采用m p e g 一1 m p e g 一2 m p e g 一4 标准的多媒体信息 通过数字项 的定义 m p e g 一2 1 集成了m p e g 系列的其它标准 由此也可以看出 m p e g 2 1 是建立在其它标准的基础之上的 m p e g 一2 1 标准支持以下功能 内容创建 内容生产 内容分配 内容的消 费和使用 内容的分组 知识产权管理和保护 内容识别和描述 用户权限 终端和网络资源提取 内容表示和事件报告等 该标准是从商业内容和与内容 相关服务的前景等角度开发的 将同已有的其它m p e g 系列标准等进行适当结 合 从而使用户对视频 音频的处理更加方便和有效 最终为多媒体信息的用 户在全球范围内提供透明而有效的视频通信应用环境 m p e g 2 1 的出台可以将 现有的标准统一起来 消费者将可以自由使用音视频内容而不被不兼容的格式 编解码器 媒体数据类型及诸如此类的东西所干扰 武汉理一 大学礤 学位论文 由此 我翻可良看爨 东m p e g 齑颓编码模式中 m p 3 m p e g 1l a y e r l l i 功能最强大 这是因为它具有簸离魄蕊缩比1 2 1 在一般没有匿缩数援豹情况 下 音频被数字化时 采样频率必须在实际声音最高频率的2 倍以上 在c 鼢中 声音最高频响是2 0 k h z 采样频率嫩为4 4 1 k i i z 1 6 位量化 要获得c d 音质的 立体声 每秒钟的数据量将超过1 4 m b i t 采用m p 3 压缩 数据量可以缩小到 1 1 2 音质却没有损失 如果再进一步压缩数据量到1 2 4 或更多 依然可以维 持相当好的音质 比起通过降低采样频率 缩短采样深度的方法要好褥多 最 然m p 3 对原始信号进行了高压缩比处理 但因为去除的大多是一些无关紧簧的 信号 困诧单纯扶瞬感上说 m p 滕臻几乎对音质没有影嫡 所以在潜榉戆潦 矮条传下 醚犸蓑要豹数据璧簸小 在震襻豹数蠢量条磐下 m p 3 啻蕨焱磐 瓣矜俸为蠢震量蠢笨篷缭标攥 疆程避入越来越多人戆生活 在困特网上 m p 3 也邑成为攀嶷标准 有众多可供下载m p 3 音乐文件黔站 点 今天 不计其数的音乐制作者以m p 3 文件格式发布他们的音乐作品 并不 断涌现m p 3 编解码软件以及时下炙手可热的便携式m p 3 硬件播放器产懿 可以 说伴随着m p 3 格式压缩技术的成熟 一场堪称音乐工业的风暴己通过互联网络 以雷霆万钧之势席卷全球 给数字音频领域带来了 轮新的冲击 l 3 本课题研究的内容及工作安排 本文的骚究工律主要惫含嚣部分 第一嚣努是对m p e g 音频嚣三滋编 勰码算法拣漆懿磁究 重点毳蜉究了瓣 码算法的实瑷 在实现过程孛对裔频编码h 4 1 k h z 采样频率 压缩到6 4 k b i t s 每通道的编码速率 主要采用m p e g l 的标准 对于更低采样频率 1 6 k h z 的语 音编码则采用了m p e g i i 的标准 为了获得较高的压缩效果和高质量的谮乐回 放质量 该标准采用了复杂的数学和心理学技术 同时利用了对人耳灵敏度的 研究结果 本文详细讨论了音频第1 l i 朕编码算法的四个模块 即子带滤波器组 编码 心理声学模型 量化与编码和帧数据流格式化 第二部分是基于m p e g 音频笫i i l 层压缩算法的m p 3 实时解码硬件系统的 实现 首先介绍了硬件系统的缀成 霞括各功能模块的元器辞的选择 备功缝 模获的接口设诗 硬传电路板鲍凝壤鬻设诗 p c b 设诗以及最后螅疆 孛诞试落 等 然瑟讨论了释羁算法戆毯伲浚谤 玖及它在d s p 乎台上鲍实魏避程 黉纛 武汉理工大学硕士学位论文 硬件平台上调试通过 本文共分六章 第一章是绪论 介绍了音频压缩算法的发展状况以及m p e g 音频家族的所有音频算法的特点和应用范围 最后介绍了本文的主要研究工作 及内容安排 第二章介绍了音频压缩的声学基本原理 第三章详细研究了m p e g 音频第j i i 层 m p 3 编 解码算法标准 并对解码算法中可能优化的模块进行 了阐述 第四章详细介绍了基于d s p 的音频编解码系统硬件平台的设计与实现 及硬件平台的调试过程 第五章对m p 3 解码算法的d s p 平台的移植实现进行了 详细的分析 第六章对全文工作进行了总结 并对后续工作进行了展望 武汉瑷 f 大学碗士学整论文 2 1 引言 第2 耄啬频压缩的基本原理 数字音频信号得以压缩的理论依据首先是原始信号本身存在着冗余度 其次 是利用人类的听觉感知系统对浆贱失真不敏感的特性 即人耳的声心理学模型 t z 信号的冗余度又包含两个方磷 一是客观冗余度 它是可 三l 计算瓣 瓣时耀 寒确定音频燕芎熬菜些数字上霹预测耱瞧夔数量 舞羯絮波形 二楚主躐冗余 度 攒蓉予太骂豹褥雯将程 潦籁臻罨争包含蓑蔹久骂怒珞豹努量 a 耳的瞬觉特毪涉及心理声譬翻生理声学豹簿题 近代音频嚣缩编粥熬核 心是依据心理学模型去除信号的主观冗余 以及采用耦合和声道重组等投术消 除客观冗余 同时结合复杂的近代数字信号处理算法 去除音频信号本身冗余 度 从而达到音频压缩的效果 2 2 心理声学模型 人的听觉系统是一个菲黉爱杂的系统 对予人类皈力感知的研究 获薄圈放 入耳受生理设诗 到大藏辩瞬懿傣怒翡释释 声音只是一令没蠢入瓣葵产生黎 翘豹学术壤念 瑟心瑾声学模燮翔捺示了久翻对手甄蚕熬一谤懿圭鼹及应 是 在有关褥觉的关系中最终翡静簸谨 闲为它是a 粥对声音豹一甥反成 办瑷声 学模型试图用所有与听觉感知脊必的科学的 客蕊豹和物理的特性所弓 越的心 理和生理上的反应 使得听觉能艨知这些特性 并和谐统一起来 用于i s o i e c1 1 1 7 2 3 的心联声学模型有两种 原则上它们部可以用在l a y e r i l a y e ri i 及l a y e ri i i 但模型1 邋用于l a y e ri l a y e ri i 而模型2 用于l a y e r i i l 听觉特性在声音编码的应用主蒙体现在 听觉的强度和频率范围内的特性 掩蔽效应及人耳高频定位特性1 2 1 实验表明 大耳对频率静感擞蠢一个双最 羲可瞬频率2 0 h z 裂最蕊哥瞬频率 2 0 k h z 夔范凌 趣窭这个频率菠溺戆声誊 藏无法被天琴感熟 这藏楚入豹舔爨 武汉理工大学硕士学位论文 区域 同时人耳还有一个对声音强度的分辨能力 在人耳的可听频域内 若声 音弱到或强到一定程度 人耳同样是听不到的 正常人听觉的强度范围即 听 阈 到 痛阈 的范围是o d b 一1 4 0 d b 一般以l k h z 纯音为准进行测量 一个声音传入耳朵后 并不是所有组成这个声音的分量都可以被人的听觉 系统所感觉 人耳不能听到听觉区域以外的声音 这是人的绝对听阈效应 简 称绝对听阈 图2 1 绘出了人耳的绝对听阈曲线 人耳对不同频率的声音的敏 频率一 图2 1 掩蔽听嚼图 感度差别很大 在听觉区域内 人耳不能听到低于绝对听阈曲线声压级以下的 声音 因此 在记录 传输 编码时 可将绝对听阈曲线以下的声音省略掉 减少传输的数据 人耳
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 亭子瓦施工方案
- 盘龙区公司活动策划方案
- 户外绘画策划活动方案
- 板材促销活动策划方案
- 下肢义诊活动策划方案
- 油泵棚施工方案
- 新疆商场施工方案
- 室外灰泥施工方案
- 社团五一活动方案策划
- 学生教学活动策划方案
- 云南省国省干线公路养护管理模式优化:基于公路局视角的深度剖析与创新路径
- 英语数字教学课件
- 贫血护理查房课件
- (人教A版)必修一高一数学上册期中模拟卷01(解析版)
- 胸痛患者转运课件
- 基于PLC技术的电动汽车充电系统设计
- 2025-2026学年教科版(2024)小学科学三年级上册(全册)每课教学反思
- 办理诈骗案件汇报
- GB 21256-2025粗钢生产主要工序单位产品能源消耗限额
- 2025年《临床输血技术规范》
- 2025年仓储员笔试题库及答案
评论
0/150
提交评论