(系统分析与集成专业论文)基于mips的aac实时多路解码器.pdf_第1页
(系统分析与集成专业论文)基于mips的aac实时多路解码器.pdf_第2页
(系统分析与集成专业论文)基于mips的aac实时多路解码器.pdf_第3页
(系统分析与集成专业论文)基于mips的aac实时多路解码器.pdf_第4页
(系统分析与集成专业论文)基于mips的aac实时多路解码器.pdf_第5页
已阅读5页,还剩74页未读 继续免费阅读

(系统分析与集成专业论文)基于mips的aac实时多路解码器.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 m p e g 2a a c ( a d v a n c e da u d i oc o d i n g ,先进音频编码) 数字音频压缩标准,已经成 为m p e g 国际标准中音频编码的核心,引领着感知音频的发展方向。m p e g 2 a a c 是高保 真音频编码标准中的一种。从编码原理的角度来看,它包含着多种新型高效的编码工具。 主要有修正离散余弦变换( m d c t ) 、时域预测编码、瞬时噪声整形、无噪声编码等等。同 时利用人耳的感知模型和统计理论,在尽可能保证音质重建的前提下,降低压缩编码码率。 针对不同的应用领域和开发的软硬件条件,m p e g 2 a a c 提出了各种不同的分层框架,每 个分层都有相应的编码工具,并且运算的复杂度和要求的内存也互不相同。本文旨在基于 单处理器基础上,对i v p e g 2a a c 音频编解码的模块进行理论研究和优化,同时开发出一 种能够适应于多解码器应用场合的多功能解码系统。 本文将m p e g 2a a c 作为研究和分析对象,从理论上对a a c 音频编解码中运算复杂 度较高的模块:心理声学分析、滤波器组、无噪声编解码等进行了相关的研究和分析。而 对于解码器而言,其中无噪声解码模块又是运算复杂度相对最高的。为了从算法层面上提 高解码效率,本文对该解码运算模块应用了一种快速霍夫曼解码的算法,大大提高了整体 的解码效率,为在单处理器上实现多路、实时解码提供了基础。 另一方面,本文所设计的系统是在基于实时码流的应用场合,因此对于m p e g 2 系统 层的传输包解码,是本系统设计的另一个重点和难点。文章详细介绍了m p e g - 2 系统层解 码中至关重要的p c r 时钟重建算法并对算法进行了优化和实现。 本文所设计的音频解码系统是基于s o c ( s y s t e mo nc h i p ,片上系统) 的嵌入式系统, 因此处理器的选择至关重要。文章引入了当今消费电子以及网络路由器、交换机中广泛使 用的m i p sc p u 作为本系统的解码芯片。本文中介绍了m i p s2 4 k cc p u 的体系结构以及流 水线机制的指令系统,并介绍了在m i p sc p u 上对嵌入式操作系统v x w o r k s 的移植。最后 设计出了整个系统的软件框架,通过在仿真器上的软件仿真,得到了系统时钟校正、音频 解码以及混音后处理之后的时域p c m 仿真结果,验证了系统的正确性和稳定性。 关键字:音频解码,嵌入式系统,混音 a b s t r a c t m p e g - 2a a c ( a d v a n c e da u d i oc o d i n g ) d i g i t a la u d i oc o m p r e s ss t a n d a r dh a sb e c o m et h ec o r e a l g o r i t h mo fh i g hq u a l i t ya u d i oc o d e ro ft h em p e g n a t i o n a ls t a n d a r d ,w h i c hl e a d st h et r e n do f t h ep e r c e p t u a la u d i oc o d i n gt e c h n o l o g y m p e g - 2a a ci so n eo ft h eh i f ia u d i oc o d i n gs t a n d a r d , i tc o n t a i n s m a n y s t a t e o f - a r t s c o d i n g t o o l s , i n c l u d i n g m o d i f i e dd i s c r e t ec o s i n e t r a n s f o r m ( m d c t ) ,t u n ed o m a i np r e d i c t i o n , t e m p o r a ln o i s es h a p i n g , n o i s e l e s sc o d i n ga n d s o o n i nt h em a i nt i m e p s y c h o a c o u s t i cm o d e lo fh u m a n i t ya u d i t o r ys y s t e ma n ds t a t i s i t ct h e o r y 锄- e u t i l i z e df o rg e t t i n gm a x i m u mc o m p r e s sb i t r a t ew i t ht h ep r e c o n d i t i o no fp e r f e c tr e c o n s t r u c tq u a l i t y f o rt h ed i f f e r e n ta p p l i c a t i o nf i e l d sa n ds o f t w a r eo rh a r d w a r ea r c h i t e c t u r e ,m p e g 一2a a ci sa b l e t op r o v i d ed i f f e r e n tc o d i n ga n dd e c o d i n gp r o f i l e ,w h i c hr e q u i r e sd i f f e r e n ta l g o r i t h mc o m p l e x i t y b a s e do ns i n g l ec p up r o c e s s i n g , t h ep a p e ra n a l y s e sa n do p t i m i z e st h ea u d i oc o d i n ga n d d e c o d i n gc o m p o n e n to fm p e g 一2a a c ,a n dd e v e l o p st h em u l t i p l ef u n c t i o na u d i od e c o d i n g s y s t e mf o rl o t so fa p p l i c a t i o nf i e l d s t h em p e g 2a a ci ss e l e c t e da st h er e s e a r c ha n da n a l y s i st a r g e t t h ep a p e ra n a l y s e st h ec o d i n g a n dd e c o d i n gc o m p o n e n tr e q u i t i n gh i g hc o m p l e x i t ya l g o r i t h mi n c l u d i n gp s y c h o a c o u s t i cm o d e l f i l t e rb a n k , q u a n t i z a t i o na n dn o i s e l e s sc o d i n g d e c o d i n g a n dt h ec o m p u t a t i o n a lc o n s u m i n gf o r n o i s e l e s sd e c o d i n gi sh i g h e rt h a na n yo t h e ra l g o r i t h mc o m p o n e n tf o ra a ca u d i od e c o d e r f o rt h e s a k eo fi m p r o v i n gt h ed e c o d i n gp e r f o r m a n c ei nt h e o r y , t h ep a p e rb r i n g si no n eq u i c kh u f f m a n d e c o d i n ga l g o r i t h mt o e n h a n c et h ed e c o d i n gp e r f o r m a n c e ,w h i c hp r o v i d e sm i l e s t o n ef o r d e v e l o p i n gt h em u l t i p l ea a c r e a lt i m ed e c o d i n gs y s t e mo nm i p sc h i p o nt h eo t h e rs i d e ,a st h es y s t e mi sd e s i g n e df o rt h er e a lt i m ea p p l i c a t i o nf i e l d s ,t h ed e c o d i n g t r a n s p o r tp a c k e to fm p e g 一2s y s t e ml a y e ri sa n o t h e rk e y s t o n ea n dd i f f i c u l 够t h ep a p e rd e t a i l s a n do p t i m i z e st h ep c rr e c o n s t r u c ta l g o r i t h mw h i c hi st h em o s ti m p o r t n e n tc o m p o n e n ti n m p e g - 2s y s t e ml a y e rd e c o d i n gp r o c e d u r e n l ea u d i od e c o d i n gs y s t e mw h i c hw a sd e s i g n e di nt h ep a p e ri sb a s e d0 nt h ee m b e d d e ds o f t w a r e o fs o c ( s y s t e mo nc h i p ) ,w h i c hm e a n st h es e l e c t i n go fc p uc h i pi st h em o s ti m p o r m e n t a sa r e s u l kt h ep a p e rc h o o s e sm i p sc p uw h i c hi sw i d e l yu s e di nc o n s u m i n ge l e c t r o na n dn e t w o r k r o u t e rf i e l d sa st h ed e c o d i n gc p u t h ep a p e rr e p r e s e n t st h ea r c h i t e c t u r ea n dp i p l i n eo ft h e i n s t r u c t i o ns y s t e mo fm i p s2 4 k cc p u ,a n dd e t a i l st h ee m b e d do p e r a t i o ns y s t e mv x w o r k s p o r t i n gp r o c e d u r e f i n a l l y , t h ep a p e rd e s i g n st h ew h o l ea r c h i t e c t u r eo ft h es o f t w a r es y s t e ma n d g e t st h et i m ed o m a i np c ms i m u l a t i o nr e s u l tw h i c hi sp r o c e s s e db yp c rr e c o n s t r u c t i n g , a a c a u d i od e c o d i n ga n dm i x i n gt op r o v et h ea n dc o r r e c t i o na n ds t a b i l i z a t i o no ft h es y s t e mb y s i m u l a t o n k e y w o r d s :a u d i od e c o d i n g , e m b e d d e ds y s t e m ,a u d i om i x i n g i i 学位论文独创性声明 本人郑重声明: l 、坚持以。求实、创新一的科学精神从事研究工作 2 、本论文是我个人在导师指导下进行的研究工作和取得的研究成果 3 、本论文中除引文外,所有试验、数据和有关材料均是真实的。 4 、本论文中除引文和致谢的内容外,不包含其他人或其它机构已经发 表或撰写过的研究成果。 5 、其他同志对本研究所做的贡献均已在论文中作了声明并表示了谢意 作者签名:动丝髦缝: 日期: 学位论文使用授权声明 本人完全了解南京信息工程大学有关保留、使用学位论文的规定,学校 有权保留学位论文并向国家主管部门或其指定机构送交论文的电子版和纸 质版:有权将学位论文用于非赢利目的的少量复制并允许论文进入学校图书 馆被查阅:有权将学位论文的内容编入有关数据库进行检索:有权将学位论 文的标题和摘要汇编出版。保密的学位论文在解密后适用本规定。 作者签名:盈赳 日 期: 关于学位论文使用授权的说明 本人完全了解南京信息工程大学有关保留、使用学位论文的规定,即:学校有权保留 送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以 采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵循此规定) 作者签名:血红 日瓤中9 导师签名 日期: 南京信息工程大学硕士学位论文 第一章前言 1 1 论文的研究意义和背景 十多年来,在信元编解码领域的研究中,音频信号的压缩编解码越来越成为人们重视 和研究的课题,尤其是最近1 0 多年来,计算机科学技术的高速发展,数字音频逐渐取代了 模拟音频,成为了多媒体技术领域的重要研究方向,尤其是宽带音频的高效编码得到了广 泛发展和应用。数字音频在消费电子、网络、广播移动无线通信和数字影视等众多领域中 有了广泛的应用。但是在很多领域中由于存储介质容量和传输带宽的限制,都要求在很低 的比特率下实现数字音频信号的传输。虽然当前的数字音频编码技术已经达到很高的水准, 但还是不能满足人们各种各样的个性化需求。 音频压缩编码技术的发展,一直是在用尽可能低的比特率获得尽可能好的音频质量的 矛盾中发展的。比特率实质上反映的是频带宽度,降低比特率实质上是压缩频带宽度。当 然随着比特率的降低,相应的算法延迟时间和计算复杂度也要增加。一些国家和组织纷纷 提出了各种不同的音频压缩编码策略和算法,而其中一些已被国际标准采纳。基本上,这 些编码方案利用了两个重要的比特率降低原则第一个原则是音频信号存在冗余信息。 一个信号可以从它的过去来部分预测,或者可以利用一组适当的信号函数集来更有效的描 述。第二个原则是利用“感知不相关”。从感知的角度来看,可以丢弃与之不相关的信号特 征,而不降低感知的质量。尤其是在目前的音频编码器中利用人类听觉掩蔽特性可以使比 特率获得显著的降低。 传统的波形感知编码已经发展相当成熟,因此进一步提高的难度相当大。当比特率下 降到3 2 k b p s 以下的时候,波形感知编码显得力不从心,效率有着明显的下降。而参数编码 则作为一种音频编码的解决方案开始引起人们的兴趣。在许多低比特率的应用领域,参数 编码已经成为传统感知编码的重要补充。例如,频带复制技术( s p e c t r a lb a n dr e p l i c a t i o n , s b r ) 已被作为对高频部分的一个参数编码扩展工具组合到受限带宽下的变换或波形编码 器中。因此利用感知编码和参数编码相结合的方式正得到广泛关注和应用。 而另一方面,目前在全球通信技术和数字电视广播中广泛应用的数据压缩与传输标准 m p e g 2 具有完善的结构将一个或更多个音频、视频或其他的基本数据流合成单个或多个 数据流以确保数据传输的正确性和可靠性【1 1 。 n p 智m 程序流 l - 匝 _ 纠“是用俯 吲t 。詹口4 i 兰翌鍪塑h 三至三三三) _ 一匝 7 i 羳硛縺詟 传输框架图 南京信息工程大学硕士学位论文 单个音频和视频原始数据流的基本多路复用方法如图1 1 所示。按照上述国际标准对 音频视频信号进行编码压缩后的原始流进行分组形成p e s 分组。当p e s 分组形成的时候, 可以加入一些与流无关的信息。 本文研究的重点在于,基于m p e g 2 的a a c 实时音频解码器,其中核心编解码器采 用a a c l c ,并组合了频带复制工具和参数立体声工具。其编解码性能远远优于其它编解码 技术。该编解码器在移动通信、数字广播网络等场合有着广泛的应用,因此对a a c 实时音 频解码器进行研究和仿真实现具有重要的理论和现实意义。另一方面,随着芯片设计技术 的提高,和通用处理器架构的发展,单个微处理器已经能够满足音频解码的实时性和精确 性的要求,于是就出现了以单个微处理器为平台的音频解码器,本文是基于l l i p s 核的实时 音频解码器的软件系统进行研究。 1 2 音频编码的基本原理 在当前的通用音频编码标准下,大部分标准的算法如下:首先为了分析和编码的方便, 将输入的音频信号从时域转换到频率域,然后在频域内对音频信号进行量化和编码。另一 方面,为了通过降低码流的比特率来达到压缩的目的,采用心理声学模型( p a m , p s y c h o a c o u s t i cm o d e l ) 对输入信号进行分析,输出心理声学参数到量化模块,对不同频率 范围内的频谱系数使用不同的心理声学参数来控制频谱系数的量化精度,从而实现对音频 信号的压缩。 比较典型的编码模型如图1 2 所示:首先将输入的音频时域信号分成两路进入编码器, 一路经过时间一频率分析滤波器进行时频的转换,在m p e g 2 4 a a c 中该滤波器为 m d c t ( 修正离散余弦变换) 滤波器组,其主要功能实现音频信号从时域到频域的转换,该 模块输出频域参数。第二路输入信号进入到p a m 进行心理声学参数的计算,采用p a m i i 实现加窗f f t ( 快速傅立叶变换) 同时将信号从时域转变到频率域,然后在每个频率范围内 分析每个临界频带的掩蔽阀值特性,分析出每个临界频带的有调和无调成分,并将其与频 率扩展函数进行卷积运算,计算出每个临界频带的掩蔽阀值。 1 量化,编码卜 码流 参数 熵编码无噪声 m 编码 u x 边信息 卜分配r 图1 2 编码模型 2 南京信息工程大学硕士学位论文 音频编码的原则是:在给定的编码率下,要达到p a m 下听觉心理所能感觉到的失真最 小。因此,心理声学模块输出的心理声学参数被送到比特分配模块进行比特分配操作,决 定对每个比例因子带和对整个音频帧采用多大的全局比例因子进行编码。比特模块输出全 局比例因子和每个子带的子带比例因子到量化编码模块中。 量化编码模块对时频分析模块输出的频率参数进行量化和编码,即根据比特分配模块 输出的全局比例因子和每个子带的子代比例因子对每个子带分别进行量化,在进行量化的 同时,同一子带内的频率系数量化时使用相同的子带量化因子。而对各子带所在的同一音 频块的频率系数进行量化时,采用相同的全局量化因子。量化时采用非线性量化,也就是 说将频率系数采用非线性量化曲线映射到量化域中。 熵编码和无损编码通常为霍夫曼( h u f f m a n ) 编码。霍夫曼编码是一种最常用的无损编 码,它使用对编码信号的统计概率来安排霍夫曼码本。从而使得在统计平均上实现对输入 编码组合的最优码本表示。在音频编码中,通常将多个数目的需编码音频量化数据组合在 一起,然后对组合后的数据进行霍夫曼编码,这样可以进一步减少编码所需要的比特数。 编码后的码流参数和边信息复用器组合成最终的音频码流,边信息参数指示该音频数据的 量化因子或采样率的辅助音频信息用于解码。而码流参数包含编码完成后的音频实际数据: 通常边信息在前,码流参数在后,公共组成一个音频帧埋1 。 1 3m p e g 2 标准下系统部分概述 m p e g 2 系统有两种编码方式:传输流和程序流。其中分别适用于不同的应用。i t u - t r e c h 2 6 2 1 1 s o i e c1 3 8 1 8 - 2 和i s o i e c1 3 8 1 8 - 3 所定义的传输流和程序流提供了必要的和 充分的编码语法。保证同步译码和现实音频、视频信息,同时保证译码缓冲区既不产生上 溢也不产生下溢。根据译码和显示时使用的编码音视频数据,以及数据本身的传输情况, 信息在编码中使用不同的时间标签。两种流定义都是面向分组的多路复用流。 程序流和协议i s o i e c1 1 1 7 2 的系统层相类似,它是将一个或多个具有相同时间基点 的数据流的p e s 分组和为单个流。 那些原始数据流可来自于程序的一些独立的非多路复用数据流,也可以来自不同的程 序流,每个程序流对应一个原始流,并具有相同的时间基点,在这种情况下,各个流中的 s r c ( s y s t e mr e f e r e n c ec l o c k ,系统参考时钟) 域值应保持一致。和单程序流一样,所有的原 始数据流可以被同步译码。 程序流是针对错误相对较少的环境设计的,适用于向交互式多媒体这样一些涉及软件 处理系统信息的应用。程序流分组是可变的而且相对较长。 传送流将有多个独立时间基点的多道程序合成一个单独的数据流,其中属于同一道程 序的各个原始数据流得p e s 分组具有相同的时间基点。传送流是针对那些容易发生错误的 环境而设计的,比如在容易丢失或高噪声的媒体中存储和传送( 实时播放的数字电视广播) 。 传送流分组长度为1 8 8 个字节。 3 南京信息工程大学硕士学位论文 程序流和传送流针对不同的应用而设计,他们的定义并不严格的遵守分层模式。从一 种形式转换到另一种形式是可能的、合理的,然而并不存在子集或超集的关系。尤其是, 从传送流中抽取一道程序的内容并产生有效的程序流是可能,只要通过普通的p e s 分组格 式变换就行了。但并不是程序流需要的所有域值都可从传送流中直接获得,有一些必须经 过推导,再多层模式中,传送流可能跨过几层范围,为的是更有效地,轻易的实现高带宽 的应用。 本系统描述所规定的句法和语义规则不同于仅仅用于编码的系统层规则,它不包括压 缩的视频、音频编码说明,相反,此语义规则全部用于数据流的合并川。 1 3 1 传送流 传送流是根据i t u tr e c h 2 6 2 1 1 s o i e c1 3 8 1 8 2 和i s o i e c1 3 8 1 8 3 协议而定义的一种 数据流,其目的是为了在有可能发生严重错误的环境中进行一道或多道程序的编码数据的 传送和存储。这种错误表现为比特值错误或分组丢失。 传送流的速率既可以是变化的也可以是固定的。传送流速率是由程序参考时钟( p c r ) 字段的位置和数值所决定的,通常对与每个程序都有自己的p c r 字段。但是,当传送流有 多道程序的时候,要构造一个所有的比特率都在变化的传送流是非常困难的,因为对每道 程序来说传送流的速率是一个分段常数,而且当有复合程序是,那些被检测的拐点不会在 同一地方出现。 传送流可以用很多方法产生有效的数据流:从原始的编码的数据流,从程序流,从其 他本身包含一个或多个程序的传送流都可以构成含有一道或多道程序的传送流。 传送流的设计方法可以使它以最小的努力完成下面的一些操作: ( 1 ) 从传送流中的一道程序恢复被编码的数据,解码并显示解码结果,图1 - 3 ( 2 ) 从传送流中的一道程序抽取分组,并生成仅含此道程序的新的传送流,图1 4 ( 3 ) 从多个传送流中提取一道或多道程序的分组,并生成新的传送流。 图1 3 典型的传送多路解调解码模型 4 南京信息工程大学硕士学位论文 通道 通道特殊传送流再次 解码器 r 多路复用器 r 含有多个程序含有单个程序 的传送流的传送流 图1 4 典型的传送多路复用模型 ( 4 ) 从传送流中提取一道程序生成含有此道程序的程序流, 图1 5 通道 通道特殊传送流多路解调 解码器 r 程序流多路复用 含有多道程序程序流 的传送流 图1 5 传送流到程序流的转换模型 ( 5 ) 把一个程序流转换成一个传送流以适于通过容易出错的环境。然后,恢复成一个 有效的。又是完全相同的程序流。 传送流有两层组成:系统层和压缩层。传送流解码器的输入流有一个包含压缩层的系 统层,视频和音频解码器的输入流只含有压缩层。接受传送流的原型解码器执行的操作或 针对整个传送流,或针对某个单独的原始流。传送流的系统层可分为两个子层,一个相应 于多路复用宽操作( 传送流分组层) ,一个相应于特定数据流操作( p e g 分组层) 。 传送流的模型解码器,包括音频和视频,在图1 3 种所示,说明解码器的功能。它的 结构并不是唯一的:一些系统解码器的功能,例如解码器的时钟控制,可以同样很好的分 布于原始流解码器和通道特殊解码器中。同样,由通道特殊译码器所发现的错误传送给某 个音频和视频解码器的方法是多种多样的。 1 3 2 程序流 程序流是一种数据流定义,用来传送和保存一道程序的编码数据或其它数据。它主要 是针对那些不容易发生错误的环境,同时也针对系统编码的处理为主要关注对象,特别是 软件处理的环境。由于本文研究的主要内容为实时环境下的音频解码器,因此是以传送流 为分析和解决问题的对象,在此只对程序流作简单的介绍。 程序流和传送流一样,它的速率也是可固定和可变的,从而组成的原始数据流的速率 也是可固定和可变化的。程序流速率是由系统参考时钟( s r c ) 和m u xr a t e 字段的位置和数 值所决定的。一个音频视频程序流解码系统的原型如图1 6 所示,它的结构并不是唯一的, 包括解码始终控制在内的系统解码器功能可以通过平均分布在原始数据流解码器和通道特 殊解码器来完成。 5 南京信息工程大学硕士学位论文 1 4m p e g 音频解码方法 图1 6 程序流解码系统 随着人们不断地追求高品质低比特率,音频编码器逐渐变得越来越复杂,相应的编码 工具也越来越多,因此与之相对应的音频解码器其复杂度和计算量也不断得到提高。本文 通过对音频解码器的框架构造的研究,以及对其解码算法的深入分析,提出了适合在m i p s 处理器上实现实时音频解码的方案。 从目前音频编码的发展来看,出现了许多适合于不同场合和要求的算法标准。下面介 绍几种国际和商业通用的音频编码标准 1 4 1m p e g 1 音频编码标准 m p e g ( m o v i n gp i c t u r ee x p e r t sg r o u p ,运动图像专家组) 工作组成立于1 9 8 8 年,负责制 定音视频标准。1 9 8 9 年,m p e g 工作组在征求了1 4 种音频编码方案后,最后确定了2 种: 一种是m u s l c a m ( m a s k i n gp a t t e r na d a p t e du n i v e r s a ls u b b a n di n t e g r a t e dc o d i n ga n d m u l t i p l e x i n g ,自适应掩蔽模式通用子带综合编码与多路复用) ,另一种是a s p e c ( a d a p t i v e s p e c t r a lp e r c e p t u a le n t r o p yc o d i n g ,自适应频谱感知熵编码) 。m u s i c a m 编码在复杂度和编 码延迟上都比较优秀,而a s p e c 变化编码器在第数据传输速率下能够保持良好的声音质 量。基于这两种算法在1 9 9 2 年1 1 月制定了m p e g - i 音频标准,确定了三个压缩层次:l i 、 l i i 、l i i i 。m p b g - l 是世界上第一个高保真音频数据压缩标准。 其中层i 的复杂度最低,是m u s i c a m 方案的简化形式,每声道以1 9 2 k b p s 的速率提 供高质量的声音,在不强调低码率的情况下应用。层i i 具有中等复杂度,它使用比层i 更 为精密的量化,通过比例系数消除冗余度和不相干性把数据进一步压缩,与m u s i c a m 几 乎完全相同,可在1 2 8 k b p s 的码率下提供近乎c d 质量的声音。层i i i 结合了m u s i c a m 算 法和a s p e c 算法的优点,复杂度最高,编码效果也是好,可在低于每声道1 2 8 k b p s 的码率 6 南京信息工程大学硕士学位论文 下获得极高品质的声音效果。层i i i 使用了心理声学模型、可切换的混合滤波器组、比特 池缓冲技术、先进的预回声控制、非均匀量化和熵编码技术,这使得m p e g - - 1 的层i 获 得了巨大的商业成功,也就是我们通常所说的i v i p 3 1 2 1 。 1 4 2m p e g 2 音频编码标准 m p e g 一1 只针对单声道或者双声道进行编码,1 9 9 4 年1 1 月m p e g 工作组制定了多声 道扩展的音频编码标准m p e g - 2 。它能够与已有的m p e g - 1 系统向下兼容。对五个全带宽 声道,m p e g - 2 能够在数据率为6 4 0 - - 一8 9 6 k b p s 的条件下提供高品质的音频效果。m p e g - - 2 定义了m p e c r - - 1 的多声道扩展,传统的双声道的替代者是3 2 + 1 多声道系统。其中m p e g - 2 b c 采用m p e c , - i 编码器,也有三个层次的多声道扩展。层i i i 是最灵活的系统,作为一个 主要的特点,i v i p e g 一2b c 层i 允许使用数目灵活的扩展声道。除了后向兼容多声道编码 外,i v l p e g - 2b c 还提供了对多个附加声道的支持,利用这些附加声道可以支持多语言编码。 另外m p e g i 广2 还支持l i n e a rp c m ( 线性p c m ) 和d o l b ya c - 3 编码。 1 4 3 口e g 2a a c 1 9 9 4 年,m p e g 工作组开始制定一个新的多声道编码标准,即所谓的m p e g - 2 非向下 兼容音频编码标准,后来更名为m p e g 2a a c ( a d v a n c e da u d i oc o d i n g 。高及音频编码) 肝e g 一2a a c 比m p e g 一2b c 的质量更高。p l i p e g - 2a a c 标准采用了如自适应窗类型选择、 帧间频谱系数预测、瞬时噪声整形、比特率,带宽缩放操作等技术,大大提高了音频编码器 的编码效率。同时a a c 与其他音频编码标准一样,采用了无噪声编码和比特分配技术,使 得m p e g 2a a c 可以满足如下要求: ( 1 ) 支持8 到9 6 k b p s 的采样频率 ( 2 ) 支持输入输出通道配置为i o ( 单声道) 、2 j 0 ( 又2 声道立体声) 和3 2 + 1 ( 左,中,右、左 环绕佑环绕、低频增强通道) 等不同的多通道配置。最多支持4 8 个主声道、1 6 个低频增强 声道、1 6 个配音,多语言声道、1 6 个集成数据流。 ( 3 ) 在3 8 4 k b p s 的数据率和3 ,2 通道配置中,可以获得“不可分辨”的音质。 ( 4 ) 预先定义介入单元,使剪辑粒度最小化。 ( 5 ) 支持在存在误码的情况下维持码流同步的机制和某种误码消除机制。 根据不同的应用,m p e g 2a a c 在质量和存储器处理能力之间提供了不同的折中。 m p e g - 2a a c 编码算法中提供了一些列的编码工具,根据处理器性能和存储量等方面系统 资源和需获得的音质的限制,目前可以选择使用六个复杂框架之一,其中包括主框架、低 复杂度框架、可分级采样率框架、长期预测框架、低延迟框架、高效率框架等。其中前三 个是m p e g 一2a a c 中制定的,而其它的是m p e g - 4 标准中扩充的,这不在本文的讨论之 列。下面介绍m p e g - 2a a c 中涉及的各个框架使用和不使用的编码工具和编码效果。 7 南京信息工程大学硕士学位论文 ( 1 ) 主框架( m a i np r o f i l e ) :采用了除增益控制之外的所有编码工具。该框架可获得最佳 的编码效果,但是其运算复杂度也最高。 ( 2 ) 低复杂度框架( l o w c o m p l e x i t y p r o f i l e ) :采用了除预测、长时预测、增益控制之外 的所有编码工具,同时瞬时噪声整形工具的滤波器阶数受限。该框架编码效果最差但是复 杂度最低,适合在嵌入式处理器中开发使用。 ( 3 ) 可分级采样率框架( s c a l e a b l es a m p l i n gr a t ep r o f i l e ) :采用了增益控制工具,不采用 长时预测、预测和耦合声道工具,同时瞬时噪声整形工具使用受限。该框架根据编码带宽 限制动态的决定编码效果。其编码效果处于前两个框架之间。 如图1 7 所示为a a c 编码的框架过程:输入信号首先经过感知模型计算出m d c t 变 换所需要的窗类型, i n s 编码所需要的感知熵和m s 强度立体声所需要的若干信息,同时 输出每个子带的信号掩蔽比到迭代循环控制模块:同时另一路信号输入到增益控制模块进 行增益控制,增益控制模块由多相滤波器组、增益检测器和增益调整器组成,这三个重要 模块共同对不同比特率限制的输入信号采用不同的增益从而完成增益控制。该模块输出的 信号送到m d c t 变换模块中进行时域到频域的交换;前回声控制的方法有两个,一个是使 用长短窗切换,另一个就是采用了t n s 编码技术。在使用l t p 编码去除相继编码帧间具有 明确基音周期特性的冗余信号后,为了取出左右声道之间的信息冗余,可以使用姗立体 声和强度立体声达到进一步压缩码流的目的。而预测编码模块则是为了去除帧间的频谱系 数冗余信息,它利用前两帧的频谱预测当前帧的频谱稀疏,然后求出帧间的预测残差,在 对预测残差进行编码,从而达到了取出帧间冗余信息的目的。经过以上相应模块减少相关 冗余信息后进入了量化和熵编码阶段。在量化过程中,为了采用人耳感知特性达到压缩的 目的,需要用到比例因子信息,而比例因子根据感知模块中得到的各个子带的信号掩蔽比 ( s m r ) 并通过迭代循环控制模块经双循环迭代得到,最后将经过量化之后的信号通过熵编 码得到编码后的频谱系数和边信息组合成最终的a a c 音频数据涮3 】。 p c m 输入 感知模型 | | h 薹h5 h 薹h 霎h 雾h l h : 迭代循环控制 比例 因子 提取 叫臀 图1 7 从c 编码过程模型 8 南京信息工程大学硕士学位论文 1 5m i p s 2 4 k c 体系结构概述 m i p s 是实际使用的r i s c 体系结构中最精巧的一种,r i s c 的设计原则是使系统设计 达到最高的有效速度,将那些能对系统性能产生净增益的功能用硬件实现,其余大部分都 用软件实现,它排除了那些实现复杂功能的复杂指令,保留了经过验证的能提高机器性能 的指令:r i s c 微处理器是编译器能直接访问基本的硬件单元,因此能将编译器作为处理器 的扩展。经过指令精简之后,计算机体系结构趋于简单,从而使得计算机主频更高,硬件 成本更低。 r i s e 的简单性使得通过对三操作数的寄存器到寄存器的运算进行变形来扩展指令集变 得更为容易方便。m i p s 2 4 k cp r o 的核兼容m i p s 2 4 k 核家族,并且支持用户可定义指令集 ( c o r e e x t e n d ) 。但是在m i p s 2 4 k e 中支持的d s p 指令扩展( a s e ) 同时m i p s 2 4 k c 核可以根 据用户定义来选择相应的内存管理单元。以下是m i p s 2 4 k cc p u 的主要特点h 。: ( 1 ) 寻址方式方面,- i i p s 只有一种寻址方式。任何加载或者存储操作( l o a d s t o r e ) 的 机器指令都可以写成: 1 w $ 1 ,o f f s e t ( s 2 ) 可以使用任何寄存器作为目标和原寄存器。偏移量o f f s e t 是一个有符号的1 6 位数字;加载 所用的程序地址是$ 2 寄存器的值与o f f s e t 的和。这种寻址方式一般已足够存取c 语言结构 体的一个成员。同时汇编器会提供一个类似简单直接寻址的方式来加载一个在连接时刻才 能确定地址的内存变量的值。 ( 2 ) 指令流水线方面,m i p s 体系结构是为流水线而设计的,m i p s 2 4 k c 设计为9 级指 令流水线,当前指令执行的同时,下一条就进行译码并且装载其操作数,同时再下一条指 令在取指令。通过重叠这些操作,即使每条指令需要五个周期来取址( i f ) 、读取寄存器( r d ) 、 算术逻辑运算( a l u ) 、访问内存( m e m ) 和写回寄存器堆( 1 r b ) ,但是通过流水线后c p u 在每个 时钟周期执行一条指令。如图1 8 为典型的五级流水线。 i f r d 旺h b f r o m f r o , , t 0 i c a c h e r e g ls t e r a u 】 f r o , , r e g i s t e r f i l e d - c a c h e f i l e i f r dw b f r o m f r o m m e m l 0 i - c a c h e r e g is t e r a l i jf r o m f i l e d - c a c h e r e g ls t e r f i l e l i f r dl i b i f r o l f r o m m e m i c a c h e r e g ls t e r u if r o m t o f i l e d c a c h e r e g is t e r f i l e 图1 8m i p s 的五级流水线 9 南京信息工程大学硕士学位论文 ( 3 ) 大量的寄存器,拥有大量寄存器使得c p u 内部可以存放许多操作数,当需要操 作数的时候只要从寄存器中取得,而不是从内存中取得,这大大减少了访存的次数。寄存 器也可以高效的向子程序传递参数,这是由寄存器窗口来完成的。 ( 4 ) 延时载入和分支,m i p s 处理器使用延时载入( d e l a y e dl o a d ) 和延时分支( d e l a y e d b r a n c h ) 来避免时间的浪费。m i p s 指令流水线在分支指令或者连续使用同一个操作数的指 令中,可能出现相关。利用延时载入能够避免这种相关,或者至少使得c p u 在这一段会被 浪费的时间内做些有用的工作。 ( 5 ) 指令的预测执行,程序中的有些指令根据实际情况可以不被执行,例如:一个条 件跳转指令,如果转移成功,跳转到的指令将被执行;否则它将不执行。在预测执行 ( s p e c u l a t i v ee x e c u t i o n ) 中,c p u 执行该指令但是不存结果。如果指令将被执行,则存结果; 否则丢弃结果。 ( 6 ) 优化编译器,对于m i p sc p u 而言它的一部分重要特征能够很容易直接利用硬件 资源来完成,而其它的特征可以说很大程度上受益于优化编译器( o p t i m i z i n gc o m p i l e r ) 。一 个优化编译器可以对指令重新排序,这有助于延时载入和分支挑砖,也可以优化分配操作 数给寄存器怕1 。 1 6 本文的研究工作和内容安排 本文主要的研究工作是基于m i p s 2 4 k cc p u 的两路a a c 实时音频解码系统。本文通 过优化设计t s 流解析部分的p c r 校正模块,在解码器端稳定精确地恢复了系统时钟:通 过优化部分音频解码器的解码模块,以及软件方面的代码优化,提高了解码速度;同时通 过设计软件浮点的乘加模块,实现了两路音频的混音效果。本系统在m i p s 仿真器上分别 测试了p c r 时钟校正和a a c 解码混音,并取得了预期的效果。下面是本文的内容安排 第二章,以m p e g - 2 系统层解码器为研究对象,介绍了t s 流解析模块,并着重针对 p c r 在目标解码器端的校正功能,建立了相应的数学模型,进行了优化设计。 第三章,以m p e g 一2a a c 编码器和解码器作为研究对象,对感知音频编码技术中运 算复杂度相对较高的模块:心理声学分析、滤波器组、量化与编码进行了研究。同时也对相 应的各个解码模块研究和分析了其运算复杂度和解码原理,为最后的软件实现建立相应的 数学模型和理论基础。 第四章,在前两章理论模型建立的基础上,在这一章中,以m i p s 2 4 k c 作为硬件平台, 在嵌入式操作系统v x w o r k s 层面上开发了相应的板级支持包( b s p ) ,m p e g - 2 系统层解码 器,a a c 音频解码器,多路音频混音等相应的系统模块,同时针对系统的要求,对部分模 块进行了软件优化,并对这些系统模块进行了任务划分和设计。 1 0 南京信息工程大学硕士学位论文 第二章m p e g 一2 系统层传送流协议解析及时钟校准的研究 2 1 传送流比特流的编码结构 传送流的编码层允许将一道或者多道程序合成为单个流。程序是一些有着相同时间基 点的原始流的集合。从每个原始流来的数据倍多路复用在一起,并带有足够的信息,允许 一道程序的所有原始流能同步显示。 传送流由一道或多道程序组成

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论