已阅读5页,还剩59页未读, 继续免费阅读
(微电子学与固体电子学专业论文)dab接收芯片中音频解码算法的研究与asic实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 随着广播事业的发展,传统的模拟广播越来越不能满足人们的需求,于是 种新的数字广播d a b ( d i g i t a l a u d i o b r o a d c a s t i n g ) 诞生了。它具有音质好、 频谱利用率高、可移动接收等优点,同时它还是一种多媒体广播,可同时传递各 种诸如声音、图像、文字、数据及活动影像等业务。 本课题的任务是设计d a b 接收芯片中的音频解码系统m u s i c a m 解码器。 本文首先从d a b 音频编码入手,讨论了声音压缩的原理,然后研究基于m p e g 一1 和m p e g 一2l s f 标准的解码算法,重点是开发运算量小、实现简单的解码实现方 案,以便于硬件的设计,最后利用a s i c 技术,完成了音频解码系统的前端设计。 a s i c 设计中,系统被分为比特分配解码、比例因子解码、反量化、合成子带 滤波、控制器、c r c 校验等功能模块。其中比特分配解码用缩减的比特分配查找 表实现,合成子带滤波采用快速反d c t 变换,并与反量化中的乘法运算共用一个 2 4 2 4 位乘法器,在减少运算量和运算复杂度的同时,有效减少芯片面积。解码 中间步骤采用2 4 比特的运算精度,最后输出1 6 比特的p c m 样值用于播放。通 过严格的功能验证,该解码芯片设计符合m p e g 标准,并达到预定的性能指标。 将该音频解码模块与整个系统联调后实现了d a b 接收系统的功能,能够清晰收 听到广播信号。 关键词:d a b m p e g m u s i c a m 音频解码a s i c a b s t r a c t a b s t r a c t 硎i t i o n a lr a d i os e r v i c e sa r ce n t e r i n gan e we r ao fd i g i t a la u d i ob r o a d c a s t i n g 0 i b ) t h ed a bs y s t e mh a sm a n ya d v a n t a g e s ,s u c h 嬲h i g h - q u a l i t yd i g i t a la u d i o , e f f i c i e n t 嘲o ft h er a d i of r e q u e n c ys p c 矗r u u l , r e l i a b l ed e l i v e r y , p o r t a b l ea n dm o b i l e r e c e i v e r s a l s oi ti st h em u l t i m e d i ab r o a d c a s t i n gt h a tc 柚d e l i v e ra u d i o ,v i s u a l ,t e x t , d a t aa tt h es a m et i m e t l l i st h e s i sc o v 锵t h ed e s i g no fam u s i c a ma u d i od e c o d e ri nd a br e c e i v e r s y s t e m i td i s c u s s e st h eg e n e m ia u d i oe n c o d i n gt h e o r yo ft h ed a bs y s t e m ,a n dt h e n p r e s e n t sa no p t i m i z e da u d i od e c o d i n ga l g o r i t h mb a s e do nt h ea u d i os t a n d a r do f m p e g 一1a n dm p b g 一2l s ea tl a s t , i ti n l a o d u c e st h ea s i cd e s i g n 。s y s t e m i m p l e m e n t a t i o na n dv e r i f i c a t i o no f t h ed a b a u d i od e c o d e r t h ea s i cs t r u c t u r eo ft h ed c c o d e ri n c l u d e ss e v e r a lf l l n e t i o n a lm o d u l e st h a ta b i t - a l l o c a t i o nd e c o d i n g ,s c a l ef a c t o rd e c o d i n g , r e q u a n t i z i n g ,s y n t h e s i sf i l t e rb a n k , c o n t r o l l e ra n dc r cv e r i f i e a t i o i li nt h eb i t - a l l o c a t i o nd e c o d i n gm o d u l e ,3s h o r tl o o k u p t a b l e sa r eu s e di n s t e a do f5l o n gt a b l e si nm p e gs t a n d a r d t or e d u c et h ec h i pa r e aa n d o p e r a t i o nc o m p l i c a c y , f a s ti d c ti si m p l e m e n t e di ns y n t h e s i sf i l t e rb a n k , w h i c ha l s o u s e sa2 4b i t sm u l t i p l i e ri nc o u l l n o nw i t hr e q u a n t i z i n gm o d u l e n 虻d e c o d e ro p e r a t e s w i t h2 4b i t sp r e c i s i o n , a n do u t p u t s16b i t sp c ms a m p l ef o ra u d i op l a y f u n c t i o n v e f i i 硎h a ss h o w nt h a tt h ed e s i g no fa u d i od e c o d e ri sc 0 玎o c ta n ds a t i s f i a b l e b y i m p l e m e n t i n gi ti nt h ed a b r e c e i v e rs y s t e m ,t h eh i g hq u a l i t yo f a u d i oi sr e c e i v e d k c y w o r d :d a b m p e gm u s i c a ma u d i od e c o d i n ga s i c 声明 学位论文创新性声明 秉承学校严谨的学分和优良的科学道德,本人声明所呈交的论文是我个人在 导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标 注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成 果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的 材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说 明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切的法律责任。 本人签名:么盗 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保 留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内 容,可以允许采用影印、缩印或其它复制手段保存论文。同时本人保证,毕业后 结合学位论文研究课题再攘写的文章一律署名单位为西安电子科技大学 日期j 出测 第一章绪论 第一章绪论 本章首先介绍了课题的背景和来源,接着叙述了本文的研究内容、成果及意 义,最后给出了本文的论文结构和章节安排 1 1 课题的背景和来源 随着c d 机的应用和普及,与以前相比。听众对声音播出质量有了更高的要求。 另外,由于汽车等交通工具的日趋普及,人们生活的节奏变快,途中的移动群体 越来越大。这些对声音的移动接收自然提出了更高的要求。目前我们收听的广播 仍是模拟广播,由于它固有的局限侄,无法达到c d 的播放质量,也不能满足入们 对移动接收的要求。因此,高质量的数字音频广播就成为广播发展的必然趋势。 近年来,由于数字技术的广泛应用,声音的拾取、记录、重放质量得到了极 大的保证;同时数字压缩技术的成熟,使在不影响主观质量评价的前提下,音频 码率可以压缩1 0 倍以上;而高效的数字调制技术和纠错编码技术同样得到了高速 发展,使得射频的频谱利用率更高,信号处理和传输更加可靠;再加上微电子技 术的完善和成熟,使得各种对数字音频信号的处理手段,像压缩编码、调制、差 错控制等技术不仅在方法上己经成熟,而且可以用硬件实现。以上几方面技术的 综合应用,为今天数字音频广播( d a b ) 的迅速崛起创造了必要的技术条件 本文便是致力于d a b 信源编码:掩蔽型自适应通用子带综合编码与复用 ( 锄s i c a 鲢,m a s k i n gp a t t e r na d a p t e du n i v e r s a ls u b h a n di n t e g r a t e dc o d i n ga n d m u l t i p l e x i n g ) 的研究,设计了d a b 接收芯片的信源解码器,并完成了解码器的 a s i c 前端设计和验证,为整个d a b 接收芯片的设计打下了基础。 1 2 本论文研究的内容和取得的成果 基于d a b 的发展现况和企业对产品性能的设想,本课题的具体要求可归纳为: 使系统可解码采样频率为2 4 k h z 或4 8 k h z ,单通道、双通道、立体声、联合立体 声等四种形式的d a b 音频数据流;开发执行速度快、硬件实现简单的解码算法: 使用硬件描述语言设计整个解码系统。 本文开发的l i u s i c a j 4 解码算法基于m p e f f - i 音频标准以及m p e g - 2 音频标准的 低采样频率部分( l s f ,l o s a m p l i n gf r e q u e n c y ) 。解码以音频数据流中固有的 帧为执行单位,一帧数据经过解码器后,每个声道产生1 1 5 2 个可以播放的p c m 数据 4 d a b 接收芯片中音频解码的算法研究与a s i c 实现 使用硬件描述语言设计音频解码器是本课题最重要的工作系统被分为解比 特分配、解比例因子,反量化、滤波( 反d c t + 加窗函数) 等部分。其中解比特分 配采用简化的查找表;为减少芯片面积,反归一化、反d c t 和加窗函数采用同一 个2 4 x 2 4 位乘法器;同时反d c t 采用了快速算法,利用一个加法器加一个乘法器 的运算模块,实现3 2 位反d c t 运算。等等算法优化,使得硬件实现的m i j s i c a m 解码器达到了企业对产品的性能指标:解码逻辑部分少于三万门实现,占用r o i i 空间8 4 2 4 b i t s ,占用r a l i 空问3 0 5 6 4 b i t s 。 1 3 本人工作介绍 在完成整个设计的过程中,本人所做工作主要包括以下几个方面: 1 基于m p e g 标准音频码流语法和解码算法,设计了运算量小、易于硬件实 现的解码算法。 2 采用v d o g 硬件描述语言,完成了系统核心各模块的硬件设计描述。 3 在仿真环境下搭建测试平台,模拟d a b 数据接收环境,产生音频比特流输 入勰码模块进行仿真调试。 4 在f p g a 板上顺利通过解码器验证。 以上的工作都经过了严格的验收,达到了预期效果。本课题设计出的 m u s i c a m 音频解码器已被应用到d a b 接收芯片中,该芯片也已预流片成功 1 4 论文结构 本文一共包括六章。第一章( 本章) 为绪论,阐明了课题的来源和应用背景, 并概括了本文的研究内容和取得的成果。 第二章介绍了数字音频的有关知识,包括音频压缩的理论基础,以及m p e g 协议中采用的音频压缩标准。 第三章介绍了d a b 的有关知识。包括d a b 的发展概况、优点,关键技术及 d a b 发射和接收系统的原理结构,然后重点解释了其中音频编码算法m u s i c m a 的编码流程和结构框图。 第四章是本文的重点。讲述了m u s i c a m 的解码原理,给出解码流程,按功 能模块对解码器进行划分,提出易于硬件实现的优化方案。 第五章介绍了系统的实现验证过程。用v c r i l o g 语言进行系统实现,在测试平 台仿真调试,用c 模型辅助功能验证,然后在f p g a 板上进一步时序验证。 第六章是全文的总结。概括了作者在本课题中所做的主要工作和课题的意义 所在,同时提出了进一步工作的方向和需要解决的问题。 第二章音频编码原理 第二章音频编码原理 本章首先介绍了音频信号数字化的原理,然后介绍了音频信号的可压缩性, 接下来利用人耳听觉的掩蔽效应阐述了音频解码算法中普遍采用的人体声学模 型,最后简要介绍了m p e g 音频编码标准。 2 1 数字声音信号 随着计算机技术和通信技术的发展,人类开始追求真正意义上的多媒体信息 的处理和交互。自然界中的各种信息,包括文字、声音和图像,都成为处理的对 象。但是,这些媒体信息都是模拟的,只有对其数字化后才能由计算机平台进行 各种处理和综合。 为了适用于以数字方式工作的通信、存储系统,我们要对模拟音频所做的第 一个工作就是将模拟音频数字化,形成数字音频。 音频信号的数字化过程,就是将模拟信号转换成有限个数字表示的离散序列, 即数字音频序列。在这一处理过程中,涉及到对模拟音频信号的采样、量化和编 码。对同一音频信源采用不同的采样、量化和编码的方式,就形成多种多样的数 字化音频信号。 2 1 1 采样过程 模拟音频信号是一个在时间上和幅值上都是连续的信号f ( t ) 。采样的过程就 是在时间上将f ( t ) 离散化的过程。一般的采样是按均匀的时间问隔进行的。设这 一问隔时间为t ,则采样后的信号为f ( k t ) ,k 为自然数。n y q u i s t 采样定理“7 1 告 诉我们,如果音频f ( t ) 是一个限带信号,它的最高频率分量为f m ,则当t 加4 2 时,可以从离散的f ( k t ) 中不失真的恢复出原来的音频信号f ( t ) 因此在采样时 我们自然十分关心音频信号的频谱范围和我们所给予的时间间隔这两个参数,因 为它们决定了数字音频能否忠实的反映原来的声音信号。为了保证无失真的还原 音频信号,通常在采样前要用一低通滤波器对该信号进行限带处理。低通滤波器 的上限频率应不超过f m 模拟信号x ( t ) 受到带宽o w h z 限制时,若每隔t = i 2 w ,对x ( t ) 进行取样 处理,从样值序列就完全能够再现原样的波形。 目前常见的音频信号的频率范围大致如下:电话信号的频率为2 0 0 h z 到 5 6d a b 接收芯片中音频解码的算法研究与a s i c 实现 3 4 k h z ,调幅广播信号的频带为2 0 h z 到1 5 k h z ,高保真音频信号的频带为2 0 h z 到2 0 k h z 。根据不同的音频信源和应用目标,可采用不同的采样频率,如8 k h z , 11 0 2 5 m i z ,1 6 k h z ,2 2 0 5 k h z ,3 2 k h z ,4 4 i k h z ,4 8 k h z 等都是典型的采样频率。 2 1 2 量化过程 量化过程是音频数字化的第二个离散过程,它将每个采样值在幅度上再进行 离散化处理将所有的采样值可能出现的范围划分成有限多个小阶距( 量化步长) 的集合,把凡是落在某个量化阶距内的采样值都赋予相同的值,即量化值。通常 这个量化值是用二进制数来表示的。使用n 比特进行量化就有2 ”个量化值。 如果每个量化阶距是相同的,或者说量化值是均匀分布的,我们称为均匀量 化,否则为非均匀量化:要注意的是,由于我们将略有不同的所有落入同一量化 阶距内的采样值都以同一量化值来表示,这就引入了失真,即量化失真量化失 真是不可逆失真,即在音频恢复时无法挽回的失真。当然这种失真也可看作是在 原来的信号上叠加了噪音所引起的,这个叠加的等效噪音就是量化噪音。在音频 数字化时,必须十分重视对量化噪音的考虑,以期尽量减少量化噪声。 模拟信号经过上述的采样和量化后,就形成数字化的脉冲调制p c m ( p u l s e c o d em o d u l a t i o n ) 信号。音频压缩编码就是在此基础上进行的。 2 2 数字音频压缩的基本理论依据 音频信号数字化之后所面i 描的一个问题是巨大的数据量给存储和传输带来的 压力。例如,对于c d 音质的数字音频,所用的采样频率为4 4 1 k h z ,量化精度为 1 6 b i t ,双声道立体声时,其数码率约为1 4 1 1 m b i t s ( 数码率= 采样频率量 化比特数声道数) ,1 秒的c d 立体声信号需要约t 7 6 4 k b 的存储空闻。因此, 为了降低传输或存储的费用,必须对数字信号进行压缩 那么数字音频信号是否可以压缩呢? 答案是肯定的根据统计表明,无论是 语音还是音乐信号,都存在着多种冗余,主要包括时域冗余、频域冗余和听觉冗 余叫衄。 2 2 1 时域冗余 音频信号在时域上的冗余形式主要表现在以下几方面: ( 1 ) 幅度分布的非均匀性 统计表明,在大多数类型的音频信号中,不同幅度的采样值出现的概率不同, 第二章音频编码原理 小幅度采样值比大幅度采样值出现的概率要高。尤其在语音和音乐信号的阃隙, 会有大量的小幅度采样值。 ( 2 ) 采样值间的相关性 对语音波形的分析表明,相邻采样值之间存在很强的相关性。当采样频率为 8 k l z 时,相邻采样值之间的相关系数大于0 8 5 。如果提高采样频率,则相邻采样 值之间的相关性将更强。而根据这种较强的一维相关性,利用差分编码技术,可 以进行有效的数据压缩。 ( 3 ) 信号周期之间的相关性 虽然音频信号分布于2 0 h z 2 0 k h z 的频带范围,但在特定的瞬问,某一声音 却往往只是该频带内的少数频率成分在起作用。当声音中只存在少数几个频率时, 就会像某些振荡波形一样,在周期与周期之阃存在着一定的相关性。利用音频信 号周期之闻的相关性进行压缩的编码器,比仅仅利用相邻采样值问的相关性的编 码器效果好,但要复杂得多。 ( 4 ) 长时自相关 上述采样值、周期间的一些相关性,都是在2 0 m s 时间间隔内进行统计的所谓 短时自相关如果在较长的时间间隔( 如几十秒) 进行统计,便得到长时自相关 函数。长时统计表明,当采样频率为8 k h z 时,相邻采样值之间的平均相关系数可 商达0 9 。 ( 5 ) 静音 话音间的停顿间歇本身就是一种冗余。若能正确检测出该静音段,并去除这 段时问的采样值数据,就能起到压缩的作用。 2 2 2 频域冗余 音频信号在频域上的冗余形式主要表现在以下几方面: ( 1 ) 长时功率谱密度的非均匀性 在相当长的时间间隔内进行统计平均,可得到长时功率谱密度函数。其功率 谱呈现明显的非平坦性。从统计的观点看,这意味着没有充分利用给定的频段, 或者说存在固有冗余度,功率谱的高频成分能量低。 ( 2 ) 语音特有的短时功率谱密度 语音信号的短时功率谱,在某些频率上出现“峰值”,而在另一些频率上出现 “谷值”。而这些峰值频率,也就是能量较大的频率,通常称其为共振峰值频率。 共振峰值频率不止一个。最主要的是兹三个,由它们决定了不同的语音特征。另 外,整个功率谱也是随频率的增加而递减。更重要的是,整个功率谱的细节以基 音频率为基础,形成了高次谐波结构。 8 d a b 接收芯片中音频解码的算法研究与a s i c 实现 2 2 3 听觉冗余 音频信号最终是给人听的,因此要充分利用入耳的听觉特性对音频信号感知 的影响。因为人耳对信号幅度,频率的分辨能力是有限的,所以凡是人耳感觉不 到的成分,即对人耳辨别声音的强度、音调、方位没用贡献的成分,称为听觉无 关的。不相关”部分,都可视为是冗余的,可以将它们压缩掉。 由于人耳听觉系统非常复杂,迄今为止人类对它的生理结构和听觉特性还不 能从生理解剖角度完全解释清楚。所以,对入耳听觉特性的研究目前仅限于心理 声学和语言声学。在进行音频数据压缩时,充分利用了人耳听觉的生理学和心理 学现象。接下来,就将介绍人体心理声学模型。 应。 2 3 心理声学模型 人耳的掩蔽效应是心理声学的基础主要表现在频域掩蔽效应和时域掩蔽效 2 3 1 频域掩蔽 所谓频率掩蔽效应是指若强信号和弱信号同时出现,则处于强信号频率附近 的弱信号被强信号掩蔽而听不到。强音称为掩蔽啻、被掩蔽而听不到的声音信号 或噪声称为被掩蔽音。 掩蔽特性与掩蔽音的强弱、掩蔽音的中心频率、掩蔽音与被掩蔽音的频率梗 对位置等有关。举例来说,如果在1 0 0 0 f f z 处有一个强音,而在ll o o h z 处有一个 强度低于2 0 d b 的弱音,l l o o h z 处的弱音就会被1 0 0 0 h z 处的强音掩蔽,无法听到 由于掩蔽效应,幅度较大的音调( 掩蔽音调) 使靠近自己的相对幅度较小的音调 变得听不见。一般来说,强音能掩蔽较弱的声音,而且两个声音的频率越接近, 掩蔽效应越明显。 首先介绍声音信号强度的表示方法声音信号的强度称为声压级,声压级l 表示为: l = 2 0l g ( p v o ) ( d b )式( 2 - 1 ) 式中;p ;声压,单位为牛顿平方米( n m 2 ) ; p o :基准声压; = 2 1 0 。n m 2 = 2 0 * 1 0 。n m 2 = 2 0 p a 式( 2 - 2 ) 在安静的环境中,人耳刚刚能感觉到的最小声音强度,称为静听阙,又称绝 对掩蔽阈值,它随频率而变化。入耳听到的声音的频率范围大约是2 0 h z 2 0 k h z , 第二章音频编码原理 从心理声学实验知道人耳的频率分辨率低频比高频好,入耳对频率为3 4 k h z 附 近的声音信号最敏感,对太低和太高的声音感觉都很迟钝。因而,绝对掩蔽阈值 相应在这一频率范围时也较小。如图2 - i 所示。当有一个强度为6 0 d b ,频率为i k i j 的单频音出现时,掩蔽阙值曲线将发生变化,0 5 k h z 以下和5 k h z 以上部分,由 于与1 瑚z 相距较远,听觉掩蔽阈值不受影响而保持不变,或者说在这些部分总掩 蔽阂值曲线与绝对掩蔽阈值曲线重合;在0 5 k h z 5 k l l z 之间,形成新的掩蔽曲 线。处于掩蔽曲线以下的声音事件( 不管是声音信号还是噪声) ,由于被6 0 d b 强 的1 l ( i z 信号所掩蔽而昕不到,当然也就不必编码和传送。于是我们称此时的i k h z 单频音为掩蔽音,而处于掩蔽曲线以下的声音事件称为被掩蔽音。 例如要想同时听到上述的1 k h z 信号和另一个2 k h z 的信号,那么由图2 1 可 以看出,2 k h z 的信号强度必须在4 0 d b 以上。 d b 声 压 级 呻f l k h z l 圈2 - 1 频谱掩蔽特性 2 3 2 时域掩蔽 除了同时发出的声音之间有掩蔽效应之外,在时间上相邻的声音之问也有掩 蔽效应,即在一个强音信号之前或之后的弱音信号,也会被掩蔽掉。这种掩蔽效 应称为时域掩蔽,也称异时域掩蔽。 时域掩蔽又分为前掩蔽和后掩蔽。在时域内。听到强音之前的短暂时问内, 已存在的弱音可以被掩蔽而听不到,这种现象称为前掩蔽;当强音消失后,经过 9 1 0 d a b 接收芯片中音频解码的算法研究与a s i c 实现 较长的持续时间,才能重新听到弱音信号,这种现象称为后掩蔽。前掩蔽和听觉 疲劳有些相似。在实践中,后掩蔽更为重要。当被掩蔽声在时间上越接近于掩蔽 声,阈值就越高。掩蔽声和被掩蔽声时间上相距很近时,后掩蔽作用大于前掩蔽 作用。一般来说,前掩蔽很短,大约只有5 2 0 m s ,而后掩蔽可以持续5 0 2 0 0 m s 。 在音频编码时,将时间上彼此相继的一些取样值归并成块,以降低码率,就 是基于人耳的时间掩蔽特性而采取的策略。 2 4m p e g 音频标准介绍 i i p e g ( m o v i n gp i c t u r ee x p e r tg r o u p ) 是一个致力于运动图像及其伴音编码 标准化工作的组织,由国际标准化i s o ( i n t e r n a t i o n a ls t a n d a r d o r g a n i z a t i o n ) 与国际电子技术委员会i e c ( i n t e r n a t i o n a ls t a n d a r do r g a n i z a t i o n ) 于1 9 8 8 年成立的,简称j 铲活动图像专家小组”。并且m p e g 又分为m p e g l 、m p e g - 2 、m p e 6 3 和m p e g - 4 等几个压缩标准。我们所熟悉的m p 3 就是采用了这几个标准中的m p e g l 压缩标准。而l a y e r 是压缩中的层技术,是一种音频编码方案。这种方案包括 l a y e r l ,l a y e r 2 、l a y e r 3 三种,m p 3 所应用的就是第三层编码方案。 2 4 1 m p e g - i 音频编码标准 活动图像专家组研究制定的m p e g - i 音频压缩算法( i s o i e c1 1 1 7 2 3 ) 是世 界上第一个高保真音频数据压缩标准。它支持每声道比特速率约为3 2 3 8 4 k b i t s 的3 2 k h z 、4 4 1 k h z 和4 8 k h z 的p c m 采样数据,已经成功地应用在v c d 、 c 胪r 伽、视频游戏及数字音频广播等领域中 m e p p i 音频压缩标准提供三个独立的压缩层次:第一层( l a y e ri ) 、第二层 ( l a y e ri i ) 和第三层( l a y e r i i i ) 。层一采用简化版的删s i c 删算法,层二采用标 准m u s i c a m 算法,层三采用m u s i c a m 与a s p e c ( a d a p t i v es p e c t r a le n t r o p yc o d i n g o fh i g hq u a l i t ym u s i cs i g n a l s ,高质量音频自适应频域熵编码) 的结合算法。 每个后续的层次都有更高的压缩比,同时也需要更复杂的编码器。用户对层次的 选择可以在编码方案的复杂性和压缩质量之间进行权衡。 第一层的编码器最为简单,主要应用于数字小型盒式磁带( d i g i t a lc o m p a c t c a s s e t t e ,d c c ) 记录系统; 第二层的编码器的复杂度属于中等,应用于数字音频广播( d i g i t a la u d i o b r o a d c a s t i n g ,d a b ) 、c d - r o m 、和v c d 等。 第三层的编码器最为复杂,应用于i s d n ( 综合业务数据网) 上的音频传输, i n t e r n e t 网上广播、m p 3 光盘存储等。 第二章音频编码原理 在尽可能保持c d 音质为前提的条件下,m p e g - 1 音频压缩算法一般所能达到 的压缩比如表2 1 所示,从编码器的输入到输出的延迟时间如表2 2 所示m 。 表2 - 1l i p e g 一1 音频压缩算法的压缩比 层次算法压缩比 立体声信号所对应的码率( k b i 悯 l m u s i c a m 的简化版 4 :l3 8 4 2m u s i c a m6 :l 8 :12 5 乱1 9 2 3m u s i c a m 与a s p e c 的1 0 - 1 1 2 :11 2 8 1 1 2 结合 t 表2 肝f a - 1 音频编码解码器的延迟时间 层次 理论最小值( m s ) 实际实现中的一般值( m s ) l1 9 r 1 6 4 】,i = 0 ,1 ,6 3 式( 3 - 2 ) 第三章d a b 信源编码m u s i c a m 3 3 2 快速傅立叶变换( f f r ) f f t 是完成离散傅立叶变换的快速算法。为了补偿分析子带滤波器频率分辨 率不足,准确地模拟在低频率范围内听觉分析所需的频谱准确度,输入的p c m 信 号同时还送入快速傅立叶变换器。这样,既可以通过多相滤波器组使信号具有高 的时间分辨率,又可以使信号通过f f t 具有高的频率分辨率。足够高的频率分辨 率可以实现尽可能低的数据率,而足够高的时闻分辨率可以确保在短暂冲击声音 信号情况下,编码的声音信号也有足够高的质量。 f f t 的变换长度n = 1 0 2 4 设输入信号x ( i ) ,经与窗函数w ( i ) 进行f f t 运 算,得到频域里的信号x ( k ) : 形盼嚣o 风( i - c o s 等) ,0 k n - , 柏- 3 ) 鼻 ) = 吉矽( d x ( 0 口卅“”,0 k sn 2式( 3 4 ) 3 3 3 心理声学模型 如第二章第三节所述,当一个强音出现时,在时域和频域里与之相邻的弱音 都可能被其掩蔽。实验表明,人耳的分辨率是与频率相关的。这种与频率的相关 性反映为“临界频带”这个概念。由于入耳对一个临界频带里的音不容易分清, 所以噪声的掩蔽域值完全由它的频率附近的信号能量决定。m u s i c a m 将音频信号 分到频域子带,然后根据每个子频带内的量化噪声大小对每个子频带进行量化。 为了达到最大的压缩比,应求出每个子频带的量化级数使得量化噪声恰好不被听 到。这种计算是利用人耳的掩蔽效应来进行的,它根据f f t 的输出值,计算信号 掩蔽比( s m r ) 。计算步骤是: ( 1 ) 确定最大声压级。在每个子频带内根据比例因子和频谱数据进行计算 在确定掩蔽闽值时采用取最大的方法。 ( 2 ) 确定安静阈值。安静阈值( 也称为绝对阈值) 由所缺的任何信号决定, 它形成了最低掩蔽边界。 ( 3 ) 识别音调和非音调成分。由于信号中的音调和非音调成分的掩蔽阈值不 同,首先要识别音调和非音调成分,然后分别来进行处理。 ( 4 ) 掩模换算。能得到相关的掩模。 ( 5 ) 计算掩蔽阈值。每个子带噪声的掩蔽阈值由信号的掩蔽曲线决定。当子 频带相对于临界频段比较宽时,选择最小阈值;当其比较窄时,将覆盖子带的阈 d a b 接收芯片中音频解码的算法研究与a s i c 实现 值进行平均。 ( 6 ) 计算全局掩蔽阈值。全局阈值通过对相应的各子频带掩蔽阅值和安静阈 值求和得到。 ( 7 ) 确定最小掩蔽阈值。基于全局掩蔽阈值来确定每个子带的最小掩蔽阈值。 ( 8 ) 计算信号掩蔽率( s 躲) 。最小信号电平和最小掩蔽阈值之间的差异决定 了每个子带的s m r 值,这个值将用于比特分配 3 3 4 比例因子( s c f ) 的确定及其编码 比例因子是个无量纲的系数。滤波器的输出值在量化之前首先被归一化, 通过同时传送相应的比例因子,在解码器就可以正确恢复出每个样值相应的幅度。 鉴于入耳听觉的时问掩蔽特性,将每个字频带中相连续的1 2 个抽样值归并成 一个块,在采样频率为4 8 k h z 时,这个块相当于1 2 x 3 2 4 8 = 8 m s ,在这样的块上计 算每个子频带的比例因子,可得到比例因子低的数据率和整个块中存在的量化噪 声的不可听性之问的最佳折中。 比例因子共有6 3 个,用i s c f = 0 ,1 ,2 6 2 来标记,并用6 比特的字长来 编码。可以通过下式计算出任何一个比例因子标号i s c f 所对应的比例因子数值: s c f j _ s c 1 = 2 2 一叼” 式( 3 5 ) 只有被分配到某一个频带的比特数不为零时,该频带的比例因子才被传送。 需要指出的是,在构成比特流时,传送的是用6 b i t s 表示的比例因子标号 i s c f ,而不是具体的比例因子数值。 3 3 5 比例因子选择信息( s c f s i ) 及其编码 由于每帧各子频带相应有3 6 个相连续的子频带样值,故每个子频带包含3 个比例因子。因此,每个子频带每帧原则上应传送3 个比例因子。但是,为了降 低用于传送比例因子的数据率,采取了一种附加的编码措施。 统计试验表明,不仅在同一个时间块内相邻子频带的比例因子有很大的依赖 关系,而且在同一个子频带中时间上彼此相连续的时间块内的比例因子也有很大 的依赖关系。 第一种依赖关系表明了音频信号的频谱包络曲线的特征,在较高频率时频谱 能量分布是典型下降的,比例因子从低频子频带到高频子频带出现连续降低 第二种依赖关系是基于时间性的依赖关系,在一个子带中相继的的比例因子 差别很小,相继的比例因子可能出现大于2 d b 的差别的概率小于1 0 。 第三章d a b 信源编码m u s i c a m 比例因子的附加编码措施,一方面是基于上述的统计联系,另一方面是基于 人耳听觉的时间掩蔽特征:同一子带内的三个连续的比例因子总是共同地被考虑。 如果它们分别用比例因子标号i s c f l 、i s c f 2 、i s c f 3 表示,计算差值 d s c f l = i s c f l - i s c f 2 和d s c f 2 = i s c f 2 - i s c f 3 ,将所得差值分为5 个等级,并根据它 们的不同组合来确定传送三个、两个、或则一个比例因子。同时,每个频带每帧 还需要传送所谓“描述每个子频带传送的比例因子的数量和位置的信息”,这种信 息称为比例因子选择信息( s c f s i ) 。 比例因子选择信息仅2 比特,可编码为“0 0 ”、“0 1 ”、“1 0 ”、“1 1 ”,分别代表 传送三个,仅传送第一个和第三个、仅传送第一个、仅传送第一个和第二个比例 因子。在静态信号时,每个子频带每帧多数情况下只需传送一个比例因子。但在 短暂的冲击信号时,多数情况下三个比例因子都要传送。采用这种附加编码措施 后,平均而言用于传送比例因子所需的数据率可以由2 2 5 k b s 降低至7 5 k b s ”。 3 3 6 动态比特分配信息及其编码 比特分配用来确定比例因子比特数和各样点比特数。将比特分配给每个子频 带的基本原则是,使音频帧期间的总的噪声一掩蔽比( 州r ) 达到最小,并且限制 所用的比特数不超过该帧允许的比特数。为了同时满足比特率和掩蔽的要求,比 特分配器应同时考虑滤波器组的输出样点和来自心理声学模型的信号一掩蔽比率 s m r 。 所谓噪声一掩蔽比率m n r 是由信号一噪声比s n r 减去信号一掩蔽比s m r 。即: m n r = s n r s m r式( 3 - 6 ) 其中,信噪比s n r 与分配的比特数( 量化级数) 有关,分配的比特数越多, 量化噪声越小。而s 搬是以d b 表示的信号强度与最小掩蔽阈值之差。因此m n r 反映了量化噪声与掩蔽阈值的大小关系,删r 越小,压缩效果越好。 比特分配的步骤是一个迭代的过程。在迭代的每一步,都找出具有最小m n r 的子频带,使它的量化级数增大,即对其分配更高的比特数。 每个子频带只允许有限的量化数量。不同的子频带分别采用3 、5 、7 、9 、1 5 、 3 1 、6 3 、1 2 7 、2 5 5 、5 11 、1 0 2 3 、2 0 4 7 、4 0 9 5 、8 1 9 1 、1 6 3 8 3 、3 2 7 6 7 、6 5 5 3 5 等1 7 种不同的音频取样值量化级。各子频带允许的量化级数还与p c m 样点采样频率, 压缩数据流比特率有关。具体的比特分配和量化级数表见参考文献 3 4 。 3 3 7 子频带取样值的量化和编码 子频带样点的量化是采用具有对称零表示的线性量化器。这种表示可以防止 d a b 接收芯片中音频解码的算法研究与a s i c 实现 围绕零变化的较小的值被量化为不同的级。每一个子带样点都进行归一化,即, 将它的值除以相应的比例因子得到x ,再用以下式子进行量化: ( 1 ) 计算a * x + b ; ( 2 ) 取n 个最高有效位; ( 3 ) 最高位取反; a 和b 为量化系数,可以从表3 - 1 中查到。n 表示编码所需的比特数,也同样 在表3 - 1 中查到。最高位取反是为了避免比特流中出现全“l ”的代码,以免混淆 于同步字。 例如:一予带样点值为s = 1 4 ,它对应的比例因子s c f = 1 5 8 74 0 10 5 19 6 82 0 , 分配的量化级数是7 。则归一化后x 的值为x = s s c f = 0 8 8 19 4 47 3 5 ,由表3 - 1 中可查得a = 0 8 7 5 ,b = - 0 1 2 5 ,编码的比特数n = 3 ,所以a 木x + b = o 6 4 67 0 16 4 3 , 其二进制表示为0 1 0 10 0 10 1 10 ,取最有效的n = 3 位为“0 1 1 ”( 小数点后第三 位四舍五入) ,高位取反为“1 1 1 ”,即s 的最终编码为“1 1 1 ”。 表3 - 1 量化反量化系数及量化分类 级数abcd是否每个码 分组 字位数 3o 7 5 0 0 0 0 0 0 0o 2 5 0 0 0 0 0 0 01 3 3 3 3 3 3 3 3 3 3 30 5 0 0 0 0 0 0 0 0 0 0是5 50 6 2 5 0 0 0 0 0 0 - 0 3 7 5 0 伽0 0 01 6 0 0 0 0 0 0 0 0 0 00 5 0 0 0 0 0 0 0 0 0 0是7 70 8 7 5 0 0 0 0 0 0 - 0 1 2 5 0 0 0 0 0 0 1 1 4 2 8 5 7 1 4 2 8 60 2 5 0 0 0 0 0 0 0 0 0 否 3 9 0 5 6 2 5 0 0 0 0 0- 0 4 3 7 5 0 0 0 0 01 7 7 7 7 7 7 7 7 7 7 70 5 0 0 0 0 0 0 0 0 0 0是1 0 1 50 9 3 7 5 0 0 0 0 0 o 0 6 2 5 0 0 0 0 01 0 6 6 6 6 6 6 6 6 6 60 1 2 5 0 0 0 0 0 0 0 0否4 3 l 0 9 3 7 5 0 0 0 0 0o 0 6 2 5 伽1 0 0 01 0 3 2 2 5 80 1 6 4 5 2o 舶2 5 0 0 0 0 0 0 0否5 6 3o 9 8 4 3 7 5 0 0 0 _ o 0 3 1 2 5 0 0 0 01 0 1 5 8 7 3 0 1 5 8 70 0 3 1 2 5 0 0 0 咖否6 1 2 70 9 9 2 1 8 7 5 0 0 o 0 0 7 8 1 2 5 0 01 0 0 7 8 7 4 0 1 5 7 50 0 1 5 6 2 5 0 0 0 0 0否7 2 5 50 9 9 6 0 9 1 7 5 00 0 0 3 9 0 6 2 5 01 0 0 3 9 2 1 5 6 8 6 30 0 0 7 8 1 2 5 0 0 0 0 否 8 5 1 1o 9 9 8 0 4 6 8 7 5o o l 9 5 3 1 2 51 0 0 1 9 5 6 9 4 7 1 60 0 0 3 9 0 6 2 5 0 0 0否9 1 0 2 3o 9 9 9 0 2 3 4 3 80 0 0 0 9 7 6 5 6 3 1 0 0 0 9 7 7 5 1 7 1 10 0 0 1 9 5 3 1 2 5 0 0否 1 0 2 0 4 70 9 9 9 7 5 5 8 5 9- 0 0 0 0 4 8 8 2 91 0 0 0 4 8 8 5 1 9 7 90 0 0 0 9 7 6 5 6 2 5 0 否 1 1 4 0 9 5o 9 9 9 7 5 5 8 5 9 o o 0 0 2 4 4 1 4 1l 舢2 4 4 2 0 0 2 40 肿0 4 8 8 2 8 1 2 5否1 2 8 1 9 10 9 9 9 8 7 7 9 3 0o o o o l 2 2 0 7 01 0 0 0 1 2 2 0 8 5 2 2o 0 ( ) 0 2 4 4 1 4 0 6 3 否 1 3 1 6 3 8 30 9 9 9 9 3 8 9 6 5一o 0 0 0 0 6 1 0 3 5i 0 0 0 0 6 1 0 3 8 8 80 0 0 0 1 2 2 0 7 0 3 l否1 4 3 2 7 6 7o 9 9 9 6 9 4 8 2 4 - 0 0 0 0 0 3 0 5 1 81 0 0 0 0 3 0 5 1 8 5 10 0 0 0 0 6 1 0 3 5 1 6否1 5 6 5 5 3 50 9 9 9 9 8 4 7 4 1o o 0 0 0 1 5 2 5 91 0 0 0 0 1 5 2 5 9 0 20 0 0 0 0 3 0 5 1 7 5 8 否 1 6 为了进一步减小编码比特流数,对处于在3 ,5 ,9 量化级的样点进行合并 第三章d a b 信源编码m u s l c a m 这时,三个连续的样点被编成一个码字。对这三个一组的样点只传送一个值v m , m s b ( 最高位) 在前,l s b ( 最低位) 在后
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 唱歌 《阳关三叠》教学设计初中音乐沪教版八年级下册-沪教版
- 三年级道德与法治下册 第四单元 多样的交通和通信 13 万里一线牵教学设计1 新人教版
- 三年级道德与法治下册期末试卷
- 生物北师大版第1节 动物运动的方式教学设计及反思
- Unit 9 Lesson 7 Reading for Writing 教案- 仁爱科普版(2024)七年级英语下册
- 排尿护理教学设计中职专业课-基础护理-医学类-医药卫生大类
- 护理层级与职业安全
- 2026年抚顺石化分公司春季高校毕业生招聘笔试模拟试题及答案解析
- 宜宾市翠屏区人民法院公开招聘司法辅助人员(3人)笔试备考题库及答案解析
- 2026潍坊某国有企业外包员工招聘考试模拟试题及答案解析
- 空调铜管规格尺寸及重量计算
- 肌少症-教学讲解课件
- 死因监测培训
- 螺冈陈考资料
- 云南金茂丽江君悦酒店工程施工组织设计
- YS/T 751-2011钽及钽合金牌号和化学成分
- LY/T 3130-2019木栈道铺装技术规程
- GB/T 8582-2008电工电子设备机械结构术语
- 生产系统建模与仿真课件
- 详细的生化池设计计算
- 预算审核(审计工作方案)-投标文件
评论
0/150
提交评论