(通信与信息系统专业论文)avsm音频编解码算法的研究及其在dsp平台上的实现.pdf_第1页
(通信与信息系统专业论文)avsm音频编解码算法的研究及其在dsp平台上的实现.pdf_第2页
(通信与信息系统专业论文)avsm音频编解码算法的研究及其在dsp平台上的实现.pdf_第3页
(通信与信息系统专业论文)avsm音频编解码算法的研究及其在dsp平台上的实现.pdf_第4页
(通信与信息系统专业论文)avsm音频编解码算法的研究及其在dsp平台上的实现.pdf_第5页
已阅读5页,还剩65页未读 继续免费阅读

(通信与信息系统专业论文)avsm音频编解码算法的研究及其在dsp平台上的实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 目前,我国在音频电子消费产品领域已经具备较强的产业基础,但是由于没 有掌握核心专利技术,相关企业长期受制于国外持有标准、专利与技术的企业和 组织,专利纠纷成为众多相关企业所面临的普遍问题,大大制约了它们的发展。 因此,制定拥有自主知识产权的相关标准变得更加必要与迫切。a v s m 音频就 是我国正在制定的拥有自主知识产权的音频压缩与传输标准,其借鉴了3 g p p 音 频标准a m r - w b + 的基本框架,旨在为迅速发展的无线网络与手机等移动设备提 供音频编解码、系统、版权保护和文件格式等方面的规范和标准。该标准成功制 定将解决目前我国音频产业所面临的高专利费用等棘手问题,为我国音频电子消 费产品产业的发展提供更广阔的空间。 本课题研究了a v s m 音频编解码算法,并在t m s 3 2 0 c 6 7 1 3 开发板上实现 了a v s o m 音频解码器。课题首先研究了a m r w b + 的基本技术框架和核心算法 模块,并在此基础上详细分析了a v s m 音频的关键技术。然后,在v c 平台下 调试了a v s m 音频参考代码( 2 0 0 7 年4 月1 1 日更新版本) ,并将其解码器移植 至c c s 仿真平台。经过存储开销与执行效率的优化,最终在c 6 7 1 3 开发板上实 现了每秒钟解码8 - 9 超帧立体声信号( 4 8 k h z 采样) 。主客观测试表明,a v s m 音频算法与a m r - w b + 性能相当。本课题的研究工作对以后a v s m 音频标准的 推广及应用实现具有一定的意义。 关键词:数字音频,a m r - w b + ,a v s m 音频,t m s 3 2 0 c 6 7 1 3 a b s t r a c t i no u rc o l m 咄a l t h o u g ht h ei n d u s t r i a lf o u n d a t i o no na u d i oi sa k e a d yv e r ys t r o n g , r e l a t e dc o r p o r a t i o n sa r es t i l lc h a i n e dt of o r e i g nc o r p o r a t i o n so ro r g a n i z a t i o n sd u et o t h el a c ko fi m p o r t a n tt e c h n i q u e sa n ds t a n d a r d s a n dm a n y p a t e n td i s p u t e sa r ef a c e db y m o s tc o r r e l a t i v ee n t e r p r i s e s ,w h i c hr e s t r i c tt h e i rd e v e l o p m e n tg r e a t l y s oi ti sm o r e n e c e s s a r ya n ds t r i n g e n tt od r a wu pr e l a t e ds t a n d a r d sw i t hp r o p r i e t a r yi n t e l l e c t u a l p r o p e r t yr i g h t s a v s - ma u d i os t a n d a r di sn o w o nd r a wb yo u rc o u n t r yi n d e p e n d e n t l y b a s e do nt h ef r a m e w o r ko fa m r - w b + a u d i os t a n d a r do f3 g p ea n di ta i m sa tb e i n g a p p l i e dt ow i r e l e s sn e t w o r ka n dm o b i l ee q u i p m e n t ,s u c ha sc e l l p h o n e i fi tc o u l db e d r a w nu ps u c c e s s f u l l y , m a n yp a t e n td i s p u t e st h a ta u d i oi n d u s t r i e sa th o m ea r e c o n f r o n t e dw i t h ,s u c ha sh i g hp a t e n tc o s t , w i l lb es e t t l e dd o w n ,a n dt h ed e v e l o p m e n t o fa u d i oi n d u s t r i e si no u rc o u n t r yw i l lb ef a s t e r t h i st h e s i si st od or e s e a r c ho na v s ma u d i oc o d e ca n di m p l e m e n ta v s ma u d i o d e c o d e ro nt m s 3 2 0 c 6 713b o a r d a tf i r s t ,s e v e r a lp a r t i c u l a rt e c h n i q u e so fa v s - m a u d i oa r ea n a l y z e d ,b a s e do nt h ei n t r o d u c t i o no ft h et e c h n i c a lf r a m e w o r ka n dt h ec o r e a l g o r i t h m so fa m r w b + t h e n ,t h er e f e r e n c ed e c o d e ro fa v s ma u d i o ( v e r s i o n u p d a t e da ta p r i l11 吼,2 0 0 7 ) i sp o r t i n gt ot h es i m u l a t o ro fc 6 7 13o nc c s p l a t f o r m a f t e rd e b u g g i n gi to nv cp l a t f o r m t h r o u g hal o to fo p t i m i z a t i o ni na s p e c t so f m e m o r ys p e n d i n ga n dd e c o d i n gs p e e d , f i n a l l y , t h ea v s ma u d i od e c o r d e ri s i m p l e m e n t e do nc 6 7 13b o a r d , a n di tc o u l dd e c o d e8 9s u p e r - f r a m e ss t e r e os i g n a l s a m p l e da t4 8 k h zp e rs e c o n d t h eo b j e c t i v ea n ds u b j e c t i v et e s t si n d i c a t et h a tt h e p e r f o r m a n c eo fa v s - ma u d i oi sg e n e r a l l ya sg o o da st h a to fa m r - w b + t h i st h e s i s i su s e f u lf o rt h es p r e a da n d a p p l i c a t i o ns t u d yo f a v s ma u d i o k e yw o r d s :d i g i t a la u d i o ,a m r - w b + ,a v s ma u d i o ,t m s 3 2 0 c 6 713 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的 研究成果,除了文中特别加以标注和致谢之处外,论史中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得苤盗盘堂或其他教育机构的学位或证 书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中 作了明确的说明并表示了谢意。 学位论文作者签名: 孔瓷殳 签字r 期:讼1 年石月i f 同 学位论文版权使用授权书 本学位论文作者完全了解苤叠态鲎 有关保留、使用学位论文的规定。 特授权墨鲞盘鲎可以将学位论文的全部或部分内容编入有关数据序进行检 索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校 向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名:裂豫处 签字噍刁年石月 翩签名:旁f 将 签字f 期:切7 年乡月同 第一章绪论 第一章绪论 1 1 数字音频编码技术发展概况 在我们日常生活中,声音是人们用来传递信息最熟悉、最方便的方式它是 携带信息的主要媒体之一,音频信号是多媒体信息的重要组成部分n 3 。上世纪8 0 年代出现的激光唱盘( c o m p a c td i s c ,c d ) 技术,全面体现出数字音频技术的 高保真、大动态范围、稳健性等优点,并在实际应用中取得了巨大的成功。在过 去l o 年中,数字音频技术已经基本代替了模拟音频技术,给人们带来了高质量 声音,并在互联网、无线通信、多媒体计算机上得到广泛应用。 目前,数字音频领域流行的编码技术按数据量的压缩性能可分为非压缩音频 ( 如波形音频、音乐设备数字接口( m u s i c a li n s t r u m e n td i g i t a li n t e r f a c e , m i d i ) 音频等) 和压缩音频( 如活动图像专家组( m o v i n gp i c t u r ee x p e r tg r o u p , 船e g ) 音频、杜比音频压缩( a u d i oc o m p r e s s i o n ,a c - 3 ) 等) 两类轻】。众所周知, 数字化声音信号的数据量是很大的。例如,普通c d 系统,其采样率为4 4 1k h z , 量化精度为1 6 比特,传输立体声音频信号需要1 4 1m b p s 的码率;l 小时的5 1 声道音乐信号,若采用线性脉冲编码调制( p u l s ec o d e dm o d u l a t e ,p c m ) 编码, 则需要1 6 2 g b 的存储空间,远远超出了c d 的容量。随着多媒体应用日益广泛, 特别是在无线和网络系统中,常常受到带宽等因素的限制,无法兼容高码率。但 对用户来说,期望在所有的数字系统上都能享受c d 音质的回放;而且,在专业音 频制作领域有一种趋势,即用更高的采样率和采样精度来获得更好的音质。如将 采样频率由4 4 1 k h z 提高到4 8 k h z ,甚至是9 6 k h z 或1 9 2 k h z ,采样精度由1 6 b i t 提高到2 4 b i t 。如果仍采用p c m 编码,无疑会有更加巨大的数据量,这在传输带 宽资源紧缺、传输代价昂贵及存储器容量有限的现实情况下是无法接受的嘲。为 了利用有限的资源,必须在不降低音质的情况下对原始数字音频信号进行编码压 缩,降低数据传输所需的码率。因此,高效的编码技术是数字音频技术实用化的 关键。 一般来讲,根据编码后的音频能否完全重构出原始声音,可以将音频编码技 术分为无损编码缩及有损编码两大类。而按照编码方案的不同,又可将其划分为 时域编码、变换编码、子带编码,以及多种技术相互融合的混合编码等等。各种 不同的编码技术,其算法的复杂程度( 包括时问复杂度和空间复杂度) 、音频质量、 算法效率( 即压缩比例) ,以及编解码延时等都有很大的不同。 第一章绪论 音频编码技术的发展最初是从无损编码开始的。7 0 年代初开始采用的类似 p c m 的瞬时压扩技术和块压扩( b l o c k - c o m p r e s s i n g ) 技术。这种技术的编码效率较 低。8 0 年代,数字信号处理技术迅速发展,使复杂的音频编码算法的运用成为可 能,出现了从音质尚可到音质卓越的一系列频域编码算法。8 0 年代末至9 0 年代 初涌现的编码算法普遍采用了一种高效率编码技术,即利用人耳的掩蔽效应和临 界频带等特性来进行子带编码和变换编码。其中有:掩蔽型通用子带综合编码复 用( m a s k i n gp a t t e r na d a p t e du n i v e r s a ls u b b a n di n t e g r a t e dc o d i n ga n d m u l t i p l e x i n g ,m u s i c a m ) 系统、1 2 8 k b p s 的a c - 2 编码器、a c 一3 系统、自适应频 谱感知熵编码( a d a p t i v es p e c t r a lp e r c e p t u a le n t r o p yc o d i n g ,a s p e c ) 和子 带自适应差分脉冲编码( s u bb a n d a d a p t i v ed i f f e r e n t i a lp u l s ec o d e m o d u l a t i o n ,s b - a d p c m ) 等。宽带语音和高保真音频编码技术在商业应用的驱动 下迅速发展。9 0 年代至今,有损音频编码把音频数据的压缩率提高到1 2 :1 ,甚 至更高。付出的代价是音质的下降。如果人们根据不同的应用要求把音频质量同 数据压缩率进行折衷,这些方案就显得非常有用。比较著名的是:m p 3 、高级音 频编码( a d v a n c e da u d i oc o d i n g ,a a c ) 、r e a lm e d i a 及我国的音视频标准 ( a u d i o & v i d e os t a n d a r d ,a v s ) 的第三部分等。同时,能给最终用户提供最佳 听觉体验的无损编码技术也取得了新的突破。m e r i d i a n 无损编码( m e r i d i a n l o s s l e s sp r e s s i n g ,地p ) 是一种应用所有权技术的音频编解码计划,它能传送 多声道环绕声,并以可能的最高的动态范围和更高的取样频率来确保任何声音细 节都表现完美瞄1 。 近年来,移动通信产业飞速发展。总体看来,第三代移动通信已走出低谷, 进入快速发展阶段。高速无线网络正在日益发展,市场上提供的移动设备从笔记 本电脑、个人数字助理( p e r s o n a ld i 西t a la s s i s t a n t ,p d a ) 到手机应有尽有,流 媒体、按讲( p u s ht ot a l k ,p t t ) 、可视电话、手机电视等业务备受追捧,通信 业务正在由传统的话音业务向宽带数据业务转变。随着移动多媒体技术的日益成 熟以及i n t e r a c t 接入技术的多样化,移动音乐、移动音频会议、音频广播、移动伴 音等诸多移动音频业务也迅速增长。据统计,到2 0 0 5 年底,全球固定电话用户 数为1 3 亿,普及率为2 0 ;全球移动用户数超过2 7 8 8 亿,普及率约为4 3 。 2 0 0 6 年全球移动通信发展呈现更加高速的增长态势,仅去年一年新增移动用户 数达6 3 8 亿,是历年新增用户数最多的一年。从我国的情况看,2 0 0 6 年底我国 固定电话用户3 6 7 亿,普及率为2 8 ;移动通信用户数为4 6 1 亿,普及率为 3 5 3 。移动数据产生的收入占整个移动业务收入的2 1 ,比去年提升3 个百分 点【4 】。相信随着向无线接入方式的演进及移动多媒体技术的日益成熟,彩铃、手 机音乐以及移动伴音等业务在运营商业务中的比重将越来越大,移动音频将成为 第一章绪论 继语音业务之后每用户平均收入( a v e r a g er e v e n u e p e ru s e r ,a r p u ) 的主要贡 献者。目前,移动音频编解码应用比较广泛的技术主要是第三代合作伙伴计划 ( t h e3 r dg e n e r a t i o np a r t n e r s h i pp r o j e c t ,3 g p p ) 的系列标准,如a m r ( a d a p t i v e m u l t i - r a t e ) 、a m p - w b ( a d a p t i v em u l t i - r a t e ) 及a m r - w b + ( e x t e n d e da d a p t i v e m u l t i r a t ew i d e b a n d ) 等,中国也在紧张制定拥有自主知识产权的音视频编码标 准a y s m 。 1 2 常见商用数字音频编码系统 经过十多年的演变,音频编码技术本身和产业应用背景都发生了明显的变 化,后起之秀辈出。目前,常见的商用音频编码系统主要有g 7 x x ,卿e g 伴音系 列、杜比音像系统及3 g p p 制定的a m r 系列。 c c i t t 最初定义的音频编码算法建议标准包括:g 7 1 1 ,g 7 2 1 ,g 7 2 2 ,g 7 2 3 等。1 9 9 5 年,i t u - t 批准了新的语音编码标准g 7 2 9 。该标准采用共轭结构代数 码激励线性预测( c o n j u g a t es t r u c t u r ea l g e b r a i cc o d ee x c i t e dl i n e a r p r e d i c t i o n ,c s a c e l p ) ,可以仅用8 k b p s 带宽传输话音,而话音质量与3 2 k b p s 的a d p c m 相同。它被广泛应用于i p - p h o n e 技术中口1 。 m p e g 系列音频编码标准应用比较广泛,主要有m p e g l - 2 一4 。m p e g - i 音频 标准按复杂度规定了三种模式,即层i ( 简化的a s p e c ) 、层i i ( 等同于m u s i c a m , 又称艘2 ) 和层i i i ( 又称肝3 ) 。层i 在数字广播( d i g i t a la u d i ob r o a d c a s t i n g , d a b ) ,层i i 在数字演播室、视频高密光盘( v i d e oc o m p a c td i s c ,v c d ) 伴音等 诸多领域得到了广泛应用璐3 ;层i i i 是在综合m u s i c a m 和a s p e c 优点基础上提出的 混合编码技术,压缩比可达l :i 0 - - 一i :1 2 ,并且低码率下仍有高品质的音质,这 使其在网络上得到了广泛应用。m p e g - 2 音频编码标准是在m p e g 一1 的基础上由双 声道扩展到5 1 声道。主要包括:m p e g - - 2b c ( 类似m p 3 ) 和m p e g - - 2a a c ( 感知编 码) 哺1 。a a c 编码算法不仅利用人耳听觉系统的掩蔽特性来掩藏有损编码失真, 而且利用变换编码除去声道内的统计冗余,压缩率可达1 :1 5 ,可获得比肝e g 一2 b c 更好的音质,适用于各种场合,如可以做电视信号伴音等,但是其后向兼容性 不好。m p e g - 4 相对m p e g - 1 ,m p e g - 2 而言,增加了通信用途,并设想应用于各种 信息压缩率、各种传输线路行驶( 包括记录媒体) 以及连接形式口1 。 杜比环绕影音是由美国杜比实验室开发的性能卓越的数字音频编码系统,其 中a c 一1 用于卫星通信和数码有线广播,a c - 2 用于专业音频的传输和存储,a c 一3 采用第三代自适应变换编码( a d a p t i v et r a n s f e rc o d i n g ,a t c ) 技术,在5 1 声道的应用中,可在3 8 4k b p s 的码率下提供透明的音频质量,其在家庭影院、 第一章绪论 h d t v 、数字视频广播d v l 3 等方面得到广泛应用,并且被定为d v d 伴音标准m 1 。 3 g p p 是领先的3 g 技术规范机构,致力于制定通用的移动通信技术规范。其 制定的a m r ( 主要应用于窄带语音编码) 、a 弧一w b ( 主要应用于宽带语音编码) 及a m r w b + ( 主要应用于宽带音频编码) 在移动通信系统中得到了很广泛的应用。 近几年,随着移动通信技术、互联网技术及多媒体技术的日益成熟,音视频 产业迅速发展,我国已经成为数字音视频产品的生产和销售大国。但是,由于我 国不掌握核心关键技术专利,相关产业和企业的发展长期受制于国外持有标准化 专利与技术的企业组织。为知识产权付费已经不仅仅是设备商的事,h 2 6 4 等国 际标准也已向运营商征收知识产权费。从前年d v d 专利收费,到去年日本厂商透 露数码相机专利收费意向0 3 ,再到今年3 月华旗、纽曼等1 2 家中国企业的船3 产 品因涉嫌侵犯意大利s i s v e l 公司专利而被德国海关扣押等等案例,都提醒我们关 注国内数字音视频产业的潜在风险。正是基于这个背景,为了在专利费上不再受 制于人,中科院计算所联合清华大学、武汉大学、上广电等国内外从事数字音视 频编解码技术研发的组织和企业,于2 0 0 2 年6 月成立了a v s i 作组,致力于制定 具有我国自主知识产权的数字音视频编解码技术标准a v s 。a v s 是包括系统、视频、 音频等三个主要标准和一致性测试等支撑标准的完整标准体系n 们,这是基于我国 创新技术和公开技术制定的开放标准,旨在为数字音视频设备与系统提供高效经 济的信源编解码技术,服务于高分辨率数字广播、高密度激光数字存储媒体、无 线宽带多媒体通信、数字电视等重大信息产业应用,从而打破国外企业在音视频 编码方面的垄断地位, 避免d v d 专利之类制约我国信息产业全行业发展的基础 性问题再次发生。2 0 0 5 年初,在a v s 工作组第1 2 次全体会议上,a v s 工作组完成 了a v s 标准第三部分( 音频编解码标准) 的草案n 妇口别。在2 0 0 5 年6 月北京会议上, 为面向新一代移动通信系统的低码率高保真音频编解码应用,a v s 音频专家工作 组决定启动a v s m 音频标准的制订,并在2 0 0 5 年8 月武汉会议上专门成立了 a v s - m 音频小组,负责制定a v s - m 音频标准。目前,a v s 第三部分已进入由a v s 总 体组最后的审批敲定阶段,a v s _ m 音频也已完成初始参考代码更新和w d 文档的撰 写,预计今年6 月份完成c d 文档的撰写。 1 3 本论文的任务与结构 本论文的任务是跟踪研究a v s m 音频算法,并基于数字信号处理器芯片 t m s 3 2 0 c 6 7 1 3 的硬件平台开发优化及最终实现a v s - m 音频解码器。本人在本课 题中主要做的工作有:算法跟踪、程序错误调试、解码程序的移植实现、存储空 间的规划、代码执行效率的优化以及实现后a v s m 音频的性能评价。 第一章绪论 第一章简要介绍数字音频编码技术的发展概况和当今常见的商用编码标准, 分析了本课题的研究背景。 第二章主要介绍a m r - w b + 宽带音频标准的算法框架及各个核心技术模块 的关键算法。 第三章对比a m r - w b + 标准来介绍a v s m 音频算法,详细分析a v s m 音 频与a m r - w b + 算法有何不同,并对相应模块性能作主观或客观评价。 第四章是本论文的重点。详细介绍了a v s - m 音频算法在t m s 3 2 0 c 6 7 1 3 硬 件平台下的移植、存储空间分配和代码执行效率的优化。 第五章对比a m r w b + ,给出了a v s _ m 音频性能的主客观评价。 最后为本论文工作的总结及展望。 第二章a 瑚r 、b + 音频编解码算法研究 第二章a m r w b + 音频编解码算法研究 2 1a m r 、船+ 音频标准简介 如今,形形色色的音频编解码器广泛应用于我们的日常生活中。选择哪种编 解码器通常取决于以下因素:音频素材的内容类型、可用通信速率、收听场合对 音质的要求、专利费以及市场品牌等。尽管现在m p 3 、a c 3 等编码算法已经获 得了巨大的成功,但是它们并不适合应用于移动设备。随着移动音频业务种类及 需求的迅速增加,效率较高的编码算法( 如a v i r 、a a c ) 已被提出,并为适应 移动音频的应用而不断改进。 a v i r - w b + 是在a m r 、a m r - w b 的基础上提出来的。a m r 采用代数码本激 励线性预测( a l g e b r a i cc o d ee x c i t e dl i n e a rp r e d i c t i o n ,a c e l p ) 技术,主要用于 语音编码。a m r w b 是在a m r 的基础上提出的宽带语音编码标准,也采用了 a c e l p 技术,其将声音信号的带宽从2 0 0 3 4 0 0 h z 扩展到5 0 7 0 0 0 h z ,增加了语音 的可懂度和自然度。而a m r - w b + 则是在a c e l p 的基础上结合了变换编码激励 ( t r a n s f o r mc o d e de x c i t a t i o n ,t c x ) 、高频编码( h i g hf r e q u e n c yc o d i n g ) 和立 体声编码( s t e r e oc o d i n g ) 技术的一种宽带音频编码标准,其增加了对立体声信 号及较高采样率的支持,主要用于传送高音质的音频内容,包括纯语音、带噪语 音、纯音乐、背景音乐混和式语音( s p e e c ho v e rm u s i c ) 以及语音穿插音乐( s p e e c h b e t w e e nm u s i c ) ,其应用业务包括3 g p p 的分组交换流( p a c k e ts w i t c h e d s t r e a m i n g ,p s s ) 、多媒体短信业务( m u l t i m e d i am e s s a g i n gs e r v i c e s ,删s ) 、 多媒体广播( m u l t i m e d i ab r o a d c a s t ) 以及下载等。a m r w b + 重建出的音频信号带 宽可高达2 4k h z ( 接近c d 音质) ,而且它与a m r - w b 后向兼容。2 0 0 4 年9 月,a m r w b + 已被e t s i 3 g p p 选为宽带音频编码标准n 驯。 2 2a m r - w b + 标准的框架 a m r w b + 音频编码器包含a m r - w b 全部的语音编码模式1 9 和a m r - w b 的 v a d ( v o i c ea c t i v i t yd e t e c t i o n ) 、d t x ( d i s c o n t i n u o u st r a n s m i s s i o n ) 技术, 并增加了音乐信号编码模块( t c x 模块) 、用于高频带编码的带宽扩展( b a n d w id t h e x t e n s i o n ) 模块及立体声模块,是自适应多码率宽带音频编码标准,这里所谓 的自适应,是指可以根据信道等环境的变化机动的改变其编码模式,即在编码的 第二章a m r - w b + 音频编解码算法研究 过程中调整编码输出比特速率,以保证重建的音频质量;所谓的多码率是指其有 很多种不同的编码模式,每一种编码模式对应于不同的编码输出比特速率,用7 b i t ( 1 2 8 种) 指示其编码模式( f r a m e t y p e ,用- m i 指示) ,目前确定已有4 8 种。其码 率范围较宽,从6 - 一4 8k b p s ,单声道信号的码率在6 - - 一3 6k b p s 之间可分级,立体 声信号的码率在8 - - - - 4 8k b p s 之间可分级。 对于采样率为8 , - 一4 8 k i - i z 的原始音频信号输入,a 胍一w b + 先通过可变采样率转 换模块一多相位滤波器进行重采样,将其转换到内在采样率f s 上( 编码模式0 1 3 除外) ,然后再以帧为单位进行编解码处理。其中,内在采样率的大小是可 选择的,其范围为1 2 8 0 0 - - 3 8 4 0 0 h z ,但是一超帧的长度是固定的,均是1 0 2 4 样 点。选择不同的内在采样率,则编码输出的比特率及一帧信号所对应的时间间隔 就不同。a m r w b + 支持的内在采样率有1 3 种,如下表2 - 1 所示引。 表2 - 1a m r w b + 支持的1 3 种内在采样率 i s fi n t e r n a lf r a m ed u r a t i o nb 打r a t e i n d e x s a m p l i n g向砂f a c t o r r a t e h z ) 0n a2 0n a 11 2 8 0 04 01 2 21 4 4 0 03 5 5 59 1 6 31 6 0 0 03 25 8 41 7 0 6 73 02 3 51 9 2 0 0 2 6 6 7 3 4 62 1 3 3 32 4s 1 6 72 4 0 0 02 1 3 31 5 1 6 82 5 6 0 02 01 92 8 8 0 01 7 7 89 8 1 03 2 0 0 01 6s 1 4 l l3 4 1 3 31 54 3 1 23 6 0 0 01 4 2 24 5 3 2 1 33 8 4 0 01 3 3 33 2 其中,模式0 对应于a m r w b + 的模式0 1 3 ( 9 种a m r w b 编码模式,4 种扩 展的a m r w b + 模式) ,如表2 - 2 所示。对于这1 4 种模式,a m r w b + 不进行内在采 样率转换,而是以2 0 m s 为一帧直接进行编解码处理。 第二章a m r - w b + 音频编解码算法研究 表2 - 2a 脓一w b + 编码模式0 - - - - 1 5 i n d e xm o d e s a m p l i n g m o n o s t e r e on u m b e ro fd a t a r a t e o c t e t sp e rf r a m e a h z )翻- 缎一w bm o d e s z e r o - p a d d e d ) 0a m r - w b6 6 0 k b p s 1 6m o d o1 7 1a m r - w b8 8 5 k b p s 1 6m o n o2 3 2a m r - w b12 6 5k b p s1 6m o n o3 2 3a m r - w b14 2 5k b p s1 6 m o n o 3 6 4a m r - w b15 8 5k b p s 1 6m o n o4 0 5a m r w b18 2 5k b p s1 6m o n o4 6 6a m r - w b19 8 5k b p s1 6m o n o5 0 7a m r - w b2 3 0 5k b p s1 6m o n o5 8 8a m r - w b2 3 8 5k b p s1 6m o n o6 0 9a m r 、v bs i d1 6m o n o5 1 0a m r w b + 1 3 6k b p s1 6 2 4 m o n o 3 4 1 1 a m r 一忸+ 1 8k b p s1 6 2 4s t e r e o4 5 1 2a m r 、v b + 2 4k b p s1 6 2 4m o n o6 0 1 3a m r - w b + 2 4k b p s1 6 2 4s t e r e o6 0 1 4f ra m ee r a s u r eo 1 5n od 觚ao 2 2 1 编码器 原始音频输入信号通过内在采样率转换模块进行预处理之后,开始以帧为单 位进行编码。详细的编码器框图如图2 - 1 所示d 制。 对于采样率为f s 的单声道信号m ( 图中阴影部分所示) ,以2 0 4 8 个样点为单 位,先通过一个滤波器组将其分割为采样率均为f s 2 的高、低两个频带,每个 频带各1 0 2 4 点,然后进行不同的编码处理。对于高带信号( m 咿) ,采用一种编 码比特数较少的带宽扩展( b a n d w i d t he x t e n s i o n ,b 肫) 技术进行编码;对于低 带信号( ) ,根据判断的音频信号类型( 语音或音乐) ,进行核心编码,即采 用a c e l p 编码( 语音类) 或者t c x 编码( 音乐类) 。最后将高带编码比特、低带编 码比特和模式比特以帧为单位( 2 5 6 样点) 打包入流。 对于采样率为f s 的立体声信号,类似单声道信号,将左( l ) 、右( r ) 两声 第二章a m r - w b + 音频编解码算法研究 道各2 0 4 8 样点通过滤波器组进行高、低带分割。对于左、右两声道的高带信号 ( l 邗、r 咿) ,分别采用带宽扩展技术进行编码。对于两声道的低带信号( k 、趾) , 一方面加和成一个单声道低带信号( ) 进行低带核心编码;另一方面,该单声 道低带信号( ) 连同右声道的低带信号( ) 一起进行立体声编码。最后类似 单声道信号,将立体声编码比特、核心编码比特、模式比特以及两个声道各自的 高带编码比特打包入流。 ih fd a r a n q s m e r s 忏 r h fe n c o d i n g i n p u ts i g n a l u c :- j j :o l rs a g n a l st o i q e qi n dn c e l l lk _ 卜,h 凸 一u 芒一 mr i _ n l j e l l nn rp a r a r n e 啊s l n p u ts i g n a l h fe n c o d i n g r i m o d e m o n o i n p u ts i g n a l p r e p r o c e s i n g l l fp a r a m e t e r s m a c e l p 1 1 c x l m u a n d a n a l y s i s r e n c o d i n g r 伺t e r b a n k l f l 止 l s t e r e o ld o w n r p a m m e t e r s r m i x i n g s t e r e o i ( l ,r ) e n c o d i n g r l f t d & ( m s ) - l r ”“” 口 m o n oo p e r a t i o n 图2 - 1a m r w b + 编码器框图 其中高、低带分割的示意图如图2 2 所示。 i n p u ts i g n a lf 2 0 4 8s a m 图2 - 2 高、低带分割示意图 输入立体声信号的两声道的低带信号加和成一个单声道信号的实现如式2 1 所示。 第二章a 朋r w b + 音频编解码算法研究 m i j f ( n ) = 0 5 宰【r l f ( n 卜l 让( n ) 】 2 2 2 解码器 ( 2 - 1 ) 编码的比特流经过信道编码、信道传输、信道解码等技术模块处理后传输到 解码器,由解码器解码合成音频信号。详细的解码器框图如图2 - 3 所示。 对于单声道信号解码( 图中阴影部分) ,从比特流中解析出高、低带参数和 模式比特,分别进行高带解码、低带核心解码,并得到高带解码信号( ) 和低 带解码信号( m l f ) ,最后将两者通过一个合成滤波器组得到一个合成的音频信号, 再经过后置滤波处理得到音频输出信号m ,完成解码。 对于立体声信号,类似单声道,先从比特流中解析出两个声道的高带参数( 两 组) 、低带参数( 一组) 、立体声参数( 一组) 及模式比特。对于两组高带参数, 分别进行高带解码得到两个声道的高带信号( k 、r 盱) ;对于低带参数进行低带 核心解码得到一个低带信号;对于立体声参数,联合低带解码得到的信号进 行立体声解码,得到左右声道的低带信号( k 、k ) 。最后对于两个声道的高、 低带信号( k 、k 、) ,类似单声道,通过合成滤波器组、后置滤波,得 到两个声道的音频信号l 和r ,完成解码。另外,a m r w b + 支持将立体声信号解码 为单声道信号,对于这种情况,解码器忽略立体声解码模块,对高带解码模块, 当左右声道高频带增益相差大于2 0 d b 时,l p 滤波器系数选择增益大的那个即可, 否则采取平均的方式获取,最后直接将高、低带解码信号合成为单声道音频信号 输出,完成解码。 h fp a r a m e t e r s- 。” l h f h fd e c o d i n g 。一一。 。翟苫善磊函:“ i i n n a i 叠f o l d e di n i - j c l l q ”q w i 口“” r h f h fd e c o d i n g m o d e m h f d e m u x m o n o s y n t h e s i s l fp a r a m e t e r sm l f n l t e r b a n ka n d a c e l p ,t c x - p o s t p r o c e s i n g d e c o d i n g 。勰噶1 b s t e r e o d e c o d i n g r l f 一 口 m o n oo p e r a t i o n 图2 3a m r w b + 解码器框图 1 0 一 第二章a m r - 、b + 音频编解码算法研究 解码完成后,得到的音频信号需要再通过采样率转换模块进行重采样,将其 采样率转换至要输出的采样率上,得到最终的音频信号输出。 2 3a m r - w b + 标准的核心算法模块 a m r - w b + 融合了当前语音和音乐编码领域的先进技术,并实现了语音编码 ( a c e l p ) 与音乐信号编码( t c x ) 转换时的无缝连接,是一种新型的编码技 术框架,在1 0 2 4 k b p s 码率下取得了极佳的编码质量1 5 】( 1 6 1 。应当指出的是, a m r - w b + 优越的性能不是单靠某一项技术而实现的,而是将各种不同技术优化 组合在一起而产生的。 2 3 1 低带核心编码a c e l p t c x 技术 对于低带信号,a m r - w b + 采用低带核心编码a c e l p t c x 技术。具体究竟 是采取何种技术,取决于输入音频信号的类型。如果是语音信号或瞬态信号,则 采用编码质量较高的a c e l p 技术;否则采用t c x 技术。a c e l p 与t c x 之间可 以无缝切换。 2 3 1 1a c e l p t c x 模式n , g i j 低带核心编码共有四种编码模式,如表2 3 所示。这四种编码模式的时域示 意图如图2 - 4 所示。显然,对于一超帧( 1 0 2 4 样点,4 帧,每帧一个模式标号) , 共有2 6 种可能的组合模式,如表2 4 所示。对于这2 6 种模式的选择,可以采取 模式判别准确率高的闭环搜索或者复杂度低的开环搜索,可根据自己实现的具体 条件权衡。 表2 - 3 低带核心编码模式 模式标号模式一次处理的样点数目 0a c e l p2 5 6 1t c x 2 5 62 5 6 + 3 2 2t c x 5 1 25 1 2 + 6 4 3t c x l 0 2 41 0 2 4 + 1 2 8 第二章a m r - w b + 音频编解码算法研究 a o t , ( 2 娜) 1 0 ( ( 2 5 6 + 笠汀r p i 固 ( p ( 2 5 6 翻t p b ) t c x ( 2 5 6 + 3 2 s m 榔) n 丑a ( z s 6 m o e s ) t c x ( 2 剐3 2 s m o e s ) 1 ( x ( 5 必科疆i d 固 a 卫l p 汹船l d 咚) 1 d ( 口5 6 + 兹疆i p 目 i e x r 5 ) ( ( 1 4 + l 荔溜t d 固 2 5 6 t m p l m 3 2 辅啦 6 4 t m l 妇 2 5 6 s m p l m 一一b 一 3 2 m 1 0 嚣 5 1 2 嗣呷b l 4 卿i 幽 图2 - 4 低带核心编码模式示意图 表2 - 4 一超帧1 0 2 4 样点可能的2 6 种模式组合 ( 0 ,0 。0 ,0 )( 0 ,0 ,0 ,1 )( 2 ,2 ,0 ,0 ) ( 1 ,0 。0 ,0 )( 1 ,0 ,0 ,1 )( 2 ,2 ,1 ,0 ) ( 0 ,1 ,0 ,0 )( 0 ,1 ,0 ,1 )( 2 ,2 ,0 ,1 ) ( 1 ,1 ,0 ,0 )( 1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论