(信号与信息处理专业论文)基于tms320dm6446的avs编码器实现.pdf_第1页
(信号与信息处理专业论文)基于tms320dm6446的avs编码器实现.pdf_第2页
(信号与信息处理专业论文)基于tms320dm6446的avs编码器实现.pdf_第3页
(信号与信息处理专业论文)基于tms320dm6446的avs编码器实现.pdf_第4页
(信号与信息处理专业论文)基于tms320dm6446的avs编码器实现.pdf_第5页
已阅读5页,还剩80页未读 继续免费阅读

(信号与信息处理专业论文)基于tms320dm6446的avs编码器实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于t m s 3 2 0 d m 6 4 4 6 的a v s 编码器实现 摘要 目前,我国第一个国家音视频编码标准a v s ( 信息技术先进音视频编 码系列标准简称) 凭借其在编码效率、复杂度、自主性方面的优势日益 受到各方的关注。该标准是数字音视频产业的基础性标准,在技术和性能 上处于国际先进水平,然而a v s 标准的产业化需要优秀的处理平台作为支 撑。美国德州仪器公司最新推出的州s 3 2 0 d m 6 4 4 6 ( 基于达芬奇技术) 嵌 入式视频系统芯片为双核架构,具有良好的任务分担和线程同步能力,以 及超强的并行处理速度和较低的资源消耗,同时还集成了视频前端和后端 处理系统,是实现a v s 编码算法的理想平台。针对a v s 视频编码算法在 t m s 3 2 0 d m 6 4 4 6 上的实现,本文主要的研究内容及取得的成果如下: 首先分析了a v s 标准的核心技术和特点,并与最新的国际视频标准 h 2 6 4 a v c 在各方面特征进行了细致的区别与比较。同时分析了a v s 参考 模型r m 5 2 j 的利弊,并结合r m 5 2 j 和h 2 6 4 a v c 实现模型t 2 6 4 两者的优 势,设计了a v s 视频编码算法的c 语言实现方案。重点编写了熵编码和环 路滤波模块,对算法码流和编码性能进行了整体调试。经编解码测试,编 码效率比r m 5 2 j 提高了5 倍,编码生成码流正确,编码效果良好。 然后本文研究了t m s 3 2 0 d m 6 4 4 6 芯片的内部结构和性能特点,介绍了 d s p 算法开发环境c o d ec o m p o s e rs t u d i o ( c c s t u d i o ) 的使用。进而,在 t m s 3 2 0 d m 6 4 4 6 的c 6 4 x + d s p 上实现了a v s 的c 语言代码算法移植,并 重点讨论了算法在该d s p 上优化的方法,主要涉及c c s t u d i o 分析工具的使 用,d s p 内部存储器空问的分配、线性汇编的改写、c a c h e 使能和性能优化 等,另外,还对利用e d m a 实现数据采样格式4 :2 :2 到4 :2 :0 的转换进行了 详细探讨。最终经过验证,优化后的算法比优化前编码效率提高了2 6 倍。 论文最后研究了t i 公司的e x p r e s sd s p 算法标准和c o d e ce n g i n e 框架, 探讨了如何在a r m + d s p 架构下进行视频编码算法设计。视频编码应用程 序( a r m 端程序) 运行在l i n u x 操作系统之上,通过启动编解码引擎调用 远程服务器( d s p 端) 的a v s 编码算法,完成对视频采集数据帧的编码。 文中详细介绍了应用程序流程、应用层编码器和服务器的配置以及远程跟 踪调试方法等。 综上,本文研究内容几乎涵盖了在t m s 3 2 0 d m 6 4 4 6 上实现a v s 编码 算法的各个主要环节,为将来进一步完善系统功能和提高系统性能提供了 有效的参考。 关键词:a v s ,t m s 3 2 0 d m 6 4 4 6 ,a r m + d s p 架构,编码算法 太掳l j 里f 人学帧i 例究,j 三学位论 i m p l e m e n 踟i o no fa v se n c o d e r b a s e d0 nt m s 3 2 0 d m 6 4 4 6 a bs t r a c t 弧ef i r s tc h i n e s ea u d i o v i d e o c o d i n g s t a n d a r d a v s ( r e f e r r e d t o i n f o r m a t i o nt e c h n o l o g ya d v a n c e da u d i oa n dv i d e oc o d i n g ”s t a n d a r d s ) h a s b e c o m ea n i n c r e a s i n gc o n c e mb yv i r t u e o fi t s a d v a n t a g e so fe f f i c i e n c y , c o m p l e x i t ya n da u t o n o m y t h es t a n d a r dh a sr e a c h e dt h ei n t e r n a t i o n a la d v a n c e d l e v e lb o t hi nt e c h n i q u ea n di np e r f o r m a n c e h o w e v e li n d u s t r i a l i z a t i o no fa v s s h o u l db es u p p o r t e db ya ne x c e l l e n tp r o c e s s i n gp l a t f o r m t m s 3 2 0 d m 6 4 4 6 ( b a s e do nd a v i n c it e c h n o l o g y ) ,t h el a t e s te m b e d d e dv i d e oc h i p 舶mt e x a s i n s t r u m e n tc o r p o r a t i o ni na m e r i c a n ,i sd u a l - c o r ea r c h i t e c t u r e ,a n dh a sg o o d c a p a b i l i t i e s o f t a s k - s h a r i n g a n dt h r e a d s y n c h r o n i z a t i o n ,h i g h e rp a r a l l e l p r o c e s s i n gs p e e da n dl o w e rp o w e rc o n s u m p t i o n 。i ta l s oh a sv i d e of r o n ta n de n d p r o c e s s i n gs y s t e m t h e r e f o r e ,i ti st h ei d e a lp l a t f o r mt or e a l i z ea v sc o d i n g a l g o r i t h m t h i s d i s s e r t a t i o nd i s c u s s e st h e i m p l e m e n t a t i o n o fa v sc o d i n g a l g o r i t h mb a s e do n1 m s 3 2 0 d m 6 4 4 6 ,a n dt h em a i nw o r k sa n da c h i e v e m e n t sa r e a sf o l l o w s : t h ec o r et e c h n o l o g i e sa n df e a t u r e so fa v sa r ea n a l y z e d ,a n dt h ev a r i o u s d i f f e r e n c e sb e t w e e na v sa n dt h ei n t e r n a t i o n a lv i d e os t a n d a r d h 2 6 4 a v ca r e c o m p a r e dc a r e f u l l y n e x t ,t h r o u g ha n a l y z i n gt h ea d v a n t a g e sa n dd i s a d v a n t a g e s o ft h er e f e r e n c em o d e lo fa v s r m 5 2 j a ni m p l e m e n t a t i o ns c h e m eo fa v s e n c o d i n ga l g o r i t h mi ncl a n g u a g ei s s e tu p ,w h i c hc o m b i n e st h em e r i t so f r m 5 2 ja n dt 2 6 4 ,t h er e f e r e n c em o d e lo fh 2 6 4 a v c e s p e c i a l l y , t h ec l a n g u a g e c o d e so fe n t r o p y c o d i n gm o d u l e a n d l o o p f i l t e rm o d u l ea r e p r o g r a m m e d ,a n dt h ep e r f o r m a n c ea n db i t s t r e a mo ft h ew h o l es y s t e ma r e d e b u g g e d 。l a s t l y , t h ee n c o d i n g a n dd e c o d i n gt e s t ss h o wt h a tt h e c o d i n g i l l 奠怃:堡r 人字1 哦i1 0 i ) i 士字位论文 e f f i c i e n c yo fn e wa v sc o d ei sf i v et i m e st h a nt h a to fr m 5 2 j ,a n dt h eg e n e r a t e d b i ts t r e a mi sc o r r e c ta n dt h ec o d i n gq u a l i t yi sg o o d i nt h i s p a p e r , t h e c h a r a c t e r i s t i c so fa r c h i t e c t u r ea n dp e r f o r m a n c eo f t m s 3 2 0 d m 6 4 4 6c h i pa r es t u d i e d ,a n dt h eu s eo fc o d ec o m p o s e rs t u d i o ( c c s t u d i o ) - - - t i sd s pa l g o r i t h md e v e l o p m e n te n v i r o n m e n t - - i sd e s c r i b e d f u r t h e r m o r e ,t h i sp a p e rh a sr e a l i z e dt h et r a n s p l a n t a t i o no fa v se n c o d e rb a s e d o nc 6 4 x + d s p p l a t f o r mo ft m s 3 2 0 d m 6 4 4 6a n dh a sd i s c u s s e dt h eo p t i m i z a t i o n o ft h ed s p a l g o r i t h m ,i n v o l v i n gt h eu s eo fp r o f i l i n gt o o l so fc c s t u d i o ,i n t e r n a l m e m o r y a l l o c a t i o no fd s p , l i n e a ra s s e m b l y , a n dc a c h ep e r f o r m a n c eo p t i m i z a t i o n , a n ds oo n i na d d i t i o n ,v i d e of o r m a t4 :2 :2t o4 :2 :0c o n v e r s i o nu s i n ge d m ai s d i s c u s s e di nd e t a i l s t h r o u g hv e r i f y i n g ,t h eo p t i m i z e d a l g o r i t h mi sm o r et h a n2 6 t i m e si ne n c o d i n gp e r f o r m a n c et h a nt h en o n o p t i m i z e d f i n a l l y , t h ep a p e rs t u d i e st i se x p r e s sd s pa l g o r i t h ms t a n d a r da n dc o d e c e n g i n ef r a m e w o r ka n de x p l a i n sh o w t od e s i g nt h ev i d e oc o d i n ga l g o r i t h mb a s e d o nt h ea r m + d s pd u a l c o r ef r a m e w o r k v i d e oa p p l i c a t i o n ( a r ms i d e ) r u n n i n g u p o nt h el i n u xo p e r a t i n gs y s t e mc a l l st h er e m o t es e r v e r ( d s ps i d e ) a v sc o d i n g a l g o r i t h mt oc o m p l e t ee n c o d i n go p e r m i o nb ys t a r t i n gc o d e ce n g i n e m o r e o v e r t h em a i nf l o w sa n dm o d u l e so fa p p l i c a t i o nl e v e lp r o g r a ma r eg i v e n ,a n d c o n f i g u r a t i o n so fa p p l i c a t i o na n ds e r v e ra n dt h er e m o t et r a c k i n gm e t h o da r e p r e s e n t e d i tc a nb es e e nt h a tt h ep a p e rc o v e r sa l lm a j o rs e c t o r so fa c h i e v i n ga v s e n c o d i n ga l g o r i t h mo nt m s 3 2 0 d m 6 4 4 6 i tm a yb r i n ge f f i c i e n tr e f e r e n c e sf o r i m p r o v i n gs y s t e mf u n c t i o n sa n de n h a n c i n gs y s t e mp e r f o r m a n c e si nt h ef u t u r e k e yw o r d s :av s ,t m s 3 2 0 d m 6 4 4 6 ,a r m + d s pf r a m e w o r k , e n c o d i n ga l g o r i t h m 声明用明 本人郑重声明:所呈交的学位论文,是本人在指导教师的指导下, 独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文 不包含其他个人或集体己经发表或撰写过的科研成果。对本文的研究 做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的 法律责任由本人承担。 论文作者签名:魑日期:论文作者签名:组耋坠日期: 一 关于学位论文使用权的说明 本人完全了解太原理工大学有关保管、使用学位论文的规定,其 中包括:学校有权保管、并向有关部门送交学位论文的原件与复印 件;学校可以采用影印、缩印或其它复制手段复制并保存学位论文; 学校可允许学位论文被查阅或借阅;学校可以学术交流为:目的, 复制赠送和交换学位论文;。学校可以公布学位论文的全部或部分内 容( 保密学位论文在解密后遵守此规定) 。 签:名:蠢鑫日期:塑墨摹:三缉兰量鱼 t 导师签名:日期: 御警i 善。z g 工、原理i 人7 :硕 研究o 产f 一论文 0 1 本课题研究的背景和意义 月l j吾 人类接受的信息大约7 0 来自视觉,视频是人类最有效和最重要的信息获取形式。 视频信号直观、具体,但原始视频信号的数据量十分庞大,给视频数据的存贮、传输等 都带来了很大的困难,严重地制约了视频应用的推广。幸运的是,视频数据中包含着大 量冗余信息,这些冗余的存在使得视频压缩成为可能f l 】。因此,研究和开发有效的视频 压缩方法,以压缩的形式存储和传输视频数据才是最好的选择。自二十世纪九十年代以 来,数字视频技术广泛应用于通信、计算机、广播电视等领域,带来了会议电视、可视 电话及数字电视、媒体存储等一系列应用,促使了一系列视频编码标准的产生。国际电 信联盟( i n t e r n a t i o n a lt e l e c o m m u n i c a t i o nu n i o n ,i t u ) 致力于电信应用,已经开发出了主 要用于低比特率视频电话的h 2 6 x 系列标准,其中包括h 2 6 1 、h 2 6 2 、h 2 6 3 与 h 2 6 4 a v c t 2 】【3 】:国际标准化组织国际电信委员会( i n t e r n a t i o n a lo r g a n i z a t i o nf o r s t a n d a r d i z a t i o n i n t e m a t i o n a le l e c t r o t e c h n i c a lc o m m i s s i o n ,i s o i e c ) 则主要面向消费类应 用,针对运动图像压缩定义了m p e g x 系列的标准,主要包括:m p e g 1 、m p e g 2 与 m p e g 4 1 4 】【5l 等。这些信源编码技术标准随着编解码技术本身的进步和超大规模集成电 路集成度、计算速度等实现条件的发展而更新换代,1 0 年前制定的第一代音视频编解 码标准的代表m p e g 2 标准已经落后,采用新的技术方案,压缩比能够从5 0 - - 7 5 倍提高1 0 0 1 5 0 倍( 标准清晰度电视约1 0 0 倍,高清晰度电视可达到1 5 0 倍) 。第二代 信源编码技术的发展将使国际数字电视和数字音视频产业格局再次“沈牌”,使得中国 与世界发达国家站在了同一起跑线上,给中国数字电视和数字音视频产业带来了超越欧 美框架的最重要的历史性机遇,a v s 标准j 下是在这样的背景下应运而生的【6 】。 我国于2 0 0 2 年6 月成立了“数字音视频编解码技术标准工作组”,联合国内从事数 字音视频解码技术研发的科研机构和企业,经过多年研究制定具有我国自主知识产权的 数字音视频编解码标准a v s 标准( a u d i oa n dv i d e os t a n d a r d ) 【7 】,并最终于2 0 0 6 年 3 月获得国家标准化管理委员会批准,国家标准号g b t2 0 0 9 0 2 2 0 0 6 ,于2 0 0 6 年3 月1 日开始实施。a v s 视频编码标准主要是为了适应数字电视广播、数字存储媒体、因 特网流媒体、多媒体通信等应用中大尺寸、高质量的运动图像压缩的需要而制定的。它 由系统、视频、音频3 个主要部分和一致性等支撑部分组成。a v s 视频标准在技术和专 太熔理17 人学顼 = 秽;究生。学 蕾沦文 利上有独到之处,应用范圈较广,同时褥玺i 信息产业部、科技部、发改委等主管部门的 大力支持,因此a v s 的产业化前景菲常乐观。 a v s 标准提出后,国内越来越多的研究人员开始关注该标准,并在将标准转化为产 品方蘑进行深入研究。目前,对a v s 研究的主要热点:一是算法标准的优化。主要蹬 标是进一步提高编解码效率和质量,同时降低码率。二是标准的产业化。主要嗣标是尽 快开发出实用的视频编解码软、硬件,应用于各种与视频相关的领域。a v s 在下述领域 具有重要的应用前景【8 l : 1 标清和高清数字电视:利用a 、,s 标准,可以用2 - 3 m 带宽实现现有6 m 带宽的 同等质量的标清电视节目,可以用6 m 的带宽实现现在需要2 0 m 带宽的m p e g - 2 高清 电视节西,大大节省广播带宽,有效利角无线频谱资源,有利于提供终端产品的自主技 术水平;另外,a v s 对m p e g 2 有良好的兼容性,m p e g 2 到a v s 的转码技术已经成熟, 转码器成本低运算量小,使褥m p e g 2 格式的节髫可以很容易地转换成a v s 节嚣,节髫 压缩效率高质量好。目前已经在杭州、成都、河北和上海等城市已经开始试验基于a v s 的国标地面无线数字电视。 2 监控、视频会议的应用:视频监控作为信息产业部电子信息发展的顷爵应用瑟 非常广,如交通监控、安全监控、远程控制等。视频会议在商业、企业方面应用也很多。 邑蓠北京、上海等城市,已经将a v s 作为监控系统的视频标准之一。 3 高清晰度光盘播放机:作为d v d 的换代产品,高清晰度光盘播放机在未来一 两年内即将走向市场,如果利用a v s 技术实现6 m b p s 的高清晰度电影压缩,就可以采 用现有红光d v d 相同或类似的光学和伺服系统以及盘片,开发出新一代高清晰度激光 视盘机系统; 4 + 宽带网络流媒体和多媒体通信:流媒体是宽带网络的拳头应用,a v s 凭借高效 的压缩性能,能够促进宽带嘲络流媒体的快速普及;可视电话是第三代移动通信需要首 先支持的功能,a v s 是移动通信这种带宽有限领域的理想选择。去年,a v s 技术标准在 网通、电信中的i p t v 当中得到推广,网通在大连的实验网中全蘸采黑a v s 技术标准, 并在逐步在全国的2 0 多个省市的网通网内采用a v s 技术标准,电信方面也正在进行着 积极测试。 随着信息技术、数字技术、两络技术的发展提升和市场的变化,我国的数字音视 频产晶技术步入一个转型升级的新阶段,将为促进国民经济增长和电子信息产业持续快 2 太原理1 人学硕十坝究生学位论文 速健康发展做穗更大地贡献。掘信息产业部预测,未来5 年内以数字技术应用为主流的 音视频产业年产值将超过通信产业,成为我隧信息产业第一大产业。这种数字音视频需 求不断增长的趋势给a v s 标准的发展和应用带来了良好的机遇。 2 0 0 7 年5 月a v s 成为i p t v 国际标准王作文档的一部分,意味着a v s 已被国际电 联列为i p t v 国际标准框架中的重要组成部分。在a v s 成为| 鞭v 国际候选标准斡同时, a v s 的产进化进程也在提速。然蕊,由予a v s 褫频标准算法提出时间较晚,毯翦还没 有特剐好的实时编码器,应用面也有限,产业化程度不够。实时编码器常见的实现方法 之一是利用d s p 实现。d s p 9 1 芯片是一种具有哈佛结构、有完整指令系统、适合实时 信号处理的微处理器,将d s p 技术成用于多媒体视频缡解码系统中,系统舆有编解码 快速、实时的特点。t m s 3 2 0 移m 6 4 4 6 ( 以下麓称d m 6 4 4 6 ) 是美鬓德翔仪器公司( 以下 篱称弧公蠲 予0 5 年1 2 胄推出的基于达芬奇技术的高集成度视频芯片,处理器为 a r m + d s p 双核架构,还鸯一个视频处理子系统( v p s s ) ,i 常适合图像视频方面的应髑。 本课题研究将在具有a r m 9 2 6 和c 6 4 x + d s p 双处理器的评估板t m s 3 2 0 d m 6 4 4 6e v m 上,充分幂| j 用双核处理器高效的协同处理能力和d s p4 8 0 0 0 m i p s 的高速运算麓力,实 现a v s 视频部分基准档次4 。0 级别实融编码算法( 本文中以下提到的a v s 均指a v s 标 准的视频部分a v s p 2 ) 。这也是对a v s 视频标准算法产业化的露益研究的探索。 誊 0 。2 论文完成的工作 本课鼷研究的叠的是以飘公司d m 6 4 4 6e v m 律为硬件处瑶平螽实现a v s 视频编 鹞算法,同时从实际应用考虑,在保持较高编码质量盼同时尽量减少编码复杂度,减少 编码时间,提嵩效率。主要完成了以下工作:( 1 ) 在深入研究视频编犸标准和硬件平台 性能结构的基础上,制定了详细的基于d m 6 4 4 6 的a v s 编码器实现方案;( 2 ) 通过参 考h + 2 6 4 a v c 和a v s 算法的标准c 代码模型,编写了兼顾速率鞠效率翳a v s 编码算法 实现c 代码;3 ) 完成了a v s 编码算法的d s p 移檀和基本优化;( 4 ) 研究了x d a i s 和x d m 算法标准,实现算法的t id s p 算法兼容性封装,并搭建了a v s 的视频编码系 统。 e 3 论文的组织 第章介绍了视频压缩编码的基本原理;详细阐述a v s 视频编码标准的核心技术、 3 太豫理1 人学硪专f 研究生学侮论文 性能特点,并与h 2 6 4 a v c 阁际视频标准进行了全面e | 二较;第二章介绍了a v s 算法d s p 实现的软硬件平台的选择,以及t l 公司的e x p r e s sd s p 算法标准。分析了目标板 t m s 3 2 0 d m 6 4 4 6e v m 的特点及其对a v s 算法的适应性;第三章描述了a v s 算法的c 语言代码详细实现过程,包括算法结构、模块划分,以及主要结构体定义等,分析了算 法在p c 平台上的编码效率和性能;第四章介绍了a v s 编码算法在d s p 上的移植和优 化,重点强调了内存分配策略,c a c h e 优化措施以及e d m a 的使用等;第五章对视频 编码算法符合f i 的x d m 数字媒体接目标准进行了讨论,并进步讨论了在a r m + d s p 结构硬件上实现应用算法远程调用的方法及过程;最后,对本论文的工作进行总结,提 出了本系统可改进之处,并对今后从事嵌入式视频系统的开发与应用提出展望。 4 太原璎! 人。硕l + 坝究生学付沦文 第一章av s 视频编码算法概述 l 。l 视频编码的基本方法和原理 多媒体信息主要包括文字、声音、图像、图形和视频等内容,其中视频又是多媒体 信息中最重要的组成部分,但是视频的信息容量巨大。对于高清晰度数字电视( i t u r 7 0 9 ) ,当帧频为2 5 场秒,每采样点8 比特进行量化,色差格式为4 :2 :2 时,每秒数据 量高达8 8 4 7 m b i t s ,而地面广播系统的传输带宽仅有6 m 到8 m 。因此无论是存储还是 传输,数字视频都必须经过极大的压缩才能具有实际意义。 视频编码的譬熬是实现对视频的压缩,其核心思想是去褶关。遥过减少视频序列阀 的相关性,降低褫频内容率前冗余,用较少的沈特数来表示视频内容,从而实现对视频 的雁缩。视频数据中包含着大量的冗余信息,主要包括空域冗余、时域冗余、统计冗余 和视觉冗余。依据消除这些冗余的不同,视频压缩编码的方法【l o 】基本上分为四类: 1 空间冗余度的压缩。一幅视频图像相邻各点的取值往往檑近或捆阍,具有空阆 相关性,这就是空闻趸余度。从频域来看,图像信号的能量主要集串褒低频附避,高频 信号酶能量随频率的增加丽迅速衰减。遥过频域变换可以将原图像信号用赢流分量及少 数低频交流分量的系数来表示,这就是变换编码中正交余弦变换d c t 的方法。 2 。时间冗余度的压缩。时域冗余是指视频图像序列沿着时间轴方向上的冗余,它 是出同物体在楣邻视频图像闯的移动丽产生的。视频序列在时域存在极强的相关性, 因此,不传送像素点本身的值藉转送其与麓一帧对应像素点的差 蛊,逛熊有效地压缩码 率。帧闻编码正是利用了时间上的冗余性。 3 统计冗余的压缩。主要是利用视频数据中存在的信息熵的进行编码,常用方法 有霍夫曼编码、游程编码和算术编码。 4 。视觉冗余的压缩。盘予人跟视觉的非均匀性,使褥人限视觉对某些空闻频率感 觉遴链。人# 良对于图豫的视觉特性包括:对亮度信号比对色度信号敏感,对低频信号沈 对高频信号敏感,对静止圈像比对运动图像敏感,以及对图像水平线条和垂盔线条比对 斜线敏感。因此,在视频压缩中可以利用视觉的特点,减小色度信号,高频信号和些 运动数擐的编码数撼量。 s 太原理l :人学颈 :蝴宄生亨t 寺论文 1 2a v s 视频标准概述 1 2 1a v s 视频标准的核心技术 a v s p 2 视频部分采用了一系列技术i 1 1 2 【1 3 1 来达到高效率的视频编码,包括帧内预 测、帧闯预测、变换、量化和熵编码等。帧闻预测使用基于块的运动矢量来消除图像间 的时间冗余;帧内预测使用空间预测模式来消除图像内的冗余。再通过对预测残差进行 变换和量化消除图像内的空阀和视觉冗余。最后,运动矢量、预预l 模式、量化参数和变 换系数用熵编码进行压缩,消除统计冗余。 1 帧内预测 a v s 视频标准采用空域内的多方向帧内预测技术5 蚓。基于空域多方向的帧内预测可 以提高预测精度,从而提高编码效率。a v s 视频标准的帧内预测基于8 8 块大小,亮度 分量的5 种预测模式分别对应五个方向的预测:水平、垂直、均僮、左下对角和右下对 角,色度分量4 种预测模式对应均值、水平、垂直和平面。a v s 视频的帧内预测还对相 邻像素进行了滤波处理来去除噪声,提高编码精度。 2 帧间预测 帧问预测采用多参考帧预测f b l 技术,使当前块能够从前面几帧图像中寻找更好的匹 配,因此能够提高编码效率。a v s 视频标准限定最多采用两个参考帧,既兼顾了搜索匹 配的性能,又大大降低了编码复杂度。 对于运动图像编码,采用变块大小运动补偿【1 6 】可以大大提高运动预测精确度。 a v s p 2 中采用了1 6 x 8 、8 1 6 、8 8 分割子块,在高分辨率序列编码复杂度和精度方面 迸行了折衷。另外,增强运动矢量的精度也是提高预测准确度的重要手段之一,而插值 滤波器的选择是影响高精度运动补偿性能的一个关键。根据高清携频的特性,a v s 视频 标准在进行运动矢量搜索时采用了l 膳像素精度插值,对1 2 和1 4 像素位置插值均采 用4 拍滤波器,其效果与6 拍滤波器相同,优点是大大降低了访问存取带宽,是一个对 硬件实现非常有价值的特性。 3 b 帧宏块编码模式 a v s 视频标准对双向预测采用了空域时域相结合的直接模式f 1 7 1 ,并在此基础上使 用了运动矢量舍入控制技术。a v s 标准还提出了对称模式,即只编码前向运动矢量, 后向运动矢量通过前向运动矢量导出,从而实现双向预测。 6 太朦理1 人学硕“ - :坝究生学 谬论文 4 整数变换”擎l 与量化 由于a v s 中最小块预测是基于8 8 块大小的,因此采用了8 8 整数d c t 变换矩阵, 整数变换具有复杂度低、完全媛配等优点。 量他是编码过程中唯一带来损失豹模块。与毁蔫豹量化方法稠比,a v s 标准中斡量 纯与变换归一纯福结合,同时可以通过乘法和移燕来实现,对于璧化步长鹣设计,量化 参数每增加8 ,相应的量化步长扩大l 倍。由予a v s 标准中变换斑阵每行的模沈较接近, 变换矩阵的归化可以在编码端完成,从而解码端反量化表不再与变换系数位置相关。 5 。熵编码 熵编码【2 0 l f f j 于去除数据的统计冗余。a v s 视频标准采黑基于上下文教鱼适应变长编 码器藩变换量化后预测残差进行编码。 6 环路滤波 a v s 视频解码的去块滤波算法是一种基于块边缘的环路滤波算法。在去块效应滤波 时,先判断边界是图像的真实边界还是方块效应所形成的边界( 假边界) 。对真实边界 不进行滤波处理,露对瑕边界则要根据周黧墅像块的性质和编解码方法采用不圜强度的 滤波。环臻滤波技术1 2 l 躺特点在于把去块效应滤波藏在编码的闭环瘸进行,帮在顿内预 溯时也麓经过去块效应滤波而重建图像,从而更逼近视觉的主观效果。a v s 滤波点数和 ,i 滤波强度分类数都比较少,降低了环路滤波的计算复杂度。 南: 1 2 2a v s 视频码流结构 在进行a v s 编码时,视频序列是比特流的最高层语法结构。视频序列由序歹| j 头开 始,后面跟赣一个或多个编码图像,每帧图像之前应有图像头。序列头可在比特流中重 复出现,称为耋复序列头。使雳重复序列头豹主要星的是支持对视频序列的随机谤瓣, 痔列头焉酶第一个编码胬像是l 赖。幅窝像是一帧,其编碣数据由图像起始鹞开始, 到序列起始码、序列结束码或下一个图像起始鹤结束。a v s 视频输入的每一帧图像都被 分为若干个条带( s l i c e ) ,条带又幽若干宏块行构成,因此在条带头后跟着若干个宏块 数据。宏块是视频编码过程的基本处理单元。每一个宏块出4 个8 x 8 的亮度块y 以及一 个c b 块茅羹一个q 块组成。 7 a 原理l :人学硪蛾究生学位论文 噬l - la v s 的视频码流结构图 f i g 。1 - 1s t r u c t u r eo f a v sv i d e ob i ts t r e a m a v s 的视频码流结构f 2 2 】如图l 。l 所示。图中,序列头、扩展用户数据、帧头数据、 条带头数据及序列结束码均通过不同的标识码加以区分。标识码共3 2 b i t s ,由前缀 “0 x 0 0 0 0 0 1 和8 b i t s 的起始码类型标识构成,其中,序列头、序列结束、用户数据、l 帧头、视频扩展数据、p b 帧头视频编辑数据的起始码类型标识分别对应:b 0 、b 1 、b 2 、 b 3 、b 5 、b 6 和b 7 :a v s 标准中条带由同彳亍或多行的宏块构成,其起始码类型标识由 0 0 到a f ;在本设计中,帧图像划分为一个条带,酃一帧数据仪含一个s l i c eh d r 。宏 块数据部分由于a v s 支持不同的块划分格式,所以宏块头之后的块数据可能会有不同 的格式。 1 3a v s 与h 2 6 4 a v c 的匕较 h 2 6 4 a v c 是t 组织起草的一个覆盖多种应用和面向多种传输环境的国际标准, 它规定了三种档次,基本档次( b a s e l i n ep r o f i l e ) 、主要档次( m a i np r o f i l e ) 和扩展档次 ( e x t e n d e dp r o f i l e ) ,其中基本档次利用i 片和p 片支持帧内和帧间编码,支持利用基于上 下文的自适应的变长编码进行的熵编码( c a v l c ) ,主要用于会议电视、可视电话和无 线通信等实时视频通信。a v s ( a u d i ov i d e oc o d i n g ) 标准是由我国自主制定,拥有自主 知识产权的音视频编解码技术标准。a v s p 2 ( v i d e o ) 是a v s 系列标准中的第二部分, 主要应用于数字地蕊电视广搂、有线电视、交互存熊媒体、宽带视频业务、实时通信业 务( 视频会议,可视电话等) 和远程视频监控等。 h 2 6 4 a v c 是技术上相对比较成熟、应用研究比较广泛的国际标准,而a v s 是我 国提浅的第一个具有自主知识产权的视频标准,a v s p 2 和 2 6 4 a v c 视频标准在结构 8 太缘理1 人学硕十 究生。予:俯论文 上十分相似,偶又各有其核心思想,因此有必要对两者进行比较1 2 3 j 俐网。 1 比特流信息 两标准都采用了参数集机制,将一些重要的序列、图像参数( 例如,图像尺寸、参 考帧数、量化和滤波参数标记等) 与其他参数分离,便于提苕解码。不月之处在予, h 2 6 4 a v c 比特流在n a l 为单位,a v s p 2 中没有定义n a l u ,僵在a v s m ( 移动视 频) 部分有相同的定义:另外,a v s p 2 中增加了图像头信息。 2 宏块类型划分和编码块模式( c b p ) 两标准的帧内、帧间预测时宏块的划分是有区别的。h 。2 6 4 a v c 中,i 帧时亮度块 有i n t r a 4 x 4 和i n t r a 一1 6 x 1 6i z 种模式,色度块只有8 x 8 模式;p 帧时宏块可以分割为 1 6 x 1 6 、1 6 x 8 、8 x 1 6 、8 x 8 、8 x 4 、4 x 8 、4 x 4 共7 种模式。而a v s p 2 中,l 帧亮度块只 有i8 x 8 模式,p 帧只有h 2 6 4 1 a v c 中划分的前5 种模式。 两标准的宏块c b p 值计算也不相同。两标准中都定义了6 也i t 的c b p ,低4 - b i t 表示4 个8 x 8 的亮度块,高2 - b i t 表示色度块。在h 2 6 4 a v c 标准中,c b p 的最低4 位每位决 定对应亮度宏块的残差系数是否为o ;高2 位为o 时,表示所有色度残差系数都为0 , 为量+ 时表示两色度块至少有一个d c 残差系数不为0 ,a c 系数为0 ,为2 时表示d c 、 a q u 残差系数都不为o 。在a v s - p 2 中,e b p 低4 位每位代表宏块按8 x 8 划分时对应的亮 度块残差系数是否包含非零系数,高2 位分别代表c r 和c b 的残差块是否包含非零系数。 3 。帧内预测 h ,2 6 4 a v c 标准帧内预测时对直流系数d c 和高频系数a c 预测是在频域内进行,其 预测块大小为4 x 4 及1 6 x1 6 ,其中4 霹帧内预测时有9 种模式,1 6 1 6 帧内预测时有4 种 模式。a v s 视频标准的帧内预测基于8 x8 块大小,亮度分量只有5 种预测模式,而且有 其自身的特点,例如,采用左下对角模式预测时,需要使用预测块下面的样点;帧内预 测时还对相邻像素进行了滤波去噪处理,这些都是h 2 6 4 a v c 中没有的。a v s 帧内预测 大大降低了模式决策的计算复杂度,但性能与h 。2 6 4 a v c 接近。 4 帧闯预测 帧间预测的模式划分方面,a v s p 2 中将最小宏块划分限制为8 8 ,而h 2 6 4 a v c 中进一步对8 x 8 划分了8 x 4 、4 x 8 、4 x 4 三种模式。实验数据表明小于8 x 8 块的划分模 式对低分辨率编码效率影响较大,蕊对于高分辨率编码则影日自甚微。在高清序列上的大 9 太捺疆i :人。颈专二留 冗生予 移论文 量实验数掭表骥,去掉8 x 8 以下块器运动豢测模式,整钵性熊降低2 - - 一4 ,型其编码 复杂度荧| j 可降低3 0 - 4 0 。 鞭。2 6 4 a v c 标准中规定帻间预测最多可慕震1 6 个参考帧,这增加了参考雕像缓冲 区管理机制的复杂性,实现比较潮难。丽实际证明2 - 一3 个参考帧基本上能达到最高的 性能,更多的参考图像对性能提升影响甚微。因此,a v s 规定最多只使用了两个参考帧, 以减小缓冲区大小提高编码效率,嗣时b 率吏本身也需要溅个参考图像的缓冲区。 在分豫素精度运动补偿时,鞭2 6 4 1 a v c 标准在翌像素播篷半像素短置采用6 擒头滤 波,1 4 像素俄置采用了线性插值,而a v s 视频标准中蠢予是对8 x 8 块进行运动补偿, 所以瓣予亮度样本采用2 令4 抽头f i r 滤波器( 1 ,5 ,5 ,1 ) 和( 1 ,7 ,7 ,1 ) 分瓢 进l 亍半精度像素和1 4 精度像素点的插值,效果与h 。2 6 4 a v c 基本相同,但降低了对访 闯存取带宽的要求。 秘帧双向帻闻预测方谣,h 2 6 4 i a v c 标准中时域壹按摸式与空域直接模式是相噩独 立的。面a v s 视频标准采用了更加高效的空域,时域相结合的直搂模式,并对商接模式 的运动矢量导出过程采取舍入控制技术,信噪比提高0 2 0 3 d b 。a v s 标准还通过对称 模式实现了双向预测。总体上比较,a v s 中拯帧的性能比h 。2 6 4 刎c 中b 枣贞性能有所 提高。 瘁变换与量纯 a v s 标准中采用的8 x 8 整数变换比h 2 6 4 a v c 采用的4 x 4 变换的去相关性强,a v s 标准编码效果毖h 2 6 4 a v c 提高约0 ,l d b 。同时由于a v s 熄变换辙阵的归一化在编码端 完成,节省了解码反变换所需的缩放表,降低了解璃器的复杂度。 根据a v s 标准的规定,量化步长是以8 为周期倍增( q s t e p i + 8 q s t e p i = 2 ) ,两 h 2 6 4 a v c 标准中量化步长是以6 失髑期。每个周期内的量化步长按指数形式增长 ( q s t e p i + l q s t e p i = 2 懈) ,这种设计考虑到编码码率与量化步长之间类似负指数函数的数 焦关系,即照着量化步长麴增长,码率减小的趋势逐渐变缓慢。因此要保诞通过q p 能 够接近线性豹控制码率的变化,必须按照近缎子指数增长形式设计量化步长。 5 ,熵编码 两标准都采用了基予上下文的可变长编码。h 2 6 4 a v c 主档次中采用基予上下文舀 适应的可变长编码( c a v l c ) ,其原理是利用4 x 4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论