




已阅读5页,还剩57页未读, 继续免费阅读
(通信与信息系统专业论文)h264算法优化及dsp实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
重庆邮电大学硕士论文摘要 摘要 h 2 6 4 a v c 是i t u tv c e g 和i s o i e cm p e g 联合制定的最新的视频编解码标 准。该标准以较高的数据压缩比和网络友好性得到了越来越多的应用。 但h 2 6 4 a v c 中采用的编码技术复杂度很高,与以往编码技术相比,高出了几 倍甚至几十倍,严重限制了该技术的应用和推广。特别在一些硬件资源受限和实 时性要求比较高的嵌入式应用中更是如此。因此在保证数据压缩比和图像质量的 前提下,如何最大限度降低算法的复杂度成了h 2 6 4 a v c 应用前景的关键所在。 而且随着视频传输应用的成熟和发展,现有的有线视频传输已经很难满足市 场的需求。特别是在手持化终端化的大趋势下,手持型的无线视频传输终端已经 是大势所趋,在此大环境下,本文在这两方面结合点处开展研究工作实属必要。 首先本文选取在h 2 6 4 a v c 编码中计算量较大的运动估计搜索算法进行主要 的算法研究。在研究了编码流程和对以往的经典运动估计搜索算法进行对比分析 后,对运动估计搜索算法进行了改进。然后结合具体d s f 硬件平台t m s 3 2 0 d m 6 4 2 对算法进行了四个方面的系统级优化。 此外,为了实现视频的无线传输,本文选取d s p 芯片t m s 3 2 0 d m 6 4 2 作为c p u , 然后选取第三代移动通信中的c d m a 2 0 0 0 1 x 无线网络模块m c 8 6 3 0 和w c d m a 无 线网络模块e m 7 7 0 w ,对硬件电路的设计实现进行了详细的说明。 最后对算法编码效率、压缩比和图像清晰度等主要的算法性能指标进行了详 细的测试,并在c d m a 2 0 0 0 1 x 无线网络环境下和w c d m a 无线网络环境下对视频 的无线传输性能指标如丢帧率、码流速率等主要指标分别进行了测试。实验结果 表明,算法在保持高数据压缩比的情况下,仍保持了较高的编码效率和图像清晰 度,并在c d m a 2 0 0 01x 无线网络环境下和w c d m a 无线网络环境下实现了高质量 的实时视频传输。 关键词:实时性,压缩比,运动估计,m c 8 6 3 0 ,e m 7 7 0 w 重庆邮电大学硕士论文 a b s t r a c t a b s t r a c t h 2 6 4 a v ci st h el a t e s tv i d e oc o d i n gs t a n d a r dd e v e l o p e dj o i n t l yb yn u t - v c e g a n di s o i e c m p e gt h es t a n d a r di sg a i n i n gm o r ea n dm o r ea p p l i c a t i o n sd u et oh i g h e r d a t ac o m p r e s s i o nr a t i oa n dn e t w o r kf r i e n d l y b u tt h eh 2 6 4 a v cc o d i n gu s e di nah i g hd e g r e eo ft e c h n i c a lc o m p l e x i t y , e v e n s e v e r a lt i m e sh i g h e rc o m p a r e dw i t ht h ep r e v i o u sc o d i n g i ts e v e r e l yl i m i t st h e a p p l i c a t i o na n dp r o m o t i o no ft h et e c h n o l o g y , e s p e c i a l l yi nl i m i t e dh a r d w a r ea n d r e a l - t i m er e q u i r e m e n t se m b e d d e da p p l i c a t i o n s t h e r e f o r e ,i nt h ep r e m i s eo fe n s u r et h e d a t ac o m p r e s s i o nr a t i oa n di m a g eq u a l i t y , h o wt om i n i m i z et h ec o m p l e x i t yo ft h e a l g o r i t h mh a sb e c o m eak e yi s s u ei nt h ep r o s p e c to fh 2 6 4 a v c a n da sv i d e ot r a n s m i s s i o na p p l i c a t i o n sg r o wm a t u r ea n di sd e v e l o p i n g ,t h ee x i s t i n g c a b l ev i d e ot r a n s m i s s i o nh a sb e e nd i f f i c u l tt om e e tm a r k e td e m a n d e s p e c i a l l yi nt h e t r e n do fh a n d - h e l dt e r m i n a l s ,h a n d - h e l dt e r m i n a l sf o rw i r e l e s sv i d e ot r a n s m i s s i o nh a s b e e nag e n e r a lt r e n d i nt h i se n v i r o n m e n t , t h i sc o m b i n a t i o no ft h eb e t w e e na r e a si s n e c e s s a r yt oc a r r yo u tr e s e a r c hw o r k f i r s t l y , t h ep a p e rs e l e c tt h em o t i o ne s t i m a t i o ns e a r c ha l g o r i t h mo ft h eh 2 6 4 a v c c o d i n g ,w h i c hc o n t a i n sal a r g ea m o u n to fc a l c u l a t i o n a f t e rs t u d y i n gt h ec o d i n gp r o c e s s a n da n a l y s i s i n gt h ep r e v i o u sc l a s s i c a lm o t i o ne s t i m a t i o ns e a r c ha l g o r i t h m ,t h em o t i o n e s t i m a t i o ns e a r c ha l g o r i t h mw a si m p r o v e d t h e nt h ea l g o r i t h mw a so p t i m i z e db yf o u r t i m e sa t s y s t e m l e v e l c o m b i n e dw i t ht h e s p e c i f i c d s ph a r d w a r e p l a t f o r m t m s 3 2 0 d m 6 4 2 i na d d i t i o n , i no r d e rt oa c h i e v et h ew i r e l e s st r a n s m i s s i o no fv i d e o ,t h ep a p e r s e l e c t e dr i m s 3 2 0 d m 6 4 2a st h ec h i pc p u ,a n dt h e ns e l e c tt h et h i r dg e n e r a t i o nm o b i l e c o m m u n i c a t i o nm o d u l em c 8 6 3 0i nt h ec d m a 2 0 0 0 1 xw i r e l e s sn e t w o r ka n dm o d u l e e m 7 7 0 wi nt h ew c d m aw i r e l e s sn e t w o r k ad e t a i l e dd e s c r i p t i o ni su s e dt oh a r d w a r e d e s i g na n di m p l e m e n t a t i o n f i n a l l y , t h ec o d i n ge f f i c i e n c yo ft h ea l g o r i t h m ,c o m p r e s s i o nr a t i oa n di m a g ec l a r i t y h a v et e s t e di nd e t a i l t h e ni nt h ee n v i r o n m e n to ft h ec d m 匕心0 0 01xw i r e l e s sn e t w o r k a n dt h ew c d m aw i r e l e s sn e t w o r kf o rw i r e l e s sv i d e ot r a n s m i s s i o n p e r f o r m a n c e i n d i c a t o ms u c ha sf r a m el o s sr a t e ,c o d ef l o wr a t ea n do t h e rk e yi n d i c a t o 璐w e r et e s t e d e x p e r i m e n t a lr e s u l t ss h o wt h a tt h eh 2 6 4 a v ca l g o r i t h mi sa b l et os t i l lm a i n t a i nah i l g h 重庆邮电大学硕士论文 a b s t r a c t c o d i n ge f f i c i e n c ya n di m a g ec l a r i t yi np r i s eo fh i g hd a t ac o m p r e s s i o nr a t i o ,a n da l s o a c h i e v eh i g h - q u a l i t yr e a l - t i m ev i d e ot r a n s m i s s i o ni nc d m a 2 0 0 0 1 xw i r e l e s sn e t w o r k a n dw c d m aw i r e l e s sn e t w o r k k e yw o r d s :r e a l t i m e ,c o m p r e s s i o nr a t i o ,m o t i o ne s t i m a t i o n ,m c 8 6 3 0 ,e m 7 7 0 w i i i 重庆邮电大学硕士论文缩略语 缩略语 伊e g m o t i o np i c t u r ee x p e r tg r o u p 运动图像专家组 n a ln e t w o r ka b s t r a c t i o nl a y e r 网络提取层 v lv i d e oc o d i n gl a y e r 视频编码层 m i p sm i l l i o ni n s t r u c t i o n sp e rs e c o n d 每秒执行百万条指令数 c a c c o n t e x t - b a s e da d a p t i v ev a r i a b l el e n g t hc o d i n g 基于上下文的自适应变长编码 c a b a cc o n t e x t - b a s e da d a p t i v eb i n a r ya r i t h m e t i cc o d i n g 基于上下文的自适应二进制算 术熵编码 m bm a c r ob l o c k 宏块 d c td i s c r e t ec o s i n et r a n s f o r m 离散余弦变换 m vm o t i o nv e c t o r 运动矢量 b m a b l o c km a t c ha l g o r i t h m 块匹配法 m em o t i o ne s t i m a t i o n 运动估计 m s em e a ns q u a r e l o r 均方误差 s a ds u mo f a b s o l u t ed i f f e r e n c e绝对误差和 n 1 dn u m b e r i n gt h r e s h o l dd i f f e r e n c e 阈值差别计数 d 队d i r e c tm e m o r ya c c e s s 直接内存访问 d s p d i g i t a ls i g n a lp r o c e s s i n g 数字信号处理 v pv i d e op o r t 视频口 c i fc o m m o ni n t e r r n e d i a t ef o r m a t 3 5 2 x 2 8 8 格式 q c i fq u a r t e rc o m m o ni n t e r m e d i a t ef o r m a t 1 7 6 x 1 4 4 格式 i v 重庆邮电大学硕士论文第一章绪论 1 1 研究背景 第一章绪论 h 2 6 4 视频压缩编码标准是一系列国际视频压缩标准中的最新标准,其最大的 优势是具有很高的数据压缩比,在同等图像质量的条件下,h 2 6 4 的压缩比是 m p e g 2 的2 倍以上,是m p e g 4 的1 5 - 2 倍。而且还有码率低、图像质量高、容错 能力强及网络适应性强等优点。但是h 2 6 4 性能的提高是以增加复杂度为代价的。 据估计,其编码的计算复杂度大约为h 2 6 3 的3 倍,解码复杂度大约为h 2 6 3 的2 倍【, 伴随这种高复杂度而来的是巨大的计算量。而在嵌入式领域中,硬件资源严重受 限,所以h 2 6 4 视频压缩编码标准算法的这种高复杂度大计算量很难在嵌入式领域 进行实时视频应用。 从现在社会来看,视频应用已经发展了很长一段时期,视频应用对各个行业 的发展起到了非常重要的作用,甚至在一些关键领域如政府、银行等行业中已经 起着不可替代的作用。但从目前趋势看,现有市场上的有线视频应用已经很难满 足一些新兴市场的需要,无线视频应用的需求不断显现。而且视频应用正在朝着 小型终端化、无线化等趋势发展,所以在可预见的未来,这种趋势必将席卷现有 的视频应用领域。因此现有的视频应用也需要向这方面不断地发展,才能满足未 来的市场需求。 但是受限于实时性能、图像质量和硬件系统成本等诸多因素,从目前现有的 软件技术和硬件技术来考虑,要实现h 2 6 4 压缩编码的实时高质量无线视频传输有 很大的难度。有理由相信,随着各种硬件系统的不断快速发展和算法的不断改进, 这些制约因素终将得到解决。但是这些都需要一个过程,针对目前巨大的市场需 求和市场潜力,寻找更为合理有效的办法来解决这一矛盾仍是当前最切实可行的 途径。 所以最大程度地进行优化以降低相应计算量和利用第三代移动通信的的无线 网络进行无线传输逐渐成为了人们研究的热点和焦点。由于h 2 6 4 本身出色的编码 性能,必将成为以后视频应用领域的首选。而且随着第三代网络通信的应用逐渐 成熟,因此,在这两个方面的结合点开展相关的研究工作非常具有实际意义。这 对推进和扩展h 2 6 4 算法的实时无线视频应用有着非常积极的意义。 重庆邮电大学硕士论文第一章绪论 1 2 国内外研究现状 作为多媒体视频通信中的核心技术之一的视频压缩技术,其追求的是既要有 较大的压缩比,又要保证一定的视频质量,而这恰好是一对对立的矛盾。如何在 这两方面之间做出最好的权衡,以推动视频压缩技术的不断发展成了人们关注的 焦点。 为此,各个国际组织制定了一系列国际标准。在视频应用中,特别是在未来 的手持终端视频应用中,不但要考虑到所选编码方案的信噪比和压缩比,受限于 手持终端的功耗和处理能力还要考虑到其实现的复杂度。比较复杂的编码方案可 能会得到较高的压缩比,但巨大的计算开销对手持终端不得不说是一个巨大的挑 战,从而影响视频传输的可实现性和实时性。 目前,在以往众多的视频编码算法中,被广泛认可并应用于实际的是i s o i e c 的m p e g 系列和r r u t 的h 2 6 x 系列标准。 h 2 61 是第一个获得广泛应用的视频编码标准,建立了取得巨大成功的基于块 的混合编码框架。为后来的m p e g - 1 、m p e g 2 和h 2 6 3 等一系列视频压缩标准提供 了基础【z j 。 m p e g l 标准是在h 2 6 1 编码算法的基础上进行改进和发展的,m p e g l 改进的 主要内容是增加了b 帧( x 2 向预测) 和图像组( g o p ) 【3 】。这些改进使m p e g l 具有 更高的压缩比,而且使视频的操作更为灵活。比如编码器中的运动估值、自适应 量化和码流速率控制等可以根据实际情况来确定。 m p e g 2 标准支持高分辨率图像和声音。m p e g 2 是工业标准d v d 的核心标准, 对m p e g l 作了重要的改进和扩充。其编码效率比m p e g l 有显著提高。 h 2 6 3 是针对甚低码率( 低于6 4 k b p s ) 视频会议和可视电话的窄带信道视频编 码建议。h 2 6 3 是为了支持低速率的通信而制定的标准,但同时希望码流能够适应 较大的动态范围,而不仅限于低码率。 m p e g 4 是i s 咖e g 提出的一种极低码率的视、音频压缩编码标准m p e g 4 标 准既能够支持码率低于6 4 k b i t s 的视频应用,也能够支持广播级的视频应用。与其 他压缩标准相比,m p e g 4 标准在d c t 的基础上引入了图像模型的概念,从而具有 更高的压缩效率。 2 0 0 1 年,由m p e g ( m o v i n gp i c t u r ee x p e r t sg r o u p ) 和v c e g ( v i d e oc o d i n g e x p e r t sg r o u p ) 共同开发新的视频编码国际标准,这就是被命名a v c ( a d v a n c e d v i d e oc o d i n g ) 的,也被称为r r u - th 2 6 4 和m p e g - 4 的第l o 部分的标准。这个新一 代的视频压缩编码国际标准已于2 0 0 3 年3 月正式被i t i j - t 所通过,并在国际上正式 2 重庆邮电大学硕士论文第一章绪论 颁布( 简称h 2 6 4 标准) 。 虽然国内视频压缩技术起步比较晚,但同样有自己的音视频编码技术标准, 它就是a v s 标准。该标准主要是为了适应数字电视广播、数字存储媒体、因特网 流媒体和多媒体通信等应用中大尺寸、高质量的运动图像压缩的需要。a v s 采用 与h 2 6 4 类似的技术框架,主要特点是高效、低复杂度。a v s 的编码效率比m p e g - 2 高两倍左右,接近于h 2 6 4 。目前的a v s 视频技术可实现标准清晰度( c c 瓜6 0 1 或相当清晰度) 、低清晰度( c 环,s ) 等不同格式视频的压缩。 本文把h 2 6 4 视频压缩编码标准算法作为研究对象,在h 2 6 4 视频压缩编码 标准引入了两个全新的概念把编码标准分为两个不同的部分:视频编码层 ( v c l ,v i d e oc o d i n gl a y e r ) 和网络提取层( n a l ,n e t w o r k a d a p t a t i o nl a y e r ) 。 视频编码层用来有效地描述编码视频数据;网络提取层则根据网络特性,负责将 编码视频信息以适当的方式进行数据打包封装这样的结构便于信息的封装和对 信息进行更好的优先级控制【5 】,使得h 2 6 4 的文件能容易地在不同网络上传输( 例 如互联网,c d m a 2 0 0 0 1 x ,g p r s ,w c d m a 等) ,具有很强的网络适应性。同时, 它也是两大国际标准化组织i s o i e c 和u t 共同制定的,各大厂商不管是处于 编码性能考虑还是处于与上下游厂商的标准对接考虑都更倾向于采用该标准。 h 2 6 4 标准这种优越的编码性能和高贵的出身使得它在视频传输、通信等领域都有 着广泛的应用。 1 3 本文研究内容 1 3 1 研究目标 基于以上几节的分析发现,采用高效的算法辅以性能优越的嵌入式平台利用 第三代无线通信的强大带宽将会是视频传输应用的一个重要方向,本文的意义正 是将这几点进行有机的结合。 本文在认真总结了视频压缩编码标准的历程后,认为h 2 6 4 视频压缩编码标准 以其强大的压缩性能和网络适应性必将取代其他主要的视频编码标准成为视频应 用的首选,故本文采用该标准算法。但在该算法的嵌入式应用中如何降低算法的 计算量是关键。本文在这方面进行了算法级优化和系统级优化两个方面的优化工 作。算法级优化中在利用空间域的上层块模式运动矢量预测法得到初始搜索点后 再用点集预判法进行运动估计搜索。系统级优化中结合硬件平台主要进行了四个 方面的优化工作。 3 重庆邮电大学硕士论文第一章绪论 嵌入式平台的选取主要考虑h 2 6 4 视频压缩编码标准算法的大运算量和视频 口的传输转换能力,本文选用t i 公司新一代专门为视频应用领域设计的d s p 芯片 t m s 3 2 0 d m 6 4 2 。其时钟频率选择6 0 0 m h z 时运算速度高达每秒4 8 0 0 百万条指令 ( m 口s ,m i l l i o ni n s t r u c t i o n sp e rs e c o n d ) 的处理能力完全有能力进行实时视频传 输应用。 在第三代无线通信网络的选择上,选择已经商用的c d m a 2 0 0 0 1 x 和w c d m a 两种无线网络更为实际。而中兴通讯的无线模块m c 8 6 3 0 和华为技术的无线模块 e m 7 7 0 w 正是这两种网络制式下的佼佼者,其中m c 8 6 3 0 可以达到下行3 1 m b p s 、 上行1 8 m b p s 的速率,e m 7 7 0 w 可以支持下行7 2 m b p s 、上行5 7 6 m b p s 的速率;因 此本文选择这两个无线模块作为无线视频传输的载体。最后通过测试和结果分析 给出各种性能指标和方案的可行性。 1 3 2 研究内容 根据本文的研究目标将主要研究内容按以下章节进行安排: 第一章概述视频压缩技术和国内外的研究现状。 第二章为了进行算法的优化,首先深入研究了h 2 6 4 算法的整体编码结构, 在此基础上研究了帧内预测、帧间预测、整数d c t 变换与量化和熵编码等关键技 术环节的具体实现方案,并在使用的技术环节上和性能指标上与以往主要视频压 缩编码标准进行了对比论证。 第三章详细分析了算法的运动估计原理,并对现有的各种运动估计算法的实 现过程进行了研究。在此基础上,对现有的运动估计算法进行了改进优化,然后 结合具体的硬件平台t m s 3 2 0 d m 6 4 2 进行系统级的优化,并结合实例给出了各项 优化措施的具体实现方法和预期目标。 第四章对基于d s p 芯片t m s 3 2 0 d m 6 4 2 和c d m a 2 0 0 0 1 x 无线网络模块 m c 8 6 3 0 与w c d m a 无线网络模块e m 7 7 0 w 的无线视频传输硬件平台的总体设计 和各关键部分电路的设计实现进行了详细的描述。 第五章本章先进行了和算法性能相关联的压缩效率、压缩比和图像清晰度等 技术指标的测试,然后在c d m a 2 0 0 0 1 x 和w c d m a 两种无线网络传输环境下分 别对丢帧率、传输码流和图像清晰度等和无线视频传输相关联的技术指标进行测 试。 第六章总结本文的研究成果,对下一步的研究方向做了一些展望。 4 重庆邮电大学硕士论文第一章绪论 1 4 本章小结 本章首先通过分析当前手持型视频传输应用的发展和市场需求给出了本文的 研究背景,然后总结了视频压缩编码标准发展的历程和国内外现状。在此基础上 提出了本文的研究目标,然后在这个研究目标下,对各个章节研究的内容进行了 细致的划分。 5 重庆邮电大学硕士论文第二章h 2 6 4 视频编码原理分析与研究 第二章h 2 6 4 编码原理分析与论证 2 1h 2 6 4 的基本编码框架 h 2 6 4 视频编码层和以往视频编码标准一样,也是采用基于块的混合视频编码 框架【6 】,如图2 1 所示。具体过程是这样的:先将输入编码器的图像帧信息分割成 块( 一般典型值是宏块) ,接着利用空间相关性与时间相关性去除相关维度的冗余, 再把原始图像块与预测图像块相减,得到预测残差。接着对求得的预测残差进行 频域变换得到变换系数并量化。最后利用熵编码进行二进制编码,进一步去除量 化后数据间的符号冗余。 图2 1 基于块的混合视频编码框架图 本章认真分析研究了一些h 2 6 4 视频压缩编码标准采用的新技术,如空间域 的帧内预测、整数d c t 变换、基于内容的熵编码( c a v l c 和c a b a c ) 等关键新 技术,然后对h 2 6 4 视频压缩编码标准算法和以往的视频压缩编码标准进行了详 细的对比论证,从详细的技术对比和各项性能指标对比来说明h 2 6 4 视频压缩编 码标准算法的优越性和巨大潜力。 2 2h 2 6 4 编码关键技术 2 2 1 帧内预测 帧内预测的基本思路是根据相关性在当前帧已编码块的基础上对当前编码块 进行预测。但在h 2 6 4 视频压缩编码标准中,帧内预测是先在空间域进行后,再转 6 重庆邮电大学硕士论文 第二章h 2 6 4 视频编码原理分析与研究 到频域进行处理。 按以往的视频编码标准进行编码后,有可能会导致帧内编码的数据量比帧间 编码的大很多,这样使得在强制刷新、码流控制以及增加抗误码性能时引入的帧 内编码往往造成码率的不平稳现象【7 】。所以h 2 6 4 视频压缩编码标准中进行了改进, 即引入了帧内预测方法。它的基本思想是对编码块进行不同模式的帧内预测之后, 再对求得的预测误差进行d c t 变换、量化、熵编码等处理,有效地避免了帧内编 码造成的码率不平稳现象,但代价是增加了计算量。 h 2 6 4 视频压缩编码标准提供t 4 种帧内预测方式:4 x 4 亮度块的帧内预测 ( i n t r a4 x 4 ) 、1 6 x 1 6 亮度块的帧内预测( i n t r a1 6 x 1 6 ) 、8 x 8 色度块的帧内预测 ( i n t r ac h r o m a ) 以及p c m 的预测方式( ip c m ) 。 在h 2 6 4 视频压缩编码标准中的帧内预测中分为亮度分量和色度分量帧内预 测两类。对亮度分量而言又分为( i n t r a4 x 4 ) 和( i n t r a1 6 x 1 6 ) 两种模式。在运 动比较剧烈的场景下,一般比较适合用( i n t r a4 x 4 ) ,然后根据实际情况它有9 种 预测模式可供选择;在运动比较缓和的场景下,一般比较适合用( i n t r a1 6 x 1 6 ) , 然后根据实际情况它有4 种预测模式可供选择。8 x 8 色度块帧内预测模式有四种: 模式0 d c 预测,模式1 水平预测,模式2 竖直预测,模式3 p l a n e 预测。 ( i n t r a4 x 4 ) 预测模式的基本思路是这样的:先将一个宏块划分成1 6 个独立 的4 x 4 子块。每个4 x 4 子块利用其上方、左方及右上方已经重建的相邻块像素进行 帧内预测,当相邻像素点不存在时,相邻像素点的值用1 2 8 代替【引。假设当前4 x 4 块 及其相邻像素的分布如图2 2 所示。相邻块中已经重建的像素点由a - m 表示,当前 块中的1 6 个像素点f l 了a - p 表示。图2 3 为4 x 4 亮度块八种预测模式的不同方向。 g ,珑 | 侈j 韧 蕊 瓦 式( 3 4 ) 即:当l 口- , 8 i t o 时,g ( a ,) = 1 当i 口一i q b i t s s i g n ( z ( “,v ) ) = s i g n ( e ( ”,力)式( 3 1 0 ) q b i t s = 1 5 + f l o o r ( q p 6 ) 其中i z ( u ,v ) i 为量化后的系数;m f ( u ,u q p ) 是一个乘数因子,其取值与量化参 数q p 相关,具体取值如表3 1 。 表示右移运算符;厂= 2 批刀,当为帧间块时 n = 6 ,当为帧内块时n = 3 。 表3 1 乘数因子朋f 的取值 坐标坐标 q p 6( 0 ,o ) ( 2 ,o ) ( 1 , 1 ) ( 1 , 3 ) 其他位置 ( 2 ,2 ) ( o ,2 )( 3 ,1 ) ( 3 , 3 ) 01 3 1 0 75 2 4 3 8 0 6 6 11 1 9 1 64 6 6 07 4 9 0 21 0 0 8 24 1 9 4 6 5 5 4 重庆邮电大学硕士论文第三章运动估计算法的研究与改进 3 9 3 6 2 3 6 4 7 5 8 2 5 48 1 9 23 3 5 55 2 4 3 57 2 8 22 8 9 34 5 5 9 在h 2 6 4 视频压缩编码标准中,如果量化系数的绝对值小于1 ,那么对应变换 系数e ( u ,v ) 被量化为零,即: , q b i t s, e ,) f ,1 ,驴) ,f ,1 ,鲈) = m 二f ( u , v , l q p ) 式( 3 1 1 ) 由式( 3 1 1 ) 可以得到式( 3 1 2 ) : e ( u ,v ) l e ( x ,y ) l l a i x ,u ) l l a ( y ,v ) i w ( u ,d式( 3 1 2 ) x = o y = o 其中s ( u ,1 ,) 可以写成式( 3 1 3 ) - b ( “,d = 乞o4 ( “,v ) 式( 3 1 3 ) 其中,以( 甜,v ) = 1 a ( x ,u ) l a i y ,v ) 口叙。,o 表示矩阵的对应项相乘。那么量化系 数e ( u ,功被量化为零必须满足的充分条件是: b ( u ,d f ( u , ,q 尸)式( 3 1 4 ) 然后对b ( “,1 ,) 进行分析,以“= 1 ,= 1 为例,此时4 ( 1 ,1 ) 的值为: 域: 以( 1 ,1 ) = 4 2 2l 2l 4 2 2 4 12 12 2 4 式( 3 1 5 ) 为了对全零点集的阀值进行确定,可以将4 x 4 预测残差块分为如下四个子区 4 = ( x ,y ) j x = 0 ,3 ,y = 0 ,3 4 = ( x ,y ) l x = 0 ,3 ,y = o ,3 ) 鸣= ( x ,y ) l x = l ,2 ,y = l ,2 4 = ( x ,y ) l x = l ,2 ,y = o ,3 对每个区域预测误差绝对值求和可以得到其相应的( s a d ) s , : 式( 3 1 6 ) 式( 3 1 7 ) 式( 3 1 8 ) 式( 3 1 9 ) 重庆邮电大学硕士论文第三章运动估计算法的研究与改进 s = ,y ) l ,v ( x ,y ) 4 ,1 i 4 式( 3 2 0 ) jy 将各个墨求和可以得到4 4 块的s a d 值: 4 s a d = 墨 式( 3 2 1 ) 1 = 1 综合式( 3 1 3 ) ,式( 3 1 5 ) 一式( 3 2 1 ) 可以得n - s ( x ,1 ) = 2 s a d + 2 s t 一墨 式( 3 2 2 ) 联合式( 3 1 1 ) 和式( 3 1 2 ) ,变换系数e 0 ,1 ) 被量化为零的充分条件为: s a d ( f ( 1 ,1 ,q p ) + 岛一2 s 0 2式( 3 2 3 ) 同理,可以得到4 4 块内所有点的变换系数被量化为零的充分条件,如表3 2 所示。 表3 24 x4 块内点变换系数被量化为零的充分条件 充分条件其他位置 s a d ( f ( 1 ,1 ,q p ) + 墨一2 s t ) 2 ( 1 ,1 ) s a d ( f ( 1 ,1 ,q p ) + s 4 2 s 2 ) 2( 1 ,3 ) s a d ( f 0 ,1 ,q p ) + s 2 2 s , ) 2( 3 ,1 ) s a d ( f 0 ,1 ,q p ) + s t 一2 s 3 ) 2( 3 ,3 ) s a d ( f ( 1 ,1 ,q p ) + s 2 + 墨) 2 ( 0 ,1 ) ( 2 ,1 ) s a d ( f ( 1 ,1 ,q p 卜墨+ 墨) 2( 0 ,3 ) ( 2 ,3 ) s a d ( f ( 1 ,1 ,q p ) + s 3 + 瓯) 2( 1 ,o ) ( 1 ,2 ) s a d ( f ( 1 ,1 ,q p 汁墨+ 是) 2( 3 ,o ) ( 3 ,2 ) s a d f ( 0 ,0 ,q p ) ( 0 ,0 ) ( 0 ,2 ) ( 2 ,o ) ( 2 ,2 ) 现设定三个独立的预判阀值五,五,互来表征表3 2 中三种坐标对应的系数: 互= ( f ( 1 ,1 ,q e ) + m i n s , 一2 s ,墨一2 s 2 ,岛一2 墨,墨一2 s 3 ) 2 式( 3 2 4 ) 石= ( f ( 1 ,1 ,q e ) + m i n s , 一2 s , ,墨一2 岛,岛一2 蜀,s l - 2 岛 ) 2 式( 3 2 5 ) 互= ( ,( o ,0 ,q p )式( 3 2 6 ) 假设4 4 块的s a d 五,就可以认为五对应点集中的所有点的量化系数全部为 零。假设4 x 4 块的s a d 值小于式( 3 2 4 ) 式( 3 2 6 ) 中任何一个,即若满足式( 3 2 7 ) 时,就可以认为这个4 4 块内的所有点的变换系数将全部被量化为零。 重庆邮电大学硕士论文第三章运动估计算法的研究与改进 s a d t ,t = m i n ( 五,互,互) 式( 3 2 7 ) 所以在运动估计搜索过程中,若某个搜索点处满足式( 3 2 7 ) ,那么可以立即 停止对搜索窗口内剩余其他搜索点的搜索估计,该块完全可以用上一帧中对应块 的重构图像来替换,若某个搜索点处满足式( 3 2 4 ) 式( 3 2 6 ) 中任何一个,即 可停止对相应点集的搜索估计,那么该点集所在位置处的像素就可以用上一帧中 对应点集的像素来代替,减轻了数据传输的压力。 3 3 3 改进算法的具体步骤 实验统计数据表明,5 0 - 9 0 的运动向量集中在以2 为搜索半径的圆内【1 9 】。 所以在改进的运动估计搜索算法中,本文依然采用经典的六边形作为大精度搜索 模板,其半径为2 。然后在其基础上再采用十字形作为小精度搜索模板,其半径为 1 。中间过程每一步都用阀值进行控制以看其是否满足停止搜索的条件。其具体实 现步骤如下。 第一步,用空间域的上层块模式运动矢量预测法求出当前块运动矢量的预测 值作为当前块运动矢量的搜索起始点,以搜索起始点作为原点建立搜索区域,搜 索半径为2 。 第二步,以初始搜索点对应六边形搜索模板的中心,在搜索半径为2 的搜索区 域内分别进行匹配计算,寻找使得搜索模板内s a d 值最小的点,同时依据式 ( 3 2 4 ) 式( 3 2 6 ) 计算正,互,正的值。 第三步,如果满足式( 3 2 7 ) ,则直接停止该块其他点的运动估计搜索,然后 在解码端该块就可以直接用上一帧中重构的对应块来表示。如果不满足式( 3 2 7 ) , 但是满足式( 3 2 4 ) 式( 3 2 6 ) 中的一个或者两者,则可以立即停止对相应点集 其他点的运动估计搜索。 第四步,如果s a d 值最小的点不在六边形搜索模板的中心,则继续移动搜索 模板窗口,在这个过程中,每一步的得到的结果都要转入第三步,看是否满足式 ( 3 2 4 ) 式( 3 2 7 ) 的条件。一直到使得s a d 值最小的点在六边形搜索模板的 中心为止,其中如果遇到第三步排除掉的点对其不做任何计算。 第五步,将上一步得到的目前最佳点为中心构造十字形,计算使得s a d 值最 小的点,若其中遇到第三步排除掉的点对其不做任何计算。所得最佳匹配点即为 最佳匹配点,然后求出运动矢量。 重庆邮电大学硕士论文第三章运动估计算法的研究与改进 3 4 基于t m s 3 2 0 d m 6 4 2 的系统级优化 3 4 1 编译选项优化 本文采用的开发工具是c c s 3 1 ( c o d ec o m p o s e rs t u d i o ) ,c c s 3 1 提供了配置、 建立、调试、跟踪和分析程序的工具,它便于实时、嵌入式信号处理程序的编制 和测试。 c c s 3 1 的编译器提供了强大的编译,编译选项优化时主要采用的编译选项如 表3 3 所示。联合使用0 3 和- p m 编译选项,可使编译器从程序级对整个程序进行 最全面、最高级的优化。 表3 3 主要编译选项 选项功能描述 - 0 3 表示得到最高程度的优化,编译器将执行各种优化循环的方 法,如软件流水、循环展开和s i m d ( 单指令多数据流) 等。 - p m 联合所有源文件进行程序级优化,在编译时可以从整个程序 的角度出发进行优化,使代码尺寸也得到优化。 - m t 向编译器说明代码中没有使用混迭技术,允许编译器在无存 储器相关性假设下进行优化。 实际测试表明,- 0 3 选项的打开对程序的优化相当显著。如果程序满足无存储 器相关性的假设,打开p m 和m t 选项可以缩短编码一帧的时间3 4 m s 【2 们。 3 4 2c a c h e 优化 本文在4 2 2 章节中详细分析了r i m s 3 2 0 d m 6 4 2 的两级缓存结构l 1 l 2 。对于硬 件资源受限的d s p 来说,合理使用非常有限的c a c h e 对程序的运行速度有着非常重 要的意义。因为c p u 只能对l l 中的l i d 和l i p 进行直接的访问,而大部分程序和数 据是存放在外部存储器里的。此时,c p u 想要访问外部存储器的程序和数据,必 须先把即将访问的外部存储器的程序和数据搬移到l 2 缓存区域,然后由l 2 搬移到 l 1 缓冲区等待c p u 访问。这个逐级搬移的过程是和c p u 处理前一批次l 1 中的数据 并行进行的,提高了工作效率。而且每次需要访问的数据都和下一次需要访问的 数据不管是在时间上还是空间上都存在一定的关联性,所以在从片外外设取访问 重庆邮电大学硕士论文第三章运动估计算法的研究与改进 数据至l j c a c h e 中去时,也会把其相邻的数据一并取至u c a c h e 中,这样在下次访问数 据时,就可以直接去c a c h e 中找,提高了c a c h e 的命中率。 有实验表明,合理地利用l 1 和l 2 两级缓存配合低工作频率的外部存储设备, 系统的效率能够达到全部使用高工作频率的内部存储器的8 0 到9 0 。这使得在内 部存储空间不够用的情况下可以使用外部低速存储设备,但不会对系统效率造成 很大的影响。 本文从以下四个方面来进行c a c h e 的优化工作。 1 ) 合理配置二级c a c h el 2 ,把l 2 配置用于c a c h e 或者s r a m 的大小需要根 据具体应用进行灵活配置。通常情况下c a c h e 容量越大越好。对本文中的视频应 用,应把一些频繁访问的数据存放到s 洲中。因此应该把l 2 的一部分作为 s r a m 来用l z 。 l 2 设置的方法有两种:一是使用d s p b i o s 静态的配置,即在前面b i o s 配置中 的m e m 模块中进行设置;二是通过c s l ( c h i ps u p p o r tl i b r a r y ) 中的c a c h e 模块 动态的配置。动态配置c a c h e 的方法如下: c a c h e c l e a n ( c a c h e _ l 2 a l l ,0 ,o ) ; c a c h ee n a b l e c a c h i n g ( c a c h e e m i f a c e 0 0 ) ; c a c h e _ e n a b l e c a c h i n g ( c a c h e e m i f a c e 0 1 ) ; c a c h e s e
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 吉林省2025年吉林省省直事业单位招聘工作人员4号(64人)笔试历年参考题库附带答案详解
- 北京市2025商务部外贸发展事务局招聘23人笔试历年参考题库附带答案详解
- 2025浙江温州市洞头区机关事业单位(国企)第一期招聘编外用工12人笔试参考题库附带答案详解
- 2025江苏海晟控股集团有限公司下属子公司招聘第一批任务型合同制员工27人笔试参考题库附带答案详解
- 2025广西旅游发展集团有限公司招聘343人笔试参考题库附带答案详解
- 2025年甘肃省民航机场集团劳务派遣工招聘58人笔试参考题库附带答案详解
- 2025年河北张家口怀来经开创新实业有限公司招聘工作人员2名笔试参考题库附带答案详解
- 2025年2月云南思茅产业园区企业用工193人笔试参考题库附带答案详解
- 2025安徽黄山市黄山区国鼎资产运营管理有限公司工作人员招聘1人笔试参考题库附带答案详解
- 2025四川成都交通投资集团有限公司校园招聘10人(第二批)笔试参考题库附带答案详解
- 丝杠安全操作保养规定
- 体育测量与评价PPT课件-第九章 运动员选材的测量与评价
- 数据中心基础设施标识标志
- 工程质量精细化管理思路、关键点及控制方法课件
- 《情满今生》读书笔记模板
- 胸痛中心网络医院STEMI患者绕行急诊和CCU方案流程图
- 2021年一级注册消防工程师继续教育试题答案
- 甲醇理化性质及危险特性表MSDS
- GB/T 7216-2009灰铸铁金相检验
- GB/T 5796.3-1986梯形螺纹基本尺寸
- 华北理工大学2016年《互换性及技术测量》期末考试复习题
评论
0/150
提交评论