（通信与信息系统专业论文）h264算法优化及dsp实现.pdf

上传人：灰*** IP属地：宁夏上传时间：2019-12-16 格式：PDF 页数：62 大小：5.71MB 积分：0 举报 版权申诉

已阅读5页，还剩57页未读，继续免费阅读

（通信与信息系统专业论文）h264算法优化及dsp实现.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

重庆邮电大学硕士论文摘要摘要 h 2 6 4 a v c 是i t u tv c e g 和i s o i e cm p e g 联合制定的最新的视频编解码标准。该标准以较高的数据压缩比和网络友好性得到了越来越多的应用。但h 2 6 4 a v c 中采用的编码技术复杂度很高，与以往编码技术相比，高出了几倍甚至几十倍，严重限制了该技术的应用和推广。特别在一些硬件资源受限和实时性要求比较高的嵌入式应用中更是如此。因此在保证数据压缩比和图像质量的前提下，如何最大限度降低算法的复杂度成了h 2 6 4 a v c 应用前景的关键所在。而且随着视频传输应用的成熟和发展，现有的有线视频传输已经很难满足市场的需求。特别是在手持化终端化的大趋势下，手持型的无线视频传输终端已经是大势所趋，在此大环境下，本文在这两方面结合点处开展研究工作实属必要。首先本文选取在h 2 6 4 a v c 编码中计算量较大的运动估计搜索算法进行主要的算法研究。在研究了编码流程和对以往的经典运动估计搜索算法进行对比分析后，对运动估计搜索算法进行了改进。然后结合具体d s f 硬件平台t m s 3 2 0 d m 6 4 2 对算法进行了四个方面的系统级优化。此外，为了实现视频的无线传输，本文选取d s p 芯片t m s 3 2 0 d m 6 4 2 作为c p u ，然后选取第三代移动通信中的c d m a 2 0 0 0 1 x 无线网络模块m c 8 6 3 0 和w c d m a 无线网络模块e m 7 7 0 w ，对硬件电路的设计实现进行了详细的说明。最后对算法编码效率、压缩比和图像清晰度等主要的算法性能指标进行了详细的测试，并在c d m a 2 0 0 0 1 x 无线网络环境下和w c d m a 无线网络环境下对视频的无线传输性能指标如丢帧率、码流速率等主要指标分别进行了测试。实验结果表明，算法在保持高数据压缩比的情况下，仍保持了较高的编码效率和图像清晰度，并在c d m a 2 0 0 01x 无线网络环境下和w c d m a 无线网络环境下实现了高质量的实时视频传输。关键词：实时性，压缩比，运动估计，m c 8 6 3 0 ，e m 7 7 0 w 重庆邮电大学硕士论文 a b s t r a c t a b s t r a c t h 2 6 4 a v ci st h el a t e s tv i d e oc o d i n gs t a n d a r dd e v e l o p e dj o i n t l yb yn u t - v c e g a n di s o i e c m p e gt h es t a n d a r di sg a i n i n gm o r ea n dm o r ea p p l i c a t i o n sd u et oh i g h e r d a t ac o m p r e s s i o nr a t i oa n dn e t w o r kf r i e n d l y b u tt h eh 2 6 4 a v cc o d i n gu s e di nah i g hd e g r e eo ft e c h n i c a lc o m p l e x i t y , e v e n s e v e r a lt i m e sh i g h e rc o m p a r e dw i t ht h ep r e v i o u sc o d i n g i ts e v e r e l yl i m i t st h e a p p l i c a t i o na n dp r o m o t i o no ft h et e c h n o l o g y , e s p e c i a l l yi nl i m i t e dh a r d w a r ea n d r e a l - t i m er e q u i r e m e n t se m b e d d e da p p l i c a t i o n s t h e r e f o r e ，i nt h ep r e m i s eo fe n s u r et h e d a t ac o m p r e s s i o nr a t i oa n di m a g eq u a l i t y , h o wt om i n i m i z et h ec o m p l e x i t yo ft h e a l g o r i t h mh a sb e c o m eak e yi s s u ei nt h ep r o s p e c to fh 2 6 4 a v c a n da sv i d e ot r a n s m i s s i o na p p l i c a t i o n sg r o wm a t u r ea n di sd e v e l o p i n g ，t h ee x i s t i n g c a b l ev i d e ot r a n s m i s s i o nh a sb e e nd i f f i c u l tt om e e tm a r k e td e m a n d e s p e c i a l l yi nt h e t r e n do fh a n d - h e l dt e r m i n a l s ，h a n d - h e l dt e r m i n a l sf o rw i r e l e s sv i d e ot r a n s m i s s i o nh a s b e e nag e n e r a lt r e n d i nt h i se n v i r o n m e n t , t h i sc o m b i n a t i o no ft h eb e t w e e na r e a si s n e c e s s a r yt oc a r r yo u tr e s e a r c hw o r k f i r s t l y , t h ep a p e rs e l e c tt h em o t i o ne s t i m a t i o ns e a r c ha l g o r i t h mo ft h eh 2 6 4 a v c c o d i n g ，w h i c hc o n t a i n sal a r g ea m o u n to fc a l c u l a t i o n a f t e rs t u d y i n gt h ec o d i n gp r o c e s s a n da n a l y s i s i n gt h ep r e v i o u sc l a s s i c a lm o t i o ne s t i m a t i o ns e a r c ha l g o r i t h m ，t h em o t i o n e s t i m a t i o ns e a r c ha l g o r i t h mw a si m p r o v e d t h e nt h ea l g o r i t h mw a so p t i m i z e db yf o u r t i m e sa t s y s t e m l e v e l c o m b i n e dw i t ht h e s p e c i f i c d s ph a r d w a r e p l a t f o r m t m s 3 2 0 d m 6 4 2 i na d d i t i o n , i no r d e rt oa c h i e v et h ew i r e l e s st r a n s m i s s i o no fv i d e o ，t h ep a p e r s e l e c t e dr i m s 3 2 0 d m 6 4 2a st h ec h i pc p u ，a n dt h e ns e l e c tt h et h i r dg e n e r a t i o nm o b i l e c o m m u n i c a t i o nm o d u l em c 8 6 3 0i nt h ec d m a 2 0 0 0 1 xw i r e l e s sn e t w o r ka n dm o d u l e e m 7 7 0 wi nt h ew c d m aw i r e l e s sn e t w o r k ad e t a i l e dd e s c r i p t i o ni su s e dt oh a r d w a r e d e s i g na n di m p l e m e n t a t i o n f i n a l l y , t h ec o d i n ge f f i c i e n c yo ft h ea l g o r i t h m ，c o m p r e s s i o nr a t i oa n di m a g ec l a r i t y h a v et e s t e di nd e t a i l t h e ni nt h ee n v i r o n m e n to ft h ec d m 匕心0 0 01xw i r e l e s sn e t w o r k a n dt h ew c d m aw i r e l e s sn e t w o r kf o rw i r e l e s sv i d e ot r a n s m i s s i o n p e r f o r m a n c e i n d i c a t o ms u c ha sf r a m el o s sr a t e ，c o d ef l o wr a t ea n do t h e rk e yi n d i c a t o 璐w e r et e s t e d e x p e r i m e n t a lr e s u l t ss h o wt h a tt h eh 2 6 4 a v ca l g o r i t h mi sa b l et os t i l lm a i n t a i nah i l g h 重庆邮电大学硕士论文 a b s t r a c t c o d i n ge f f i c i e n c ya n di m a g ec l a r i t yi np r i s eo fh i g hd a t ac o m p r e s s i o nr a t i o ，a n da l s o a c h i e v eh i g h - q u a l i t yr e a l - t i m ev i d e ot r a n s m i s s i o ni nc d m a 2 0 0 0 1 xw i r e l e s sn e t w o r k a n dw c d m aw i r e l e s sn e t w o r k k e yw o r d s ：r e a l t i m e ，c o m p r e s s i o nr a t i o ，m o t i o ne s t i m a t i o n ，m c 8 6 3 0 ，e m 7 7 0 w i i i 重庆邮电大学硕士论文缩略语缩略语伊e g m o t i o np i c t u r ee x p e r tg r o u p 运动图像专家组 n a ln e t w o r ka b s t r a c t i o nl a y e r 网络提取层 v lv i d e oc o d i n gl a y e r 视频编码层 m i p sm i l l i o ni n s t r u c t i o n sp e rs e c o n d 每秒执行百万条指令数 c a c c o n t e x t - b a s e da d a p t i v ev a r i a b l el e n g t hc o d i n g 基于上下文的自适应变长编码 c a b a cc o n t e x t - b a s e da d a p t i v eb i n a r ya r i t h m e t i cc o d i n g 基于上下文的自适应二进制算术熵编码 m bm a c r ob l o c k 宏块 d c td i s c r e t ec o s i n et r a n s f o r m 离散余弦变换 m vm o t i o nv e c t o r 运动矢量 b m a b l o c km a t c ha l g o r i t h m 块匹配法 m em o t i o ne s t i m a t i o n 运动估计 m s em e a ns q u a r e l o r 均方误差 s a ds u mo f a b s o l u t ed i f f e r e n c e绝对误差和 n 1 dn u m b e r i n gt h r e s h o l dd i f f e r e n c e 阈值差别计数 d 队d i r e c tm e m o r ya c c e s s 直接内存访问 d s p d i g i t a ls i g n a lp r o c e s s i n g 数字信号处理 v pv i d e op o r t 视频口 c i fc o m m o ni n t e r r n e d i a t ef o r m a t 3 5 2 x 2 8 8 格式 q c i fq u a r t e rc o m m o ni n t e r m e d i a t ef o r m a t 1 7 6 x 1 4 4 格式 i v 重庆邮电大学硕士论文第一章绪论 1 1 研究背景第一章绪论 h 2 6 4 视频压缩编码标准是一系列国际视频压缩标准中的最新标准，其最大的优势是具有很高的数据压缩比，在同等图像质量的条件下，h 2 6 4 的压缩比是 m p e g 2 的2 倍以上，是m p e g 4 的1 5 - 2 倍。而且还有码率低、图像质量高、容错能力强及网络适应性强等优点。但是h 2 6 4 性能的提高是以增加复杂度为代价的。据估计，其编码的计算复杂度大约为h 2 6 3 的3 倍，解码复杂度大约为h 2 6 3 的2 倍【，伴随这种高复杂度而来的是巨大的计算量。而在嵌入式领域中，硬件资源严重受限，所以h 2 6 4 视频压缩编码标准算法的这种高复杂度大计算量很难在嵌入式领域进行实时视频应用。从现在社会来看，视频应用已经发展了很长一段时期，视频应用对各个行业的发展起到了非常重要的作用，甚至在一些关键领域如政府、银行等行业中已经起着不可替代的作用。但从目前趋势看，现有市场上的有线视频应用已经很难满足一些新兴市场的需要，无线视频应用的需求不断显现。而且视频应用正在朝着小型终端化、无线化等趋势发展，所以在可预见的未来，这种趋势必将席卷现有的视频应用领域。因此现有的视频应用也需要向这方面不断地发展，才能满足未来的市场需求。但是受限于实时性能、图像质量和硬件系统成本等诸多因素，从目前现有的软件技术和硬件技术来考虑，要实现h 2 6 4 压缩编码的实时高质量无线视频传输有很大的难度。有理由相信，随着各种硬件系统的不断快速发展和算法的不断改进，这些制约因素终将得到解决。但是这些都需要一个过程，针对目前巨大的市场需求和市场潜力，寻找更为合理有效的办法来解决这一矛盾仍是当前最切实可行的途径。所以最大程度地进行优化以降低相应计算量和利用第三代移动通信的的无线网络进行无线传输逐渐成为了人们研究的热点和焦点。由于h 2 6 4 本身出色的编码性能，必将成为以后视频应用领域的首选。而且随着第三代网络通信的应用逐渐成熟，因此，在这两个方面的结合点开展相关的研究工作非常具有实际意义。这对推进和扩展h 2 6 4 算法的实时无线视频应用有着非常积极的意义。重庆邮电大学硕士论文第一章绪论 1 2 国内外研究现状作为多媒体视频通信中的核心技术之一的视频压缩技术，其追求的是既要有较大的压缩比，又要保证一定的视频质量，而这恰好是一对对立的矛盾。如何在这两方面之间做出最好的权衡，以推动视频压缩技术的不断发展成了人们关注的焦点。为此，各个国际组织制定了一系列国际标准。在视频应用中，特别是在未来的手持终端视频应用中，不但要考虑到所选编码方案的信噪比和压缩比，受限于手持终端的功耗和处理能力还要考虑到其实现的复杂度。比较复杂的编码方案可能会得到较高的压缩比，但巨大的计算开销对手持终端不得不说是一个巨大的挑战，从而影响视频传输的可实现性和实时性。目前，在以往众多的视频编码算法中，被广泛认可并应用于实际的是i s o i e c 的m p e g 系列和r r u t 的h 2 6 x 系列标准。 h 2 61 是第一个获得广泛应用的视频编码标准，建立了取得巨大成功的基于块的混合编码框架。为后来的m p e g - 1 、m p e g 2 和h 2 6 3 等一系列视频压缩标准提供了基础【z j 。 m p e g l 标准是在h 2 6 1 编码算法的基础上进行改进和发展的，m p e g l 改进的主要内容是增加了b 帧( x 2 向预测) 和图像组( g o p ) 【3 】。这些改进使m p e g l 具有更高的压缩比，而且使视频的操作更为灵活。比如编码器中的运动估值、自适应量化和码流速率控制等可以根据实际情况来确定。 m p e g 2 标准支持高分辨率图像和声音。m p e g 2 是工业标准d v d 的核心标准，对m p e g l 作了重要的改进和扩充。其编码效率比m p e g l 有显著提高。 h 2 6 3 是针对甚低码率( 低于6 4 k b p s ) 视频会议和可视电话的窄带信道视频编码建议。h 2 6 3 是为了支持低速率的通信而制定的标准，但同时希望码流能够适应较大的动态范围，而不仅限于低码率。 m p e g 4 是i s 咖e g 提出的一种极低码率的视、音频压缩编码标准m p e g 4 标准既能够支持码率低于6 4 k b i t s 的视频应用，也能够支持广播级的视频应用。与其他压缩标准相比，m p e g 4 标准在d c t 的基础上引入了图像模型的概念，从而具有更高的压缩效率。 2 0 0 1 年，由m p e g ( m o v i n gp i c t u r ee x p e r t sg r o u p ) 和v c e g ( v i d e oc o d i n g e x p e r t sg r o u p ) 共同开发新的视频编码国际标准，这就是被命名a v c ( a d v a n c e d v i d e oc o d i n g ) 的，也被称为r r u - th 2 6 4 和m p e g - 4 的第l o 部分的标准。这个新一代的视频压缩编码国际标准已于2 0 0 3 年3 月正式被i t i j - t 所通过，并在国际上正式 2 重庆邮电大学硕士论文第一章绪论颁布( 简称h 2 6 4 标准) 。虽然国内视频压缩技术起步比较晚，但同样有自己的音视频编码技术标准，它就是a v s 标准。该标准主要是为了适应数字电视广播、数字存储媒体、因特网流媒体和多媒体通信等应用中大尺寸、高质量的运动图像压缩的需要。a v s 采用与h 2 6 4 类似的技术框架，主要特点是高效、低复杂度。a v s 的编码效率比m p e g - 2 高两倍左右，接近于h 2 6 4 。目前的a v s 视频技术可实现标准清晰度( c c 瓜6 0 1 或相当清晰度) 、低清晰度( c 环，s ) 等不同格式视频的压缩。本文把h 2 6 4 视频压缩编码标准算法作为研究对象，在h 2 6 4 视频压缩编码标准引入了两个全新的概念把编码标准分为两个不同的部分：视频编码层 ( v c l ，v i d e oc o d i n gl a y e r ) 和网络提取层( n a l ，n e t w o r k a d a p t a t i o nl a y e r ) 。视频编码层用来有效地描述编码视频数据；网络提取层则根据网络特性，负责将编码视频信息以适当的方式进行数据打包封装这样的结构便于信息的封装和对信息进行更好的优先级控制【5 】，使得h 2 6 4 的文件能容易地在不同网络上传输( 例如互联网，c d m a 2 0 0 0 1 x ，g p r s ，w c d m a 等) ，具有很强的网络适应性。同时，它也是两大国际标准化组织i s o i e c 和u t 共同制定的，各大厂商不管是处于编码性能考虑还是处于与上下游厂商的标准对接考虑都更倾向于采用该标准。 h 2 6 4 标准这种优越的编码性能和高贵的出身使得它在视频传输、通信等领域都有着广泛的应用。 1 3 本文研究内容 1 3 1 研究目标基于以上几节的分析发现，采用高效的算法辅以性能优越的嵌入式平台利用第三代无线通信的强大带宽将会是视频传输应用的一个重要方向，本文的意义正是将这几点进行有机的结合。本文在认真总结了视频压缩编码标准的历程后，认为h 2 6 4 视频压缩编码标准以其强大的压缩性能和网络适应性必将取代其他主要的视频编码标准成为视频应用的首选，故本文采用该标准算法。但在该算法的嵌入式应用中如何降低算法的计算量是关键。本文在这方面进行了算法级优化和系统级优化两个方面的优化工作。算法级优化中在利用空间域的上层块模式运动矢量预测法得到初始搜索点后再用点集预判法进行运动估计搜索。系统级优化中结合硬件平台主要进行了四个方面的优化工作。 3 重庆邮电大学硕士论文第一章绪论嵌入式平台的选取主要考虑h 2 6 4 视频压缩编码标准算法的大运算量和视频口的传输转换能力，本文选用t i 公司新一代专门为视频应用领域设计的d s p 芯片 t m s 3 2 0 d m 6 4 2 。其时钟频率选择6 0 0 m h z 时运算速度高达每秒4 8 0 0 百万条指令 ( m 口s ，m i l l i o ni n s t r u c t i o n sp e rs e c o n d ) 的处理能力完全有能力进行实时视频传输应用。在第三代无线通信网络的选择上，选择已经商用的c d m a 2 0 0 0 1 x 和w c d m a 两种无线网络更为实际。而中兴通讯的无线模块m c 8 6 3 0 和华为技术的无线模块 e m 7 7 0 w 正是这两种网络制式下的佼佼者，其中m c 8 6 3 0 可以达到下行3 1 m b p s 、上行1 8 m b p s 的速率，e m 7 7 0 w 可以支持下行7 2 m b p s 、上行5 7 6 m b p s 的速率；因此本文选择这两个无线模块作为无线视频传输的载体。最后通过测试和结果分析给出各种性能指标和方案的可行性。 1 3 2 研究内容根据本文的研究目标将主要研究内容按以下章节进行安排：第一章概述视频压缩技术和国内外的研究现状。第二章为了进行算法的优化，首先深入研究了h 2 6 4 算法的整体编码结构，在此基础上研究了帧内预测、帧间预测、整数d c t 变换与量化和熵编码等关键技术环节的具体实现方案，并在使用的技术环节上和性能指标上与以往主要视频压缩编码标准进行了对比论证。第三章详细分析了算法的运动估计原理，并对现有的各种运动估计算法的实现过程进行了研究。在此基础上，对现有的运动估计算法进行了改进优化，然后结合具体的硬件平台t m s 3 2 0 d m 6 4 2 进行系统级的优化，并结合实例给出了各项优化措施的具体实现方法和预期目标。第四章对基于d s p 芯片t m s 3 2 0 d m 6 4 2 和c d m a 2 0 0 0 1 x 无线网络模块 m c 8 6 3 0 与w c d m a 无线网络模块e m 7 7 0 w 的无线视频传输硬件平台的总体设计和各关键部分电路的设计实现进行了详细的描述。第五章本章先进行了和算法性能相关联的压缩效率、压缩比和图像清晰度等技术指标的测试，然后在c d m a 2 0 0 0 1 x 和w c d m a 两种无线网络传输环境下分别对丢帧率、传输码流和图像清晰度等和无线视频传输相关联的技术指标进行测试。第六章总结本文的研究成果，对下一步的研究方向做了一些展望。 4 重庆邮电大学硕士论文第一章绪论 1 4 本章小结本章首先通过分析当前手持型视频传输应用的发展和市场需求给出了本文的研究背景，然后总结了视频压缩编码标准发展的历程和国内外现状。在此基础上提出了本文的研究目标，然后在这个研究目标下，对各个章节研究的内容进行了细致的划分。 5 重庆邮电大学硕士论文第二章h 2 6 4 视频编码原理分析与研究第二章h 2 6 4 编码原理分析与论证 2 1h 2 6 4 的基本编码框架 h 2 6 4 视频编码层和以往视频编码标准一样，也是采用基于块的混合视频编码框架【6 】，如图2 1 所示。具体过程是这样的：先将输入编码器的图像帧信息分割成块( 一般典型值是宏块) ，接着利用空间相关性与时间相关性去除相关维度的冗余，再把原始图像块与预测图像块相减，得到预测残差。接着对求得的预测残差进行频域变换得到变换系数并量化。最后利用熵编码进行二进制编码，进一步去除量化后数据间的符号冗余。图2 1 基于块的混合视频编码框架图本章认真分析研究了一些h 2 6 4 视频压缩编码标准采用的新技术，如空间域的帧内预测、整数d c t 变换、基于内容的熵编码( c a v l c 和c a b a c ) 等关键新技术，然后对h 2 6 4 视频压缩编码标准算法和以往的视频压缩编码标准进行了详细的对比论证，从详细的技术对比和各项性能指标对比来说明h 2 6 4 视频压缩编码标准算法的优越性和巨大潜力。 2 2h 2 6 4 编码关键技术 2 2 1 帧内预测帧内预测的基本思路是根据相关性在当前帧已编码块的基础上对当前编码块进行预测。但在h 2 6 4 视频压缩编码标准中，帧内预测是先在空间域进行后，再转 6 重庆邮电大学硕士论文第二章h 2 6 4 视频编码原理分析与研究到频域进行处理。按以往的视频编码标准进行编码后，有可能会导致帧内编码的数据量比帧间编码的大很多，这样使得在强制刷新、码流控制以及增加抗误码性能时引入的帧内编码往往造成码率的不平稳现象【7 】。所以h 2 6 4 视频压缩编码标准中进行了改进，即引入了帧内预测方法。它的基本思想是对编码块进行不同模式的帧内预测之后，再对求得的预测误差进行d c t 变换、量化、熵编码等处理，有效地避免了帧内编码造成的码率不平稳现象，但代价是增加了计算量。 h 2 6 4 视频压缩编码标准提供t 4 种帧内预测方式：4 x 4 亮度块的帧内预测 ( i n t r a4 x 4 ) 、1 6 x 1 6 亮度块的帧内预测( i n t r a1 6 x 1 6 ) 、8 x 8 色度块的帧内预测 ( i n t r ac h r o m a ) 以及p c m 的预测方式( ip c m ) 。在h 2 6 4 视频压缩编码标准中的帧内预测中分为亮度分量和色度分量帧内预测两类。对亮度分量而言又分为( i n t r a4 x 4 ) 和( i n t r a1 6 x 1 6 ) 两种模式。在运动比较剧烈的场景下，一般比较适合用( i n t r a4 x 4 ) ，然后根据实际情况它有9 种预测模式可供选择；在运动比较缓和的场景下，一般比较适合用( i n t r a1 6 x 1 6 ) ，然后根据实际情况它有4 种预测模式可供选择。8 x 8 色度块帧内预测模式有四种：模式0 d c 预测，模式1 水平预测，模式2 竖直预测，模式3 p l a n e 预测。 ( i n t r a4 x 4 ) 预测模式的基本思路是这样的：先将一个宏块划分成1 6 个独立的4 x 4 子块。每个4 x 4 子块利用其上方、左方及右上方已经重建的相邻块像素进行帧内预测，当相邻像素点不存在时，相邻像素点的值用1 2 8 代替【引。假设当前4 x 4 块及其相邻像素的分布如图2 2 所示。相邻块中已经重建的像素点由a - m 表示，当前块中的1 6 个像素点f l 了a - p 表示。图2 3 为4 x 4 亮度块八种预测模式的不同方向。 g ，珑 | 侈j 韧蕊瓦式( 3 4 ) 即：当l 口- , 8 i t o 时，g ( a ，) = 1 当i 口一i q b i t s s i g n ( z ( “，v ) ) = s i g n ( e ( ”，力)式( 3 1 0 ) q b i t s = 1 5 + f l o o r ( q p 6 ) 其中i z ( u ，v ) i 为量化后的系数；m f ( u ，u q p ) 是一个乘数因子，其取值与量化参数q p 相关，具体取值如表3 1 。表示右移运算符；厂= 2 批刀，当为帧间块时 n = 6 ，当为帧内块时n = 3 。表3 1 乘数因子朋f 的取值坐标坐标 q p 6( 0 ，o ) ( 2 ，o ) ( 1 , 1 ) ( 1 , 3 ) 其他位置 ( 2 ，2 ) ( o ，2 )( 3 ，1 ) ( 3 , 3 ) 01 3 1 0 75 2 4 3 8 0 6 6 11 1 9 1 64 6 6 07 4 9 0 21 0 0 8 24 1 9 4 6 5 5 4 重庆邮电大学硕士论文第三章运动估计算法的研究与改进 3 9 3 6 2 3 6 4 7 5 8 2 5 48 1 9 23 3 5 55 2 4 3 57 2 8 22 8 9 34 5 5 9 在h 2 6 4 视频压缩编码标准中，如果量化系数的绝对值小于1 ，那么对应变换系数e ( u ，v ) 被量化为零，即： , q b i t s， e ，) f ，1 ，驴) ，f ，1 ，鲈) = m 二f ( u , v , l q p ) 式( 3 1 1 ) 由式( 3 1 1 ) 可以得到式( 3 1 2 ) ： e ( u ，v ) l e ( x ，y ) l l a i x ，u ) l l a ( y ，v ) i w ( u ，d式( 3 1 2 ) x = o y = o 其中s ( u ，1 ，) 可以写成式( 3 1 3 ) - b ( “，d = 乞o4 ( “，v ) 式( 3 1 3 ) 其中，以( 甜，v ) = 1 a ( x ，u ) l a i y ，v ) 口叙。，o 表示矩阵的对应项相乘。那么量化系数e ( u ，功被量化为零必须满足的充分条件是： b ( u ，d f ( u ，，q 尸)式( 3 1 4 ) 然后对b ( “，1 ，) 进行分析，以“= 1 ，= 1 为例，此时4 ( 1 ，1 ) 的值为：域：以( 1 ，1 ) = 4 2 2l 2l 4 2 2 4 12 12 2 4 式( 3 1 5 ) 为了对全零点集的阀值进行确定，可以将4 x 4 预测残差块分为如下四个子区 4 = ( x ，y ) j x = 0 ，3 ，y = 0 ，3 4 = ( x ，y ) l x = 0 ，3 ，y = o ，3 ) 鸣= ( x ，y ) l x = l ，2 ，y = l ，2 4 = ( x ，y ) l x = l ，2 ，y = o ，3 对每个区域预测误差绝对值求和可以得到其相应的( s a d ) s , ：式( 3 1 6 ) 式( 3 1 7 ) 式( 3 1 8 ) 式( 3 1 9 ) 重庆邮电大学硕士论文第三章运动估计算法的研究与改进 s = ，y ) l ，v ( x ，y ) 4 ，1 i 4 式( 3 2 0 ) jy 将各个墨求和可以得到4 4 块的s a d 值： 4 s a d = 墨式( 3 2 1 ) 1 = 1 综合式( 3 1 3 ) ，式( 3 1 5 ) 一式( 3 2 1 ) 可以得n - s ( x ，1 ) = 2 s a d + 2 s t 一墨式( 3 2 2 ) 联合式( 3 1 1 ) 和式( 3 1 2 ) ，变换系数e 0 ，1 ) 被量化为零的充分条件为： s a d ( f ( 1 ，1 ，q p ) + 岛一2 s 0 2式( 3 2 3 ) 同理，可以得到4 4 块内所有点的变换系数被量化为零的充分条件，如表3 2 所示。表3 24 x4 块内点变换系数被量化为零的充分条件充分条件其他位置 s a d ( f ( 1 ，1 ，q p ) + 墨一2 s t ) 2 ( 1 ，1 ) s a d ( f ( 1 ，1 ，q p ) + s 4 2 s 2 ) 2( 1 ，3 ) s a d ( f 0 ，1 ，q p ) + s 2 2 s , ) 2( 3 ，1 ) s a d ( f 0 ，1 ，q p ) + s t 一2 s 3 ) 2( 3 ，3 ) s a d ( f ( 1 ，1 ，q p ) + s 2 + 墨) 2 ( 0 ，1 ) ( 2 ，1 ) s a d ( f ( 1 ，1 ，q p 卜墨+ 墨) 2( 0 ，3 ) ( 2 ，3 ) s a d ( f ( 1 ，1 ，q p ) + s 3 + 瓯) 2( 1 ，o ) ( 1 ，2 ) s a d ( f ( 1 ，1 ，q p 汁墨+ 是) 2( 3 ，o ) ( 3 ，2 ) s a d f ( 0 ，0 ，q p ) ( 0 ，0 ) ( 0 ，2 ) ( 2 ，o ) ( 2 ，2 ) 现设定三个独立的预判阀值五，五，互来表征表3 2 中三种坐标对应的系数：互= ( f ( 1 ，1 ，q e ) + m i n s , 一2 s ，墨一2 s 2 ，岛一2 墨，墨一2 s 3 ) 2 式( 3 2 4 ) 石= ( f ( 1 ，1 ，q e ) + m i n s , 一2 s , ，墨一2 岛，岛一2 蜀，s l - 2 岛 ) 2 式( 3 2 5 ) 互= ( ，( o ，0 ，q p )式( 3 2 6 ) 假设4 4 块的s a d 五，就可以认为五对应点集中的所有点的量化系数全部为零。假设4 x 4 块的s a d 值小于式( 3 2 4 ) 式( 3 2 6 ) 中任何一个，即若满足式( 3 2 7 ) 时，就可以认为这个4 4 块内的所有点的变换系数将全部被量化为零。重庆邮电大学硕士论文第三章运动估计算法的研究与改进 s a d t ，t = m i n ( 五，互，互) 式( 3 2 7 ) 所以在运动估计搜索过程中，若某个搜索点处满足式( 3 2 7 ) ，那么可以立即停止对搜索窗口内剩余其他搜索点的搜索估计，该块完全可以用上一帧中对应块的重构图像来替换，若某个搜索点处满足式( 3 2 4 ) 式( 3 2 6 ) 中任何一个，即可停止对相应点集的搜索估计，那么该点集所在位置处的像素就可以用上一帧中对应点集的像素来代替，减轻了数据传输的压力。 3 3 3 改进算法的具体步骤实验统计数据表明，5 0 - 9 0 的运动向量集中在以2 为搜索半径的圆内【1 9 】。所以在改进的运动估计搜索算法中，本文依然采用经典的六边形作为大精度搜索模板，其半径为2 。然后在其基础上再采用十字形作为小精度搜索模板，其半径为 1 。中间过程每一步都用阀值进行控制以看其是否满足停止搜索的条件。其具体实现步骤如下。第一步，用空间域的上层块模式运动矢量预测法求出当前块运动矢量的预测值作为当前块运动矢量的搜索起始点，以搜索起始点作为原点建立搜索区域，搜索半径为2 。第二步，以初始搜索点对应六边形搜索模板的中心，在搜索半径为2 的搜索区域内分别进行匹配计算，寻找使得搜索模板内s a d 值最小的点，同时依据式 ( 3 2 4 ) 式( 3 2 6 ) 计算正，互，正的值。第三步，如果满足式( 3 2 7 ) ，则直接停止该块其他点的运动估计搜索，然后在解码端该块就可以直接用上一帧中重构的对应块来表示。如果不满足式( 3 2 7 ) ，但是满足式( 3 2 4 ) 式( 3 2 6 ) 中的一个或者两者，则可以立即停止对相应点集其他点的运动估计搜索。第四步，如果s a d 值最小的点不在六边形搜索模板的中心，则继续移动搜索模板窗口，在这个过程中，每一步的得到的结果都要转入第三步，看是否满足式 ( 3 2 4 ) 式( 3 2 7 ) 的条件。一直到使得s a d 值最小的点在六边形搜索模板的中心为止，其中如果遇到第三步排除掉的点对其不做任何计算。第五步，将上一步得到的目前最佳点为中心构造十字形，计算使得s a d 值最小的点，若其中遇到第三步排除掉的点对其不做任何计算。所得最佳匹配点即为最佳匹配点，然后求出运动矢量。重庆邮电大学硕士论文第三章运动估计算法的研究与改进 3 4 基于t m s 3 2 0 d m 6 4 2 的系统级优化 3 4 1 编译选项优化本文采用的开发工具是c c s 3 1 ( c o d ec o m p o s e rs t u d i o ) ，c c s 3 1 提供了配置、建立、调试、跟踪和分析程序的工具，它便于实时、嵌入式信号处理程序的编制和测试。 c c s 3 1 的编译器提供了强大的编译，编译选项优化时主要采用的编译选项如表3 3 所示。联合使用0 3 和- p m 编译选项，可使编译器从程序级对整个程序进行最全面、最高级的优化。表3 3 主要编译选项选项功能描述 - 0 3 表示得到最高程度的优化，编译器将执行各种优化循环的方法，如软件流水、循环展开和s i m d ( 单指令多数据流) 等。 - p m 联合所有源文件进行程序级优化，在编译时可以从整个程序的角度出发进行优化，使代码尺寸也得到优化。 - m t 向编译器说明代码中没有使用混迭技术，允许编译器在无存储器相关性假设下进行优化。实际测试表明，- 0 3 选项的打开对程序的优化相当显著。如果程序满足无存储器相关性的假设，打开p m 和m t 选项可以缩短编码一帧的时间3 4 m s 【2 们。 3 4 2c a c h e 优化本文在4 2 2 章节中详细分析了r i m s 3 2 0 d m 6 4 2 的两级缓存结构l 1 l 2 。对于硬件资源受限的d s p 来说，合理使用非常有限的c a c h e 对程序的运行速度有着非常重要的意义。因为c p u 只能对l l 中的l i d 和l i p 进行直接的访问，而大部分程序和数据是存放在外部存储器里的。此时，c p u 想要访问外部存储器的程序和数据，必须先把即将访问的外部存储器的程序和数据搬移到l 2 缓存区域，然后由l 2 搬移到 l 1 缓冲区等待c p u 访问。这个逐级搬移的过程是和c p u 处理前一批次l 1 中的数据并行进行的，提高了工作效率。而且每次需要访问的数据都和下一次需要访问的数据不管是在时间上还是空间上都存在一定的关联性，所以在从片外外设取访问重庆邮电大学硕士论文第三章运动估计算法的研究与改进数据至l j c a c h e 中去时，也会把其相邻的数据一并取至u c a c h e 中，这样在下次访问数据时，就可以直接去c a c h e 中找，提高了c a c h e 的命中率。有实验表明，合理地利用l 1 和l 2 两级缓存配合低工作频率的外部存储设备，系统的效率能够达到全部使用高工作频率的内部存储器的8 0 到9 0 。这使得在内部存储空间不够用的情况下可以使用外部低速存储设备，但不会对系统效率造成很大的影响。本文从以下四个方面来进行c a c h e 的优化工作。 1 ) 合理配置二级c a c h el 2 ，把l 2 配置用于c a c h e 或者s r a m 的大小需要根据具体应用进行灵活配置。通常情况下c a c h e 容量越大越好。对本文中的视频应用，应把一些频繁访问的数据存放到s 洲中。因此应该把l 2 的一部分作为 s r a m 来用l z 。 l 2 设置的方法有两种：一是使用d s p b i o s 静态的配置，即在前面b i o s 配置中的m e m 模块中进行设置；二是通过c s l ( c h i ps u p p o r tl i b r a r y ) 中的c a c h e 模块动态的配置。动态配置c a c h e 的方法如下： c a c h e c l e a n ( c a c h e _ l 2 a l l ，0 ，o ) ； c a c h ee n a b l e c a c h i n g ( c a c h e e m i f a c e 0 0 ) ； c a c h e _ e n a b l e c a c h i n g ( c a c h e e m i f a c e 0 1 ) ； c a c h e s e

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（通信与信息系统专业论文）h264算法优化及dsp实现.pdf

文档简介

温馨提示

最新文档

评论

（通信与信息系统专业论文）h264算法优化及dsp实现.pdf

文档简介

温馨提示

最新文档

评论

相关文档