（电路与系统专业论文）基于ARM9的AVSM软件解码器优化研究[电路与系统专业优秀论文].pdf

上传人：活*** IP属地：宁夏上传时间：2020-01-09 格式：PDF 页数：71 大小：1.74MB 积分：0 举报 版权申诉

（电路与系统专业论文）基于ARM9的AVSM软件解码器优化研究[电路与系统专业优秀论文].pdf_第2页

（电路与系统专业论文）基于ARM9的AVSM软件解码器优化研究[电路与系统专业优秀论文].pdf_第3页

（电路与系统专业论文）基于ARM9的AVSM软件解码器优化研究[电路与系统专业优秀论文].pdf_第4页

（电路与系统专业论文）基于ARM9的AVSM软件解码器优化研究[电路与系统专业优秀论文].pdf_第5页

已阅读5页，还剩66页未读，继续免费阅读

（电路与系统专业论文）基于ARM9的AVSM软件解码器优化研究[电路与系统专业优秀论文].pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

摘要摘要多媒体技术和数字通信技术的迅速发展使视频编码和压缩技术成为研究的热点通信信道带宽以及终端处理器处理能力的限制对视频编码标准提出了更高的要求 a v s a u d i o v i d e o c o d i n g s t a n d a r d 是为了改变我国音视频压缩领域缺乏自主产权的局面由国家信息产业部的音视频编解码技术标准工作组制定的第二代信源编码标准 a v s m 作为a v s 的第七部分足专门针对无线网络的特点提出的移动视频编码标准通过对a v s m 编解码原理深入的学习本文首先将a v s m 参考代码w i n 2 5 a 移植到a r m 体系上接着对w m 2 5 a 进行了c 代码的无失真优化从两个优化指标程序代码数据存储空间和解码速度分别阐述和研究了各种优化的方法消除冗余减少内存搬运结构调整算法优化等各种优化方法融合应用于不同的模块对同一个问题的不同优化途径将根据实际的优化结果进行比较分析采用较合理的方法文章最后对优化之后的解码器进行一致性测试和l c d 输出程序的设计完善了解码器本文给出的最终解码器优化结果与参考代码相比较在程序的代码存储空间和数据存储空间上分别有4 0 7 0 和7 9 2 5 的减少在解码速度上有5 8 倍的提高解码器在主频为3 8 4 m h z 的h h a r m 2 4 4 0 平台上对图像尺寸为q v g a 码率在3 8 4 k b p s 以上的视频测试序列解码时速度在1 8 一2 6f p s 之间基本符合了嵌入式系统的实际应用需要关键字 a v s m a r m 9 优化摘要 a b s t r a c t v i d e oc o m p r e s s i o n t h o u g har e s e a r c hf o c u sb r o u g h tf o r n lb yt h ef a s t d e v e l o p m e n to fm u l t i m e d i at e c h n o l o g ya n dd i g i t a lc o m m u n i c a t i o nt e c h n o l o g y h a s p o s e dah i g h e rd e m a n do nv i d e oc o d i n gd u et ot h el i m i t a t i o no ft h eb a n d w i d t ho f c o m m u n i c a t i o na n dt e r m i n a lp r o c e s s o r a v s a u d i ov i d e oc o d i n gs t a n d a r d t h es e c o n dg e n e r a t i o ns i g n a l o u r c 圮c o d i n g s t a n d a r de s t a b l i s h e db ya u d i oa n dv i d e oc o d i n gs t a n d a r dw o r k g r o u p w i l lb et h e s o l u t i o nt ot h el a c ko fi n d c p e i l d e n tp r o p e r t yr i g h ti na u d i oa n dv i d e oc o m p r e s s i o n d o m a i ni nc h i n a a st h es e v e n t hp a r to f a v s a v s mi st h ev e r ym o b i l ev i d e oc o d i n g s t a n d a r da c c o r d i n gu n i q u e l yw i t l lt h ec h a r a c t e r i s t i c so f w i r e l e s sn e t o nt h ep r i n c i p l e so f a v e m r e f e r e n c ec o d ew i n 2 5 ai sf i r s tt r a n s p l a n t e dt oa r m a r c h i t e c t u r e t h e ncc o d en o n d i s t o r t e do p t i m i z a t i o no nw i n 2 5 ap r o c e e d e dw h i c h e x p l o r e s i nt w oa s p e c t so fc o d e d a t as i z ea n dd e c o d i n gs p e e d t h ef o l l o w i n gk i n d s o fm e t h o d sa s r e d u n d a n c ye l i m i n a t i o n m e m o r ym o v e m e n tr e d u c t i o n s t r u c t u r e a d j u s t m e n t a r i t h m e t i co p t i m i z a t i o ne t c w h e nd i f f e r e n to p t i m i z a t i o nm e t h o d sw e r e o p t i o n a lo n o n ep r o b l e m t h ea p p r o p r i a t eo u ew a sa d o p t e da c c o r d i n gt o t h e o p t i m i z a t i o nr e s u l t f u r t h e r m o r e t h ec o n f o r m a n c e t e s to nt h eo p t i m i z e dd e c o d e ra n d t h ed e s i g no nl c d o u t p u tp r o g r a m m i n gh a v eu l t i m a t e l yp 础e c t e dt h ed e c o d e r c o m p a r e dw i t hr e f e r e n c ec o d e t h eo p t i m i z a t i o nr e s u l tr e d u c e dc o d es i z ea n dd a t a s i z eb y4 0 7 0 a n d7 9 2 5 a n di m p r o v e dd e c o d i n gs p e e db y5 8t i m e s w h e nv i d e o t e s ts e q u e n c e s q v g a a b o v e3 8 4 k b p s w e l ed e c o d e d t h es p e e dw a s1 8 2 6 f v so n h h a r m 2 4 4 0 3 8 4 m h z p l a t f o r m w h i c hb a s i c a l l ya n s w e r e dt h ee m b e d d e ds y s t e m a p p l i c a t i o nr e q u i r e m e n t k e yw o r d s a v s m a r m 9 o p t i m i z a t i o n u 第一章绪论第一章绪论多媒体技术是将文本图形图像动画视频和声音等形式的信息结合在一起并通过计算机进行综合处理和控制能支持完成一系列交互式操作的信息技术随着计算机技术集成电路技术和网络通信技术的发展多媒体有着广泛的应用前景视频图像作为重要的多媒体信息近年来发展迅猛诸如数码摄影视频会议高清晰电视h d t v v c d d v d 以及交互式视频游戏等等视频图像通信已经成为人类最重要的通信手段之一视频的数据量很大例如帧率为3 0 f p s 的c i f 3 5 2 x 2 8 8 的视频采样4 2 0 数据流量将达到3 6 5 m b i t s 如果是h d t v 数据量将会更加巨大显然这样未经压缩的数据不仅在i n t e r a c t 有限带宽的网络上无法传输而且也大大超出了计算机的存储和处理能力数字信号也失去了实用价值因此为了存储处理传输这些数据必须进行压缩尽管原始视频的数据量非常惊人但是视频数据具有高度相关性一帧图像或者图像序列之间有大量的冗余信息包括时间冗余空间冗余统计冗余等形式这些冗余的存在给视频压缩带来了可行性视频压缩的目的就是在保证一定图像质量的前提下尽可能消除冗余来减少数据量 1 1 视频压缩标准的发展视频压缩的标准化是在视频压缩技术大力发展的基础上产生的是进行产业化的前提国际电信联盟 i t l 矗和国际标准化组织电工委员会 i s o f l e c 从2 0 世纪8 0 年代开始一直致力于视频压缩标准的研究与制定如图1 1 m 1 的标准包括有h 2 6 1 h 2 6 2 h 2 6 3 h 2 6 4 等的h 2 6 x 系列主要应用于实时视频通信方面如视频会议等等 i s o i e c 的标准包括m p e g 1 m p e g 2 m p e g 4 的m p e g x 系列主要应用于视频存储广播电视等 l t u t 和i s o i e c 也共同制定一些标准 m p e g 2 标准等同于h 2 6 2 h 2 6 4 则是i t u t 与i s o i e c 共同组成的联合视频组 j v t 制定的被纳入了m p e g 4 的第l o 部分 1 1 第一章绪论 n u th 西ih 2 6 3 i l 2 6 3 2 6 3 i s o l e c劓阱lm 唧刚曰国圉 1 9 8 4 1 9 8 6 1 9 8 81 9 9 01 9 9 21 9 9 4 1 9 9 61 9 9 82 0 0 0 图1 1 国际视频压缩标准发展历程下面简单地对这些视频标准进行介绍 1 1 1m p e g x 系列标准 2 l m p e g l m p e g 1 的传输速率是1 s m b p s 应用于数字存储媒体运动图像及伴音的编码适用于不同带宽的设备如c d r o m v i d e o c d m p e g l 标准的制定极大地促进了v c d 产业的发展 m p e g 2 h 2 6 2 m p e g 2 的传输速率为1 0 m b p s 针对高清晰电视 h d t v 数字视频广播 d v b 以及数字d v d 等制定的 m p e g 2 支持隔行扫描 m p e g 1 则不行另外 m p e g 2 开始具有类和等级的概念并且开始支持h d t v 尺寸的视频图像 m p e g 2 的产生使高品质和音质的d v d 逐渐取代了v c d 口e g 4 m p e g 4 的初始目标是面向低码率的第二代编码标准传输码率为4 8 6 4 k b i t s 主要应用于视频电话 v i d e op h o n e 视频邮件 v i d e oe m a i l 等 m p e g 4 引入了一个a v 对象视频音频对象的概念是m p e g 4 为支持基于内容编码而提出的 a v 对象是听觉视觉或者视听内容的表示单元另外 m p e g 4 提供了基于视频对象的时域和空域可分级性称为视频对象平面 v i d e oo b j e c tp l a n e 代表了视频对象平面的基本层或者增强层 2 第一章绪论 1 1 2h 2 6 x 系列标准嘲 h 2 6 1 这是最早的视频压缩标准在码率为p x 6 4 k b p s p l 3 0 的i s d n 综合业务数字网上传输可视电话和会议电视只针对c i f 和q c i f 两种图像格式每帧图像分成图像层宏块组层宏块层块层来处理为以后的标准发展奠定了基础 h 2 6 3 i t u t 推出的最早用于低码率视频编码的标准之后的改进版本 h 2 6 3 h 2 6 3 增加了许多选项使之具有更广泛的适用性 h 2 6 3 的传输速率低于6 4 k b p s 图像格式可以是s q c i f q c i f c i f 4 c i f 1 6 c i f 运动补偿使用半象素精度 h 2 6 3 和h 2 6 3 则在压缩效率和抗误码性能方面进行了改善 h 2 6 4 m p e g a v c h 2 6 4 是由r r u t 的v c e g 和i s o i e c 的m p e g 共同组成的联合视频组 j v t 颁布的在i s o i e c 中被命名为a v c a d v a n c e d v i d e oc o d i n g 列入m p e g 4 的第l o 部分在i t u t 中命名为h 2 h 2 6 4 是目前为止最先迸的视频压缩标准具有以下优点 1 码率低在相同的图像质量下 h 2 6 4 的码率比h 2 6 3 和m p e g 4 减少5 0 大大减少了数据流量增加了编码效率 2 图像质量高由于算法的成熟与先进可以提供高清晰和高质量的图像质量以适应未来视频市场的需求 3 网络适用性强网络友好的结构和语法增强了对误码和丢包的处理提高了解码器的纠锘能力 4 工作模式多既可以工作于低时延模式来实现实时要求如视频会议又可以用于无时延限制的场合例如视频存储等 5 技术先进包括使用4 x 4 块变换帧内预测 1 4 象素精度的运动估计多参考帧与多种大小块的帧间预测技术以及采用两种可选的熵编码基于内容的自适应变长编码 c a v l c 和基于内容的自适应二进制算术编码 c a b a c 第一章绪论 1 2a v s 视频标准的发展卅为了改变我国在音视频压缩标准中缺乏自主产权的局面由国家信息产业部科学技术司成立的数字音视频编解码技术标准工作组提出了我国自主的信源编码标准 a s a u d i ov i d e oc o d i n gs t a n d a r d i 刀 a v s 标准是信息技术先进音视频编码系列标准的简称 a v s 标准包括系统视频音频数字版权管理等四个主要技术标准和一致性测试等支撑标准如表1 1 所示视频标准由两个部分组成针对高清晰度和高质量的广播电视数字存储媒体的a v s i 0 第二部分和面向移动视频低码率的a v s m 第七部分其中a v s l 0 已经成为国家标准 a v s m 则正在审批中表1 1a v s 标准包含的部分编号名称编号名称 1 系统 6 数字媒体版权管理 2 视频 7 移动视频 3 音频 8 在i p 网络上传输a v s 4 一致性测试 9 a v s 文件格式 5 参考软件 a v s 标准的制定为我国数字音视频产业化的发展提供了基础性标准为我国构建技术一专利一标准一芯片与软件一整机与系统制造一数字媒体运营与文化产业的产业链条提供了难得机遇产品链如图1 2 其产业化的主要产品包括 1 芯片 a v s 的编解码芯片包括高清晰度和标准清晰度预计国内的需求量在未来的十多年时间内每年将达到4 0 0 0 多万片 2 软件 a v s 基于l i n u x 和w i n d o w s 系统的流媒体播放点播等 3 整机包括a v s 机顶盒硬件播出服务器 a v s 手机 a v s 便携式数码产品等 4 第一章绪论信源编码理论 l 技术专利算法 i 标准i 编解码芯片与软件广电电信设备系统家电 p c 消费电子媒体运营商用户一电视台高清晰数字电视一电视机广播电视直播卫星一音像发行 o卜移动视频通信卜一机顶盒 n ny 宽带网络流媒体一电信运营视频会议与视频监控一计算机激光视频播放机一内容提供商一手机图1 2a v s 应用产品与领域 a v s m 作为a v s 的第七部分其目的是为迅速发展的无线网络与手机等移动设备提供视频编解码系统版权保护和文件格式等方面的规范和标准应用范围包括交互存储媒体宽带视频业务多媒体邮件分组网络的多媒体业务实时通信远程视频监控等r 玎 a v s m 的特点 s 9 l a v s m 具有良好的兼容性可以兼容h 2 基本层有利于芯片支持国内和国际两种标准同时也有利于a v s m 标准国际化 2 a v s m 的编码效率是m p e g 2 的两倍与m p e g 4 相当但是由于在算法上进行了简化复杂度比m p e g 4 低另外 a v s m 的专利授权模式简单费用低廉硬件实现成本比h 2 6 4 低 3 a v s m 采用了国际上普遍流行的混合编码模式具体包括帧内预测帧间预测变换和熵编码等一系列技术 a v s m 与h 2 6 4 一样采用图像宏块划分技术将视频分为序列帧条带宏块子宏块象素 a v s m 采用两层编码模式视频编码层 v c l d e oc o d i n gl a y s 和网络抽象层 n a l n e t o r k a b s 似i o nl a y e r 分别负责视频数据的压缩和网络输出码流的封装在低码率的情况下变换的块单位越小编码性能越好因此 a v s m 选择4 x 4 为最小块单位第一章绪论 1 3a v s m 在嵌入式系统中优化的意义 a s m 是针对无线网络与移动设备的应用而制定的所以其应用的硬件平台以嵌入式系统为主在未来带宽大大增加的3 g 网络中多媒体等娱乐信息的广泛应用是关键亮点尤其是手机电视被认为是移动和媒体两大产业联姻的一个产物被誉为继电影电视电脑之后的笫四屏幕州批1 2 1 嵌入式硬件平台相对通用计算机而言其处理器的能力较弱存储空间资源有限因而对功耗程序的代码存储空间等提出了新的要求而a v s m 标准的参考代码首先考虑其功能的正确性代码比较冗长通常不能直接在工程中应用因此研究a v s m 在嵌入式系统中的优化不但可以研究视频压缩标准的原理而且在工程中也有很大的实际意义由于终端设备主要负责解码端本论文只针对a v s m 的解码部分进行优化研究 a r m 处理器因为其体积小功耗低价格便宜性能高控制性强等特点成为嵌入式系统的主选处理器之一本文针对a r m 9 平台进行a v s m 解码器的优化研究 1 4 国内研究的现状视频解码的优化研究一般有以下三个方面 1 针对通用计算机 p c 的优化这个主要是用作研究实际用途不大 2 针对嵌入式系统例如d s p a r m 等处理器平台这个主要是软件优化本文就是在a r m 9 平台上的软件优化研究 3 a s i c 设计即将解码器做成专用解码芯片大大加快解码的速度这个主要是应用于大规模的生产目前关于a v s m 在这方面的资料未曾找到由于a v s m 标准正在审批研究主要停留在国内现状如下 1 文献 1 3 1 a v s m 视频解码器的设计与实现一文中提到的研究方法是基于通用计算机的其计算机的性能是奔腾4 代c p u3 0 g h z 内存5 1 2 m b 测试序列q p 值为3 2 i 帧间隔5 帧解码1 0 0 帧图像其结果如表1 2 6 第一章绪论表1 2 文献 1 3 优化结果测试序列图像格式比特率解码时间解码速度 k b p s s f p s b u s q c i f 6 40 6 21 6 1 3 f o r e n l a nq c i f6 4 1 0 39 7 1 b r i d g e c i f6 43 2 83 0 5 m o b i l ec i f 8 04 o l2 4 9 在码率小于1 0 0 k b p s 的情况下 q c l f 1 7 6 x 1 4 4 视频序列可以达到9 0 f p s 到1 6 0 f p s 以上 c i f 3 5 2 x 2 8 8 序列可以基本达到实时 2 5 f p s 以上 2 文献 1 4 1 a v s m 解码在b r e w 平台上的实现一义中的方法是针对嵌入式平台的其硬件为三星b r e w 平台手机w 1 0 9 a r m 9 2 6 e j s 中央处理器主频1 5 0 m h z 序列的q p 均为3 6 结果如表1 3 表1 3 文献 1 町优化结果测试序列图像格式总帧数解码时间解码速度 s f p s s i l e n tq c i f 3 0 01 5 51 9 4 f o r e m a n q c i f 3 0 0 1 7 51 7 1 b u sq c i f 1 5 01 0 51 4 3 f o o t b a l l q c i f 2 5 0 1 7 51 4 3 可见针对q o f 的图像解码速度可以达到1 4 l l 玲到2 0 脑之间 1 5 论文研究内容与章节安排 1 5 1 本论文的研究工作和目标 1 对a v s m 的编解码器结构的各个模块做原理分析了解掌握a v s m 的具体编解码原理 2 针对a r m 体系进行a v s m 软件移植研究 3 具体研究解码器中的各个模块分析优化方法拟取得的优化结果在 h h a r m 2 4 4 0 开发板主频为3 8 4 m h z 的调试平台上针对q v g a 3 2 0 x 2 4 0 码率3 8 4 k b p s 以上0 5 f p s 编码帧率的视频序列解码速度达到1 5 f p s 以上程序存储空间小于6 9 k 数据存储空间小于1 0 k 4 解码器一致性测试分析和l c d 输出程序设计 7 第一章绪论 1 5 2 论文章节安排第一章绪论主要介绍了国际上各个视频标准的发展然后重点介绍我国自主制定的a v s m 标准技术特点最后针对优化研究的现状提出了本论文的研究内容和优化目标第二章首先介绍了视频编码的一些基本概念和一般视频编码的结构然后详细介绍a v s m 编解码原理对主要的模块进行算法分析第三章首先简单介绍了a r m 体系的特点和h h a r m 2 4 4 0 开发平台的搭建方法然后对参考代码w m 2 5 a 在a r m 上进行移植工作最后设计了a v s m 的 a p i 接口第四章是本文的重点在对代码仔细阅读和进行复杂度分析的前提下对各个模块进行优化研究各种优化方法的分析和比较最后从程序代码数据存储空间和解码速度两个方面给出了优化结果性能超过了既定的优化目标第五章对最终解码器进行一致性测试和视频输出程序的设计完善解码器第六章给出了本文研究工作的总结同时为下一步研究内容和方向进行了展望 8 第二章a v s m 编解码器算法分析第二章a v s m 编解码器算法分析 2 1 视频编码简介视频由一系列图像组成与静止图像不同视频是活动的图像按照顺序以一定的速率投到屏幕上由于人的视觉暂留效应就会产生动态画面的感觉 2 1 1 时序采样人的视觉暂留效应指的是图像的更换频率更幅率大于2 0 h z 时在视觉上就会产生连续画面的感觉所以电影规定每秒2 4 帧 p a l 制电视为每秒 2 5 帧但是实际上如果仅仅是更幅率大于2 0 h z 人尽管能够有连续的感觉但还是会产生闪烁的感觉这就是因为闪烁感觉效应的存在当重复的光源投到人服的视网膜上时如果出现频率不够高人就会有忽暗忽明的感觉而当重复的频率大于一个值的时候人眼就不会有闪烁的感觉这个就是临界闪烁频率这个频率为4 5 h z p a l 制电视播放为每秒2 5 帧通过隔行扫描使闪烁的频率为5 0 h z 大于临界闪烁频率电影为每秒2 4 帧在放映的时候遮光器是双并口结构这样在画面停留的时候曝光两次于是闪烁频率为4 8 h z 了 2 1 2 色彩空间自然界有无数种色彩通过三基色原理由红绿蓝三种单色光信号利用不同的比例相加混色组成各种色彩这样只要用三个信息红绿蓝 r g b 存储传输就可以了根据对人类视觉系统 h v s 的研究人眼对亮度的敏感度大于色度但是在r g b 系统中三种基本色彩的重要性是一样的所以我们需要通过转化色彩空间降低色度的比例从而来减少数据量 y u v 色彩空间就能很好的解决这个问题 y 是亮度分量 u 和v 分别是r g b 的色差分量他们的转化公式如下 i t g b 到y u v y 0 3 0 r o 5 9 g o 1 1 b 9 第二章a v s m 编解码嚣算法分析 u 0 4 9 3 b y v 0 8 7 7 r y 1 y u v 到r g b r y 1 4 0 7 5 r 1 2 8 g y 0 3 4 5 5 c 0 1 2 8 一o 7 1 6 9 v 1 2 8 b y 1 7 7 9 u 一1 2 8 色彩空间r g b 转化为y u v 后可以通过采样来减少色度分量的数据量这个过程又称作子采样几个y 亮度值共用一个u 色度值和v 色度值来近似地还原象素既可以不降低图像的分辨率又可以减少数据量 1 4 4 4 格式无子采样这种格式中每一个象素的y u v 值都保留如图2 1 j 爷够孕孕啥啥i 啥q 够爷爷够国图2 1y u v 4 4 4 格式图 2 4 2 2 格式 4 个象素的y 亮度分量都保留而u v 分量各取2 个象素点色度数据量减少了一半如图2 2 啥o 啥 o 啥o 啥 o 岔 o q o 啥呛图2 2 y u v 4 2 2 格式图 3 4 2 0 格式 4 个象素的y 分量保留 u v 分量只取1 个象素点色度数据量减少了四分之三如图2 3 1 0 第二章a v s m 编解码器算法分析 oo oo oo oo oooo oo oo 图2 3 y u v 4 2 0 格式图 2 1 3 一般视频编码系统在第一章中已经提到数据压缩的基本原理就是消除冗余大多数视频压缩算法采用对时间域冗余和空间域冗余进行消除来达到压缩的目的在时间域上前后帧之间有很大的相关性特别是同一个场景中的帧而在空间域上彼此相邻的象素点相关性也很高图2 4 视频编码器框图一般的视频编码系统如图2 4 所示主要分为三个功能单元时域模型空域模型和熵编码器1 1 5 1 未压缩的视频数据从时域模型输入由于相邻帧之间存在较大的冗余可用预测的方法来达到消除所谓预测就是通过对之前或者之后的帧作为参考采用运动估计和运动补偿来预测出和当前帧更接近的预测帧减少预测帧和当前帧的差别时域模型输出的是残差图像预测帧与当前帧相减频域模型的输入是时域模型输出的残差图像利用同一帧中象素点之间的相关性消除其频域冗余在现在流行的视频编码标准中包括m p e g 4 h 2 6 4 和a v s 都是对残差图像进行频域变换量化得到相应的系数经过量化之后的变换系数保留了少量的残差系数达到了对残差图像的压缩第二章a v s m 编解码器算法分析效果熵编码是对变换系数和一些其他参数比如帧间帧内预测模式运动矢量等进行编码压缩消除统计冗余例如用较短的二进制码分配给出现频率较高的系数最后输出视频用于传输或存储解码器则是编码器的反处理首先通过熵解码器解出变换系数和运动矢量等其次通过反交换重建残差图像同时解码器根据参考帧和运动矢量产生预测帧最后预测帧与残差图像相加即得到了重建图像 2 2a v s m 编解码器原理分析图2 5a s m 编码框图 a v s m 标准采用基于块的混合编码 b l o c k e d b a s e dh y b r i dv i d e oc o d i n g f r a m e w o r k 编码框图如图2 5 所示 a v s m 标准的应用是面向低码率的移动设备上因此与h 2 6 4 和a v s l 0 等不同其在各个模块的实现上尽可能采取复杂度低的算法以适应低带宽的无线网络同时还采用了自主的拥有知识产权的编码技术输入视频信号为需要编码的当前帧与预测帧相减之后的残差图像经过变换量化的系数通过熵编码输出码流参考帧是之前编码过的帧经过反量化反变换环路滤波等重建出来的然后进行帧内或者帧间预测得到当前帧的预测帧虚线框图中显示的便是a v s m 解码器重建图像处输出为解码后的图像 a v s m 支持4 2 0 的y u v 图像格式只支持l p 帧标准中核心的模第二章a v s m 编解码器算法分析块有帧内预测帧问预测变换量化环路滤波熵编码等这些模块的实现算法决定着标准的编码效率与实现复杂度在接下去的几节中将重点对这些实现算法进行分析 2 2 1 帧内预测帧内预测应用在i 帧图像编码中依据周围已经编码和重建之后的块形成当前块的预测块 a v s m 的亮度帧内预测采用了两种方式基于4 x 4 块的预测 i n t r a4 x 4 和基于1 6 x 1 6 块的预测 i n t md i r e c t i n t r a4 x 4 用较小的块进行预测可以很好地反应出图像的细节适用于比较复杂的图像提高图像质量 i n t r ad i r e c t 采用了宏块单位进行预测适合于图像平坦区域维持图像质量的同时降低了编码的复杂度图2 6 亮度帧内预测模式当采用i n t m4 x 4 时每个4 x 4 块由上边左边以及左上角共9 个周围的象素值预测得到如图2 6 所示其中 d 与h 的象素值延伸4 个组成1 7 个象素点对当前块进行预测每个4 x 4 块共有9 种预测模式可以选择编码器使用最佳模式进行编码除去d c 模式利用上边和左边的8 个点取平均值其他8 种预测模式的方向矢量由图2 6 中0 到7 标志与最新的h 2 6 4 相比较 a v s m 用来帧内预测的象素点为9 个而h 2 6 4 为1 7 个另外 a v s m 改进了最可能模式的获取方式提高了最佳模式与最可能模式的匹配概率如图2 7 所示 a v s m 在进行了改进之后与h 2 6 4 的帧内预测性能比较唧 1 3 第二章a v s m 编解码器算法分析一严一科一也2 6 4 一t 8 0 0 1 2 0 01 6 0 02 0 0 0 2 4 0 0 b i t r a t e k b p s n e w s c i f 图像帧内预测图2 7 a v s 与h 2 6 4 帧内预测性能比较当采用i n t m d i r e c t 模式时编码就相应比较简单可以一次性对1 6 个4 x 4 块进行帧内预测编码这样对平坦的视频区域非常有效与h 2 6 4 的1 6 x 1 6 亮度模式预测相比无须做哈达码变换表2 1 给出了采用i n t r a d i r e c t 模式带来的 p s n r 提升 9 1 表2 1i n t r a d i r e c t 模式提升的p s n r 测试序列全i 帧i p p p 模式 a p s n r d b a p s n r d b b u so 1 2 7 5 6 20 0 0 8 5 0 2 f o o t b a l l0 5 2 4 2 0 5o 0 1 5 7 7 5 f o r e m a n0 0 3 1 6 3 9 0 0 0 3 8 4 0 m o b i l e o 0 0 9 4 0 0 o 0 0 1 9 1 0 n e w s0 0 9 2 9 4 6 o 0 0 4 1 l o p a r i s 0 0 3 2 5 7 00 0 0 8 8 8 1 t e m p e t e 0 0 4 8 3 9 10 0 1 2 5 9 6 平均提升 o 1 2 1 1 3 00 0 0 5 1 2 8 色度帧内预测基于4 x 4 块但是每个8 x 8 色度块中的所有4 x 4 块采用相同色度预测模式相对亮度帧内预测色度帧内预测比较简单预测模式只有三种 d c 预测水平预测和垂直预测其方向矢量如图2 8 与亮度i n t r a 4 x 4 类似色度帧内预测也采用了象素点延伸的方式减少为9 个象素点来预测降低了复杂度昌勰钉 5 踮雅站匏乱鲫约审芷z 厶第二章魁r s m 编解码器算法分析 2 2 2 帧间预测 x a b cddddd eb d f fgh g j kl hp r h h h h 2 图2 8 色度帧内预测模式帧问预测采用基于块的运动补偿从先前编码和重建的帧产生当前块的预测块 a v s m 的帧问预测只有p 帧没有b 帧编码器中的帧间预测包含运动估计和运动补偿运动估计就是在参考帧中搜索当前块的最佳匹配块运动补偿就是利用运动矢量插值等技术产生预测块在解码端帧间预测只包含运动补偿 a v s m 帧间预测基于块实现每个亮度宏块 1 6 x 1 6 划分成1 6 x 1 6 1 6 x 8 8 x 1 6 和8 x 8 如果采用8 x 8 划分方式时可以进一步划分成8 x 8 8 x 4 4 x 8 4 x 4 四种方式选择大的分块方式可以减少比特数但是小的分块方式可以保留图像丰富的细节编码器可以灵活地选择块的划分方式对图像进行编码运动矢量是当前块与最佳匹配块的位移 a v s m 的亮度运动矢量精度为1 4 象素色度运动矢量精度为1 8 象素而且运动矢量所指的参考象素可以超出参考图像的边界亮度不超过1 6 个象素色度不超过8 个象素点帧间预测中对参考块的插值是最重要的部分图2 1 0 中给出了参考块的整数象素点 1 2 象素点 1 4 象素点的位置其中 a 等大写字母是整数象素点小写字母是非整数象素点第二章a v s m 编解码器算法分析图2 9 帧间亮度插值示意图当运动矢量指向整数象素时不需要插值参考值即是得到的预测值当运动矢量指向i 2 象素点时预测值通过水平8 抽头滤波器 1 4 1 2 4 l 4 1 1 2 4 1 和垂直4 抽头滤波器 l 5 5 1 计算得到例如图中i 2 点b 首先对水平方向上最近的8 个象素点滤波得到中间值b c 4 d 1 2 e 4 l f 4 l g 一1 2 h 4 i 3 最后的预测值b b 3 2 6 图中的l 陀象素点j 则是由垂直方向上的4 个1 尼象素点滤波得到即j e a b t h h 最后的预测值j j 4 3 其中缸 t h h 和上面求b 的方式一样分别由水平滤波而得当运动矢量指向1 4 象素点时预测值通过最近的整数点或者1 2 象素点线性插值计算例如1 4 象素点a 有整数点f 和l 2 象素点b 而得 a 饵 h 1 l 对于色度分量的1 8 象素样本使用双向线性插值方法取得如图2 1 0 色度样本插值使用与对应亮度块的运动矢量m v e 预测样本矩阵的元素 p r e d m a t r i x x y 根据下式计算 p r e d m a t r i x x y c l i p l 州x 哪y x a d x 8 d y x b s 4 x x d y x c d x x d y x d4 3 2 6 图2 1 0 帧间色度插值示意图 1 6 第二章a v s m 编解码器算法分析与h 2 6 4 相比较 a v s m 采用了新的插值方法有效地避免了专利问题表 2 2 给出了a v s m 和h 2 6 4 在插值方法上的比较1 9 表2 2a v s m 和h 2 6 4 插值比较 h 2 6 4 a v s m 比较结果 a v s mv sh 2 6 4 门数 9 0 19 1 51 5 5 关键路径 i l s 3 5 93 7 75 0 1 功耗 m w 3 6 0 03 5 6 4 1 0 内存 1 2 9 61 2 3 2 4 9 4 为了减少运动矢量的数据量 a v s m 采用了对运动矢量进行预测之后传输运动矢量差值的方法图2 1 1 所示 e 为当前块 a b c d 分别是e 的周边块其中d 的右下角 b 的左下角和e 的左上角紧贴 c 的左下角紧邻e 的右上角 a 的右下角则与e 的左下角相连当c 块不存在时直接使用d 块的运动信息当a b c 三块中只有一块可以用时则e 的预测运动矢量直接为存在块的运动矢量当多块可用时如果e 是g x l 6 的左块 e 的预测运动矢量等于a 的运动矢量 e 是8 x 1 6 的右块 e 的预测运动矢量等于c 的运动矢量如果e 是1 6 x 8 的上块 e 的预测运动矢量等于b 的矢量如果e 是1 6 x 8 的下块 e 的预测运动矢量等于a 的矢量其他情况时根据最佳接近原则选取和其他两个运动矢量最近的运动矢量作为当前块e 的预测运动矢量根据以上方法得到的预测运动矢量和运动估计搜索得到的最佳匹配块运动矢量m v 相减得到差m v d 进行熵编码 i d bc i a 当前块e 图2 1 1 运动矢量预测示意图 1 7 第二章a v s m 编解码器算法分析 2 2 3 变换与量化变换过程是将残差图像转换到一个变换域上使数据相关性减少而且紧凑 a v s m 采用了基于4 x 4 块的可逆整数余弦交换 i c t 具有计算速度快实现简单等优点避免了浮点运算在嵌入式系统中尤其重要与h 2 6 4 不同 a v s m 的直流d c 系数不用进行哈达码二次变换减少了实现复杂度 a v s m 的交换系数矩阵如下 222 l l一3 2 22 33 1 由于采用了i c t 各个变换的模大小不一因此需要对变换系数进行缩放达到归一化另外为了减少乘法的次数 h 2 6 4 将正向缩放和量化结合在一起反向缩放和反量化结合在一起 a v s m 中采用了带频密封整数变换p i t 技术就是将正向缩放量化反向缩放结合在一起而解码器有反量化减少了解码端的存储与运算开销示意如图2 1 2 其中虚线框内为编码器部分 6 1 传统i c t 变换和量化 p i t 变换和量化图2 1 2 p i t 和传统i c t 的比较量化是为了将处于大范围的信号映射到一个较小范围中减少数据的比特数 a v s m 中采用标量量化避免了乘法和浮点运算量化的操作公式为孕r o 俐扫 2 1 其中是乙量化得到的系数 x 是变换系数 q 岬是量化步长用量化参数 q p 进行索引 a v s m 中量化参数范围为0 到6 3 而且每增加8 量化步长就第二章a v 譬m 编解码器算法分析增加一倍表2 3 给出了a v s m 采用的变换量化方法与h 2 6 4 性能的比较 9 1 表2 3a v s 与h 2 6 4 变换量化性能比较测试序列 p s n r d b q c i f 5 h zq c l f 1 5 h z c i f 15 h zc i f 3 0 i i z b u s o 0 1 9 8 3 1 o 0 2 6 9 9 7 0 1 1 7 9 1 5 o 1 2 0 4 1 1 f o r e m a n0 0 2 6 5 9 8 0 0 0 7 0 2 1 0 0 9 9 13 8 0 0 8 8 1 0 6 f o o t b a l l0 0 6 1 7 9 70 0 2 3 3 5 0 0 0 1 1 8 0 9 0 2 1 8 5 8 m o b i l e0 0 1 9 5 8 5 o 0 1 5 8 0 7 0 0 7 9 2 3 9 0 0 8 5 1 6 5 n e w 0 0 0 1 9 2 80 0 0 2 6 9 5 0 0 2 7 1 0 2 0 0 2 7 6 2 0 p a d s0 0 4 6 1 8 0o 0 1 9 0 5 5 o 0 3 4 4 8 10 0 3 2 4 9 8 t e m p e t e 0 0 8 4 2 8 7 o 0 1 4 4 7 2 0 0 0 3 9 7 0 0 0 3 7 1 6 9 平均提升o 0 0 6 8 7 3 0 0 0 0 7 3 6 0 0 5 3 3 8 0 0 0 4 9 6 9 0 变换量化之后非零的系数集中在4 x 4 块的左上角其中d c 0 o 系数是最重要的为了进行熵编码操作需要对量化系数进行z i g z a g 扫描如图2 1 3 2 2 4 熵编码 2 1 3z i g z a g 扫描示意图 a v s m 码流中的语法元素均采用定长码或指数哥伦布编码均匀分布的语法元素用定长码来编码可变概念分布的语法元素用指数哥伦布编码不定长的非变换系数运动矢量等直接用指数哥伦布编码输入码流变换系数先通过 2 dv l c 编码然后再指数哥伦布编码而在h 2 6 4 中指数哥伦布只编码变换系数以外的语法元素经过z i g z a g 扫描之后的量化系数存在着大量的连续零系数 a v s m 用二维数组 1 e v e l 和r u n 来表示一维系数 l e v e l 数组包含了非0 量化系数的幅值 r u n 数组代表非零系数前连续零的个数 a v s m 采用基于上下文根据已编码的系数来确定v l c 码表的切换的2 0 v l c 来编码4 x 4 块对于帧内帧间亮第二章a v s m 编解码器算法分析度色度的不同分别用不同的v l c 码表总共有1 8 张下面将对a v s m 大量采用的指数哥伦布编码进行阐述以0 阶指数哥伦布为例 o 阶指数哥伦布码子的构造方式 mz e r o l 1 u f o 其中 i n f o 是携带信息的域中间的1 是标志位前

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（电路与系统专业论文）基于ARM9的AVSM软件解码器优化研究[电路与系统专业优秀论文].pdf

文档简介

温馨提示

最新文档

评论

（电路与系统专业论文）基于ARM9的AVSM软件解码器优化研究[电路与系统专业优秀论文].pdf

文档简介

温馨提示

最新文档

评论

相关文档