（计算机应用技术专业论文）mpeg4形状编码的研究.pdf

上传人：灰*** IP属地：宁夏上传时间：2020-01-10 格式：PDF 页数：63 大小：1.94MB 积分：0 举报 版权申诉

已阅读5页，还剩58页未读，继续免费阅读

（计算机应用技术专业论文）mpeg4形状编码的研究.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

摘要摘要 m p e g 一4 是运动图像专家组织制定的新一代多媒体压缩国际标准它提供了一系列自然和合成的音视频编码工具标准采用基于对象的编码技术可扩展编码技术和容错机制等实现了基于内容的交互性和更高的压缩效率它将多媒体的音视频应用扩展到了前所未有的领域本文首先对m p e g 4 标准和其校验模型 v m 的关键技术进行了阐述然后对v m 中的形状编码过程进行了深入分析利用宏块之间的相关性和形状信息的特点提出了一种形状编码的快速运动估计算法针对在不同误差阈值下尺寸转化的宏块数目和比率不同的特点对v m 中形状编码的尺寸转化算法进行了改进并且结合精细可扩展编码的思想利用形状信息和四叉树的特点提出了一种新的二值形状空域可扩展编码算法最后结合自己的研究对视频编码的进一步发展和形状编码进一步研究提出了自己的一些看法关键词 m p e g 4 形状编码运动估计尺寸转化可扩展编码 a b s t r a c t a b s t r a c t m p e g 4i san e wg e n e r a t i o ni s o i e cs t a n d a r df o rm u l t i m e d i ac o m m u n i c a t i o n d e v e l o p e db y t h em o v i n gp i c t u r e se x p e r tg r o u p m p e g a n dp r o v i d e sas e to ft o o l s f o rn a t u r a la n ds y n t h e t i cv i d e o a u d i oc o d i n g t h em p e g 4v i s u a ls t a n d a r ds u p p o r t s m a n yt e c h n i q u e si n c l u d e do b j e c t b a s e dc o d i n g s c a l a b l ec o d i n g a n de r r o rr e s i l i e n t c o d i n g t h em a i nf u n c t i o n sp r o v i d e db ym p e g 一4a r e c o n t e n t b a s e d i n t e r a c t i v i t y u n i v e r s a la c c e s s i b i l i t y a n di m p r o v e dc o m p r e s s i o n m p e g 一4s p r e a d st h ev i d e o a u d i o a p p l i c a t i o no f m u l t i m e d i at oe v e r y w h e r e t h ep i v o t a lt e c h n o l o g yo fm p e g 4a n di t sv e r i f i c a t i o nm o d e v m a r ed e s c r i b e d f i r s ti nt h i sp a p e r t h e nad e e pa n a l y s i so f s h a p ec o d i n gi nv m i sp e r f o r m e d af a s t a n de f f i c i e n tm o t i o ne s t i m a t i o na l g o r i t h mb a s e do nt h ef e a t u r e so fv i d e om o t i o nv e c t o r a n ds h a p ei n f o r m a t i o ni sp r o p o s e dt oi m p r o v es e a r c hs p e e di nm o t i o ne s t i m a t i o nf o r m p e g 一4s h a p ec o d i n g am o d i f ys i z e c o n v e r s i o na l g o r i t h mi s p r o p o s e dt o r e d u c e c o m p u t a t i o n a lc o m p l e x i t y f o rs h a p ec o d i n g an e ws h a p es p a t i a ls c a l a b l e c o d i n g a l g o r i t h mf o rm p e g 4 i sp r o p o s e db a s e do nt h ef e a t u r e so fv i d e o ss h a p ei n f o r m a t i o n a n d q u a d t r e e s o m ei d e a sf o rt h en e w d e v e l o p m e n to fv i d e oc o d i n ga n dr e s e a r c ho fs h a p e c o d i n ga r ep r o p o s e d b a s e do nt h er e s e a r c h e so f t h i s p a p e r a tl a s t k e yw o r d m p e g 4s h a p ec o d i n g m o t i o ne s t i m a t i o ns i z ec o n v e r s i o n s c a l a b l ee n c o d i n g 创新性声明 v 5 8 3 4 4 4 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果尽我所知除了文中特别加以标注和致谢中所罗列的内容以外论文中不包含其他人已经发表或撰写过的研究成果也不包含为获得西安电子科技大学或其他教育机构的学位或证书而使用过的材料与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意申请学位论文与资料若有不实之处本人承担一切相关责任摊名关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定即研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学本人保证毕业离校后发表论文或使用论文成果时署名单位仍然为西安电子科技大学学校有权保留送交论文的复印件允许查阅和借阅论文学校可以公布论文的全部或部分内容可以允许采用影印缩印或其他复制手段保存论文保密的论文在解密后遵守此规定抛名导师签名奎塾拯日期丝丝f 耋耋j 丝日期抄斗 i 第一章绪论第一章绪论 1 1多媒体编码技术的发展和概况 2 1 世纪的人类社会将是信息化和网络化的社会网络信息具有数字化和海量性的特点网络应用的最重要目标之一就是进行多媒体通信多媒体信息主要包括图像声音和文本三大类其中视频音频等信号的信息量非常大它们的存储和传输给网络带来很大的困难成为阻碍网络多媒体发展的瓶颈之一同时各种视频音频信息的表达方式不同在不同的应用环境下对内容的侧重点要求不同不同的来源还可能有不同的输入输出要求因此研究和开发新型有效的多媒体数据压缩编码方法并建立国际标准是最好的选择传统的压缩编码是建立在香农 s h a n n o n 信息论的基础上它以经典的集合论为基础用统计概率模型来描述信源但是它未考虑信息接受者的主观特性及信息本身的具体含义重要程度和引起的后果压缩编码的发展历程实际是以香农信息论为出发点不断完善和改进的过程编码方法可以分成下述三类考虑信源的统计特性预测编码方法变换编码方法矢量编码方法矢量量化编码方法子带 4 波编码方法神经网络编码方法等考虑人眼的视觉特性基于方向滤波的图像编码方法基于图像轮廓一纹理的编码方法考虑图像传递的景物特性分形编码基于内容的编码方法也有人将图像编码方法分为两代第一代是基于数据统计去掉的是数据冗余称为低层压缩编码方法第二代是基于内容去掉的是内容冗余其中基于对象 o b j e c t b a s e d 方法称为中层压缩编码方法其中基于语义 s y n t a x b a s e d 方法称为高层压缩编码方法基于内容压缩编码方法代表新一代的压缩方法也是目前最活跃的领域最早是由瑞典的f o r c h h e i m e r 1 9 8 3 年提出的随后日本的h a m s h i m a 等人也展示了不少研究成果 l 为了实现多媒体传输的国际标准化国际标准化组织i s o i n t e r n a t i o n a l s t a n d a r do r g n i z a t i o n 与i e c i n t e r n a t i o n a le l e c t r o n i cc o m m i t t e e 于1 9 8 8 年联合成立了m p e g m o v i n g p i c t u r ee x p e r tg r o u p 组织 m p e g 的任务是致力于运动图像及其伴音编码标准化工作 m p e g 先后推出和正在建立的标准有m p e g 1 i m p e g 2 2 m p e g 4 7 m p e g 7 3 1 m p e g 2 1 e 4 等不同标准具有不同的用途和解码质量 m p e g 标准的出现和发展对多媒体通信的发展起到了革命性的推动作用 m p e g 标准一直是许多科研机构和大学的科研热点也是工业界产品丌发的热点 m p e g 标准阐明了声音和电视图像的编码和解码过程严格定义了声音和图像数据编码后组成位数据流的句法提供了编解码的测试方法等但没有对所有内容都作严格规定尤其是对压缩和解压缩的算法这样既保证了解码器能对符合m p e g 标准的声音数据和电视图像数据进行正确解码又给m p e g 标准的具体实现留有很大余地人们可以不断改进编码和解码算法提高声音和电视图像的质量以及编码效率 m p e g 一1 于1 9 9 3 年成为国际标准它是对1 5 m b i t s 以下数据传输率的数字存储媒体运动图像及其伴音的压缩编码标准适用于c d r o m v c d c d i 交互式c d 等它可对s i f 标准交换格式分辨率 n t s c 制式为3 5 2 x 2 4 0 p a l 制式为3 5 2 2 8 8 的图像进行压缩传输速率为1 5 m b i t s 每秒播放3 0 帧具有c d 音质图像质量基本与v h s 家用录像机相当 m p e g 1 也被用于数字通信网络上的视频传输如基于a d s l 非对称数字用户线路的视频点播 v o d 远程教育等 m p e g 2 于1 9 9 5 年成为国际标准其目标是达到高级工业标准的图像质量以及更高的传输率 m p e g 2 所能提供的传输率在3 1 0 m b i 讹之间在n t s c 制式下的分辨率可达7 2 0 x 4 8 6 可提供广播级的图像质量和c d 级的音质适用于数字电视广播 d v b h d t v 和d v d 的运动图像及其伴音的压缩编码目前 m p e g 2 己得到广泛应用如美国欧洲日本在d v d 和数字电视广播方面都采用m p e g 2 压缩技术 m p e g 4 从1 9 9 4 年开始工作于1 9 9 9 年初正式成为国际标准 m p e g 4 是一个适用于低传输速率应用的方案与m p e g 1 和m p e g 2 相比 m p e g 一4 的目标是要在异构网络环境下能够高度可靠地工作并且更加注重多媒体系统的交互性和灵活性继m p e g 4 之后要解决的矛盾就是对日渐庞大的图像声音信息的管理和迅速搜索针对这一矛盾 1 9 9 8 年l o 月 m p e g 启动了一个新的工作项目即多媒体内容描述接1 3 m u l t i m e d i ac o n t e n t d e s c r i p t i o n i n t e r f a c e 一m p e g 7 它的目标是扩展现有系统有限的查询能力使其包括更多的信息形式 m p e g 7 将确立各种类型的多媒体信息标准的描述方法 m p e g 在1 9 9 9 年1 0 月的墨尔本会议上又提出了多媒体框架 m u l t i m e d i af r a m e w o r k m p e g 2 1 的概念并于 2 0 0 0 年7 月开始工作 m p e g 2 1 总体上来讲是一个支持通过异构网络和设备使用户透明而广泛地使用多媒体资源的标准其目标是建立一个交互的多媒体框架在推出m p e g 1 和m p e g 2 的同时另一个国际组织c c i t t i n t e r n a t i o n a l t e l e g r a p ha n dt e l e p h o n ec o u n s u l a t i v ec o m m i t t e e 一国际电话电报咨询委员会后改名口qi t u t i n t e m a t i o n a lt e l e c o m m u n i c a t i o n su n i o n t e l e c o m m u n i e a t i o ns e c t o r 第一章绪论也先后推出了h 2 6 1 和h 2 6 3 5 l 两个用于传输数字视频信号的压缩标准在h 2 6 3 之后 i t u t 视频编码专家组 v i d e oc o d i n ge x p e r t sg r o u p v c e g 的短期任务是对h 2 6 3 标准的扩充制定h 2 6 4 1 3 标准长期目标是低速率视频传输标准 h 2 6 l 在2 0 0 1 年 m p e g 组织成立视频联合组 j o i n tv i d e ot e a m t j v t 由m p e g 和v c e g 的一部分专家组成负责将原来的m p e g 一4 的第1 0 部分和 h 2 6 4 合并为m p e g 一4 的第1 0 部分这个标准又称为先进的视频编码 j 刮 a d v a n c e d v i d e oc o d i n g a v c 我国在视音频编码的标准制定方面发展也很迅速我国制定数字视音频编解码标准目的不仅仅是为了把专利许可费控制在合理水平上更重要的意义是开发出技术更先进的标准从源头上提高我国数字音视频产业的核心竞争力为我国数字电视音视频产业和相关芯片产业提供跨越发展的技术源头为国际数字音视频市场提供更好的选择国家信息产业部科学技术司于2 0 0 2 年6 月批准成立数字音视频编解码技术标准化工作组 6 a u d i ov i d e oc o d i n gs t a n d a r dw o r k g r o u po f c h i n a 简称a v s 工作组工作组的任务是面向我国的信息产业需求联合国内企业和科研机构制修订数字音视频的压缩解压缩处理和表示等共性技术标准为数字音视频设备与系统提供高效经济的编解码技术服务于高分辨率数字广播高密度激光数字存储媒体无线宽带多媒体通讯互联网宽带流媒体等重大信息产业应用 a v s 工作组制定的a v s 信息技术先进音视频编码标准与国际标准m p e g 2 兼容并针对数字电视光盘播放机网络流媒体多媒体通信等应用进行了具体的规定和定义从框架上提供了对国内外各种主流视频音频编码标准的支持按照编码方法发展的两代论目前已经制定成熟的视频压缩编码标准 m p e g 1 m p e g 2 h 2 6 1 h 2 6 3 都属于第一代压缩编码方法一一基于数据统计的压缩编码方法而正在制定的m p e g 4 和m p e g 7 属于第二代压缩编码方法中的基于对象的压缩编码方法 1 2 本文的研究内容我国多媒体编解码标准 a v s 的制定和发展在很多内容上是借鉴和吸收国际上已经成功的标准的结果所以研究国际先进标准对国内标准的发展非常重要尽管m p e g 4 标准版本已经制定出来但是标准中所包括的编解码算法和技术要应用于实际还有许多问题需要解决同时m p e g 4 是一个开放的标准它的具体各部分的算法实现是一个逐步改进和完善的过程编码速度图像质量和压缩效率等是在标准实用化阶段需要考虑的问题本文的研究基础是目前新制订的m p e g 4 标准研究内容是视频编码中的形状编码 m p e g 4 彤状编码的研究编解码算法和可扩展编解码算法在深入研究的基础上本文对m p e g 一4 标准提供的校验模型中的形状编码的某些部分提出了改进算法并用m p e g 一4 标准建议的测试序列进行了测试取得了满意的效果主要研究内容如下 1 对m p e g 4 标准和其校验模型 v m 的关键技术进行了介绍对v m 中的形状编码算法进行了详细分析 2 提出了种快速的形状编码运动估计算法此算法利用相邻块的相关性确定搜索的初始点根据初始预测块和当前块的绝对误差和 s u mo fa b s o l u t e d i f f e r e n c e s a d 选择要采用的搜索算法实验表明此算法计算复杂度低搜索范围大预测精度高 3 针对在不同误差闽值下尺寸转化的宏块数目和比率不同的特点对 m p e g 一4 v m 中形状编码的尺寸转化确定分辨率算法进行了改进采用改进算法可以提高编码速度减少运算复杂度改善编码质量 4 提出了一种新的空域可扩展形状编码算法利用形状信息的特点和四叉树的原理来实现形状信息编码的渐进的可扩展分层编码这种算法实现简单可以很好的实现可扩展的编码思想 1 3 章节的安排本文的章节安排如下第章对多媒体编码的发展作简单介绍并介绍了作者的主要工作第二章对m p e g 4 标准和其校验模型 v m 内容作简要介绍第三章对m p e o 4 形状编码做详细分析论述并对本文提出的运动估计改进算法和尺寸转化改进算法作了详细的阐述第四章对可扩展编码作简要介绍对提出的一种新的空域形状可扩展编码算法做详细的阐述第五章结束语对m p e g 标准的发展进行了展望对本文的研究工作进行了总结附录和参考文献第二章m p e g 4 视频编码第二章m p e g 4 视频编码 2 1 m p e g 4 技术及应用综述 2 1 1 m p e g 4 标准概要 m p e g 4 标准不仅针对一定比特率下的视频音频编码并且更加注重多媒体系统的交互性和灵活性 1 i 一孽函掣 k 宴慰 h 一心二渊 1 c o m p o s i f i o n a n dr c n d e r n g 什俞秆 6 毒柏硷嘲峥6 譬团1 u w h a 呻dc q t l d m 垡b n 0 h 口d i n r 埘m a 栅 l a y e r i k 篙n p k w d c m n p t k n i l r i a l i t i v e h 6 j m i m l l a v 0 b 媾b a ii iii 晶 ie 口日曲瞳j 压 p 甲占瑟 m h 口0 m m u l a d c xh b 七 i il 怒州 fk 删u 甲r 1 f r lj p f s j r t p i l u 0 l u d l a y e r m p e 矗 u d p t gl t m髂t h l l m 3 z 一一 n m i 5 函柏m 口m e d i u m 图2 1 一个m p e g 4 视听终端的处理过程 m p e g 一4 标准不像以前的多媒体标准一样是基于帧的编码而是基于对象的编码对于观察者而言一幅场景总可以划分成一些不同的内容及背景每一部 m p e g 一4 形状编码的研究分的内容对应一个独立的音频视频 a u d i o v i d e o 对象这些a v 对象都拥有自己单独的编解码器用户可以对场景中的内容进行交互操作因此 m p e g 一4 标准的基本内容就是高效率地编码组织存储传输a v 对象图2 1 显示了一个m p e g 4 视听终端的处理过程一个场景包括一个站着的女士一个桌子一个地球仪个在其上有多媒体演示的电子白板等等通过对象分割编码压缩增加同步信息然后传输到用户端用户端接收到这些信息后根据同步信息解压缩然后既可以根据传送过来的组合信息恢复原始场景也可以根掘自己的需要选择要恢复的a v 对象生成新的场景 m p e o 4 提供了对音频对象视频对象情景描述以及与发送系统的接口进行编码的标准方法由于在解码端要对a v 对象进行重新组合所以m p e g 4 既支持自然的a v 对象编解码也支持合成的a v 对象编解码 2 1 2 m p e g 4 标准的主要特点和功能 m e p o 4 视频编码标准支持m p e g 1 m p e c 一2 中的大多数功能提供不同的视频标准源格式码率帧频下矩形图像的有效编码同时也支持基于内容的图像编码如图2 2 在m p e g 4 功能集的底层是v l b v v e r yl o wb i tr a t ev i d e o 核心它为码率在5 6 4 k b p s 范围内的视频操作与应用提供算法与工具支持较低的空间分辨率低于3 5 2x 2 8 8 像素和较低的帧频低于1 5 h z v l b v 核心支持的专用功能包括矩形图像序列的有效编码多媒体数据库的搜索和随机存取图2 2m p e g 4 视频编码工具结构 m p e g 4 的h b v h i g hb i tr a t ev i d e o 同样支持上述功能其码率范围在 6 4 k b p s 1 0 m b b p s 之间它与v l b l 核心采用相同或相似的算法但它支持更高第二章m p e g 4 视频编码的空间与时间分辨率允许传输和存储适用于演播室的高质量视频信号典型应用为数字电视广播与交互式检索 m p e g 一4 最终支持的码率将高于m p e g 2 m p e g 一4 包括如下几部分主要功能 1 基于内容的编码基于内容的交互性基于内容的多媒体数据存取工具基于内容的码流操纵和编辑自然与合成数掘的混合编码增强的时间域随机存取 2 编码效率的改进和并发数据流的编码提高编码效率对多个并发数据流的编码支持对同一场景多视点的有效编码对于立体视频应用要求具有利用信息冗余的能力并支持有无与正常视频兼容性要求条件下的联合编码方案 3 容错机制错误易发环境中的错误鲁棒性 r o b u s t n e s s 和错误修复 r e s i l i e n c e 技术 4 基于内容的可伸缩性 s c a l a b l e 包括基于内容的空域可扩展编码和时域可扩展编码 2 1 3m p e g 4 的体系结构 m p e g 一4 标准主要有6 个部分系统标准视频标准声音标准一致性测试参考软件和多媒体集成框架其核心部分有四个模块系统层视频音频和d m i f 1 d e l i v e r ym u l t i m e d i ai n t e g r a t i o nf r a m e w o r k 其中前三部分是独立于传输的而d m i f 则定义了面向传输的特性另外还有两个支持模块一致性测试 c o n f o r m a n c et e s t i n g 和参考软件 r e f e r e n c es o f t w a r e m e d i aa w a r e d e i i v e r yu n a w a r e i s o i e c1 4 4 9 6 2v i s u a l s 川e c1 4 4 0 6 3a u d i o m e d i au n a w a r e d e l i v e l yt l l l a w a r e s a l p h at h 那么a c q 0 否贝 l j a c q 1 如果所有p b 块误差都小于预定误差阈值 a l p h a t h 就认为可以使用该近似形状块代替原始形状块反之则不能编码模式的确定分两步进行这是第一步的算法 i f a l l o b a b s h a p e m o d e a l l 0 e l s ei f a l l 2 5 5 b a b s h a p e m o d e a l l 2 5 5 e l s ei f a c q b a b 2 5 5 a c q b a b 0 第三章形状编码的研究平改进 i f o p a q u e p i x e l s 2 1 2 8 s h a p e m o d e a l l 2 5 5 e l s es h a p e m o d e 2 a l l o e l s ei f a c q b a b 2 5 5 s h a p e m o d e a l l 一2 5 5 e l s ei f v o p t y p e 2 i v o p s h a p e m o d e i n t r a c a e h 如果是b p v o p s h a p e m o d e i n t r ac a e d e c i d e c r 0 n 确定分辨率如果是b p v o p 这一步在后面进行注意上面程序中a l l o b a b 干i ia l l 2 5 5 b a b 是指这个b a b 块内象素全为 0 或者全为2 5 5 a c q b a b 0 n ia c q b a b 2 5 5 是指这个b a b 块如果被编码为全 0 或者全2 5 5 解码质量可以接受在这一步先大概确定该b a b 块用a u0 a l l2 5 5 和还是i n t r ac a e i n t e r c a e 模式后面再根据运动向量进行进一步的确定 3 运动估计和补偿确定b a b 块后如果该v o p 是b v o p 或p v o p 那么就对待编码的b a b 进行运动估计得到运动矢量m v s m vf o rs h a p e 如果该v o p 是i v o p 则该步可以省去在论文3 3 部分将对运动估计进行详细研究 4 确定编码模式二进行运动估计后如果该v o p 是b v o p 或p v o p 那么就对待编码的b a b 进行进一步的编码模式确定如果是i v o p 则不需要进行这一步 i f s h a p e m o d e a l l o m o t i o n e s f i m a t i o n 0 运动估计 i f a l l 0 b a b 11 a c q m c b a b 判断1 6 个子块的s a d 是否全小于误差阀值 m cb a b 指运动补偿块 n 如果全透明或不接受帧间c a e d e c i d e c r 0 i f 靖定分辨率 i f m v s i s z e r 0 0 n 动向量为零 s h a p e m o d e r n t e rc a em v z e l s e s h a p e m o d e i n t e r c a e m v n z e l s ei f s h a p e m o d e a l l 2 s s e m v s i s z e r o o m p e g 4 彤状编码的研究如果全不透明且运动向量不为零全不透明编码 s h a p e m o d e 2 2 a l l2 5 5 e l s ei f a l l 2 5 5 b a b a l l 2 5 5 i v l c b a b s h a p e m o d e2 a l l 2 5 5 e l s ei f m v s i s z e r o o 运动向量为0 s h a p e m o d e m v z n o u p d t e l s e s h a p e m o d e m v n z n o u p d t 5 尺寸转化确定待编码b a b 块的分辨率由于有码率控制和空域可扩展性所以有时分辨率的改变是必需的尺寸转化由两步组成转化的比例由v o pc r 确定 v o pc r 可以取1 2 或者1 4 当 v o pc r 为1 2 时整个v o p 就通过下采样得到原来l 4 大小的形状图下采样可以通过平均值来代替多个采样点上采样通过插值得到 v o p 的形状编码是基于b a b 块而b a b 块的分辨率可根据不同块特点而改变 v m 中确定b a b 块的分辨率c r 的算法如下 c r 1 4 d o w n s a m p l e s h a p e 0 u p s a m p l e s h a p e 0 i f a c q b a b r e t u r n c r 1 2 d o w n s a m p l e s h a p e 0 u p s a m p l e s h a p e 0 i f a c q b a b r e t u r n c r l 先将当前b a b 块按c r 所代表比例值进行下采样再进行相应上采样得到与原来同样尺寸的重构b a b 块再对这两个b a b 块相应p b 4 4 块计算s a d 绝对误差和值如果s a d p b i a l p h a t h 那么a c q b a b 返n y bf a l s e 若所有1 6 个p b 4 x 4 块s a dp b i a l p h a t h 则a c q b a b 返回为t r u e 6 基于上下文的算术编码除过a l l o 和a l l 一2 5 5 两种编码模式其余编码模式的b a b 块都要进行基于上下文的算术编6 q c a e 分帧内和帧间两种模式对帧内编码模式分别尝试水平扫描和垂直扫描两种方式进行编码最终采用编码字节少的一种并输出到输出码流中对帧间编码模式先尝试帧内模式下的水平和垂直扫描方式再尝第三章形状编码的研究和改进试帧间模式下的水平和垂直扫描方式编码最终采用其中编码字节最少的种并输出到输出码流中 c a e 编码过程将在下节详细论述 3 1 2 狄度形状编码 1 轮廓编码和灰度a l p h a 值编码狄度的a l p h a 平面编码由两部分组成一个是它的形状轮廓编码另一个是在轮廓中的a l p h a 值的编码轮廓编码采用二值形状编码 a l p h a 值编码采用任意形状的纹理编码见图3 1 b 轮廓是通过在灰度级的a l p h a 平面上通过设定阈值0 得到的除了d c t 变换是基于帧的像亮度值一样灰度a l p h a 值被分割为1 6 1 6 块进行编码在码流中一个a l p h a 宏块的编码将附加到它对应纹理宏块编码的后面 2 羽化许多视频序列使用灰度a l p h a 掩码它们的纹理相对简单一些例如有些是由固定灰度值构成的灰度a l p h a 掩码还有些灰度a l p h a 掩码由一个在轮廓边缘处从2 5 5 递减到0 的二值a l p h a 掩码构成这样可以和背景形成光滑过渡后面这种类型的掩码可以用一个二值的掩码和羽化描述一个简单的改进的二进制 a l p h a 掩码组成羽化就是轮廓边缘光滑过渡到背景这部分的详细内容见 m p e g 4 校验模型i 3 2 基于上下文的算术编解码本节将详细讨论基于上下文的算术编码 c a e 和解码 c a d 过程 c a e 编码属于一种改进的更高效的算术编码 3 2 1 算术编码简介算术编码 3 0 在图像数据压缩标准中扮演了重要的角色在算术编码中信息用0 到1 之间的实数进行编码算术编码用到两个基本的参数符号的概率和它的编码间隔信源符号的概率决定压缩编码的效率也决定编码过程中信源符号的间隔而这些间隔包含在0 到1 之间编码过程中的间隔决定了符号压缩后的输出算术编码对整条信息无论信息有多么长其输出仅仅是一个数而且是一个介于0 和l 之间的二进制小数因此译码器在接受到表示这个小数的所有位之前不能进行译码算术编码和哈夫曼编码一样也是对在信息中出现较多概率大的符号采用较少的编码位数对在信息中出现较少概率小的符号采用相对较多的编码位数从而达到压缩的目的但由于算术压缩可以将一个符号出现的概率表示为小数个二进制位而哈夫曼编码的符号编码位数都为整数所以算术编码可以接近无损压缩的熵极限比哈夫曼编码效率更高对于较长的信息所有符号在大量信息中的概率差别很小如果直接应用这些概率编码压缩率不大如果采用在一定限制条件上下文环境下的概率即基于上下文的算术编码其信息的熵建立在更高的概率层次上这样得到的信息总熵值更小压缩率更高 3 2 2c a e 编码 c a e 编码主要分为计算上下文值查概率表和算术编码三部分 1 计算上下文值环境数基于上下文的算术编码中符号的概率并不是该符号在整个信息中出现的概率而是该符号在一定上下文环境下的概率这时信息的总熵值更小这里存在一个上下文模板的大小的问题模板越大信息的总熵值越小但需要存储模板的概率表也越大 c a e 算法在两者均衡之下选择帧内模板大小为1 0 帧问模板为 9 a l i 目 m 玑t p 1 x 1 to t t b o r d m cb a 工n t r a c e 时的相关点 b i n t e r c a e 时的相关点水平扫描方式时 c 6c l c g c s c o c e c e 7 c s c 2 阳讳 t h e f c u i x r e r l e s n t o f 日纽 t h eb p r d e i x r e e l d s 韪b a b a i n t r a c a e 时的相关点 b i n t e r c a e 时的相关点垂直扫描方式时图3 3 计算上下文时的相关点第二章形状编码的研究平改进上下文值就是根据当 j i 的待编码点附近的多个点的象素值生成的一个数字帧内与帧问形状块的取点位置如图3 3 从图中可见帧内块在当前点附近取1 0 个点帧间块在当前点附近取4 个点并在运动补偿块中的对应点周围取5 个点注意当扫描方向为垂直时形状有所不同帧内块与帧间块生成上下文值的公式都是 c 印2 k 其中c k 取值为0 或1 表示对应环境点是否透明 k 0 1 2 9 如果第k 点为2 5 5 则c k 为1 否则c k 为0 2 查概率表形状块中每个点生成上下文值后将以该上下文值为索引从概率表中取得一个概率值其中帧内和帧间形状块对应不同的概率表帧内概率表的大小为2 1 0 2 4 帧间概率表的大小为2 9 5 1 2 v m 中c a e 编码概率表只存储了模板中所有排列的上下文情况下输入符号为 0 的概率概率为一个放大2 的整数输入符号为l 的概率就是用2 减去输入符号为0 的概率的差概率表见参考文献 1 5 之附录f 3 算术编码算术编码主要涉及5 个过程初始化符号编码规格化比特填充终止处理初始化算术编码在实际应用中并不是直接对小数进行变换它将符号范围和符号概率都放大到一个很大的二进制整数这样便子编解码操作在开始编码前要初始化下次输入符号的编码输出范围输出范围即编码输出的高低 h 和l 边界实际由两个参数确定低边界l 和范围r 因为h l r v m 中算术编码的初始化编码输出范围为0 2 即l 0 r 2 符号编码每次算术编码根据输入符号为高概率符号还是低概率符号和该符号的概率确定新的编码结果输出范围 c a e 编码的低概率符号 l p s 和高概率符号 m p s 并不是固定的1 或者0 在当前上下文下如果输入符号1 的概率大于符号0 的概率则l 为高概率符号 0 为低概率符号如果输入符号0 的概率大于符号1 的概率则0 为高概率符号 1 为低概率符号如果输入为l p s 将新的l 变为上次编码的高边界h 如果输入为m p s l 不变新的r 值由上次 r 值乘以符号概率得到规格化每编码一个输入符号后编码范围都会减小为了防止溢出要对输出范围进行判断如果太小则进行一定的放大同时移位输出一些已经确定的输出位在v m 中如果编码范围小于2 则进行放大直到大于2 如果等待全部算术编码结束再输出编码结果这个二进制串将非常长计算机的内存有限这翌竺里丝些塑些塑婴样做显然不合理当编码范围缩小时编码的l 和h 将会非常接近如 k 0 6 2 5 7 h 0 6 2 5 9 这时不管后而编码范围如何缩小编码的最终输出结果前面的几位 o 6 2 5 都不会改变所以在每进行一次符号编码后要判断l 和h 的最高有效位左边编码位如果相同就输出这些位比特填充在编码过程可能出现一些和系统控制符相同的二进制串必须在这些串中加入一些填充位以防系统判断错误终止处理编码结束时必须判断输出一个在编码输出范围内码长最短的二进制串同时添加编码结束符号 3 2 3c a d 解码 c a d 解码也分为计算上下文值查概率表和算术解码三部分算术解码过程和编码过程相似处理正好相反过程为初始化符号解码规格化终止处理符号解码每次根据概率表判断输入编码结果落在高概率符号范围内还是低概率符号范围内如果落在该概率符号范围内则输出高概率符号反之输出低概率符号并更新符号范围规格化和编码类似对符号输入范围进行必要的放大同时根据需要读入新的比特位在读入比特时要判断去除填充比特 3 3 一种改进的m p e g 4 形状编码的快速运动估计算法在m p e g 编码中一般采用三种手段进行图像压缩一是利用d c t 变换来消除图像帧内冗余二是利用熵编码来消除符号编码冗余三是利用运动估计来消除图像的帧间冗余对于运动图像而言帧间冗余远大于帧内冗余和符号冗余因此运动估计显得特别重要然而同时运动估计算法的运算量也是非常大的其被认为是 m p e g 发展的障碍之一一直以来多数研究学者都将注意力集中在纹理编码的快速运动估计算法上了虽然形状编码的运动估计和纹理编码的运动估计相似但也存在不同的地方利用视频序列的相关属性和形状信息的边界特点本文提出了一种关于 m p e g 一4 形状编码的快速运动估计 m e 算法同时针对b a b 块的不同运动量对b a b 块进行分类不同类采用不同的搜索范围和搜索方法这些大大的提高了运动估计的处理速度降低了搜索算法的搜索点数获得了比较满意的结果第三章形状编码的研究和改进 3 3 1 运动估计算法概述运动估计是序列图像编码提高压缩比的一项关键技术研究的重点多数是由物体的二维运动来估计其三维运动运动目标在帧问有平移旋转及其它变化而背景的变化要小一些或者是静止的如果要全面地估计运动物体的各种运动变化需要含有许多参数的估计由于实际编码和压缩效率的要求目前视频国际标准大多仅考虑物体的平移运动运动模型为高麓其中 x y 为运动物体的初始位置 h v 为运动物体的终止位置 v v 为运动矢量运动估计的方法有块匹配法和象素递归法块匹配法是将当前图像帧分成大小相等的矩形子块假定这些块只做平移运动对于每一个子块通过搜索窗在前一帧的图像块中搜索具有最大相关性的匹配子块从而确定其运动矢量象素递归法是对每个象素的位移进行估计块匹配法的精度较低但它的位移跟踪能力强易实现得到广泛的应用 m p e g 标准亦推荐块匹配法当酋子块搜索匹配区 c 区为最佳匹配区 y 为运动矢量图3 4 块匹配算法不意图将当前帧第k 帧均匀地划分为m n 图像宏块并在上一帧参考帧内开辟大小为 m 2 h n 2 v 的一块区域用本帧宏块在参考帧的搜索区内寻找最优匹配误差最小的匹配块求得运动矢量见图3 4 衡量匹配好坏的准则有最小均方误差 m s e 和最小绝对值误差 m a d m a d 准则由于计算量小硬件实现简单而得到广泛使用 m a d 准则定义为 n m a d i i l i 五 m 胆一五一 m f 九 l 2 其中 i j 分别为水平与垂直方向的偏移量工为第k 帧当前块灰度值五一为在参考帧第k 1 帧搜索窗1 2 1 内相对于当前块偏移为 i j 的块在m p e g 4 v m 中竺型堂鉴塑些塑婴一不是直接用m a d 柬作为误差准则而是取其和一绝对误差和s a d s u mo f a b s o i u t ed i f f e r e n c e 柬作为误差计算和判断的如式 3 其中的和一分别为当前块与参考块的形状a l p h a 掩码 n s a d i l m 六一沏十f n j l 3 5 在已知匹配准则的情况下如何搜索匹配误差最小的子块就是搜索算法所要解决的问题由于实际上一个块的运动分布一般集中在该块位置附近因此块匹配的搜索只需在一定的范围内进行假设块的运动分布在水平和垂直方向上是各向均匀的即不在其中某个方向上占优那么搜索范围应该是以当前块所在位置为中心的正方形显然最佳的块匹配搜索算法是全搜索 f u l ls e a r c h f s 即在搜索范围内逐个像素位置作块匹配运算但此算法计算量很大设搜索目的块的最大可能的位移为w 则f s 的搜索次数为l 2 w l j 在实际的应用中f s 由于巨大的计算量严重的影响了视频编码算法的整体效率因而提出了很多改

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（计算机应用技术专业论文）mpeg4形状编码的研究.pdf

文档简介

温馨提示

最新文档

评论

（计算机应用技术专业论文）mpeg4形状编码的研究.pdf

文档简介

温馨提示

最新文档

评论

相关文档