（信号与信息处理专业论文）h264视频压缩编码标准研究与dsp实现.pdf

上传人：灰*** IP属地：宁夏上传时间：2020-01-09 格式：PDF 页数：52 大小：3.51MB 积分：0 举报 版权申诉

（信号与信息处理专业论文）h264视频压缩编码标准研究与dsp实现.pdf_第2页

（信号与信息处理专业论文）h264视频压缩编码标准研究与dsp实现.pdf_第3页

（信号与信息处理专业论文）h264视频压缩编码标准研究与dsp实现.pdf_第4页

（信号与信息处理专业论文）h264视频压缩编码标准研究与dsp实现.pdf_第5页

已阅读5页，还剩47页未读，继续免费阅读

（信号与信息处理专业论文）h264视频压缩编码标准研究与dsp实现.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

论文题目 h 2 6 4 视频压缩编码标准研究与d s p 实现专业信号与信息处理研究生王克钊签名尘立壶l 指导老师吴延海签名色缸摘要随着信息技术的发展网络传输速度的提高视频应用己经走进我们的生活在这样的背景下需要一个具有高压缩比网络亲和性好的视频压缩标准于是h 2 6 4 a v c 应运而生 h 2 6 4 a v c 是i t u tv c e g 和i s o i e cm p e g 联合制定的最新视频编码标准是目前图像通信研究领域的热点问题之一 h 2 6 4 采用了许多新技术使得编码性能大幅度提高但这是以复杂度的成倍增加为代价的这就使得h 2 6 4 在实时视频编码及传输应用中面临着巨大的挑战利用高性能数字信号处理器 d s p 来实现h 2 6 4 实时编码器是一种快速有效的方法所以研究h 2 6 4 编码器结构和在基于t i 高性能d s p 处理器t m s 3 2 0 d m 6 4 2 上的实现具有非常重要的意义论文从研究h 2 6 4 a v c 编码器的结构开始具体分析了h 2 6 4 a v c 编码器的各个模块以及相应模块所采取的一系列先进技术在对这些技术进行研究的基础上选择 h 2 6 4 的官方参考模型j m 8 6 作为研究对象对整个代码的帧片宏块的编码过程进行了系统的研究参考x 2 6 4 一些算法的实现方法对代码进行了裁剪和c 算法级优化在深入剖析算法的基础上对影响编码速度的瓶颈部分进行研究对u m h e x a g o n s 算法进行了改进在此基础上将在p c 机下优化过的代码进行d s p 的移植及优化工作结合所选用芯片的特点给出了移植过程中常见错误及其改正方法最终完成了h 2 6 4 编码器的d s p 移植关键词 h 2 6 4 a v c j m 8 6 d m 6 4 2 优化移植研究类型应用研究 s u b j e c t r e s e a r c ho nh 2 6 4v i d e oc o m p r e s s i o n c o d i n gs t a n d a r da n di t s d s p i m p l e m e n t a t i o n s p e c i a l t y s i g n a la n di n f o r m a t i o np r o c e s s i n g n a m e w a n gk e z h a o i n s t r u c t o r w uy a n h a i a b s t r a c t s i g n a t u r e 业尝垃一 s i g n a t ur e w i t ht h ed e v e l o p m e n to fi n f o r m a t i o n t e c h n o l o g ya n di m p r o v e m e n to fn e t w o r k s p e e d v i d e oa p p l i c a t i o n sh a sb e e ni n t oo u rl i v e s u n d e rt h i sb a c k g r o u n d w ea l s on e e da v i d e oc o d ew h i c hs h o u l dh a v eh i g he f f i c i e n c ya n dg o o da d a p ta b i l i t yo fv a r i o u sn e t w o r k s h 2 6 4 a v ci st h en e w e s tv i d e oi n t e r n a t i o n a ls t a n d a r dd e s i g n e db yb o t hi t u tv c e g a n di s o i e cm p e g t h en e wt e c h n o l o g yi m p r o v e dc o d i n ge f f i c i e n c yg r e a t l y h o w e v e rt h ei m p r o v e m e n t i sb a s e do nt h ec o s to fr a p i di n c r e a s e dc o m p l e x i t y w h i c hm a k e si td i f f i c u l t yo fr e a l t i m e c o d i n ga n dt r a n s m i s s i o no fh 2 6 4 b a s e do nh i g h p e r f o r m a n c ed i g i t a ls i g n a lp r o c e s s o rt o i m p l e m e n t h 2 6 4v i d e oe n c o d e ri so n eo fm o s te f f i c i e n tm e t h o d s i nt h i sp a p e r f i r s t l y i t a n a l y z e dt h es t r u c t u r eo fh 2 6 4 t h e n i ti n t o r d u c e dt h em a i nt e c h n o l o g i e so fe a c hm o d u l e o fh 2 6 4 b a s e do nt h er e s e a r c ho ft h e s em a i nt e c h n o l o g i e s i ts e l e c th 2 6 4o f f i c i a lj m 8 6 r e f e r e n c em o d e la sar e f e r e n c e i ta n a l y z e dt h ep r o c e s so f f r a m e e n c o d i n g s l i c e e n c o d i n g a n dm a c r o b l o c k e n c o d i n g i tr e f e r e n c e ds o m em o t h e d so fx 2 6 4 c u t t i n gt h ec o d ea n d o p t i m i z i n gp r o c e s so ft h eo r i g i n a lcc o d e t h r o u g hd e e p l ys t u d y i n gt h em a i nt e c h n i q u e s a n da l g o r i t h m s u m h e x a g o n sa l g o r i t h mt ob ei m p r o v e g i v e ns o m ec o m m o n e r r o r sa n dt h e i r c o r r e c t i o nm e t h o d si nt h ep r o c e s so ft r a n s p l a n t a t i o n f i n a l l yt h ei m p r o v e de n c o d i n g a l g o r i t h m sa r et r a n s p l a n t e dt ot h ed s pc h i p k e y w o r d s h 2 6 4 a v cj m 8 6d m 6 4 2 o p t i m i z a t i o nt r a n s p l a n t a t i o n t h e s i s a p p l i c a t i o nr e s e a r c h 姿料技七学学位论文独创性说明本人郑重声明所呈交的学位论文是我个人在导师指导下进行的研究工作及其取得研究成果尽我所知除了文中加以标注和致谢的地方外论文中不包含其他人或集体已经公开发表或撰写过的研究成果也不包含为获得西安科技大学或其他教育机构的学位或证书所使用过的材料与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意学位论文作者签名立炙勃1 日期学位论文知识产权声明书本人完全了解学校有关保护知识产权的规定即研究生在校攻读学位期间论文工作的知识产权单位属于西安科技大学学校有权保留并向国家有关部门或机构送交论文的复印件和电子版本人允许论文被查阅和借阅学校可以将本学位论文的全部或部分内容编入有关数据库进行检索可以采用影印缩印或扫描等复制手段保存和汇编本学位论文同时本人保证毕业后结合学位论文研究课题再撰写的文章一律注明作者单位为西安科技大学保密论文待解密后适用本声明学位论文作者签名立克纠指导教师签名钆留影月拳年 1 绪论 l 绪论 1 1 选题背景及研究意义视频信息随着社会的发展科技的进步应用领域和范围越来越广包括视频会议远程医疗远程监控基于网络的流媒体的传输和播放等都需要大量的视频信息对数字视频及图像存储和传输业务的需求随之大幅度增加相比较其它类型的信息如文本和数据数字图像的数据量巨大例如一幅分辨率为2 2 7 2 1 7 0 4 像素数码相机照片常用像素的照片其数据量约为9 3 m b i t 如果不经过压缩直接存储一张1 g b 的存储卡只能存储8 0 张左右的照片因此必须对数字信号进行压缩用尽可能少的数据来表达信息节省传输和存储的开销i l l 为了能够在网络带宽存储空间和处理器主频受限的条件下数字视频及图像存储和传输业务更好的实施就必须对视频数据进行大量压缩因此提出和制定了许多满足这些要求的视频压缩编码标准由i t u t 和i s o i e c 共同成立的联合视频小组 t 制定的i t u th 2 6 4 a v c 2 1 以下简称h 2 6 4 标准正是其中一种可视电话视频会议网络传输数字电视及无线多媒体通信等与我们的工作生活息息相关实现一个通用的多媒体通信终端具有很好的社会意义和广泛的市场发展潜力多媒体通信终端平台除了要有适合网络或者无线通信的视频通信协议外还需要有快速稳定的处理器作为多媒体处理的硬件平台多媒体通信终端系统的关键是信号处理视频信号图像信号音频信号是多媒体系统进行处理和传输的对象其中视频信号是信息量最大数据量最大的部分由于传输信道带宽的限制必须对视频信号进行压缩处理以适应信道码率的要求而视频压缩一般都具有很高的运算复杂度像运动估计 d c t 变换等运算量非常大它们占用了多媒体信号处理总量的绝大部分时间因此具有较高运算能力的处理器才能作为多媒体通信终端的运算单元目前数字信号处理器 d s p 的高速发展为实现高效的多媒体信号处理平台提供了可能性 t i 公司的 t m s 3 2 0 d m 6 4 2 t 3 处理器具有高主频多条流水线高并行度以及专门的视频信号处理指令等优点它是视频处理领域首选的d s p 芯片之一基于d s p 实现的多媒体通信终端设备同基于p c 机和f p g a 专用芯片实现的通信终端相比具有灵活性高可移植性强升级方便等优点因此以t m s 3 2 0 d m 6 4 2 为核心处理器的d s p 为实现高效的音视频信号处理提供了快速稳定的多媒体信号处理平台经过以上分析将h 2 6 4 算法在d s p 上实现对于多媒体通信的研究具有较高的意义和价值西安科技大学硕士学位论文 1 2 国内外研究现状 1 2 1 常用编码标准目前国际上主要的编码标准有两大系列分别是由i s 0 i e c 制定的m p e g x 系列标准和i t u t 制定的h 2 6 x 系列标准下面对这两个系列作简要介绍 1 i s o i e c 编码标准 m p e g 系列 m p e g x 系列标准是由国际标准化组织 i s o 运动图像专家组 m p e g 制定侧重应用于多媒体业务视频存储视频广播流媒体等 m p e g 1 1 标准制定的目标码率为1 2 m b i t s 其对于c i f c o m m o ni n t e r m e d i a t e f o r m a t 中间公共格式 3 5 2 2 8 8 格式图像可以达到实时播放该标准是为只读 c d r o m 光盘的视频存储和播放所制定的主要应用于v c d 业务 m p e g 2 p 1 是i t u t 与m p e g 共同完成的标准 i t u t 称这个标准为h 2 6 2 主要针对数字视频广播 d v b 高清晰度电视 h d t v 和d v d 等制定是目标码率为4 9 m b i t s 的运动图像及其伴音的编码标准 m p e g 4 坤1 是新一代的编码标准其中提出了许多新的编码思想其核心思想是面向对象编码能够支持更高压缩效率与应用范围这种编码标准部分借鉴h 2 6 3 标准其编码系统是开放的可随时加入新的有效的算法模块 2 i t u t 编码标准 h 系列 h 2 6 x 系列是由国际电信联盟 i t u t 视频编码专家组v c e g v i d e oc o d i n ge x p o r t g r o u p 制定该系列侧重于实时视频通信会议电话可视电话该系列现有h 2 6 1 h 2 6 2 h 2 6 3 h 2 6 4 标准 h 2 6 1 1 是第一个实用视频编码标准于1 9 9 0 年制定它是针对低比特率应用场合的一种编码标准主要应用于双向视频通信 h 2 6 1 采用的算法主要是帧间预测和二维 d c t 变换的混合编码方法后来许多编码标准都是在h 2 6 1 基础上的发展和改进 h 2 6 2 p 由i t u t 和i s o i e c 联合开发相当于m p e g 2 目前其己广泛的应用于d v d 数字电视数字广播等领域 h 2 6 3 p 1 是针对低码率视频压缩提出的新标准其目的是为了支持码率低于6 4 k b i t s 的应用目前己成为视频会议的主要标准 h 2 6 3 和h 2 6 3 是h 2 6 3 的改进版 h 2 6 4 a v c 是i t u t 与i s o i e c 共同成立的联合视频组 t j o i n t v i d e ot e a m 共同制定的新标准该标准仍采用预测结合变换的混合编码方案但引入了许多新的编码技术和工具使其编码效率比其它标准有明显提高在相同的图像重建质量下比h 2 6 3 节约5 0 的码率 h 2 6 4 具有较高的复杂度在编码端计算的复杂度约是h 2 3 6 的3 倍约是m p e g 一4 的4 5 倍 2 1 绪论 1 2 2h 2 6 4 视频压缩标准研究现状 h 2 6 4 标准中的关键技术包括多种更好的运动估计小数像素多模式多参考帧 4 x 4 小尺寸块的整数变换更精确的帧内预测熵编码等其中针对帧内 i n t r a 和帧间 i n t e r 宏块的精确快速的预测模式决策算法快速的高精度运动估计算法高效率的熵编码算法是研究的热点和难点 h 2 6 4 并不明确的规定一个编码器如何实现而是规定了一个编了码的视频比特流的句法和该比特流的解码方法各个厂商的编码器和解码器在此框架下应能够互通在实现上具有较大的灵活性而且有利于相互竞争这促进了各开发厂商对编码器的灵活实现目前业内比较流行的开源编码器有三种 j m x 2 6 4 及t 2 6 4 j m 模型由德国h h i 研究所从2 0 0 2 年2 月开始开发它是h 2 6 4 的官方测试模型实现了2 6 4 所有的特性但其程序结构冗长编码复杂度极高 x 2 6 4 模型由网上自由组织从2 0 0 4 年6 月开始联合开发的兼容2 6 4 标准码流的编码器其注重实用和j m 相比在不明显降低编码性能的前提下努力降低编码的计算复杂度其至今无解码器 t 2 6 4 模型由中国视频编码自由组织联合从2 0 0 4 年1 0 月开始开发的2 6 4 编解码器编码器编码输出标准的2 6 4 码流解码器只能解t 2 6 4 编码器生成的码流 1 2 3d s p 技术发展现状随着信息技术的发展数字多媒体处理系统己经逐步取代传统的模拟系统可以用来实现数字多媒体处理的集成电路主要有三大类 a s i c 专用芯片 f p g a 现场可编程门阵列 d s p 数字信号处理器相比较a s i c f p g a 而言 d s p 平台在视频产品开发领域有以下几方面的优势第一用户开发自由度更大支持多种个性化开发可以满足市场不断提出的新的要求在第一时间提升产品性能增强产品的竞争能力第二 d s p 处理能力强可以在一个d s p 上同时实现多路音视频信号的压缩处理这样使进一步大幅度降低产品的成本成为可能第三开发周期短实现快速技术更新和产品换代第四芯片功耗低对提高产品的稳定性提供可靠保障世界上第一个单片d s p 芯片是1 9 7 8 年a m i 公司发布的 2 8 11 第一片可编程d s p 芯片的诞生为数字信号处理理论的实际应用开辟了道路 1 9 7 9 年美国i n t e l 公司发布的商用可编程器件2 9 2 0 是d s p 芯片的一个主要里程碑这两种芯片内部都没有现代d s p 芯片所必须有的单周期乘法器 1 9 8 0 年日本n e c 公司推出的p p d 7 7 2 0 是第一个具有乘法器的商用d s p 芯片在这之后最成功的d s p 芯片当数美国德州仪器公司 t i 的一系列产品 t i 公司在市场上主要有三大系列产品 1 面向数字控制运动控制的 t m s 3 2 0 c 2 0 0 0 系列主要包括t m s 3 2 0 c 2 4 x f 2 4 x t m s 3 2 0 c 2 4 x l f 2 4 0 x 3 西安科技大学硕士学位论文 t m s 3 2 0 c 2 8 x x 等 2 面向低功耗手持设备无线终端应用的t m s 3 2 0 c 5 0 0 0 系列主要包括t m s 3 2 0 c 5 4 x t m s 3 2 0 c 5 4 x x t m s 3 2 0 c 5 5 x 等 3 面向高性能多功能复杂应用领域的t m s 3 2 0 c 6 0 0 0 系列主要包括t m s 3 2 0 c 6 2 x x t m s 3 2 0 c 6 4 x x t m s 3 2 0 c 6 7 x x 等如今 t i 的一系列d s p 产品已经成为当今世界上最有影响的d s p 芯片 t l 成为世界上最大的d s p 芯片供应商其d s p 市场份额占全世界份额近5 0 本论文使用的即是t i 公司2 0 0 3 年底推出的一款针对多媒体应用的芯片 m s 3 2 0 d m 6 4 2 1 3 本文主要工作与章节安排本课题的主要目的是分析和优化h 2 6 4 的官方参考模型j m 8 6 并将优化后的代码移植到t m s 3 2 0 d m 6 4 2 芯片上实现d s p 平台的h 2 6 4 视频压缩编码本文的主要工作如下 1 详细研究了h 2 6 4 视频压缩编码标准分析了h 2 6 4 编码算法研究了d s p 移植平台d m 6 4 2 的相关特性 2 对三大开源编码器进行了对比选用了j m 8 6 版本的官方参考模型作为算法实现的基础详细研究了j m 8 6 代码的编码流程参考x 2 6 4 代码将课题中不需要的功能去除改进和优化程序改进了u m h e x a g o n s 算法并对改进后的性能进行了验证 3 把基于p c 机的改进后的代码在d m 6 4 2 处理平台上进行初步移植对移植过程中遇到的问题和解决办法做出了详细地分析说明并给出了最终结果基于以上工作本文主要章节安排如下第二章详细地介绍了h 2 6 4 a v c 标准的特点和其中包含的新技术包括其分层的体系结构以及视频编码层的新特性最后指出了复杂度是h 2 6 4 未被广泛采用的主要因素之一必须进行算法和平台的快速优化第三章介绍了开发使用的硬件环境包括d s p 芯片的结构特点外设接口流水线以及开发用软件平台的特点第四章选择h 2 6 4 官方参考模型j m 8 6 作为研究代码根据项目的实际情况对代码进行裁剪和优化根据选用的硬件特点进行了p c 机的c 算法级优化 p c 机至i j d s p 的移植和d s p 平台上的d s p 代码优化实现了d s p 平台上的视频压缩编码最后一章为全文总结并对下一步工作进行了展望 4 2h2 6 4 视频编码标准的特点厦关键技术 2h 2 6 4 视频编码标准的特点及关键技术 2 1 概述日自口较为经典和广泛使用的图像压缩编码方法是混台编码印通过减少统计冗余柬达到压缩图像数据量的目的 h2 6 4 在技术上不但集中了以往标准的优点而且对关键算法进行了改进使其在图像质量编码效率压缩率及网络适应性容错性等方面均较以往的视频压缩标准有较大改善与以往标准相比 h2 6 4 主要有以下优点m i 在相同重建图像质量下比h 2 6 3 和m p e g 4 p a r t 2 节约5 0 左右的码率可在很宽的码率范围内提供高质量的视频服务对信道时延的适应性较好既可工作于低时延模式以满足实时业务如会议电视等又可工作于无时延限制的宽松场合如视频存储等具备较强的抗误码能力包括支持传输环境恶劣的无线网络采用分层模式视频编码层 v c l v i d e o c o d i n g l a y e r 和专用于网络传输的网络抽象层 n a l n e t w o r k a b s t r a c t i o n l a y e r 进一步提高网络适应能力 2 2h 2 6 4 的输入图像格式类型 h 2 6 4 支持的视频源格式包括y u v 4 2 0 4 2 2 和4 4 4 连续视频取样格式如图2 1 所示同时支持运行扫描和隔行扫描的视频序列对丁隔行扫描的视频帧 h2 6 4 支持将奇偶场进行独立编码也支持将奇偶场一起编码的方式麓噜7 噜c噜噜噜 4 t 4 i 4 4 毫一噜叠噜噜 4 c 噜 l 二图2 l 连续视频取样格式西安科技大学硕士学位论文目前 h 2 6 4 主要针对采用y u v 4 2 0 采样的视频序列进行压缩编码其中视频序列的一帧可以由连续的数据构成也可以由两个交织场奇场和偶场来构成为了统一无论编码数据的组织方式是连续的还是由交织的两场构成都统一称为一帧图像 p i c t u r e 2 3h 2 6 4 的编码格式 h 2 6 4 将视频编码系统分为视频编码层 v c l 和网络抽象层 n a l 两个层次1 1 4 1 v c l 数据即编码处理后的输出它表示被压缩编码后的视频数据序列在v c l 数据传输或者存储之前这些编码的v c l 数据先被映射或封装进n a l 单元中 n a l 作为h 2 6 4 标准的一部分正式定义了视频编解码器和外部网络之间基于包的接口以便将v c l 层视频流进行协议封装后通过n a l 集成到传输层 1 1n a l 头 r b s pn a l 头 r b s p n a l 头 r b s p l 图2 2 n a l 单元序列 n a l 单元序列如图2 2 所示 n a l 层把数据封装成为若干网络抽象单元 n a l u n a lu n i t 这些网络抽象单元可以在现有的大部分网络中以包的形式传送封装于网络抽象单元中的数据称为原始字节序列载荷 r b s p r a wb y t e ss e q u e n c ep a y l o a d s 根据 r b s p 的不同网络抽象单元中可以分为不同的类型 h 2 6 4 中的r b s p 主要分为两种一种为视频编码数据一种为控制数据视频编码数据可以以s l i c e 每个s l i c e 由若干宏块组成为单位进行组织也可以对s l i c e 进行数据分割即将每个s l i c e 中编码后的数据按类型分为三种同类型的数据组织到一起形成三个数据划分 d a t ap a r t i t i o n 视频编码数据以数据划分为单位进行组织其中控制数据是指视频序列参数图像参数等信息对于解码端可以认为这些网络抽象单元或者正确无误或者在网络中丢失或者存在位错误一般网络抽象单元头信息中会设有相应标志来指示是否发生位错误解码器能够识别发生位错误的网络抽象单元并决定是对其进行解码还是丢弃 v c l 层主要研究基于混合编码中涉及到的常规的运动补偿变换编码熵编码等编码技术来提高视频信号的编码效率使用s l i c e 技术将一个待编码图像分割成许多宏块来处理 v c l 的主要任务如下 1 通过分块技术将对整帧的处理降到对块的处理来降低视频处理时间 2 通过变换量化和熵编码方式对原始块进行编码以达到降低视频帧空间冗余度的目的 3 采用运动估计和运动补偿技术只对残差数据进行编码以降低时间冗余 6 2h 2 6 4 视频编码标准的特点及关键技术图2 3h 2 6 4 编码器 h 2 6 4 的v c l 层压缩算法是在h 2 6 3 和h 2 6 3 的基础上发展而来的也采用与 h 2 6 3 和m p e g 4 类似的基于块的混合编码方法采用帧内 i n t r a 和帧间 i n t e r 两种编码模式编码都以宏块为单位进行对于i 帧图像采用帧内模式编码对于p 帧和b 帧图像则采用帧问模式编码通过复杂的帧间预测来减少运动图像的时间冗余通过对预测残差进行d c t 变换来减少空间冗余 i n t r a 编码的基本流程为选择宏块的帧内预测模式一帧内编码一对残差数据进行变换和量化一对量化后的系数进行变长编码和算术编码一生成重构块用于后继块编码时的参考 i n t e r 编码流程为多模式运动估计根据率失真优化算法选择编码模式一运动补偿产生残差数据一对残差数据进行变换量化和编码 h 2 6 4 编码器如图2 3 所示 1 5 1 编码时首先把当前帧e 划分成宏块宏块有帧内和帧间两种模式帧内模式使用当前帧内己编码的宏块进行预测帧间模式使用以往一个或多个帧作为参考进行运动预测然后对预测值和原始值的差值d 进行整型变换量化重新排序和v c l 编码最后将运动失量m v 和每个宏块的头信息进行熵编码产生压缩数据流进行传输对量化系数x 进行逆量化反变换后与预测系数相加得到未经滤波的 1f 帧对 i f 帧进行滤波得到当前重构帧解码过程对应于编码器的各部分进行逆向操作即可输出重构图像数据具体过程为对每个块进行再量化逆转换产生差值d 因为是不可逆量化所以d 与d 不同将运动补偿预测p 加到d 上产生重构块各重构块存储起来以便产生重构帧e 一个完整的帧被解码后生成的就可输出显示了也可保存起来用作参考帧以生成下一帧 2 4h 2 6 4 的档次和级并不是所有的用户都需要一种视频标准所提供的所有特性因此 h 2 6 4 像以前所有其他视频标准那样提供了不同的档次 p r o f i l e s 和级 l e v e l s 不同的p r o f i l e 提供了不同的算法要求和限制使用相同p r o f i l e 的解码器能够解码该p r o f i l e 支持的所有特性 7 西安科技大学硕士学位论文而编码器只需支持该p r o f i l e 内的部分特性对一个指定的p r o f i l e 又分为不同的l e v e l l e v e l 的选择一般是根据计算机的运算能力和内存容量决定的 h 2 6 4 规定了三个档次1 1 6 1 每个档次支持一组特定的编码功能和特定的应用 1 基本档次 b a s e l i n ep r o f i l e 在h 2 6 4 中的i d 值是6 6 它支持视频会议可视电话无线通信等实时视频通信应用等 b a s e l i n ep r o f i l e 的解码器支持以下特性 i 片和p 片类型去块滤波 z i g z a g 扫描方式 1 4 像素精度运动估计三级运动分块最小块为4 x 4 的块 c a v l c 熵编码模式 4 2 0 的色度块采样率等 2 主要档次 m a i np r o f i l e 的i d 值是7 7 它主要应用于数字广播电视和数字视频存储领域 m a i np r o f i l e 的解码器除支持b a s e l i n ep r o f i l e 中的大部分特性外还支持以下特性采用b 片的帧间编码加权预测的帧内编码 c a b a c 熵编码场编码帧场自适应编码等 3 扩展档次 e x t e n d e dp r o f i l e 的i d 值是8 8 它主要应用于流媒体中 e x t e n d e d p r o f i l e 除支持b a s e l i n ep r o f i l e 中的所有特性外还支持以下特性 b 片类型加权预测 s p 和s i 片类型数据分层片场编码帧场自适应编码 2 5h 2 6 4 中的关键技术 h 2 6 4 标准的主要目的是提供一种和以往视频编码标准相比具有更高编码质量的视频编码标准 h 2 6 4 仍然采用运动估计预测变换和熵编码等作为其编码的主要技术内容在编码时将视频帧分为帧内 i n t r a 和帧间 i n t e r 两种编码模式首先将视频帧分成块以便将帧的处理在块的层次上进行然后利用视频帧内存在的空间冗余性通过相邻像素预测本块像素对视频块进行不同域之间的变换从时域转化到另一个域使得变换系数集中到少数几个点上或利用连续的视频帧之间具有的时间冗余性通过运动估计技术在参考帧内搜索找到和当前块相关性最大的视频块然后计算两块之间的差值并对差值进行变换最后对变换系数和运动矢量进行熵编码下面分别介绍h 2 6 4 中各种关键技术 2 5 1 帧内预测帧内预测 i n t r ap r e d i c t i o n 是使用相邻块对编码块像素值进行预测对预测残差再进行变换编码 h 2 6 4 对亮度块的帧内预测方法采用1 6 x1 6 和4 x 4 两种块方式预测0 7 1 对色度块采用8 x 8 的块方式预测就亮度而言对于图像中较为平坦的部分采用1 6 x1 6 预测对于变化较大的细节部分采用4 x 4 预测预测之前要对当i j 宏块相邻的左上重建块进行分类根据不同的分类用重建块作为参考选择不同预测模式进行预测亮度块4 x 4 预测有9 种预测模式 1 6 x1 6 预测有4 种预测模式色度块8 8 预测有4 种预测模式 8 2h 2 6 4 视频编码标准的特点及关键技术 qab cde fgh 图2 44 x 4 亮度预测 1 4 x 4 亮度宏块预测 4 x 4 亮度预测如图2 4 在4 x 4 亮度块预测中块上面和左边预测像素a q 为己编码并重构的像素用作编码器中的预测参考像素 a p 为待预测像素利用a q 值和9 种预测模式实现编码器通过计算每种预测方式的绝对误差和s a e t h es u mo f a b s o l u t e e r r o r s 选择s a e 最小的预测模式进行预测编码帧内4 x 4 预测有9 种模式如下所述模式0 垂直由a b c d 垂直推出相应像素值模式1 水平由i j k l 水平推出相应像素值模式2 d c 由a d 和i l 平均值推出所有像素值模式3 下左对角线由4 5 度方向像素内插得出相应像素值模式4 下右对角线由4 5 度方向像素内插得出相应像素值模式5 右垂直由2 6 6 度方向像素内插得出相应像素值模式6 下水平由2 6 6 度方向像素内插得出相应像素值模式7 左垂直由2 6 6 度方向像素内插得出相应像素值模式8 上水平由2 6 6 度方向像素内插得出相应像素值 2 1 6 x1 6 亮度宏块预测帧内1 6 x1 6 预测模式根据与当前宏块相邻的像素生成预测值在进行预测之前首先要判断这些邻近像素是否存在如果不存在比如当前宏块位于图像边缘或邻近宏块位于其它片中时则无法进行预测 1 6 x1 6 预测共有4 种预测模式如下所述模式0 垂直由上边像素推出相应像素值模式l 水平由左边像素推出像素值模式2 d c 由上边和左边像素平均值推出像素值模式3 平面利用线形p l a n e 函数及左上像素推出像素值适用于亮度变化平缓区域 3 8 x 8 色度宏块块预测该预测是针对当前宏块的两个8x8 色度分量它们由己编码的左上方色度像素预测而得共有4 种预测模式模式0 d c 模式1 水平模式2 垂直和模式3 平面两 9 西安科技大学硕士学位论文个色度分量预测模式相同且与1 6 x1 6 亮度预测类似 2 5 2 帧间预测帧间预测和编码主要是利用视频信号的时域相关性通过运动估计和补偿把视频信号的时域冗余信息去掉从而达到压缩视频数据的目的由于视频信号的时域相关性远远大于其空域相关性所以通过采用帧间预测和编码可以更大的降低编码码流帧间编码的帧分为两种一种是p p r e d i c t i o n 帧一种是b b i d i r e c t i o n a l p r e d i c t i o n 帧 p 帧是前向预测帧 b 帧是双向预测帧采用前后双向预测下面介绍帧间编码的各种技术 1 子块的划分进行运动估计时使用的块大小对运动估计的效果有较大的影响使用比较小的块可以使得运动估计更精确从而产生较小的运动残差达到降低码率的作用 h 2 6 4 在进行运动估计时使用了不同的宏块分割方式宏块划分模式如图2 5 所示一个1 6 x1 6 宏块可以分为1 个1 6 x1 6 2 个1 6 x8 或8 x1 6 或4 个8 8 等几种块大小对8 x8 的块又可以分为 1 个8 8 2 个 8 x 4 或4 8 4 个4 x 4 的块宏块的色度成分采用和亮度块相同的分割模式只是尺寸在水平和垂直方向减半 o 1 o 1 o 1 4 8 8 l6 8 8 o 1 23 图2 5 宏块划分模式每一个块具有一个运动矢量m v 一个宏块最多可以携带1 6 个不同的运动矢量每个m v 被编码传输并且分割选择也被编码压缩到比特流中对大的分割尺寸而言 m v 的选择和分割类型只需较少比特但运动补偿残差在多细节区域中的能量高小尺寸分割运动补偿残差能量低但需要较多的比特表征m v 和分割选择整体而言大的分割尺寸适用于平坦区域小尺寸适用于多细节区域 l o 2h 2 6 4 视频编码标准的特点及关键技术 2 m v 预测由于h 2 6 4 支持多种宏块和子宏块的分割如果图像细节较多时划分的块尺寸较小若对每个块的m v 独立编码则需要相当数目的比特一个块的m v 与邻近块具有较强的相关性因此m v 可由邻近已编码的分割块预测而得即可以通过相邻已编码的分割块的运动矢量预测值m v p 和当前宏块的m v 得到预测与当前的差异m v d 将m v d 编码传输在解码端 m v p 以相同的方式形成并加到m v d 上对于跳编码宏块而言由于不存在m v d 其运动补偿宏块也由m v 直接生成 3 1 4 精度像素内插运动估计就是在参考帧中寻找一个与当前块最匹配的块作为当前块的估计值在 h 2 6 4 中更是把运动估计的精度提高到了1 4 像素并且把1 8 像素精度的运动估计作为了一个可选项 h 2 6 4 中使用1 4 像素估计和整像素相比可以节省2 0 的码率 1 4 像素精度的运动估计使用滤波算法得到半像素和1 4 像素位置的点如果运动矢量指向整像素位置那么预测数据由相应的参考图像的像素组成否则相应的非整位置像素值需要用内插的方法获得 4 多参考帧运动估计在h 2 6 4 中使用的多参考帧运动估计技术是对单帧运动估计技术的简单扩展即在多个参考帧中找到一个使预测误差达到最小的运动矢量使用5 个参考帧和1 个参考帧相比可以节省5 1 0 的码率多个参考帧存放于帧缓存中在帧缓存中包括短期参考帧和长期参考帧两种参考帧类型为了有效的利用多参考帧必须采用合理的内存管理方法在h 2 6 4 中允许采用两种帧缓存管理方案即自适应缓存管理模式和滑动窗口帧缓存管理模式在h 2 6 4 标准中 b 帧可以采用i 帧 p 帧或者b 帧作为参考帧对b 帧而言有5 种预测模式分别是前向预测后向预测双向预测直接模式和帧内预测模式 2 5 3 整数变换和量化为了进一步节省图像传输码率需要对图像信号进行压缩为了去除图像信号中的相关性及减小图像编码的动态范围通常采用变换编码及量化技术n 引变换编码将图像时域信号变为频域信号在频域中图像信号的能量大部分集中在低频区域由于d c t 的性能十分接近统计意义上的最优变换k l t 而且具有快速算法所以 d c t 被广泛地应用于各种视频编码标准中但是传统的d c t 无论在运算精度还是复杂度上都存在明显的不足 h 2 6 4 中引入了整型d c t 变换对图像或预测残差采用的是4 x 4 整型d c t 这样不但解决了精度问题而且由于乘法均可由移位运算代替运算的复杂度也大大降低为了进一步提高压缩效率 h 2 6 4 还允许把每个4 4 的变换矩阵中的直流分量单独取出组成一西安科技大学硕士学位论文新的4 x 4 矩阵对此矩阵进行h a r d a m a r d 变换量化过程在不降低视觉效果的前提下减少图像编码长度减少视觉恢复中不必要的信息 h 2 6 4 采用标量量化技术它将每个图像样点编码映射成较小数值量化过程是对d c t 结果进行操作 j 下变换中的数乘运算和量化过程同时进行根据图像动态范围的大小来确定量化参数既保留了图像中必要的细节又可减少码流 2 5 4 熵编码熵编码是无损压缩编码方法它生成的码流可以经解码无失真地恢复出原数据熵编码是在统计意义上对数据的冗余信息进行压缩的方法在视频编码中对出现概率较大的数据用较短的字长来表示对出现概率较小的数据用较长的字长来表示从而达到降低数据量的目的在h 2 6 4 中有两种熵编码方法 c a v l c t l 9 co m e n b a s e da d a p t i v e v a r i a b l el e n g t hc o d i n g 和c a b a ct 2 0 c o n t e x t b a s e da d a p t i v eb i n a r ya r i t h m e t i cc o d i n g 对不同的编码方案采用不同的选择i2 1 1 c a v l c 主要利用经变换和量化后的4 x 4 矩阵的特性来实现高效的编码 1 经过变换与量化后的预测残差中含有较多的0 这样在z i g z a g 扫描之后用 r u n l e v e l 编码表示预测残差可以取得较好压缩效果 2 残差末尾的几个非零变换系数一般为 1 c a v l c 对它们单独进行编码 3 作为空间相关性的一种表现当i j 块中的非零系数个数和周围块中的非零系数个数有一定的相关性 c a v l c 利用这一点自适应地选择编码当前块中非零系数个数的码表 4 位于低频处的系数值一般较大而位于高频处的则相反 c a v l c 利用这一点自动地选择编码l e v e l 的码表其编码流程如下 1 编码非o 系数个数和拖尾系数t r a i l i n go n e s 2 编码t r a i l i n go n e s 1 的符号 3 编码系数段l e v e l 4 编码最后一个系数前所有的零 t o t a lz e r o s 5 编码非零系数前零的个数 r u nb e f o r e c a b a c 编码是一种算术编码它通过构建模型来预测当前的视频信号与c a v l c 编码相比 c a b a c 提供了更高的编码效率进一步节省了码率 2 5 5 去方块效应滤波在h 2 6 4 中编解码器反变换量化后图像会出现方块效应产生方块效应的主要原因是基于块的帧内和帧间的预测残差的d c t 变换其变换系数的量化过程相对粗糙因 1 2 2h 2 6 4 视频编码标准的特点及关键技术而反量化过程恢复的变换系数带有误差会造成在图像块边界上的视觉不连续还有一个原因是来自于运动补偿运动补偿块可能是从不是同一帧的不同位置上的内插样点数据中复制而来的运动补偿块的匹配不可能是绝对准确的所以就会在复制块的边界上产生数据不连续尽管h 2 6 4 采用较小的4 4 变换尺寸可以降低这种不连续现象但仍需要一个去方块滤波器以最大限度提高编码性能1 2 2 1 滤波就是为了降低由h 2 6 4 高压缩比产生的明显的块失真效应所有块按扫描顺序进行有条件的滤波以平滑块间的亮度落差减小失真提高解码帧的质量使重构后的图像更贴近原始图像滤波过程是先计算出块的边界强度再根据边界强度值选用不同的滤波方法滤波器强度参数与编码模式关系如表2 1 所示表2 1 滤波器强度参数与编码模式关系图像块模式与条件b s 边界两边一个图像块为帧内预测并且边界为宏块边界边界两边一个图像块为帧内预测边界两边一个图像块对残差编码边界两边图像块运动欠量差不小于1 个亮度图像点距离边界两边图像块运动补偿的参考帧不同其它 b s 0 时不进行滤波 b s 为非零时判断区分该边界是否

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（信号与信息处理专业论文）h264视频压缩编码标准研究与dsp实现.pdf

文档简介

温馨提示

最新文档

评论

（信号与信息处理专业论文）h264视频压缩编码标准研究与dsp实现.pdf

文档简介

温馨提示

最新文档

评论

相关文档