（信号与信息处理专业论文）h264视频编码算法研究及解码算法的软件实现.pdf

上传人：扣*** IP属地：宁夏上传时间：2020-01-13 格式：PDF 页数：58 大小：1.83MB 积分：0 举报 版权申诉

（信号与信息处理专业论文）h264视频编码算法研究及解码算法的软件实现.pdf_第2页

（信号与信息处理专业论文）h264视频编码算法研究及解码算法的软件实现.pdf_第3页

（信号与信息处理专业论文）h264视频编码算法研究及解码算法的软件实现.pdf_第4页

（信号与信息处理专业论文）h264视频编码算法研究及解码算法的软件实现.pdf_第5页

已阅读5页，还剩53页未读，继续免费阅读

（信号与信息处理专业论文）h264视频编码算法研究及解码算法的软件实现.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

北京邮电大掌硕士掌位论文 h 2 6 4 视频编码算法研究及码算法的软件实现 h 2 6 4 视频编码算法研究及解码算法的软件实现摘要 h 2 6 4 是由i s o i e c 和i t u t 两大国际标准化组织共同制定的面向实际应用的视频编码新标准新一代视频编码标准同目前人们熟悉的h 2 6 3 相比 h 2 6 4 的编码效率可以提高5 0 以上并且具有更好的容错能力和网络适应性尽管h 2 6 4 目前还处于f i n a l d r a f t 阶段并被没有成为正式的国际标准但它编码性能和新特性使得它在未来的视频通信领域具有非常广泛的应用前景本轮文的研究内容来源于国家自然科学基金项目 h 2 6 l 视频编码算法研究及其d s p 实现主要完成了h 2 6 4 视频编码算法分析以及解码算法的软件实现工作具体而言本论文完成了一下主要工作 1 较详细地分析了h 2 6 4 采用的新技术包括 h 2 6 4 的分层结构多模式帧内预测编码整数余弦变换 i c t 运动估值和运动补偿通用变长编码 u v l c 和基于上下文变长编码 c a v l c 相结合的熵编码等 2 对h 2 6 4 形成r t p 数据包的打包过程进行了深入研究 3 开发了完整的h 2 6 4 解码软件该软件能利用r t p 协议从网络接收硬件编码设备产生的h 2 6 4 数据流并进行实时解码目前本论文所开发的解码软件已经能通过1 0 m b s 以太网口同位于局域网内的硬件编码设备进行通信并对接收到的视频流进行解码为后期的应用开发奠定了基础关键字 h 2 6 4 视频编码视频解码 r t p 北京邮电大掌硕士掌位论文 h 2 6 4 视频编码算法研究及码算法的软件实现 t h er e s e a r c ho fh 2 6 4v i d e o p r o t o c o l a n dt h er e a l i z a t i o n o fi t sd e c o d i n gt e r m i n a l a b s t r a c t h2 6 4i st h en e w e s ti n t e r n a t i o n a lv i d e oc o d i n gs t a n d a r da n di sn o wi ni t sf i n a l s t a g e so fd e v e l o p m e n tb y t h ej o i n ti t u ta n di s o i e cs t a n d a r d so r g a n i z a t i o n s t h i s l l e ws t a n d a r di n c r e a s ec o d i n ge f f i c i e n c yw h i l ep r o v i d i n gt h es a m ep i c t u r eq u a l i t ya t h a l ft h eb i tr a t ec o m p a r e dt ot h eh 2 6 3 一b a s e dt e c h n o l o g i e s w h i c hi sn o ww i d e l yu s e d i nv i d e o c o n f e r e n c i n gs y s t e m s w h a t sm o r eh 2 6 4h a se r r o rr e s i l i e n c et o o l si n c l u d e d t om a i n t a i nv i d e o q u a l i t y i n e r r o r p r o n e t r a n s m i s s i o n sa n dn e t w o r k a d a p t a b i l i t y a l t h o u g ht e c h n i c a lw o r k o nh 2 6 4i sm a t u r ea n dn e a r i n gc o m p l e t i o n w ee m p h a s i z e t h a tt h ec o d i n gp e r f o r m a n c er e s u l t sp r e s e n t e di nt h i sw o r kr e f l e c to n b t h ec u r r e n t d r a f to ft h es t a n d a r da n da r es u b j e c tt o c h a n g ea st h ed r a ns t a n d a r dc o m i n a e st o e v o l v e t h ec o n t e n to ft h ep a p e rc o m ef r o map r o j e c ts p o n s o r e db yn a t i o n a ln a t u r a l s c i e n c ef o u n d a t i o no f c h i n a t h er e s e a r c ho nt h en e wv i d e oc o d i n ga n di t sr e a l i z a t i o n b a s e do nd s p t h em a i nt a s ko ft h ep r o j e c ti st o a n a l y z et h eh 2 6 4a n df i n i s ht h e d e c o d i n gt e r m i n a lb a s e do ni t i nf a c tt h em a i nt a s k sw i l lb ef i n i s h e da sf o l l o w i n g s 1 a n a l y z ei nd e t a i lt h en e w c h a r a c t e r i s t i c so f h 2 6 4 i n c l u d i n g l a y e r e dc o d i n g m u l t i m o d em o t i o ne s t i m a t i o n i c t m o t i o ne s t i m a t i o na n dm o t i o nc o m p e n s a t i o n u v l ca n dc a v l c w h i c hm a k eh 2 6 4m o r ee f f i c i e n tt h a nh 2 6 3i nv i d e oc o d i n g 2 i n t r o d u c e dt h er e a l t i m em u l t i m e d i at r a n s p o r tp r o t o c o l s r t pa n dr t c p a n d d e s c r i b eh o wt op a c k e tt h eh 2 6 4c o d eb a s e do nr t p 3 d e v e l o p e dt h eh 2 6 4d e c o d i n gt e r m i n a lw h i c hc a nr e c e i v et h ec o d ef r o mt h e n e t w o r ka n dt h e nd e c o d et h ec o d er e a i t i m ee f f i c i e n t l yo np c k e y w o r d s h 2 6 4 t h ee n c o d e ro f v i d e o t h ed e c o d e ro f v i d e o r t p 北京邮电大掌硕士掌位论文 h 2 6 4 视频编码算法研究及码算法的软件实现 w i t hh a r d w a r eb a s e dh 2 6 4e n c o d e rt h r o u g h10 m b se t h e m e ti n t e r f a c et or e c e i v e v i d e os t r e a m i na d d i t i o n i tc a r la l s od e c o d et h er e c e i v e dv i d e os t r e a mc o r r e c t l ya n d s h o v e i to i lt h es c r e e n k e y w o r d s h 2 6 4 t h ee n c o d e ro fv i d e o t h ed e c o d e ro fv i d e o r t p 独创性或创新性声明本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果尽我所知除了文中特别加以标注和致谢中所罗列的内容以外论文中不包含其他人已经发表或撰写过的研究成果也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意申请学位论文与资料若有不实之处本人承担一切相关责任本人签名酝落日期避望关于论文使用授权的说明学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定即研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘允许学位论文被查阅和借阅学校可以公布学位论文的全部或部分内容可以允许采用影印缩印或其它复制手段保存汇编学位论文保密的学位论文在解密后遵守此规定保密论文注释本学位论文属于保密在一年解密后适用本授权书非保密论文注释本学位论文不属于保密范围适用本授权书本人签名匦聱日期卫竖 j 导师签名蕉莹利曰期逊监玉 f 北京邮电大掌硕士掌位论文 h 2 6 4 视频编码算法研究及码算法的软件实现 a 课题背景绪论本课题的研究内容来源于国家自然科学基金项目 b t 2 6 l 视频编码算法研究及其d s p 实现该项目主要研究新一代视频编码标准中的核心技术和相应的d s p 实现技术满足视频通信远程实时监控等应用的需要图1 给出了本项目系统结构框图视频捕获设备采集到的视频信号首先将传送给基于t m l 3 0 0d s p 芯片的硬件视频编码系统编码后的数据流通过以太网接口传送到局域网内解码设各通过网络接收数据然后进行解码和显示本论文的工作主要涉及解码部分同时也对网络传输及编码算法部分进行了较为详细的研究督卜口视频捕获视频压缩视频解码远程监控端显示 j 墨j l h 2 6 4 视频通信系统框图谈到与视频通信相关的编码标准人们自然会想到h 2 6 1 和h 2 6 3 这两个目前广泛使用的国际比准目前常见的视频通信终端设备大都基于h2 6 3 h 2 6 1 标准而本论文所涉及的h 2 6 4 是继h 2 6 3 之后的下一代编码标准其编码效率要明显高于现有的编码标准当然编码效率的提高是以增加系统的复杂性为代价的a 软件仿真的结果表明 h 2 6 4 的复杂程度也明显高于现有的视频编码国际标准随着对h 2 6 4 算法研究不断深入芯片运算速度日新月异 h 2 6 4 的一些特性使其在通信数字电视及互联网中应用将越来越广泛本项目的另外项重要的研究内容就是研究过h 2 6 4 的d s p 优化算法使其能在通用的d s p 运行并实现北京邮电大掌硕士掌位论文 h 2 6 4 视频编码算法研究及码算法的软件实现 bh 2 6 4 视频编码标准随着社会的不断发展视听领域里发生了一系列巨大的变化会议电视 v c d 数字电视以及高清晰度电视 h d t v 等新技术和新系统正迅速走进我们的生活与传统的模拟电视相比这些新系统的突出特点是采用了全数字的图像声音处理技术随着这些数字电视系统的曰益成熟和不断发展针对不同的应用领域一系列相应的数字视频音频编码标准也迅速地被制定并不断得到完善其中包括应用于会议电视及可视电话的i 2 6 1 h 2 6 3 用于静止图像压缩的 p e g 用于 v c d 的m p e g l 和用于广播电视 d v d 以及h d t v 的m p e g 2 这些标准的制定使各个不同设备制造厂商所生产的各种数字视频设备可以相互配合使用组成各种不同的视频应用系统由i t u t 的视频编码专家组 v i d e oc o d i n ge x p e r t sg r o u p v c e g 和i s o i e c 的m p e g m o t i o np i c t u r ee x p e r t sg r o u p 专家组联合制定出的视频编码新标准h 2 6 4 将极大地降低发送视频图像所需要的带宽并对诸如数字卫星广播数字视频存储以及互联网传播等一系列技术进行改进以提高视频质量新标准h 2 6 4 有以下五个特性更高的编码效率与h 2 6 3 v 2 h 2 6 3 十或m p e g 一4 相比在相同的编码质量条件下 h 2 6 4 最多可以节省5 0 的比特率更好的图像质量 h 2 6 4 在各种比特率条件下都可以提供满意的图像质量更强的时延适应性 h 2 6 4 可以在低时延模式下工作以适应实时通信应用如会议电视等也可以在高时延模式下工作以取得最佳的压缩效果例如视频图像的存储基于服务器的视频流应用等更强的容错能力 h2 6 4 提供了相应的工具来处理包交换网络中的丢包和易于产生误码的无线信道中的误码问题更好的网络适应能力在h 2 6 4 中视频编码层 v i d e oc o d i n g l a v e r v c l 和网络提取层 n e t w o r k a d a p t i n g l a y e r n a l 是彼此分离的这样压缩后的视频内容可以在不同类型的网络上传输也使图像内容的打包和优先级控制更加容易上述特点使得h i2 6 4 将成为通信数字电视及互联网视频应用首选的标准目前已有某些厂家用硬件来实现h 2 6 4 算法取得很好的效果北京邮电大掌硕士掌位论文 h 2 6 4 视频编码算法研究及码算法的软件实现 c 本论文的研究内容本论文详细介绍了h 2 6 4 视频编码技术描述了i t 2 6 4 基于r t p 打包过程简单介绍了h 2 6 4 编码规范并开发基于p c 机上的解码终端本论文安排如下 1 第一章从总体上介绍了视频编码技术包括视频编码领域基本的数据压缩算法和国际上视频编码标准的发展然后再介绍了多媒体传输协议 2 第二章详细介绍h 2 6 4 视频编码技术分析h 2 6 4 视频编码技术的特点 3 第三章介绍实时多媒体传输协议r t p 和r t c p 并描述基于h 2 6 4 标准的 r t p 打包 4 第四章介绍对h 2 6 4 编码规范并介绍了解码端程序实现 j 第五章总结了h 2 6 4 编码技术并展望了未来视频技术的发展北京邮电大学硕士掌位论文h 2 6 4 见频编码算法研究及码算法的软件实兰第一章视频编码技术与多媒体传输协议 1 1 基本的数据压缩方法视频图像在时间上和空间上都包含许多冗余信息对视频图像压缩的基本方法和思想主要概括为两点在空间方向上图像数据采用静态图像的压缩算法来去掉冗余信息在时间方向上图像数据压缩采用运动补偿 m t i o nc o m p e n s a t i o n 算法来去掉冗余信息数据压缩可以分为两种类型无损压缩和有损压缩无损压缩是指压缩后的数据在进行解压缩后与压缩前的数据完全一致没有任何信息损失无损压缩的方法是构筑在香农的信息理论基础之上的根据信号的统计特性进行编码有损压缩是指压缩后的数据重构后与原始数据有所不同但不会影响人们对原始资料所要表达的信息的理解在多媒体压缩技术中往往先对多媒体数据采用有损压缩算法进行处理然后再对处理过的数据进行无损压缩目前广泛运用于视频编码技术的压缩算法主要有三种统计编码预测编码和变换编码这三种编码方法在上个世纪8 0 年代已经非常成熟现在广泛应用在各种图像视频编码标准中下面分别介绍这三种方法的编码思想统计编码主要针对无记忆信源根据信息码字出现概率的分布特征而进行压缩编码寻找概率与码字长度间的最优匹配常用的统计编码有游程编码哈夫曼编码和算术编码三种统计编码不会引入误差因此也称为无损压缩编码预测编码根据数据的统计特性得到预测值然后传输图像像素与其预测值的差值信号使传输的码率降低达到压缩的目的预测编码方法简单经济编码效率较高变换编码利用数字图像像素间存在高度相关性进行某种变换来消除这种相关性以上列举出的一些经典编码技术可以称为第一代视频编码技术这些编码技术都是非常优秀的纹理编码它们能够在中等压缩率的情况下提供非常好的图像质量但在非常低的位率情况下无法为一般的序列提供令人满意的质量八十年代第一代编码技术已经达到了顶峰这类技术去除客观和视觉冗余信息的能力已接近极限究其原因是由于这些技术都没有利用图像的结构特点北京邮电大掌硕士掌位论文 h 2 6 4 视频编码算法研究及码算法的软件实现因此它们也就只能以像素或块作为编码的列象另外这些技术在设计编码器时也没有考虑人类视觉系统的特性为了克服第一代视频编码技术的局限性发展中的第二代编码技术不局限于信息论的框架并且充分利用人的视觉生理心理和图像信源的各种特征实现从波形编码到模型编码的转变以便获得更高压缩比第二代编码方法主要有基于分形的编码基于模型的编码基于区域分割的编码和基于神经网络的编码等分形编码是适于自相似性较强的自然景物图像例如海岸线云彩大树等基于模型或知识的编码方法是指在编码端通过各种分析手段提取所建模型的特征与状态参数而在解码端则依据这些参数通过模型及相关知识生成所被建模的信源这类方法把计算机视觉和计算机图形学中的方法应用到视频编码中基于区域分割与合并的视频编码方法是根据图像的空域特征将图像分成纹理和轮廓两部分然后分别对它们进行编码该方法一般可分为三步来完成即预处理编码和滤波预处理将图像分割成纹理和轮廓两部分选取分割方法是关键它直接影响图像编码的效果分割之后图像成为一系列相连的小区域对纹理可采用预测编码和变换编码对轮廓则采用链码方法进行编码这种方法较好地保存了对人眼十分重要的边缘轮廓信息因此在压缩比很高时解码图像质量仍然很好神经网络法是模仿人脑处理问题的方法通过各种人工神经元网络模型对数据进行非线性压缩人工神经网络是一个非线性动态网络工作过程一般分训练和工作两个阶段训练阶段就是使用一些训练图像和训练算法调整网络的权重使重建图像的误差最小目前直接用于图像压缩编码的神经网络主要有反向误差传播型和自组织映射型第二代编码方法充分利用了计算机图形学计算机视觉人工智能与模式识别等相关学科的研究成果为视频压缩编码开拓出了广阔的前景但是由于第二代编码方法增加了分析的难度所以大大增加了实现的复杂性从当前发展情况来看第二代编码方法仍处于深入研究的阶段例如分形法由于图像分割迭代函数系统代码的获得是非常困难的因而实现起来时间长算法非常复杂模型法则仅限于人头肩像等基本的视频上进一步的发展有赖于新的数学方法和其它相关学科的发展神经网络的工作机理至今仍不清楚所以在视频编码中的应用研究进展缓慢目前多与其他方法结合使用但由于巨大压缩性能的潜力人们都在致力于这些新方法的研究之中近年来还出现了一类充分利用人类视觉特性的多分辨率编码方法如子带编码和基于小波变换的编码这类方法使用不同类型的一维或二维线性数字滤波器对视频进行整体的分解然后根据人类视觉特性对不同频段的数据进行北京邮电大掌硕士掌位论文 h 2 6 4 视频编码算法研究及码算法的软件实现粗细不同的量化处理以达到更好的压缩效果这类方法原理上仍属于线性处理属下波形编码可归入经典编码方法但它们又充分利用了人类视觉系统的特性因此可以被看作是第一代编码技术向第二代编码技术过渡的桥梁c 1 2 视频编码标准的发展因为视频业务的数据量大可压缩的冗余信息多而且是判别多媒体服务质量好坏的主要因素视频编码技术是多媒体应用的核心视频的编码技术将是今后多媒体视频通信中的核心技术之一图像编码理论和数字技术的逐渐成熟促进了视频通信的发展学术和应用领域都致力于视频技术的研究并且制定了一系列国际标准在视频应用中编码方法的选择不但要考虑到压缩比信噪比还要考虑到算法的复杂性太复杂的编码算法可能会产生较高的压缩比但也会带来较大的计算开销软件实现时会影响通信的实时性目前在众多视频编码算法中影响最大并被广泛应用的是i s o i e c 的m p e g 系列和i t u t 的h 2 6 x 系列标准如 i t u th 2 6 1 h 2 6 3 和i s o i e c 的m p e g 一1 和m p e g 2 等这些标准覆盖了很大的视频速率范围和应用领域支持不同速率不同的图像质量要求等条件的视频业务能够满足包括电视会议视频电子邮件可视电话广播级视频应用等不同要求的服务随着视频应用需求的不断发展视频压缩技术也有了很大的提高新出现的压缩标准有了更高的压缩效率在相同的图像质量下需要更低的传送码率或在相同的传输速率提供质量更好的图像同时支持不同的传输速率以适应不同的传送网络下面分别介绍相关的图像编码标准 2 2 1j p e g 在1 9 8 6 年 i s o 与c c i t t 联合成立联合图片专家组f j o i m p h o t o g r a p h i c e x p e r t sg r o u p j p e g 研究制定静止图像数字压缩编码标准 d i g i t a l c o m p r e s s i o n a n dc o d i n go f c o n t i n u o u s t o n es t i l li m a g e s 19 8 7 年11 月 i e c 也参加合作因此 j p e g 是三者联合的结果经过多次国际会议讨论和修改后于1 9 9 1 年3 月提交j p e g 建议草案 1 9 9 2 年7 月通过正式标准 j p e g 用于连续变化的静止图象包括灰度等级和颜色两方面的连续变化 j p e g 有两种操作模式一是以d c t 为基础的有损压缩方法二是以熵编码为技术的无损压缩方法随着通信技术尤其是移动通信图像压缩技术和集成电路技术的发展个人视频通信正成为现实个人视频通信的显著特点是交互性和极低的通信码 6 北京邮电大掌硕士学位论文 h 2 6 4 视频编码算法研究及码算法的软件实现率极低码率通常指编码后的码率低于6 4 k b s 因此极低码率数字视频压缩编码是国际上的研究热点 h 2 6 3 和m p e 0 4 是这方面的两个比较成功的标准但是这两个标准还不能完全满足在有限的带宽中传输高质量的图像序列目前图像专家正致力于有更高压缩特性的编码标准一h 2 6 4 2 2 2m p e g 系翻运动图像专家组 m o v i n g p i c t u r e e x p e r t sg r o u p m p e g 原来是 j s o i e c j t c l s c 2 9 下面的第1 1 工作组w g l l 成立于1 9 8 8 年任务是研究开发活动图像及其声音的数字编码国际标准 m p e g 从开始的1 5 家单位发展到现在的1 0 0 多家单位参加 i s o m p e g 在1 9 9 1 年1 1 月提交了 s o 1 7 2 标准用于数字存储媒体的码率为15 m b i t s 的活动图像及其声音编码 c o d i n go f m o v i n g p i c t l l r e s a n da s s o c i a t e da u d o f o rd i g i t a ls t o r e m e d i a a t u p l 0 1 5 m b w s 建议草案即通常所说的m y e g 1 该标准于1 9 9 2 年1 1 月通过 1 9 9 3 年8 月公布在影视和多媒体计算机领域中得到了广泛应用 m p e g 1 标准主要是为了视频存贮媒体如v c d 而制定该标准能够适应变码流的处理其主要目的是在l 1 5 m b i t s 的情况下提供3 0 帧c i f 3 5 2 2 8 8 1 v h s 的质量的图像 m p e g 1 的实时编码通常需要硬件才能完成解码可以用软件来完成 m p e g 1 不能提供分级图像编码也不能在丢包率高的情况下应用 1 9 9 2 年7 月m p e g 开始制定m p e g 2 而在此之前 i t u t 也成立了一个 a t m 环境下图像编码的专家组由此开始了j t c l 和i t u t 的合作 m p e g 2 是m p e g 制定的第二个国际标准 m p e g 2 标准扩展了b l p e o 1 标准能够支持高分辨率图像和声音目标码率是在3 1 5 m t i s 传输速率条件下提供广播级的图像而且能够提供信嗓比 s n r 时间和空i 刨三种分级编码该标准应用于卫星广播时在当前的一个模拟信道中不牺牲质量的情况下能提供5 路数字的编码节目 m p e g 4 是i s o m p e g1 9 9 1 年5 月提出并于1 9 9 3 年7 月得到确认其目标是极低码率的音频视频压缩编码它支持用于通信访问和数字视听数据处理的新方法特别是基于内容的考虑到低损耗高性能技术提供的机会和面临迅速扩展的多媒体数据库的挑战 m p e g 4 将提供灵活的框架和开放的工具集这些工具将支持一些新型的和常规的功能 m p e g 4 支持逐行扫描和隔行扫描是基于视频对象的编码标准通过对象识别提供了空间的可伸缩性 m p e g 4 标准是今后一段时间压缩标准的主流 m p e g 4 标准既能够支持码率低于6 4 k b i t s 的视频应用也能够支持广播级的视频应用与其他压缩标准相比 m p e g 4 标准北京邮电大学硕士掌位论文 h 2 6 4 视频编码算法研究及码算法的软件实现在d c t 的基础上引入了图像模型的概念从而具有更高的压缩效率 m p e g 4 的工作集中于发展m s d l m p e g 4s y n t a c t i cd e s c r i p t i o nl m l g u a g e n 言 m s d l 和 j a v a 的思想一样能够通过下载功能模块部分建立新编解码器 m p e g 一7 1 9 9 6 2 0 0 0 是多媒体内容描述接口与前述标准集中在音频视频内容的编码和表示不同它集中在对多媒体内容的描述 h 2 6 i 与h 2 6 3 标准主要面向于低码率的视频应用如可视电话和会议电视 h 2 6 1 足最早出现的视频编码标准它的输出码率是6 4 k b w s 的倍数 h 2 6 1 视频压缩编码是图像压缩编码领域4 0 年研究成果的结晶是第一个在国际上产生广泛影响的视频压缩编码标准随后的m p e g 系列标准中的视频压缩编码算法无论从原理和基本框图来看都是以h 2 6 1 为基础的是对h 2 6 1 的重要发展和改进 h 2 6 1 主要是为了1 s d n 的会议电视和可视电话的应用它采用的算法结合了可减少时间冗余的帧问预测和可减少空间冗余的d c t 变换的混合编码方法和i s d n 信道相匹配其输出码率是p x 6 4 k b w s p 取值较d h q 只能传清晰度不太高的图像适合于面对面的电视电话 p 取值较大时如d 6 可以传输清晰度较好的会议电视图像其基本算法与m p e g 标准类似但h 2 6 1 所需要的计算量能够显著下降这种算法通过均衡图像质量和运动来优化带宽所以对于快速运动的图像图像重建质量会下降 h 2 6 1 的输出速率是恒定的而图像质量非恒定 h 2 6 3 是i 丁u 关于码率低于6 4 k b s 的窄带信道视频编码建议它是在h 2 6 1 建议的基础上发展起来的其帧频为每秒l o 帧以上图像分辨率为1 7 6 象素 1 4 4 行 q c i f 格式或者1 2 8 象素 9 6 行 s q c i f 格式 h 2 6 3 是为了支持低速率的通信而制定的标准但同时希望码流能够适应较大的动态范围而不仅限于低码率能够取代h 2 6 1 h 2 6 3 的容错能力很强能适应误码率高的信道 h 2 6 1 和h 2 6 3 的主要区别在于 h 2 6 3 在运动估计时采用了半像素精度 h 2 6 1 是整像素精度同时h 2 6 3 还增加了四个选项搜索范围不受限的运动估计 u n r e s t r i c t e d m o t i o n v e c t o r s 算术编码 s y n t a x b a s e da r i t h m e t i cc o d i n g 高级预测 a d v a n c e d p r e d i c t i o n 类似于m p e g 的前向和后向预测帧 p b 帧 h 2 6 3v e r s i o n 2 或称h 2 6 3 是在h 2 6 3 的基础上以增加编码的可选项的形式改进的在语法上与h 2 6 3 兼容但编码效率有很大提高适用范围也更大其主要的应用方向仍是低码流的视频业务用于p s t n 以及无线接入的高误码比的通信环境因此在h 2 6 3 e 既增加了一些改进编码效率的方法同时也提高了抗误码性能的能力由于实现成本较低 h 2 6 3 标准已经越来越多地被采用北京邮电大掌硕士掌位论文h 2 6 4 视频编码算法研究及码算法的软件实现 h2 6 3 已经由1 t u t 正式制定为标准并且在h 2 6 3 的基础上增加了三个选项主要是为了增强码流在恶劣信道上的抗误码性能同时也是为了增强编码效率这三个选项分别为选项u a n n e x u 1 一个增强型的参考选择 e r p s 能够提供增强的编码效率和信道错误再生能力实现e r p s 模式时需要设计多缓冲区用于存贮多参考帧图像选项v a n n e xv 一个数据分片的模式 d p s 能够提供增强型的抗误码能力特别是在传输过程中本地数据被破坏 d p s 的思想是通过分离视频码流中d c t 系数和运动矢量数据将运动矢量的数据采用可逆编码的方式进行保护选项w a n n e x w 在h 2 6 3 的码流中增加的补充信息保证增强型的反向兼容性附加信息包括指示采用的定点i d c t 图像信息和信息类型任意的二进制数据文本任意的版权标题视频描述统一的资源识别重复的图像头当前的前帧可靠参考时问的下一帧不可靠参考时间的下一帧交替的场上或下场指示稀疏的参考帧识别在m p e g 4 规格星新增了动画压缩率约为以往方式两倍的新方式 m p e g 4 a d v a n c e dv i d e oc o d e c a v c 2 0 0 2 年1 2 月9 日 1 3 日期间在日本香川县淡路岛举行的m p e g m o v i n g p i c t u r ee x p e r t sg r o u p 聚会上已确定了相关技术规格在规范书定稿以后会在2 0 0 3 年3 月1 7 日被确定为国际标准规范 i s a v c 为过去被称作 m p e g 一4v i s u a lp a r t1 0 规格采用了近似d c t 离散余弦变换的整数运算来替代迄今为止在m p e g 1 2 4 中所采用的d c t 因此它与以往的 m p e g 一4 编码播放设备不兼容标准化将由m p e g 的上级组织i s o i e c 和i t u 共同成立的小组 j v t 负责进行 a v c 也被称作 i t u t h 2 6 4 据称该压缩标准能够在i n t e m e t 上通过使用比其他同类标准少得多的网络资源传播d v d 品质的媒体内容而且h 2 6 4 使得在卫星或是有限电缆上每信道能传送4 路高清节目其运行费用比基于m p e g 一2 系统低得多这对于有线电视投资者无疑具有巨大的吸引力由于h 2 6 4 编码比现有的编码算法的压缩比高1 倍这将使其在移动通信领域也占有一席之地在下一章我们将详细介绍h 2 6 4 算法标准 1 3 新的视频传输技术本小节主要介绍与视频实时传输有关的新技术流媒体技术多媒体同步技术自适应的视频传输技术和无线视频传输技术流媒体技术北京邮电大掌硕士掌位论文 h 2 6 4 视频编码算法研究及码算法的软件实现流媒体技术是指把连续的影像和声音信息经过压缩处理后允许浏览者一边观看收听边下载的技术目前在流媒体领域中竞争的公司主要有三个 m i c l o s o f l r e a ln e t w o r k s 和a p p l e 公司而相应的代表产品是w i n d o w s m e d i a r e a l s y s t e n l 和q u i c k t i m e 流媒体技术是网络音视频技术发展到一定阶段的产物是一种解决多媒体网络带宽问题的软技术涉及流媒体数据的采集压缩存储传输和网络通信等多项技术多媒体同步技术多媒体同步技术是多媒体系统中涉及到的多媒体表现质量的关键技术多媒体同步分为媒体内同步和媒体间同步其中媒体间同步技术尤其实视频和音频的同步是各个研究机构研究的重点国内外对多媒体同步的研究主要集中在两方面同步时间模型的研究和网络环境下的终端同步处理时间模型是同步时间关系的形式化描述其研究工作大多基于p e t r i 网及其扩展进行自适应视频传输技术自适应视频传输技术可以使视频编码器输出的码流根据网络当时传输的情况自动调节带宽高时编码器可以提高输出码率提高图像质量带宽低时可以适当减少输出码率以避免过度的丢包使接收端难以恢复编码图像使图像出现马赛克等恶劣效果自适应视频传输技术的代表是微软亚洲研究院网络多媒体小组推出的s m a r t s c a l a b l em e d i aa d a p t a t i o na n dr o b u s tt r a n s p o r t 视频编码技术 s m a r t 视频编码技术提供了一个嵌入式的可伸缩性的码流码流可以在一个非常宽的带宽范围内进行自适应的调整 s m a r t 编码技术主要研究自扩展的高效的鲁棒的音视频描述它将作为下代面向不同种类且动态变化的有线无线信道或网络以及多样化的用户设备的媒体在线播放和视频会议的基础该技术不仅追求高效的压缩性能而且致力于提供普遍适用的可扩展性能空域扩展时域扩展以及码率扩展错误恢复能力和鲁棒性其中的关键技术已经被m p e g 一4 标准所采纳无线视频传输技术无线通信近几年的飞速发展使移动视频通信变得越来越现实移动视频通信要解决的不仅是传输带宽问题还要解决在不可靠传输信道下如何提高视频传输的抗误码性能微软亚洲研究院已将机构进行了调整确定了新一代无线网络技术这一新的研究方向并将其定义为研究院未来工作中的一个研究重点北京邮电大掌硕士掌位论文h 2 6 4 视频编码算法研究及码算法的软件实现第二章h 2 6 4 视频编码标准随着社会的信息化人们对图像业务的需求越来越大同时对视频图像的质量也提出更高的要求宽带通信网的急速发展尤其是移动通信网络的同新月异大大的促进了视频通信的大面积应用 3 g 发展的主要目的就是让移动网不仅能支持语音业务更主要的用途是承载视频业务同时随着电子技术的飞跃发展媒体处理器的计算能力也正以成倍的速度增长为终端设备支持高质量的视频提供了可能在这种情况下发展一种高编码性能和高抗误码性能的视频编码技术己成为趋势 h 2 6 4 是继h 2 6 3 和m p e g 4 的下一代视频编码标准在体系上也是m p e g 4 的第十部分 h 2 6 4 是继h 2 6 3 之后的下一代视频压缩编码新标准早在 9 9 7 年 i t u t 的视频编码专家组 v i d e oc o d i n ge x p e l sg r o u p v c e g 就己经开始了h 2 6 4 的前身 l 2 6 4 的研究工作后来i s o i e c 的活动图像专家组 m o t i o n p i c t u r ee x p e l s g r o u p m p e g 看到h 2 6 4 的良好发展也加入进来与v c e g 一起成立了联合视频组 j o i n tv i d e ot e a m 丁v t 共同致力于h 2 6 4 建议也即m p e g 4 第1 0 部分高级视频编码算法的开发工作进行h 2 6 4 视频压缩算法研究的主要目的是采用目前广泛采用的视频压缩算法的系统结构开发出一种高效的视频压缩标准 h 2 6 4 采用返回基本的思想去开发高性能的视频编码标准即采用现有的基本算法和结构通过精心优化计算流程和方法来取得更好视频编码性能与现有的h 2 6 1 h 2 6 3 标准相比 h 2 6 4 保持了编码器的系统结构不变如图2 1 主要包括四个步骤 1 把一帧图像划分为小块 m a c r ob l o c k 及b l o c k 每个小块包含很多像素点把对整幅图像的编码分成对许多小块的处理 2 通过对图像块的变换量化和熵编码或变长编码消除图像中的空间冗余 3 由于相邻的各帧图像存在很大的相似性即时间冗余所以我们只需要将相邻帧图像间的变化进行编码传送即可这是通过运动搜索和运动补偿实现的对每一个编码块通过搜索上一编码帧或之前的几帧的相应位置来找到一个运动向量这一向量将和帧间差值起传送用于这图像块的编解码 4 残余编码对于原始块和相应的预测块之间的差值进行变换量化和熵编码以去除当前帧剩下的空间冗余北京邮电大掌硕士掌位论文h 2 6 4 视频编码算法研究及码算法的软件实现图2 1 镉解码结构图但是与以前的编码算法h2 6 3 相比 h 2 6 4 加入了一些新的特性以提高编码效率这些特征如下对于进行帧内编码的图像不是直接对原始图像进行变换量化和编码而是首先采用多种不同的预测方法对图像进行预测然后对差值进行上述处理以取得更佳的编码效率在运动搜索和运动补偿方面 h 2 6 4 采用了从4 4 到1 6 1 6 共1 3 种搜索块进行运动搜索以提高匹配程度采用1 4 像素精度进行搜索以提高搜索精度另外根据对编码延时的不同要求 h 2 6 4 还可以对之前的多个已编码帧进行运动搜索以达到最佳的效果在变换编码方面 l 2 6 4 采用了4 x 4 的整数变换 i c t 代替d c t 变换整数变换的效果接近d c t 但是运算量要少而且在反变换过程中不会由于计算精度问题丽引入误差在熵编码过程中 h 2 6 4 使用单一的变长编码 u v l c 和基于内容的上下文变长编码 c a v l c 进行编码虽然h 2 6 4 仍然采用了类似于h 2 6 3 的总体结构但的确增加了一些新的特性来提高系统的性能下面我们将详细介绍h 2 6 4 编码标准 2 1 h 2 6 4 编码标准结构下图2 2 为h 2 6 4 编码器的语法结构图下文将根据此结构框图对算法进行详细描述北京邮电大掌硕士掌位论文h 2 6 4 视频编码算法研究及码算法的软件实现 2 2 图像编码类型图2 2 编码流程图 o m t r 盲l o o p h 2 6 4 除了支持传统的图像片外 h 2 6 4 还支持新的码流间可转换图片称为s w i t c h i n gp s p 和s w i t c h i n g i s 1 码流中包含了s p 和s i 片之后解码器能在有类似内容但码率不同致间快速切换并同时支持随机访问和快速回放模北京m e 电大学硕士掌位论文竺竺竺竺兰兰竺兰兰竺兰兰竺兰竺兰式从而最大限度的利用现有资源而不出现因缺少参考帧引起的解码错误这样 h2 6 4 编码共有以f 八种类型当前图像采用帧内预测编码 i n t r ap r e d i c t 进行压缩不进行运动补偿和运动搜索当前图像采用帧间编码 i n t e rp r e d i c t 而且参考帧是经过编码的前一帧图像当前图像采用帧间编码 i n t e rp r e d i c t 而且参考帧是经过编码的前一帧或多帧图像在这种模式下对每个宏块 m b 除了运动矢量和残余编码后的系数外还要传送参考帧的信息当前图像采用帧内编码 i n t e rp r e d i c t 参考帧是当前图像的前一帧及后一帧图像即b 帧当前图像采用帧内编码 i n t e rp r e d i c t 但参考帧是当前图像之前多帧及之后的多帧图像即b 帧 s p s w i t c h i n g p 图像参考帧是经过编码的前一帧图像 s p 图像参考帧是经过编码的前一帧或多帧图像在这种模式下对每个宏块 m b 除了运动矢量和残余编码后的系数外还要传送参考帧的信息 s i s w i t c h i n gi 图像 2 3 宏块编码类型如前所述编码器首先将一幅完整图像分为多个宏块 m b 然后对这些

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（信号与信息处理专业论文）h264视频编码算法研究及解码算法的软件实现.pdf

文档简介

温馨提示

最新文档

评论

（信号与信息处理专业论文）h264视频编码算法研究及解码算法的软件实现.pdf

文档简介

温馨提示

最新文档

评论

相关文档