新一代视频压缩编码标准H264学习心得.docx_第1页
新一代视频压缩编码标准H264学习心得.docx_第2页
新一代视频压缩编码标准H264学习心得.docx_第3页
新一代视频压缩编码标准H264学习心得.docx_第4页
新一代视频压缩编码标准H264学习心得.docx_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章和第二章 绪论和数字视频1.一个是压缩比2. 保持主观质量和客观质量信噪比(S/N)视频压缩可能性的依据:1.预测编码 ,根据帧内相关性和帧间的相关性,即找到相应的参考像素或参考帧作为预测值,已达到视频压缩编码。2. 变换编码,视频信号在能量上包含着的大部分都是直流和低频部分(图像的平坦部分),少量的高频部分(图像细节)。用数学变换后得到2维矢量空间,其中大部分的直流和低频是相同的,可以不必用码去表示,结果完成压缩编码视频压缩技术基本结构按照信源模型可将视频编码区分为基于波形的编码和基于内容的编码,信源模型采用“一副图像由许多像素构成”, 视频编码是基于波形的编码,其采用把预测编码和变换编码组合起来的基于块的混合编码把一副图像分割成块8x8(像素) 或者16x16,然后进行压缩处理信源模型采用“一个分量有几个物体构成”, 视频编码是基于内容的编码块的编码方式在边界时会有高的预测误差和失真。MPEG-4采用的编码方式就是既基于块的混合编码,也采用基于内容的编码方法低于15帧的视频质量不高,一般要25要30 ,可视频电话会议可取15-20帧每秒。数字视频数值电视的优势。数值电视的PCM原理:取样,就是在时间轴上连续变化的模拟信号变为离散量的过程。量化 取样后得到的脉冲信号在时间上是离散的,但是在赋值上空间上仍然是连续的,比如可以取3.56,3.7812344等等,我们采用四舍五入将其变为有限个值。这种将信号幅值由连续量变为离散量的过程称为量化。由于四舍五入参数的失真称为“量化噪音”。PCM编码 对于量化后的信号,通常用二进制表示,这时的编码称为脉冲编码调制-即PCM编码。上述取样,量化,PCM编码都由A/D转换器完成,反之则由D/A转换器完成。数字电视信号:时间取样隔行扫描帧图像由 顶场 底场 组成 一帧由一个顶场和底场组成,帧和场的邻近行相关性并不相同:帧的空间相关性强,时间相关性弱;场的时间相关性强,空间相关性弱静态图像,运动量小的图像用帧编码 ,运动量多的用场编码实际中要 帧/场编码相结合空间取样在同一电视信号帧中,同一行由若干取样点构成,这些取样点 称为像素,这些取样属于空间取样 。前提:一帧图像是静止的,每个像素处于同一时间不同空间上。不同国家间标准电视格式不同(即扫描格式),为了不同国家点的视频通信,往往采用一个中间格式(CLF)彩色空间 RGB YCbCr(YUY)彩色电视取样格式4:2:0数字电视信号的编码参数:量化值Qp(量化节距)一般取8位 即8位bit表示一个取样值 8位取样即有258个灰度级;取样频率;视频信号的预处理 色彩差值以Bayer图像 阵列举例:为降低成本,简化工艺,图像传感器一个像素点只能给出单色的色调值,不能同时给出G,R,B的值,所以要根据周围的点的相关性来获得。红色/蓝色点处的像素绿色分量插值等于其相邻的四个像素点的绿色分量平均值。例如,G8 = (G3+G7+G9+G13) / 4。在绿色点处的红色/蓝色分量的插值这分两种情况:一种情况是如果存在相邻的两个像素的红色/蓝色分量,就取红色/绿色分量的均值,例如B7=(B6+B8)/2,R7= (R2+R12)/2。另一个情况是周围没有相邻的红色/蓝色分量,就取对象线方形的四角像素点处红色/蓝色分量的均值,R8=(R2+R4+R12+R14)/4,B12=(B6+B8+B16+B18)/4。色彩校正伽马校正光强度I和显示器加载电压P ywei 伽马值是非线性的 需要伽马校正 使其变为线性的图像增强图像增强作为一种重要的图像处理技术,目的无非就是两个:第一更适合人眼的感觉;第二有利于后续的分析处理。图像增强主要包括直方图均衡、平滑滤波、中值滤波、锐化等内容。一般情况下,图像增强既可以在空间域实现,也可以在频域内实现 对于消除相关性的理解,相关性就是说明有些值并不是它实际的值,只是根据相关性,由周围的值计算出来的,这里面是包含误差的 ,所以相关性也说明了有误差。平滑滤波图像的能量主要集中在其低频部分,噪声所在的频段主要在高频段,同时图像中的细节信息也主要集中在其高频部分,因此,如何去掉高频干扰又同时保持细节信息是关键。在空域法中,图像平滑的常用方法是采用均值滤波或中值滤波,对于均值滤波,它是用一个有奇数点的滑动窗口在图像上滑动,将窗口中心点对应的图像像素点的灰度值用窗口内的各个点的灰度值的平均值代替,如果滑动窗口规定了在取均值过程中窗口各个像素点所占的权重,也就是各个像素点的系数,这时候就称为加权均值滤波;对于中值滤波,对应的像素点的灰度值用窗口内的中间值代替。图像蜕化使图像的边缘变得更加鲜明经过平滑的图像变得模糊的根本原因是因为图像受到了平均或积分造成的,因此可以对其进行逆运算(如微分运算)就可以使图像变的清晰。从频率域来考虑,图像模糊的实质是因为其高频分量被衰减,因此可以用高通滤波器来使图像清晰。图像锐化的技术有两种方法:微分法和高通滤波法。图形直方图它描述了一幅图像的灰度级内容,从 数学上来说图像直方图是图像各灰度值统计特性与图像灰度值的函数白平衡图像传感器没有这种人眼的适应性, 在不同的光线下,由于图像传感器输出的不平衡性,造成其输出的彩色失真:或者图像偏蓝,或者偏红,理解白平衡,涉及到另一个重要的概念:色温。所谓色温,简而言之,就是定量地以开尔文温度表示色彩。色温越高,蓝色成分就越多;色温越低,红色成分就越多第三章 熵编码 就是利用信源的统计特性进行码率压缩的编码;有变长编码和算数编码:变长编码又称哈弗曼编码(也称最佳编码):原理是 对出现概率大的符号分配短字长的二进制码,对出现概率小的符号分配长字节码。第四章 视频编码标准简介H261 各个国家的彩色格式 (PAL和NTSC) H261采用中间格式CIF采用CIF格式,视频信号 采用CIF及QCIF格式时,视频信号的结构采用下图所示的图像、块组(GOB,groupof block)、宏块(MB,macroblock)、块(B,block)四级结构。每帧CIF图像由2个GOB组成,每个GOB由33个MB组成,每个MB由4个亮度块和1个Cr块及1个Cb块组成,每个块(B)又由88像素构成。一帧QCIF图像由3个GOB组成。视频信源编码器将视频信号编码压缩,主要采用混合编码方法;视频复合编码器将每帧图像数据编排成四层结构,并通过熵编码对视频数据进行进一步压缩输出;传输缓冲器和码率控制器用于保证输出码流尽量稳定;传输编码器用于视频数据的误码检测和纠正。H263 有5种图像格式 H264视频信源编码框和H261相同,不同的是H264输入有多种格式,输出为H263码流MPEG-1 标准的功能:(1) 视频压缩编码,压缩后码率在1.5Mbps,可用于视频传输和视频存储;编码前必须将视频图像转换成逐行扫描图像。(2)录像机的正放、图像冻结快进、快退和慢放功能以及随机存储功能。MPEG-1 的图像类型和编码结构:MPEG-1定义了3种图像类型:I,P,B图像,I 图像即帧内(Intra)图像,采用帧内编码,不参考其它图像,但可作为其它类型图像的参考帧。P图像即预测(Predicted)图像,采用帧间编码,参考前一幅I或P图像,用作运动补偿。B图像即双向预测(Bi- predicted)图像,参考前后两个方向图像。双向预测编码解决了“暴露”问题, 让图像能更柔和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论