第八章变换编码.ppt

上传人：奇*** IP属地：河北上传时间：2020-03-08 格式：PPT 页数：45 大小：1.37MB 积分：12 举报 版权申诉

已阅读5页，还剩40页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第八章变换编码第一节基本原理第二节离散正交变换第三节静止图像的变换编码第四节MDCT 变换编码有何意义本章之前我们一直认为冗余度是数据固有的但实际上有时却与不同的表示方法有很大关系预测编码希望通过对信源建模来尽可能精确地预测源数据而本章则考虑将原始数据变换到另一个更为紧凑的表示空间得到比预测编码更高的数据压缩引言 1 变换编码的基本思想变换编码 TransformCoding 的基本思想是将在通常的欧几里德几何空间空间域描写的图像信号映射变换到另外的向量空间变换域进行描写然后再根据图像在变换域中系数的特点和人眼的视觉特性进行编码第一节基本原理图像分解减少变换的计算复杂度图像变换解除每个子图像内部像素之间的相关性或者说将尽可能多的信息集中到尽可能少的变换系数上压缩不是在变换中而是在量化变换系数时及编码时取得的第一节基本原理 2 正交变换的几何意义考虑两个相邻数据样本x1与x2的联合事件第一节基本原理用图6 2的二维 2D 平面坐标表示其中x1与x2轴分别表示相邻两样本可能的幅度等级由于信号变化缓慢 x1与x2同时出现相近幅度等级的可能性较大故图6 2阴影区内45 斜线 x2 x1 附近的联合事件出现的概率也就较大不妨将此阴影区之边界称为相关圈信源的相关性越强相关圈就越加扁长 x1与x2呈现出水涨船高的紧密关联特性此时欲编码圈内各点的位置就要对两个差不多大的坐标值分别进行编码信源的相关性越弱此相关圈就越加方圆说明x1处于某一幅度等级时 x2可能出现在不相同的任意幅度等级上第一节基本原理现在若对该数据进行正交变换从几何上相当于把图6 2所示的 x1 x2 坐标系旋转45 变换成 y1 y2 坐标系那么此时该相关圈正好处在y1上的投影就越大而在y2上的投影则越小因而从 y2坐标来看任凭y1在较大范围内变换而y2却巍然不动或仅仅微动这就意味着变量y1和y2之间的联系在统计上更加互相独立第一节基本原理因此通过这种坐标系的旋转变换就能得到一组去掉大部分甚至全部统计相关性的另一种输出样本而且样本方差也将重新分布在原坐标系中两相邻样本常具有相同的方差但在新坐标系中却有表明样本能量向y1轴相对地集中了虽然样本的方差总和并未因坐标旋转而变即保持变换后各坐标轴上方差的不均匀分布为数据压缩编码创造了条件以上几何解释可推广到一串n个数据点或一块m n个像素的子图像将该数据串或数据块看成n维或m n维空间中的一个点则此时的正交变换从几何上看不过是n维或m n维坐标系的一个旋转正交变换实现数据压缩的物理本质经过多维坐标系中适当的旋转和变换能够把散布在各个坐标轴上的原始数据在新的适当的坐标系中集中到少数坐标轴上因此可能用较少的编码位数来表示一组信号样本实现高效率的压缩编码第一节基本原理第二节离散正交变换 1 正交变换的定义如果是由N个信号样本构成的列向量有时就称X为矢量信号是一个的矩阵则定义了X的一个线性变换 A也称为此变换的和矩阵而变换结果也是一个N维的矢量信号称作X的像 6 2 2 变换前的信号变换后的信号如果线性变换保持N维矢量X的模不变则称为正交变换此时 A便为正交矩阵构成正交矩阵的冲要条件为 I为单位矩阵因此有即正交矩阵的转置即为其逆矩阵这不仅保证了正交矩阵A的逆矩阵A 1一定存在而且无需求解同时A 1还具有与A相同的元素这就使硬件处理设备大为简化式 6 2 3 还保证了式 6 2 2 的X和Y一一对应因而能够用反变换得到唯一确定的原始信号第二节离散正交变换 6 2 3 2 正交变换的性质 1 能量守恒性可以证明空间域中的数据平方和和变换域中的数据的平方和存在能量守恒关系即第二节离散正交变换 2 熵保持性如果把f x y 看作是一个具有一定熵值的随机函数那么变换系数F u v 的熵值和原来图像信号f x y 的熵值相等 3 去相关性 Decorrelation 当输入的数据高度相关时变换后趋向于不相关 4 能量集中性 EnergyCompaction 大部分正交变换趋向将数据的大部分能量集中到相对少数几个系数上由于整个能量守恒因此这意味着许多变换系数只含有很少的能量第二节离散正交变换第二节离散正交变换 3 KL变换第二节离散正交变换以矢量信号 X 的协方差矩阵的归一化正交特征向量 qi 所构成的正交矩阵 Q 对该矢量信号所作的正交变换 Y QX 称作Karhunen Loeve变换或特征向量变换简称KL变换或KLT 由上述定义为实现KTL首先要知道再根据此求出Q 第二节离散正交变换解由求特征值令按次序可解出例6 4 若已知随机信号X的协方差矩阵求正交矩阵Q 第二节离散正交变换求特征向量将代入 6 2 6a 有解这3个方程组 1 由得即 2 由得即 3 由得即第二节离散正交变换得到归一化正交矩阵代入式 6 2 5 验证正好是以作为主对角元素的对角矩阵其中待定实常数可由归一化正交条件即式 6 2 6b 解得第二节离散正交变换 KL变换的性质 KLT使矢量信号的各个分量互不相关即变换域信号的协方差矩阵为对角线型 KLT是在均方误差准则下失真最小的一种变换故又称最佳变换对第二条性质的解释说明这个问题是从数据压缩提出的因为经正交变换后矢量信号Y的分量个数并未减少若要压缩数据必须删去能量较小的一些分量这就带来失真设只保留m m N 个分量则解码时也只能恢复m个分量若删去的N m个信号分量的均值为0 则可以证明 KLT可使恢复信号的均方误差最小且这个最小值等于变换域内矢量信号被删除的最小的 N m 个方差之和相当于Y的协方差矩阵最小N m个对角元之和即这就给编解码器的设计带来了方便而且也便于失真和码率的控制第二节离散正交变换第二节离散正交变换 4 离散余弦变换 1 一维DCT变换第二节离散正交变换 2 二维DCT变换一个N N像块f x y x y 0 1 N 1 的二维DCT定义为第二节离散正交变换 DCT编码和解码过程 DCT变换 DCT逆变换原图像除以量化系数取整 1 编码过程 2 解码过程压缩图像乘以量化系数取整压缩图像解压图像 DCT编码中对图像带来失真的主要原因如下舍去高频系数而使图像产生模糊对某些系数采用粗量化而产生颗粒状结构像块的划分使相邻像块人为地造成亮度不连续即块效应 1 变换矩阵的选择正交变换的性质能量守恒性其对于数据压缩的指导意义在于只有当空间域信号能量全部转换到某个变换域后有限个空间取样值才能完全由有限个变换系数对于基矢量的加权来恢复熵保持性正交变换本身并不丢失信息因此可以用传送变换系数来达到传输信息的目的去相关性正交变换有可能使相关的空间域转变为不相关的变换域使存在于相关性之中的数据冗余度得以去除能量重新分配与集中这是正交变换最重要的优点也是利用它能实现数据压缩的物理本质此性质DPCM并不具备这条规律指导我们有可能利用此先验知识在质量允许的情况下舍弃一些能量较小者从而使数据率有较大的压缩第三节静止图像的变换编码第三节静止图像的变换编码如果图像信号为马尔可夫模型则典型正交变换的大致性能比较如下正交变换能量集中性能从好到差的顺序正交变换运算量从小到大的排序综合考虑图像压缩选DCT为变换矩阵性能较好变换类型选定后为实现方便起见实用中的子图像及二维变换矩阵常选的方阵而变换矩阵阶数M的选取原则一般有两条若M小便于自适应计算速度快实现简单但方块效应严重若M大去相关效果好但渐趋饱和从概念上 M越大计入的相关数据样本越多有利于改善性能但当数据块足够大后若再加大M 则新加入的样本与中心附近的样本之间相关性甚小对数据压缩的好处不明显而计算复杂性将迅速增加对于图像编码现在最常用的子图像块大小为根据选定或指定的变换矩阵A及其阶数即图像的分块尺寸完成正变换后则整个编码器的实现过程上要就是选择变换域系数并对选中的系数按一定的准则与编码 2 系数选择与量化 1 系数选择在变换域中选择哪些系数进行量化编码略去哪些系数不予传输接收端直接补零对变换法压缩编码的性能有很大影响原则上应该保留能量集中的方差大的系数系数选择实际上是在变换域的二次取样通常有以下两种方法区域编码阈值编码第三节静止图像的变换编码区域编码只对规定区域内的变换系数进行量化编码略去区域外的系数区域的形状和大小取决于图像预滤波器的频率响应所需压缩比的大小所选用的变换方法和变换块的大小区域编码的关键选出能量相对集中的区域以便保留大部分图像能量使得恢复图像的质量劣化不那么显著从统计意义上变换系数的能量多半集中于低频系数所以编码区域总取在低频端第三节静止图像的变换编码区域编码的缺点有时大能量的系数也会出现在其他区域舍掉它们会造成图像质量较大的损失如边缘模糊因为舍掉的多是高频系数总体效果呈现一种平滑了的感觉区域编码的优点编码简单对区域内的编码位数可预先分配从而使变换块的码率为定值有利于限制误码扩散为了扬长避短可预先设几个区域再根据实际系数的分布自动选取能量最大者并将区域类别额外编码通知接收端第三节静止图像的变换编码阈值编码不限定编码区域而是对整个变换块事先设定一个门限若某系数方差或幅度绝对值超过该阈值就保留下来进行编码传输否则舍弃优点有一定的自适应能力可以得到较区域编码更好的图像质量缺点图像中超过阈值的有效系数是随机的需要同时对它们的位置信息进行编码较区域编码复杂需要一定的技巧否则得不偿失第三节静止图像的变换编码 2 系数量化和比特分配标量量化分组量化矢量量化第三节静止图像的变换编码几个系数量化的例子先编码后对编码系数量化如前所述对图像进行变换编码时常选用8 8或16 16的方阵即对大小为8 8或16 16的子图像进行编码第三节静止图像的变换编码例6 5 JPEG H 261 263和MPEG 1 2等国际标准均选择了的二维DCT 则由式 6 2 14a 和 6 2 17a 可直接写出此时的二维DCT正反变换 2D FDCT和2D IDCT 为量化例1用于帧间编码即对预测误差进行量化例6 6 H 261建议对每一分块的64个2D FDCT系数用同一均匀量化器量化即图5 13中的 Q 得到量化后的DCT系数c k l 公式如下其中INT表示取整 S为该系数原来的符号 S 0表示正值 S 1表示负值 q为量化阶量化步长可用来控制图像的压缩比和重建质量反量化即图5 13中的则为显然一般量化过程引入了不可逆的信息压缩量化例2 用于帧内编码对图像的变换矩阵进行量化第三节静止图像的变换编码例6 7 JPEG标准用具有64个独立量化阶Q k l 的量化分层表亦称量化矩阵来分别规定对DCT域中64个系数的量化精度使得某个系数X k l 的具体量化阶取决于人眼对该频率分量的视觉敏感性理论上对不同的彩色坐标系空间分辨率数据精度及应用场合应该有不同的量化表所以 JPEG并未统一规定一张标准表只是对亮度和色度的水平样本数为2 1 各样本均为8位的源图像格式及按式 6 3 3a 定义的2D FDCT归一化算法建议分别采用图6 5和6 6的量化表可取得良好的主观视觉效果若表中各量化阶再除以2 则重建图像的主观质量往往与源图像不可区分因此 JPEG算法也可通过调整一个公共的比例因子类似于H 261的q 来缩放对各系数的量化阶量化过程就是简单地将变换系数除以相应的量化阶后四舍五入取整数即第三节静止图像的变换编码第三节静止图像的变换编码例题MPEG 2的视频编码标准给出的均匀量化公式则为其中qp即为由码率控制和自适应量化所给出的公共控制因子关键是MPEG 1和MPEG 2的量化加权矩阵Q既可用于帧内编码也可用于帧间编码 MPEG规定编码器可根据图像序列的特性来选择Q 并通过标题信息通知解码器加权矩阵的选择意味着可根据变化系数的重要性分配编码位数图6 7给出了MPEG推荐的帧内和帧间默认量化权矩阵可见对于帧间编码默认上式等价于H 261的式 6 3 5a 表明MPEG量化器实际上综合了H 261量化器和JPEG量化器又由图5 13可以看出帧间编码是对MC预测误差图像进行2D FDCT的其系数与主观视觉之间的关系相对较弱且更为复杂故对帧间编码的64个系数均用同一个常数加权亦在情理之中第三节静止图像的变换编码 a 帧内量化矩阵 b 帧间量化矩阵图6 7MPEG默认的量化权矩阵 3 顺序编码与渐进编码问题什么是顺序编码什么是渐进编码为什么要进行渐进编码首先与活动图像相比人眼更易于观察到静止图像中的细节因此要求所传输的图像具有更高的清晰度这就增加了传输时间比如对通常是逐行扫描顺序传输的图像信号在普通电话信道中也往往需要几秒甚至几十秒才能自上而下自左而右地逐步传完整幅图像因此如果能由粗到细逐渐浮现全图就有助于消除收看者的焦急等待而且他还可以在对中间结果的图像清晰度感到满意的时候终止这幅图像的传输这不仅可能节约信道时间和费用而且这种通信方式也更加灵活友好对于上网查阅图像库的内容时非常有用第三节静止图像的变换编码能够达到由粗到细逐渐浮现全图这种画面建立要求的编码方法叫做渐进建立而通常的按顺序一次建立满足最终分辨率和清晰度要求的画面的编码方法称为顺序建立 JPEG标准支持这两种图像建立模式适用于各种分辨率和格式的连续色调图像在压缩模式选择上 JPEG标准可采用以下4种操作模式基于DCT的顺序型操作模式基于DCT的渐进型操作模式基于DPCM的无损编码顺

人人文库> 全部分类> 行业资料 > 管理策划

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第八章变换编码.ppt

文档简介

温馨提示

最新文档

评论

第八章 变换编码.ppt

文档简介

温馨提示

最新文档

评论

相关文档

第八章变换编码.ppt