




已阅读5页,还剩101页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多媒体数据压缩技术 什么是数据压缩 数据压缩就是在一定的精度损失条件下 以最少的数码表示信源所发出的信号 分钟数字音频信号需要的存储空间 1 分钟数字视频信号需要的存储空间 1 压缩编码技术基础 多媒体数据压缩的必要性多媒体信息是海量信息 彩色电视信号信息量100Mb S 图象 声音多媒体海量信息的数据存储 处理 传输是软 硬件技术难题数据压缩的可行性信息论观点 信源数据是信息量 信源熵 和信息冗余量之和信息冗余 空间冗余 时间冗余 结构冗余 知识冗余 视觉冗余等数据压缩通过减少冗余量而尽可能保留信源信息量压缩编码方法分类冗余度压缩 无损压缩 信息保持编码或熵编码 可逆运算信息量压缩 有损压缩 失真度编码或熵压缩编码 不可逆 允许失真 空间冗余 一幅图像表面上各采样点的颜色之间往往存在着空间连贯性 基于离散像素采样来表示物体表面颜色的像素存储方式可利用空间连贯性 达到减少数据量的目的 例如 在静态图像中有一块表面颜色均匀的区域 在此区域中所有点的光强和色彩以及饱和度都是相同的 因此数据有很大的空间冗余 时间冗余 运动图像一般为位于一时间轴区间的一组连续画面 其中的相邻帧往往包含相同的背景和移动物体 只不过移动物体所在的空间位置略有不同 所以后一帧的数据与前一帧的数据有许多共同的地方 这种共同性是由于相邻帧记录了相邻时刻的同一场景画面 所以称为时间冗余 同理 语音数据中也存在着时间冗余 视觉冗余 人类的视觉系统对图像场的敏感度是非均匀的 但是 在记录原始的图像数据时 通常假定视觉系统近似线性的和均匀的 对视觉敏感和不敏感的部分同等对待 从而产生比理想编码 即把视觉敏感和不敏感的部分区分开来的编码 更多的数据 这就是视觉冗余 时间域压缩 迅速传输媒体信源频率域压缩 并行开通更多业务空间域压缩 降低存储费用能量域压缩 降低发射功率 数据压缩的好处 压缩编码的衡量指标 压缩比要大恢复后的失真小压缩算法要简单 速度快压缩能否用硬件实现 经典数据压缩理论 信息论中的信源编码理论解决的主要问题 1 数据压缩的理论极限 2 数据压缩的基本途径 信源 信源被抽象为一个随机变量序列 随机过程 如果信源输出的随机变量取值于某一连续区间 就叫做连续信源 比如语音信号X t 如果信源输出的随机变量取值于某一离散符号集合 就叫做离散信源 比如平面图像X x y 和电报 信源 X1 X2 X3 X4 离散信源 如果随机序列中各个变量具有相同的概率分布 则称为离散平稳信源 如果离散平稳信源的输出序列中各个变量是相互独立的 即前一个符号的出现不影响以后任何一个符号出现的概率 则称为离散无记忆平稳信源 否则称为离散有记忆平稳信源 信源 X1 X2 X3 X4 a1 a2 a3 am 信息量和熵 信息量的度量 信源S熵的定义 信源熵举例一幅用256级灰度表示的图象 每个像素点灰度的概率均等 编码每个像素需8位40个像素组成的灰度图象 灰度为5级 ABCDE 出现每个灰度的像素个数不同 为 15 7 7 6 5 该图象的熵为H s 2 196 40个像素需40 2 196 87 84位 信息量和熵 仙农信息论把一个事件 字符a1 所携带的信息量定义为 I a1 log2 1 p log2p bit 其中p为事件发生 字符出现 的概率I a1 即随机变量X取值为a1时所携带的信息量因为X的信息量也是一个随机变量 所以我们要研究它的统计特性 其数学期望为 称H X 为一阶信息熵或者简称为熵 Entropy 熵 Entropy 在符号出现之前 熵表示符号集中的符号出现的平均不确定性 在符号出现之后 熵代表接收一个符号所获得的平均信息量 根据直觉 信源编码的数据输出速率 平均码长 与信源熵之间应该有某种对应关系 信源的概率分布与熵的关系 熵的大小与信源的概率模型有着密切的关系 最大离散熵定理 当与信源对应的字符集中的各个字符为等概率分布时 熵具有极大值log2m m为字符集中字符个数 二进制信源的熵 二进制信源输出一个二进制数码所携带的平均信息量最大为1bit 最大离散熵定理的应用 对于同一个信源其总的信息量是不变的 如果能够通过某种变换 编码 使信源尽量等概率分布 则每个输出符号所独立携带的信息量增大 那么传送相同信息量所需要的序列长度就越短 离散无记忆信源的冗余度隐含在信源符号的非等概率分布之中 只要H X 小于log2m 就存在数据压缩的可能 编码 信源 X1 X2 X3 X4 a1 a2 a3 am 信源 X1 X2 X3 X4 b1 b2 b3 bn 0 1 平均码长与熵 如果对字符aj的编码长度为Lj 则X的平均码长为 根据前面对二进制信源的分析 有 在Lj log2pj时 平均码长取得极小值H X 关于离散无记忆平稳信源的结论 一阶熵即为离散无记忆平稳信源的压缩极限 基本极限 只要信源不是等概率分布 就存在着数据压缩的可能性 数据压缩的基本途径之一 使各字符的编码长度尽量等于字符的信息量 联合熵与条件熵 设随机变量X和Y分别取值于符号表 a1 a2 am 和 b1 b2 b3 bn 定义X与Y的联合熵为 定义X关于Y的条件熵为 离散有记忆信源的冗余 联合熵与其可能达到的最大值之间的差值反映了该有记忆信源所含的冗余度 这种冗余是由于随机变量序列之间的相关性造成的 关于离散有记忆平稳信源的结论 离散有记忆平稳信源的压缩极限为 压缩的基本途径之二 尽量去除各分量之间的相关性 再对各分量进行独立编码 压缩的基本途径之三 可利用条件概率进行编码 阶越高越有利 压缩的基本途径之四 可将多个分量合并成向量 利用其联合概率进行编码 联合的分量越多越有利 多媒体数据压缩编码分类 无损压缩香农 范诺编码哈夫曼编码算术编码 前三个为统计编码 RLE编码 行程编码 增量调制编码词典编码 有损压缩预测编码 DPCM 运动补偿等面向频率域方法 正交变换 DCT 子带编码等面向空间域方法 统计分块编码等基于重要性方法 滤波 子采样 比特分配 矢量量化等模型方法 分形编码 模型基编码等 混合压缩编码JBIG JPEG MPEG H 261等技术标准 熵编码 熵编码包括香农 范诺编码 霍夫曼编码和算术编码 其宗旨在于找到一种编码使得平均码长到达熵极限 基本思想就是对出现概率较大的符号取较短的码长 而对出现概率较小的符号取较大的码长 无损压缩编码算法 香农 范诺编码与哈夫曼编码哈夫曼编码 根据统计频率生成Huffman树 然后编码前缀码 编解码简单实际使用时 对文件进行两遍扫描 第一遍统计频率 第二遍编码压缩比不高对错误敏感 没有错误保护功能 形成错误传播 霍夫曼编码 具体步骤 1 初始化 2 合并概率最小的两个事件 3 排序 4 如果事件个数大于2则重复 2 和 3 5 赋值 6 编码 霍夫曼编码举例 H X 1 75L1 2L2 1 75 霍夫曼编码的局限性 利用霍夫曼编码 每个符号的编码长度只能为整数 所以如果源符号集的概率分布不是2负n次方的形式 则无法达到熵极限 输入符号数受限于可实现的码表尺寸译码复杂需要实现知道输入符号集的概率分布没有错误保护功能 香农 范诺编码 香农 范诺编码与Huffman编码相反 采用从上到下的方法 具体步骤为 1 首先将编码字符集中的字符按照出现频度和概率进行排序 2 用递归的方法分成两部分 使两个部分的概率和接近于相等 直至不可再分 即每一个叶子对应一个字符 3 编码 香农 范诺编码举例 0 1 0 1 0 0 1 1 无损压缩编码算法 算术编码消息用0到1之间的实数进行编码两个参数 符号的概率和它的编码间隔信源符号的概率决定压缩编码的效率 也决定编码过程中信源符号的间隔对错误敏感 容易形成错误传播 算术编码 Huffman编码的局限性 Huffman编码使用整数个二进制位对符号进行编码 这种方法在许多情况下无法得到最优的压缩效果 假设某个字符的出现概率为80 该字符事实上只需要 log2 0 8 0 322位编码 但Huffman编码一定会为其分配一位0或一位1的编码 可以想象 整个信息的80 在压缩后都几乎相当于理想长度的3倍左右 算术编码 基本思想 算术编码不是将单个信源符号映射成一个码字 而是把真个信源表示为实数线上的0到1之间的一个区间 其长度等于该序列的概率 再在该区间内选择一个代表性的小数 转化为二进制作为实际的编码输出 消息序列中的每个元素都要用来缩短这个区间 消息序列中元素越多 所得到的区间就越小 当区间变小时 就需要更多的数位来表示这个区间 采用算术编码每个符号的平均编码长度可以为小数 算术编码举例 一 算术编码举例 二 最后的子区间起始位置 85 256 0 01010101子区间长度 27 256 0 00011011子区间尾 7 16 0 0111取编码区间中的一个值 最后编码为 011 信源分布 算术编码的具体实现 因为实际只能用有限长的寄存器 这就要求将已编码的高位码字及时输出 但又不能输出过早 以免后续运算还要调整已输出的码位 请看参考书上给出的算法 算术编码每次递推都要做乘法 所以效率比较低 二进制算术编码是一种实用的编码算法 用移位代替了乘法 使效率大大提高 自适应算术编码可以在编码过程中根据符号出现的频繁程度动态的修改分布概率 这样可以避免在编码之前必须精确求出信源概率的难题 自适应算术编码举例 输入序列为 bcc 行程编码 RLE 行程编码 Run LengthEncoding 它通过将信源中相同符号序列转换成一个计数字段再加上一个重复字符标志实现压缩 例如 RTTTTTTTTABBCDG被转换为 R 8TABBCDG 其中 作为转义字符 表明其后所跟的字符表示长度 行程编码多用于黑白二值图像的压缩中 例如00000000111111111111000001111111被转化为一系列黑串和白串长度的编码 81257 因为串长度并非等概率分布 所以一般要配合以统计编码 Huffman编码 无损压缩编码算法 RLE行程编码一系列重复值有一个单独值和计数值代替当一行中有连续n n 63 个相同像素时 第一个字节最高两位为11 低位为n 第二个字节为重复像素值当一个像素与后续不同时 如果像素高位为11 则仍用两个字节表示 但重复个数为1 即第一个为11000001 第二为像素值当一个像素与后续不同且高位不为11时 直接存储该像素压缩比取决于图象的连续性 无损压缩编码算法 词典编码通用数据流压缩方法编码前不需要构造码表 它从一个简单的表开始随着工作进展构建一个更有效的码表用简单代码替换比较复杂的字串 并用一个转换表记录这些替换关系转换表通过动态生成 且压缩完毕后 无须记录该转换表 词典编码 词典编码主要利用数据本身包含许多重复的字符串的特性 例如 吃葡萄不吐葡萄皮 不吃葡萄倒吐葡萄皮 我们如果用一些简单的代号代替这些字符串 就可以实现压缩 实际上就是利用了信源符号之间的相关性 字符串与代号的对应表就是词典 实用的词典编码算法的核心就是如何动态地形成词典 以及如何选择输出格式以减小冗余 第一类词典编码 第一类词典法的想法是企图查找正在压缩的字符序列是否在以前输入的数据中出现过 然后用已经出现过的字符串替代重复的部分 它的输出仅仅是指向早期出现过的字符串的 指针 LZ77算法 LZ77算法在某种意义上又可以称为 滑动窗口压缩 该算法将一个虚拟的 可以跟随压缩进程滑动的窗口作为词典 要压缩的字符串如果在该窗口中出现 则输出其出现位置和长度 使用固定大小窗口进行词语匹配 而不是在所有已经编码的信息中匹配 是因为匹配算法的时间消耗往往很多 必须限制词典的大小才能保证算法的效率 随着压缩的进程滑动词典窗口 使其中总包含最近编码过的信息 是因为对大多数信息而言 要编码的字符串往往在最近的上下文中更容易找到匹配串 LZ77编码的基本流程 1 从当前压缩位置开始 考察未编码的数据 并试图在滑动窗口中找出最长的匹配字符串 如果找到 则进行步骤2 否则进行步骤3 2 输出三元符号组 off len c 其中off为窗口中匹配字符串相对窗口边界的偏移 len为可匹配的长度 c为下一个字符 即不匹配的第一个字符 然后将窗口向后滑动len 1个字符 继续步骤1 3 输出三元符号组 0 0 c 其中c为当前字符 然后将窗口向后滑动1个字符 继续步骤1 LZ77算法 LZ77编码举例 LZSS算法 LZ77通过输出真实字符解决了在窗口中出现没有匹配串的问题 但这个解决方案包含有冗余信息 冗余信息表现在两个方面 一是空指针 二是编码器可能输出额外的字符 这种字符是指可能包含在下一个匹配串中的字符 LZSS算法的思想是如果匹配串的长度比指针本身的长度长就输出指针 匹配串长度大于等于MIN LENGTH 否则就输出真实字符 另外要输出额外的标志位区分是指针还是字符 LZSS编码的基本流程 1 从当前压缩位置开始 考察未编码的字符 并试图在滑动窗口中找出最长的匹配字符串 如果匹配串长度len大于等于最小匹配串长度 len MIN LENGTH 则进行步骤2 否则进行步骤3 2 输出指针二元组 off len 其中off为窗口中匹配字符串相对窗口边界的偏移 len为匹配串的长度 然后将窗口向后滑动len个字符 继续步骤1 3 输出当前字符c 然后将窗口向后滑动1个字符 继续步骤1 LZSS编码举例 输入数据流 编码过程MIN LEN 2 LZSS算法 在相同的计算机环境下 LZSS算法比LZ77可获得比较高的压缩比 而译码同样简单 这也就是为什么这种算法成为开发新算法的基础 许多后来开发的文档压缩程序都使用了LZSS的思想 例如 PKZip GZip ARJ LHArc和ZOO等等 其差别仅仅是指针的长短和窗口的大小等有所不同 LZSS同样可以和熵编码联合使用 例如ARJ就与霍夫曼编码联用 而PKZip则与Shannon Fano联用 它的后续版本也采用霍夫曼编码 第二类词典编码 第二类算法的想法是企图从输入的数据中创建一个 短语词典 dictionaryofthephrases 这种短语可以是任意字符的组合 编码数据过程中当遇到已经在词典中出现的 短语 时 编码器就输出这个词典中的短语的 索引号 而不是短语本身 LZ78算法 LZ78的编码思想是不断地从字符流中提取新的字符串 String 通俗地理解为新 词条 然后用 代号 也就是码字 Codeword 表示这个 词条 这样一来 对字符流的编码就变成了用码字 Codeword 去替换字符流 Charstream 生成码字流 Codestream 从而达到压缩数据的目的 LZ78编码器的输出是码字 字符 W C 对 每次输出一对到码字流中 与码字W相对应的字符串 String 用字符C进行扩展生成新的字符串 String 然后添加到词典中 LZ78编码算法 步骤1 将词典和当前前缀P都初始化为空 步骤2 当前字符C 字符流中的下一个字符 步骤3 判断P C是否在词典中 1 如果 是 则用C扩展P 即让P P C 返回到步骤2 2 如果 否 则输出与当前前缀P相对应的码字W和当前字符C 即 W C 将P C添加到词典中 令P 空值 并返回到步骤2 LZ78编码举例 输入数据流 编码过程 LZW算法 J Ziv和A Lempel在1978年首次发表了介绍第二类词典编码算法的文章 在他们的研究基础上 TerryA Welch在1984年发表了改进这种编码算法的文章 因此把这种编码方法称为LZW Lempel ZivWalch 压缩编码 在编码原理上 LZW与LZ78相比有如下差别 LZW只输出代表词典中的字符串 String 的码字 codeword 这就意味在开始时词典不能是空的 它必须包含可能在字符流出现中的所有单个字符 即在编码匹配时 至少可以在词典中找到长度为1的匹配串 LZW编码是围绕称为词典的转换表来完成的 LZW算法的词典 LZW编码器 软件编码器或硬件编码器 就是通过管理这个词典完成输入与输出之间的转换 LZW编码器的输入是字符流 Charstream 字符流可以是用8位ASCII字符组成的字符串 而输出是用n位 例如12位 表示的码字流 Codestream 码字代表单个字符或多个字符组成的字符串 String LZW编码算法 步骤1 将词典初始化为包含所有可能的单字符 当前前缀P初始化为空 步骤2 当前字符C 字符流中的下一个字符 步骤3 判断P C是否在词典中 1 如果 是 则用C扩展P 即让P P C 返回到步骤2 2 如果 否 则输出与当前前缀P相对应的码字W 将P C添加到词典中 令P C 并返回到步骤2 LZW编码举例 输入数据流 编码过程 LZW算法 LZW算法得到普遍采用 它的速度比使用LZ77算法的速度快 因为它不需要执行那么多的缀 符串比较操作 对LZW算法进一步的改进是增加可变的码字长度 以及在词典中删除老的缀 符串 在GIF图像格式和UNIX的压缩程序中已经采用了这些改进措施之后的LZW算法 LZW算法取得了专利 专利权的所有者是美国的一个大型计算机公司 Unisys 优利系统公司 除了商业软件生产公司之外 可以免费使用LZW算法 预测编码 基本原理根据某种模型 利用以前的一个或多个样本值 对当前的样本进行预测对当前样本实际值和预测值之差进行编码若模型选取足够好 图象或声音样本时间相关性很强 压缩比高特点算法简单 速度快 易于硬件实现编码压缩比不太高误码易于扩散 抗干扰性差 预测编码 预测编码是数据压缩理论的一个重要分支 它根据离散信号之间存在一定相关性的特点 利用前面的一个或多个信号对下一个信号进行预测 然后对实际值和预测值的差 预测误差 进行编码 如果预测比较准确 那么误差信号就会很小 就可以用较少的码位进行编码 以达到数据压缩的目的 第n个符号Xn的熵满足 所以参与预测的符号越多 预测就越准确 该信源的不确定性就越小 数码率就可以降低 预测编码 分类线性预测编码和非线性预测编码帧内预测编码和帧间预测编码 量化器 编码器 预测器 解码器 预测器 信道 输入XN 输出XN 发送端 接收端 eNXN eN XN eN XN DPCM是有损型还是无损型关键看对预测误差ek如何编码 预测方程式 线性预测 如果ai是常数 则为时不变线性预测 否则为自适应线性预测 ADPCM 最简单的预测方程 最佳线性预测 使误差函数达到最小值的预测方程式叫做最佳线性预测 求最佳线性预测的各个参数ai 列方程组 代入 得到联立方程组 如果为一阶线性预测 则可求得 图像信号的预测编码 一副数字图像可以看成一个空间点阵 图像信号不仅在水平方向是相关的 在垂直方向也是相关的 根据已知样值与待预测样值间的位置关系 可以分为 1 一维预测 行内预测 利用同一行上相邻的样值进行预测 2 二维预测 帧内预测 利用同一行和前面几行的数据进行预测 3 三维预测 帧间预测 利用相邻几帧 或不同波段 上的取样值进行预测 静止图像的二维预测编码 这种压缩算法被应用到JPEG标准的无损压缩模式之中 中等复杂程度的图像压缩比可达到2 1 c a b x d 三邻域预测法 活动图像的帧间预测编码 视频信号的冗余度主要体现在空间相关性 帧内 时间相关性 帧间 和色度空间表示上的相关性 对于每秒25帧 30 的电视信号 其相继帧之间存在极强的相关性 据统计256级灰度的黑白图像序列 帧间差值超过3的象素数不超过4 所以在活动图像序列中可以利用前面的帧来预测后面的帧 以实现数据压缩 帧间预测编码技术被广泛应用到H 261 H 263 MPEG 1和MPEG 2等视频压缩标准之中 具有运动补偿的帧间预测 活动图像序列中的一个画面可以大致划分为3个区域 1 背景区 相邻两个画面的背景区基本相同 2 运动物体区 可以视为由前一个画面的某一区域的像素平移而成 位移矢量 3 暴露区 指物体运动后而显露出来的曾被遮盖的背景区域 运动补偿预测就是将前一个画面的背景区 平移后的运动物体区作为后一个画面的预测值 运动补偿帧间预测编码 运动补偿帧间预测从原理上包括如下几个基本步骤 1 图像分割 把图像划分为静止的背景和若干运动的物体 各个物体可能有不同的位移 但构成同一物体的所有像素的位移相同 2 运动矢量估值 考察前后两个画面 利用运动估值算法得到每个物体的位移矢量 3 运动补偿 用运动矢量补偿物体的运动效果再进行预测 4 编码 除了对实测值与预测值之间的差值进行编码传送外 还要传送位移矢量以及区域分割信息 运动补偿帧间预测编码 编码器 运动补偿 图像输入 运动矢量输出 译码器 帧缓存 运动估值 预测误差输出 变换编码 预测编码希望通过对信源建模来尽可能的预测源数据 而变换编码则考虑将原始数据变换到另一个表示空间 使数据在新的空间上尽可能相互独立 而能量更集中 X Y X Y 变换编码 基本思路先将空间域图象通过某种正交变换 获得一系列变换系数在变换过程中 使图象变换系数能量相对集中再对其变换系数进行区域量化 按其所含能量大小 分配不同数据量分类傅立叶变换 哈尔变换 沃尔西 哈达玛变换 斜变换等 图象 分块变换 区域采样 量化编码 图象再现 反变换 填零 译码 存储或传输 混合编码技术与国际标准 JPEG编码标准H 261标准简介MPEG标准概述MPEG 1标准MPEG 2标准MPEG 4标准 算法概要 JPEG JointPhotographicExpertsGroup 是一个由ISO和CCITT两个组织机构联合组成的一个图像专家小组 负责制定静态的数字图像数据压缩编码标准 这个专家组开发的算法称为JPEG算法 并且成为国际上通用的标准 JPEG是一个适用范围很广的静态图像数据压缩标准 既可用于灰度图像又可用于彩色图像 JPEG不仅适于静止图像的压缩 电视图像的帧内图像的压缩编码 也常采用此算法 JPEG标准还可以大范围地调节图像压缩率及其保真度 标准主要采用了两种基本的压缩算法 一种是采用以离散余弦变换 DCT 为基础的有损压缩算法 另一种是采用以预测技术为基础的DPCM无损压缩算法 JPEG编码标准 JPEG编码标准 基于DPCM的无损编码模式 压缩比可以达到2 1 基于DCT的有损顺序编码模式 压缩比可以达到10 1以上 基于DCT的递增编码模式基于DCT的分层编码模式 JPEG规定了4种运行模式 以满足不同需要 JPEG有损顺序编码算法的主要计算步骤如下 1 将源图像分成几个颜色平面 分量图像 2 分成8 8数据块进行正向离散余弦变换 FDCT 2 量化 quantization 3 Z字形排列量化结果 zigzagscan 4 使用差分脉冲编码调制 differentialpulsecodemodulation DPCM 对直流系数 DC 进行编码 5 使用行程长度编码 run lengthencoding RLE 对交流系数 AC 进行编码 6 熵编码 entropycoding JPEG编码标准 JPEG编码标准 译码或者叫做解压缩的过程与压缩编码过程正好相反 IDCT JPEG编码标准 正向离散余弦变换 对每个单独的彩色图像分量 把整个分量图像分成8 8的图像块 如图所示 并作为两维离散余弦变换DCT的输入 通过DCT变换 把能量集中在少数几个系数上 DCT变换使用下式计算 逆变换使用下式计算 JPEG编码标准 量化 对于有损压缩算法 JPEG算法使用如图所示的均匀量化器进行量化 量化步距是按照系数所在的位置和每种颜色分量的色调值来确定 JPEG编码标准 量化 因为人眼对亮度信号比对色差信号更敏感 因此使用了两种量化表 亮度量化值和色差量化值 此外 由于人眼对低频分量的图像比对高频分量的图像更敏感 因此图中的左上角的量化步距要比右下角的量化步距小 JPEG编码标准 DC系数DPCM编码和AC系数Z形排列之后采用RLE编码 JPEG编码标准 熵编码 使用熵编码还可以对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩 JPEG标准规定了两种熵编码算法 哈夫曼编码和自适应算术编码 哈夫曼编码采用的一般是固定的哈夫曼编码表 而不是临时统计出来的 并且对亮度分量和色度分量采用了不同的哈夫曼表 JPEG编码标准 基于DPCM的无损编码模式 主要采用了三邻域二维预测编码和熵编码 无失真编码器 源图像数据 压缩的图像数据 预测器 熵编码器 表说明 DPCM预测编码框图 JPEG编码标准 JPEG编码标准 基于DCT的递增编码模式 此模式与顺序模式编码步骤基本一致 不同之处在于递增模式每个图像分量的编码要经过多次扫描才完成 第一次扫描只进行一次粗糙的压缩 然后根据此数据先重建一幅质量低的图像 以后的扫描再作较细的扫描 使重建图像质量不断提高 直到满意为止 递增模式分为两种 1 按频段累进 2 按位累进 JPEG编码标准 基于DCT的分层编码模式 1 降低原始图像的空间分辨率 2 对已经降低分辨率的图像按照顺序编码模式进行压缩并存储或传输 3 对低分辨率图像进行解码 然后用插值法提高图像的分辨率 4 将分辨率已经升高的图像作为原图像的预测值 并把它与原图像的差值进行基于DCT的编码 5 重复步骤3 4直到图像达到完整的分辨率 H 261概述 H 261也称P 64 这是ITU T 前身为CCITT 最早制定的关于视频编码的国际标准 考虑到ISDN的传输码率以64kbps为单位 因此以p 64kbps p 1 30 作为为H 261的标准码率 H 261标准主要用于电视电话和电视会议 它支持QCIF p 1 2 CIF p 2 两种图像输入格式 H 261解决的问题 第一是编码算法问题 确立了一种合理的 保证图像质量且为各国图像编码专家所公认的统一的算法 算法必须能够实时操作 解码延时要短 第二是与PCM标准兼容的问题 编解码器以64 1920kb s的工作速率去覆盖N ISDN或PCM一次群的通道 第三 解决电视制式不同的问题 为了使同一标准既能用于PAL 625 和NTSC 525 两种电视制式系统 源编码基于中间格式CIF格式 所以输入输必须经转换到CIF或QCIF格式再进行源编码 视频编码图像格式一览表 H 261的信源编码算法 信源编码算法的一般形式如下图所示 主要由帧间预测 帧内分块和量化组成 H 261的信源编码算法 一 将预测误差或输入图像划分成为8 8的象素块 进一步 将4个亮度像块和两个在空间位置上与之重叠的色差像块符合成一个16 16的宏块 MB 二 对于帧序列中的第一副图像或景物变换后的第一副图像 采用帧内变换编码 利用8 8的DCT实现 各DCT系数经过线性量化 变长编码后进入缓冲器 根据缓冲器的上溢和下溢 来反馈调节量化器的量化步长 以控制视频编码位流使之与信倒速率相匹配 H 261的信源编码算法 帧间预测采用混合方法 利用运动补偿预测 当预测误差超过某个门限后 对误差做DCT 视觉加权量化及熵编码 运动矢量信息编码后也送到缓冲器中 DCT去除空间冗余度 而使用有运动补偿的帧间预测来去除时间上的冗余 这是一个典型的帧内 帧间自适应预测加DCT变换的混合算法 H 261的图像复用编码 H 261源编码后进行图像复用编码 实际上是把比特流分成图像 Picture 像块组 GOB Groupofblocks 宏块 MB Macroblock 和像块 Block 并附加相应的信息 按照CIF格式 每帧CIF图像包含12个GOB 每个GOB包含33个MB 每个MB包含4个亮度数据块和各1个Cb Cr色度块 每个B包含8 8象素 H 261的图像复用编码 H 261数据流结构 H 261视频压缩算法 利用二维DCT减少图像的空间域的冗余度 利用运动补偿预测减少图像的时间域冗余度 利用视觉加权量化减少图像 灰度域 的冗余度 利用熵编码来减少图像的 频率域 的冗余度 H 26标准系列 ITU T于1990年成立了 ATM视频编码专家组 负责制定适用于B ISDN信道ATM编码传输标准 该专家组于1993年11月与ISO的MPEG专家组联合提出了H 262建议草案 MPEG 2 用于数字存储介质和数字视频通信中图像信息的编码表示和解码规定 该标准向下兼容 能够在很宽的范围内对不同分辨率和不同输出比特的图像信号有效的进行压缩 H 263是ITU制定的低比特率视频信号压缩标准 可以应用于PSTN和移动通信网 30Kb s MPEG标准概述 MPEG MovingPictureExpertGroup 是在1988年由国际标准化组织 ISO 和国际电工委员会 IEC 联合成立的专家组 负责开发电视图像数据和声音数据的编码 解码和它们的同步等标准 这个专家组开发的标准称为MPEG标准 MPEG
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年特殊作业安全培训试题及答案(新规范)
- 药用植物与生药学试题及答案
- 安全生产员工考试题及答案
- 国产化技术突破-洞察及研究
- 武汉市离婚协议财产分割与保险理赔服务合同
- 儿童教育机构店铺转让居间协议书
- 文化产业股东借款及股权代持协议
- 高端餐饮店面房出租合作协议范本
- 教育设施分包合同台账质量与进度监管办法
- 酒店餐饮承包合同终止及品牌授权续约协议书
- 2025四川蜀道养护集团有限公司招聘15人考试参考题库及答案解析
- 股权转让担保责任及权益保护合同
- 1 学习伴我成长(教学设计)-2024-2025学年统编版(2024)道德与法治三年级上册
- 2025年安全工程师《安全生产管理》考前模拟卷(一)
- 2024年青海省行政执法资格考试备考题库及答案(题型)
- 2025-2026学年第一学期校园“1530”安全教育记录表
- 压力性损伤的分期及护理
- 2025年注册安全工程师考试(初级)安全生产法律法规试卷及答案
- 支付终端管理办法
- 公共艺术-音乐篇(中职公共艺术)完整版全套教学课件
- MES运行管理办法
评论
0/150
提交评论