多媒体数字压缩技术.ppt

上传人：x*** IP属地：四川上传时间：2020-02-08 格式：PPT 页数：106 大小：888.31KB 积分：15 举报 版权申诉

已阅读5页，还剩101页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

多媒体数据压缩技术什么是数据压缩数据压缩就是在一定的精度损失条件下以最少的数码表示信源所发出的信号分钟数字音频信号需要的存储空间 1 分钟数字视频信号需要的存储空间 1 压缩编码技术基础多媒体数据压缩的必要性多媒体信息是海量信息彩色电视信号信息量100Mb S 图象声音多媒体海量信息的数据存储处理传输是软硬件技术难题数据压缩的可行性信息论观点信源数据是信息量信源熵和信息冗余量之和信息冗余空间冗余时间冗余结构冗余知识冗余视觉冗余等数据压缩通过减少冗余量而尽可能保留信源信息量压缩编码方法分类冗余度压缩无损压缩信息保持编码或熵编码可逆运算信息量压缩有损压缩失真度编码或熵压缩编码不可逆允许失真空间冗余一幅图像表面上各采样点的颜色之间往往存在着空间连贯性基于离散像素采样来表示物体表面颜色的像素存储方式可利用空间连贯性达到减少数据量的目的例如在静态图像中有一块表面颜色均匀的区域在此区域中所有点的光强和色彩以及饱和度都是相同的因此数据有很大的空间冗余时间冗余运动图像一般为位于一时间轴区间的一组连续画面其中的相邻帧往往包含相同的背景和移动物体只不过移动物体所在的空间位置略有不同所以后一帧的数据与前一帧的数据有许多共同的地方这种共同性是由于相邻帧记录了相邻时刻的同一场景画面所以称为时间冗余同理语音数据中也存在着时间冗余视觉冗余人类的视觉系统对图像场的敏感度是非均匀的但是在记录原始的图像数据时通常假定视觉系统近似线性的和均匀的对视觉敏感和不敏感的部分同等对待从而产生比理想编码即把视觉敏感和不敏感的部分区分开来的编码更多的数据这就是视觉冗余时间域压缩迅速传输媒体信源频率域压缩并行开通更多业务空间域压缩降低存储费用能量域压缩降低发射功率数据压缩的好处压缩编码的衡量指标压缩比要大恢复后的失真小压缩算法要简单速度快压缩能否用硬件实现经典数据压缩理论信息论中的信源编码理论解决的主要问题 1 数据压缩的理论极限 2 数据压缩的基本途径信源信源被抽象为一个随机变量序列随机过程如果信源输出的随机变量取值于某一连续区间就叫做连续信源比如语音信号X t 如果信源输出的随机变量取值于某一离散符号集合就叫做离散信源比如平面图像X x y 和电报信源 X1 X2 X3 X4 离散信源如果随机序列中各个变量具有相同的概率分布则称为离散平稳信源如果离散平稳信源的输出序列中各个变量是相互独立的即前一个符号的出现不影响以后任何一个符号出现的概率则称为离散无记忆平稳信源否则称为离散有记忆平稳信源信源 X1 X2 X3 X4 a1 a2 a3 am 信息量和熵信息量的度量信源S熵的定义信源熵举例一幅用256级灰度表示的图象每个像素点灰度的概率均等编码每个像素需8位40个像素组成的灰度图象灰度为5级 ABCDE 出现每个灰度的像素个数不同为 15 7 7 6 5 该图象的熵为H s 2 196 40个像素需40 2 196 87 84位信息量和熵仙农信息论把一个事件字符a1 所携带的信息量定义为 I a1 log2 1 p log2p bit 其中p为事件发生字符出现的概率I a1 即随机变量X取值为a1时所携带的信息量因为X的信息量也是一个随机变量所以我们要研究它的统计特性其数学期望为称H X 为一阶信息熵或者简称为熵 Entropy 熵 Entropy 在符号出现之前熵表示符号集中的符号出现的平均不确定性在符号出现之后熵代表接收一个符号所获得的平均信息量根据直觉信源编码的数据输出速率平均码长与信源熵之间应该有某种对应关系信源的概率分布与熵的关系熵的大小与信源的概率模型有着密切的关系最大离散熵定理当与信源对应的字符集中的各个字符为等概率分布时熵具有极大值log2m m为字符集中字符个数二进制信源的熵二进制信源输出一个二进制数码所携带的平均信息量最大为1bit 最大离散熵定理的应用对于同一个信源其总的信息量是不变的如果能够通过某种变换编码使信源尽量等概率分布则每个输出符号所独立携带的信息量增大那么传送相同信息量所需要的序列长度就越短离散无记忆信源的冗余度隐含在信源符号的非等概率分布之中只要H X 小于log2m 就存在数据压缩的可能编码信源 X1 X2 X3 X4 a1 a2 a3 am 信源 X1 X2 X3 X4 b1 b2 b3 bn 0 1 平均码长与熵如果对字符aj的编码长度为Lj 则X的平均码长为根据前面对二进制信源的分析有在Lj log2pj时平均码长取得极小值H X 关于离散无记忆平稳信源的结论一阶熵即为离散无记忆平稳信源的压缩极限基本极限只要信源不是等概率分布就存在着数据压缩的可能性数据压缩的基本途径之一使各字符的编码长度尽量等于字符的信息量联合熵与条件熵设随机变量X和Y分别取值于符号表 a1 a2 am 和 b1 b2 b3 bn 定义X与Y的联合熵为定义X关于Y的条件熵为离散有记忆信源的冗余联合熵与其可能达到的最大值之间的差值反映了该有记忆信源所含的冗余度这种冗余是由于随机变量序列之间的相关性造成的关于离散有记忆平稳信源的结论离散有记忆平稳信源的压缩极限为压缩的基本途径之二尽量去除各分量之间的相关性再对各分量进行独立编码压缩的基本途径之三可利用条件概率进行编码阶越高越有利压缩的基本途径之四可将多个分量合并成向量利用其联合概率进行编码联合的分量越多越有利多媒体数据压缩编码分类无损压缩香农范诺编码哈夫曼编码算术编码前三个为统计编码 RLE编码行程编码增量调制编码词典编码有损压缩预测编码 DPCM 运动补偿等面向频率域方法正交变换 DCT 子带编码等面向空间域方法统计分块编码等基于重要性方法滤波子采样比特分配矢量量化等模型方法分形编码模型基编码等混合压缩编码JBIG JPEG MPEG H 261等技术标准熵编码熵编码包括香农范诺编码霍夫曼编码和算术编码其宗旨在于找到一种编码使得平均码长到达熵极限基本思想就是对出现概率较大的符号取较短的码长而对出现概率较小的符号取较大的码长无损压缩编码算法香农范诺编码与哈夫曼编码哈夫曼编码根据统计频率生成Huffman树然后编码前缀码编解码简单实际使用时对文件进行两遍扫描第一遍统计频率第二遍编码压缩比不高对错误敏感没有错误保护功能形成错误传播霍夫曼编码具体步骤 1 初始化 2 合并概率最小的两个事件 3 排序 4 如果事件个数大于2则重复 2 和 3 5 赋值 6 编码霍夫曼编码举例 H X 1 75L1 2L2 1 75 霍夫曼编码的局限性利用霍夫曼编码每个符号的编码长度只能为整数所以如果源符号集的概率分布不是2负n次方的形式则无法达到熵极限输入符号数受限于可实现的码表尺寸译码复杂需要实现知道输入符号集的概率分布没有错误保护功能香农范诺编码香农范诺编码与Huffman编码相反采用从上到下的方法具体步骤为 1 首先将编码字符集中的字符按照出现频度和概率进行排序 2 用递归的方法分成两部分使两个部分的概率和接近于相等直至不可再分即每一个叶子对应一个字符 3 编码香农范诺编码举例 0 1 0 1 0 0 1 1 无损压缩编码算法算术编码消息用0到1之间的实数进行编码两个参数符号的概率和它的编码间隔信源符号的概率决定压缩编码的效率也决定编码过程中信源符号的间隔对错误敏感容易形成错误传播算术编码 Huffman编码的局限性 Huffman编码使用整数个二进制位对符号进行编码这种方法在许多情况下无法得到最优的压缩效果假设某个字符的出现概率为80 该字符事实上只需要 log2 0 8 0 322位编码但Huffman编码一定会为其分配一位0或一位1的编码可以想象整个信息的80 在压缩后都几乎相当于理想长度的3倍左右算术编码基本思想算术编码不是将单个信源符号映射成一个码字而是把真个信源表示为实数线上的0到1之间的一个区间其长度等于该序列的概率再在该区间内选择一个代表性的小数转化为二进制作为实际的编码输出消息序列中的每个元素都要用来缩短这个区间消息序列中元素越多所得到的区间就越小当区间变小时就需要更多的数位来表示这个区间采用算术编码每个符号的平均编码长度可以为小数算术编码举例一算术编码举例二最后的子区间起始位置 85 256 0 01010101子区间长度 27 256 0 00011011子区间尾 7 16 0 0111取编码区间中的一个值最后编码为 011 信源分布算术编码的具体实现因为实际只能用有限长的寄存器这就要求将已编码的高位码字及时输出但又不能输出过早以免后续运算还要调整已输出的码位请看参考书上给出的算法算术编码每次递推都要做乘法所以效率比较低二进制算术编码是一种实用的编码算法用移位代替了乘法使效率大大提高自适应算术编码可以在编码过程中根据符号出现的频繁程度动态的修改分布概率这样可以避免在编码之前必须精确求出信源概率的难题自适应算术编码举例输入序列为 bcc 行程编码 RLE 行程编码 Run LengthEncoding 它通过将信源中相同符号序列转换成一个计数字段再加上一个重复字符标志实现压缩例如 RTTTTTTTTABBCDG被转换为 R 8TABBCDG 其中作为转义字符表明其后所跟的字符表示长度行程编码多用于黑白二值图像的压缩中例如00000000111111111111000001111111被转化为一系列黑串和白串长度的编码 81257 因为串长度并非等概率分布所以一般要配合以统计编码 Huffman编码无损压缩编码算法 RLE行程编码一系列重复值有一个单独值和计数值代替当一行中有连续n n 63 个相同像素时第一个字节最高两位为11 低位为n 第二个字节为重复像素值当一个像素与后续不同时如果像素高位为11 则仍用两个字节表示但重复个数为1 即第一个为11000001 第二为像素值当一个像素与后续不同且高位不为11时直接存储该像素压缩比取决于图象的连续性无损压缩编码算法词典编码通用数据流压缩方法编码前不需要构造码表它从一个简单的表开始随着工作进展构建一个更有效的码表用简单代码替换比较复杂的字串并用一个转换表记录这些替换关系转换表通过动态生成且压缩完毕后无须记录该转换表词典编码词典编码主要利用数据本身包含许多重复的字符串的特性例如吃葡萄不吐葡萄皮不吃葡萄倒吐葡萄皮我们如果用一些简单的代号代替这些字符串就可以实现压缩实际上就是利用了信源符号之间的相关性字符串与代号的对应表就是词典实用的词典编码算法的核心就是如何动态地形成词典以及如何选择输出格式以减小冗余第一类词典编码第一类词典法的想法是企图查找正在压缩的字符序列是否在以前输入的数据中出现过然后用已经出现过的字符串替代重复的部分它的输出仅仅是指向早期出现过的字符串的指针 LZ77算法 LZ77算法在某种意义上又可以称为滑动窗口压缩该算法将一个虚拟的可以跟随压缩进程滑动的窗口作为词典要压缩的字符串如果在该窗口中出现则输出其出现位置和长度使用固定大小窗口进行词语匹配而不是在所有已经编码的信息中匹配是因为匹配算法的时间消耗往往很多必须限制词典的大小才能保证算法的效率随着压缩的进程滑动词典窗口使其中总包含最近编码过的信息是因为对大多数信息而言要编码的字符串往往在最近的上下文中更容易找到匹配串 LZ77编码的基本流程 1 从当前压缩位置开始考察未编码的数据并试图在滑动窗口中找出最长的匹配字符串如果找到则进行步骤2 否则进行步骤3 2 输出三元符号组 off len c 其中off为窗口中匹配字符串相对窗口边界的偏移 len为可匹配的长度 c为下一个字符即不匹配的第一个字符然后将窗口向后滑动len 1个字符继续步骤1 3 输出三元符号组 0 0 c 其中c为当前字符然后将窗口向后滑动1个字符继续步骤1 LZ77算法 LZ77编码举例 LZSS算法 LZ77通过输出真实字符解决了在窗口中出现没有匹配串的问题但这个解决方案包含有冗余信息冗余信息表现在两个方面一是空指针二是编码器可能输出额外的字符这种字符是指可能包含在下一个匹配串中的字符 LZSS算法的思想是如果匹配串的长度比指针本身的长度长就输出指针匹配串长度大于等于MIN LENGTH 否则就输出真实字符另外要输出额外的标志位区分是指针还是字符 LZSS编码的基本流程 1 从当前压缩位置开始考察未编码的字符并试图在滑动窗口中找出最长的匹配字符串如果匹配串长度len大于等于最小匹配串长度 len MIN LENGTH 则进行步骤2 否则进行步骤3 2 输出指针二元组 off len 其中off为窗口中匹配字符串相对窗口边界的偏移 len为匹配串的长度然后将窗口向后滑动len个字符继续步骤1 3 输出当前字符c 然后将窗口向后滑动1个字符继续步骤1 LZSS编码举例输入数据流编码过程MIN LEN 2 LZSS算法在相同的计算机环境下 LZSS算法比LZ77可获得比较高的压缩比而译码同样简单这也就是为什么这种算法成为开发新算法的基础许多后来开发的文档压缩程序都使用了LZSS的思想例如 PKZip GZip ARJ LHArc和ZOO等等其差别仅仅是指针的长短和窗口的大小等有所不同 LZSS同样可以和熵编码联合使用例如ARJ就与霍夫曼编码联用而PKZip则与Shannon Fano联用它的后续版本也采用霍夫曼编码第二类词典编码第二类算法的想法是企图从输入的数据中创建一个短语词典 dictionaryofthephrases 这种短语可以是任意字符的组合编码数据过程中当遇到已经在词典中出现的短语时编码器就输出这个词典中的短语的索引号而不是短语本身 LZ78算法 LZ78的编码思想是不断地从字符流中提取新的字符串 String 通俗地理解为新词条然后用代号也就是码字 Codeword 表示这个词条这样一来对字符流的编码就变成了用码字 Codeword 去替换字符流 Charstream 生成码字流 Codestream 从而达到压缩数据的目的 LZ78编码器的输出是码字字符 W C 对每次输出一对到码字流中与码字W相对应的字符串 String 用字符C进行扩展生成新的字符串 String 然后添加到词典中 LZ78编码算法步骤1 将词典和当前前缀P都初始化为空步骤2 当前字符C 字符流中的下一个字符步骤3 判断P C是否在词典中 1 如果是则用C扩展P 即让P P C 返回到步骤2 2 如果否则输出与当前前缀P相对应的码字W和当前字符C 即 W C 将P C添加到词典中令P 空值并返回到步骤2 LZ78编码举例输入数据流编码过程 LZW算法 J Ziv和A Lempel在1978年首次发表了介绍第二类词典编码算法的文章在他们的研究基础上 TerryA Welch在1984年发表了改进这种编码算法的文章因此把这种编码方法称为LZW Lempel ZivWalch 压缩编码在编码原理上 LZW与LZ78相比有如下差别 LZW只输出代表词典中的字符串 String 的码字 codeword 这就意味在开始时词典不能是空的它必须包含可能在字符流出现中的所有单个字符即在编码匹配时至少可以在词典中找到长度为1的匹配串 LZW编码是围绕称为词典的转换表来完成的 LZW算法的词典 LZW编码器软件编码器或硬件编码器就是通过管理这个词典完成输入与输出之间的转换 LZW编码器的输入是字符流 Charstream 字符流可以是用8位ASCII字符组成的字符串而输出是用n位例如12位表示的码字流 Codestream 码字代表单个字符或多个字符组成的字符串 String LZW编码算法步骤1 将词典初始化为包含所有可能的单字符当前前缀P初始化为空步骤2 当前字符C 字符流中的下一个字符步骤3 判断P C是否在词典中 1 如果是则用C扩展P 即让P P C 返回到步骤2 2 如果否则输出与当前前缀P相对应的码字W 将P C添加到词典中令P C 并返回到步骤2 LZW编码举例输入数据流编码过程 LZW算法 LZW算法得到普遍采用它的速度比使用LZ77算法的速度快因为它不需要执行那么多的缀符串比较操作对LZW算法进一步的改进是增加可变的码字长度以及在词典中删除老的缀符串在GIF图像格式和UNIX的压缩程序中已经采用了这些改进措施之后的LZW算法 LZW算法取得了专利专利权的所有者是美国的一个大型计算机公司 Unisys 优利系统公司除了商业软件生产公司之外可以免费使用LZW算法预测编码基本原理根据某种模型利用以前的一个或多个样本值对当前的样本进行预测对当前样本实际值和预测值之差进行编码若模型选取足够好图象或声音样本时间相关性很强压缩比高特点算法简单速度快易于硬件实现编码压缩比不太高误码易于扩散抗干扰性差预测编码预测编码是数据压缩理论的一个重要分支它根据离散信号之间存在一定相关性的特点利用前面的一个或多个信号对下一个信号进行预测然后对实际值和预测值的差预测误差进行编码如果预测比较准确那么误差信号就会很小就可以用较少的码位进行编码以达到数据压缩的目的第n个符号Xn的熵满足所以参与预测的符号越多预测就越准确该信源的不确定性就越小数码率就可以降低预测编码分类线性预测编码和非线性预测编码帧内预测编码和帧间预测编码量化器编码器预测器解码器预测器信道输入XN 输出XN 发送端接收端 eNXN eN XN eN XN DPCM是有损型还是无损型关键看对预测误差ek如何编码预测方程式线性预测如果ai是常数则为时不变线性预测否则为自适应线性预测 ADPCM 最简单的预测方程最佳线性预测使误差函数达到最小值的预测方程式叫做最佳线性预测求最佳线性预测的各个参数ai 列方程组代入得到联立方程组如果为一阶线性预测则可求得图像信号的预测编码一副数字图像可以看成一个空间点阵图像信号不仅在水平方向是相关的在垂直方向也是相关的根据已知样值与待预测样值间的位置关系可以分为 1 一维预测行内预测利用同一行上相邻的样值进行预测 2 二维预测帧内预测利用同一行和前面几行的数据进行预测 3 三维预测帧间预测利用相邻几帧或不同波段上的取样值进行预测静止图像的二维预测编码这种压缩算法被应用到JPEG标准的无损压缩模式之中中等复杂程度的图像压缩比可达到2 1 c a b x d 三邻域预测法活动图像的帧间预测编码视频信号的冗余度主要体现在空间相关性帧内时间相关性帧间和色度空间表示上的相关性对于每秒25帧 30 的电视信号其相继帧之间存在极强的相关性据统计256级灰度的黑白图像序列帧间差值超过3的象素数不超过4 所以在活动图像序列中可以利用前面的帧来预测后面的帧以实现数据压缩帧间预测编码技术被广泛应用到H 261 H 263 MPEG 1和MPEG 2等视频压缩标准之中具有运动补偿的帧间预测活动图像序列中的一个画面可以大致划分为3个区域 1 背景区相邻两个画面的背景区基本相同 2 运动物体区可以视为由前一个画面的某一区域的像素平移而成位移矢量 3 暴露区指物体运动后而显露出来的曾被遮盖的背景区域运动补偿预测就是将前一个画面的背景区平移后的运动物体区作为后一个画面的预测值运动补偿帧间预测编码运动补偿帧间预测从原理上包括如下几个基本步骤 1 图像分割把图像划分为静止的背景和若干运动的物体各个物体可能有不同的位移但构成同一物体的所有像素的位移相同 2 运动矢量估值考察前后两个画面利用运动估值算法得到每个物体的位移矢量 3 运动补偿用运动矢量补偿物体的运动效果再进行预测 4 编码除了对实测值与预测值之间的差值进行编码传送外还要传送位移矢量以及区域分割信息运动补偿帧间预测编码编码器运动补偿图像输入运动矢量输出译码器帧缓存运动估值预测误差输出变换编码预测编码希望通过对信源建模来尽可能的预测源数据而变换编码则考虑将原始数据变换到另一个表示空间使数据在新的空间上尽可能相互独立而能量更集中 X Y X Y 变换编码基本思路先将空间域图象通过某种正交变换获得一系列变换系数在变换过程中使图象变换系数能量相对集中再对其变换系数进行区域量化按其所含能量大小分配不同数据量分类傅立叶变换哈尔变换沃尔西哈达玛变换斜变换等图象分块变换区域采样量化编码图象再现反变换填零译码存储或传输混合编码技术与国际标准 JPEG编码标准H 261标准简介MPEG标准概述MPEG 1标准MPEG 2标准MPEG 4标准算法概要 JPEG JointPhotographicExpertsGroup 是一个由ISO和CCITT两个组织机构联合组成的一个图像专家小组负责制定静态的数字图像数据压缩编码标准这个专家组开发的算法称为JPEG算法并且成为国际上通用的标准 JPEG是一个适用范围很广的静态图像数据压缩标准既可用于灰度图像又可用于彩色图像 JPEG不仅适于静止图像的压缩电视图像的帧内图像的压缩编码也常采用此算法 JPEG标准还可以大范围地调节图像压缩率及其保真度标准主要采用了两种基本的压缩算法一种是采用以离散余弦变换 DCT 为基础的有损压缩算法另一种是采用以预测技术为基础的DPCM无损压缩算法 JPEG编码标准 JPEG编码标准基于DPCM的无损编码模式压缩比可以达到2 1 基于DCT的有损顺序编码模式压缩比可以达到10 1以上基于DCT的递增编码模式基于DCT的分层编码模式 JPEG规定了4种运行模式以满足不同需要 JPEG有损顺序编码算法的主要计算步骤如下 1 将源图像分成几个颜色平面分量图像 2 分成8 8数据块进行正向离散余弦变换 FDCT 2 量化 quantization 3 Z字形排列量化结果 zigzagscan 4 使用差分脉冲编码调制 differentialpulsecodemodulation DPCM 对直流系数 DC 进行编码 5 使用行程长度编码 run lengthencoding RLE 对交流系数 AC 进行编码 6 熵编码 entropycoding JPEG编码标准 JPEG编码标准译码或者叫做解压缩的过程与压缩编码过程正好相反 IDCT JPEG编码标准正向离散余弦变换对每个单独的彩色图像分量把整个分量图像分成8 8的图像块如图所示并作为两维离散余弦变换DCT的输入通过DCT变换把能量集中在少数几个系数上 DCT变换使用下式计算逆变换使用下式计算 JPEG编码标准量化对于有损压缩算法 JPEG算法使用如图所示的均匀量化器进行量化量化步距是按照系数所在的位置和每种颜色分量的色调值来确定 JPEG编码标准量化因为人眼对亮度信号比对色差信号更敏感因此使用了两种量化表亮度量化值和色差量化值此外由于人眼对低频分量的图像比对高频分量的图像更敏感因此图中的左上角的量化步距要比右下角的量化步距小 JPEG编码标准 DC系数DPCM编码和AC系数Z形排列之后采用RLE编码 JPEG编码标准熵编码使用熵编码还可以对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩 JPEG标准规定了两种熵编码算法哈夫曼编码和自适应算术编码哈夫曼编码采用的一般是固定的哈夫曼编码表而不是临时统计出来的并且对亮度分量和色度分量采用了不同的哈夫曼表 JPEG编码标准基于DPCM的无损编码模式主要采用了三邻域二维预测编码和熵编码无失真编码器源图像数据压缩的图像数据预测器熵编码器表说明 DPCM预测编码框图 JPEG编码标准 JPEG编码标准基于DCT的递增编码模式此模式与顺序模式编码步骤基本一致不同之处在于递增模式每个图像分量的编码要经过多次扫描才完成第一次扫描只进行一次粗糙的压缩然后根据此数据先重建一幅质量低的图像以后的扫描再作较细的扫描使重建图像质量不断提高直到满意为止递增模式分为两种 1 按频段累进 2 按位累进 JPEG编码标准基于DCT的分层编码模式 1 降低原始图像的空间分辨率 2 对已经降低分辨率的图像按照顺序编码模式进行压缩并存储或传输 3 对低分辨率图像进行解码然后用插值法提高图像的分辨率 4 将分辨率已经升高的图像作为原图像的预测值并把它与原图像的差值进行基于DCT的编码 5 重复步骤3 4直到图像达到完整的分辨率 H 261概述 H 261也称P 64 这是ITU T 前身为CCITT 最早制定的关于视频编码的国际标准考虑到ISDN的传输码率以64kbps为单位因此以p 64kbps p 1 30 作为为H 261的标准码率 H 261标准主要用于电视电话和电视会议它支持QCIF p 1 2 CIF p 2 两种图像输入格式 H 261解决的问题第一是编码算法问题确立了一种合理的保证图像质量且为各国图像编码专家所公认的统一的算法算法必须能够实时操作解码延时要短第二是与PCM标准兼容的问题编解码器以64 1920kb s的工作速率去覆盖N ISDN或PCM一次群的通道第三解决电视制式不同的问题为了使同一标准既能用于PAL 625 和NTSC 525 两种电视制式系统源编码基于中间格式CIF格式所以输入输必须经转换到CIF或QCIF格式再进行源编码视频编码图像格式一览表 H 261的信源编码算法信源编码算法的一般形式如下图所示主要由帧间预测帧内分块和量化组成 H 261的信源编码算法一将预测误差或输入图像划分成为8 8的象素块进一步将4个亮度像块和两个在空间位置上与之重叠的色差像块符合成一个16 16的宏块 MB 二对于帧序列中的第一副图像或景物变换后的第一副图像采用帧内变换编码利用8 8的DCT实现各DCT系数经过线性量化变长编码后进入缓冲器根据缓冲器的上溢和下溢来反馈调节量化器的量化步长以控制视频编码位流使之与信倒速率相匹配 H 261的信源编码算法帧间预测采用混合方法利用运动补偿预测当预测误差超过某个门限后对误差做DCT 视觉加权量化及熵编码运动矢量信息编码后也送到缓冲器中 DCT去除空间冗余度而使用有运动补偿的帧间预测来去除时间上的冗余这是一个典型的帧内帧间自适应预测加DCT变换的混合算法 H 261的图像复用编码 H 261源编码后进行图像复用编码实际上是把比特流分成图像 Picture 像块组 GOB Groupofblocks 宏块 MB Macroblock 和像块 Block 并附加相应的信息按照CIF格式每帧CIF图像包含12个GOB 每个GOB包含33个MB 每个MB包含4个亮度数据块和各1个Cb Cr色度块每个B包含8 8象素 H 261的图像复用编码 H 261数据流结构 H 261视频压缩算法利用二维DCT减少图像的空间域的冗余度利用运动补偿预测减少图像的时间域冗余度利用视觉加权量化减少图像灰度域的冗余度利用熵编码来减少图像的频率域的冗余度 H 26标准系列 ITU T于1990年成立了 ATM视频编码专家组负责制定适用于B ISDN信道ATM编码传输标准该专家组于1993年11月与ISO的MPEG专家组联合提出了H 262建议草案 MPEG 2 用于数字存储介质和数字视频通信中图像信息的编码表示和解码规定该标准向下兼容能够在很宽的范围内对不同分辨率和不同输出比特的图像信号有效的进行压缩 H 263是ITU制定的低比特率视频信号压缩标准可以应用于PSTN和移动通信网 30Kb s MPEG标准概述 MPEG MovingPictureExpertGroup 是在1988年由国际标准化组织 ISO 和国际电工委员会 IEC 联合成立的专家组负责开发电视图像数据和声音数据的编码解码和它们的同步等标准这个专家组开发的标准称为MPEG标准 MPEG

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

多媒体数字压缩技术.ppt

文档简介

温馨提示

最新文档

评论

多媒体数字压缩技术.ppt

文档简介

温馨提示

最新文档

评论

相关文档