第5章多媒体数据压缩技术.

上传人：小*** IP属地：台湾上传时间：2022-02-13 格式：DOC 页数：38 大小：1.64MB 积分：30 举报 版权申诉

已阅读5页，还剩33页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、www.wordwendan 中文Word文档库本文由【中文word文档库】搜集整理。中文word文档库免费提中文 word 文档库，海量 word 文档免费下载www.wordwendan word文档供海量教学资料、行业资料、范文模板、应用文书、考试学习和社会经济等第5章多媒体数据压缩技术本章要点：多媒体数据压缩技术概述量化统计编码变换编码数据压缩编码国际标准5.1多媒体数据压缩技术概述（必要、可行、分类）5.1.1多媒体数据压缩编码的必要性由于多媒体元素种类繁多、构成复杂，使得数字计算机面临的是数值、音乐、动画、静态图像和电视视频图像等多种媒体元素，且要将它们在模拟量和数字量之间

2、进行自由转换、信息吞吐、存储和传输。目前，虚拟现实技术还要实现逼真的三维空间、3D立体声效果和在实境中进行仿真交互，带来的突出问题就是媒体元素数字化后数据量大得惊人，解决这一问题，单纯靠扩大存储器容量、增加通信干线传输率的办法是不现实的。通过数据压缩技术可大大降低数据量，以压缩形式存储和传输，既节约了存储空间，又提高了通信干线的传输效率，同时也使计算机得以实时处理音频、视频信息，保证播放出高质量的视频和音频节目。5.1.2多媒体数据压缩的可能性安特尼科罗威尔意意大利 1975年,300公斤中文 word 文档库，海量 word 文档免费下载www.wordwendan 中文 word

3、文档库，海量 word 文档免费下载www.wordwendan 中文Word文档库分析冗余? 中文 word 文档库，海量 word 文档免费下载www.wordwendan 中文Word文档库图像数据压缩技术就是研究如何利用图像数据的冗余性来减少图像数据量的方法。下面是常见的一些图像数据冗余：（1）空间冗余：是由于基于离散像素采样的方法不能表示物体颜色之间的空间连惯性导致的；（2）时间冗余：就是对于象电视图像、动画等序列图片，当其中物体有位移时，后一帧的数据与前一帧的数据有许多相同的地方；（3）结构冗余：在有些图像的纹理区，图像的像素值存在着明显的分布模式；（4）知识冗余：对于图像

4、中重复出现的部分，我们可构造其基本模型，并创建对应各种特征的图像库，进而图像的存储只需要保存一些特征参数，从而可大大减少数据量；（5）视觉冗余：事实表明，人类的视觉系统对图像场的敏感性是非均匀和非线性的；6.1.3多媒体数据压缩方法的分类1有损与无损压缩：第一种分类方法是根据解码后数据是否能够完全无丢失地恢复原始数据，可分为：中文Word文档库1）无损压缩：也称可逆压缩、无失真编码、熵编码等。原理：去除或减少冗余值，但这些值可在解压缩时重新插入到数据中，恢复原始数据。它大多使用在对文本和数据的压缩上，但是压缩比较低，大致在2： 15： 1之间。典型算法有：Hufman编码、Shannon-F

5、ano编码、算术编码、游程编码和Lenpel-Ziv编码等。2）有损压缩：也称不可逆压缩和熵压缩等。此法在压缩时减少了的数据信息是不能恢复的。2、压缩技术分类：第二种分类方法是按照压缩技术所采用的方法来分的，见下表所示:多媒体数据编码算法PCM自适应、固定式预测编码自适应、固定式（DPCM、 M ）混合编码变换编码傅里叶、离散余弦（DCT ）、离散正弦（DST）、哈尔、斜变换、沃尔什 -哈密瓜达马、卡胡南-劳夫（K-L ）、小波统计编码（熵编码）哈夫曼、算术编码、费诺、香农、游程编码（RLE ）、LZW静态图像编码方块、逐渐浮现、逐层内插、比特平面、抖动电视编码帧内预测帧间运动估

6、计、运动补偿、条件补充、内插、编码帧间预测其他编码矢量量化、子带编码、轮廓编码、二值图像3. 脉冲编码调制 PCM （ Pulse Code Modulation ）编码分类1）预测编码（Predictiove Codi ng, PC）:这种编码器记录与传输的不是样本的真实值，而是它与预期测值的差。预测值由欲编码图像信号的过去信息决定。由于时间、空间相关性，真实值与预测值的差值变化范围远远小于真实值的变化范围，因而可以采用较少的位数来表示。2）变换编码（Tran sform Codi ng, TC ）:其主要思想是利用图像块内像素值之间的相关性，把图像变换到一组新的基上，使得能量集中到少数几个

7、变换系数上，通过存储这些系数而达到压缩的目的。3）统计编码：最常用的统计编码是 Hufman编码。它对于出现频率大的符号用较少的位数来表示，而对出现频率小的符号用较多的位数来表示。其编码效率主要取决于需编码的符号出现的概率分布，越集中则压缩比越高。5.2量化通常量化是指模拟信号到数字信号的映射，它是模拟量化为数字量必不可少的步骤。由于模拟量是连续的，而数字量是离散量，因此量化操作实质上是用有限的离散量代替无限的模拟量的多对一映射操作。5.2.1 比特率比特率是采样率和量化过程中使用的比特数的产物。它是数据通信的一个重要参数。公用数据网的信道传输能力常常是以每秒传送多少KB或多少GB信息量

8、来衡量的。中文Word文档库数字音频格式比较应用类型采样频率(KHz )带宽(KHz )频带(Hz)比特率(KB/S)电话8.03.0200320064远程会议16.07.0507000256数字音频光盘44.120.020200001410数字音频带48.020.020200001536522量化原理量化处理是使数据比特率下降的一个强有力的措施。脉冲编码调制(PCM )的量化处理在采样之后进行。数据压缩编码中的量化是指以PCM码作为输入，经正交变换、差分、或预测处理后，在熵编码之前，对正交变换系数、差值或预测误差的量化处理。模拟无限等级数字等级有限化t数字量化处理量化输入值的动态范围很大,需

9、要以多的比特数表示一个数值，量化输出只能取有限个整数，称作量化级，一般希望量化后的数值用较少的比特数就可表示。每个量化输入被强行归一到与其接近的某个输出，即量化到某个级。量化处理总是把一批输入, 量化到一个输出级上，所量化处理是一个多对一的处理过程，是个不可逆过程，量化处理中有信息丢失，或者说会引起量化误差(量化噪声)。5.2.3标量量化器的设计1. 量化器的设计要求(1) 给定量化分层级数，满足量化误差最小；(2) 限定量化误差，确定分层级数，满足以尽量小的平均比特数，表示量化输出。2. 量化方法和量化特性量化方法有标量量化和矢量量化之分，标量量化又可分为均匀量化、非均匀量化和自适应

10、量化。下图画出一个标量量化过程的示意图：中文 word 文档库，海量 word 文档免费下载www.wordwendan 中文Word文档库W1 W3W3W?W8：'-b覆区足埒量化的画数，是一 1O像的灰度差值直方图1|IIW5 W6W1W2W3W4W5W6W7W8.龍荒量化过程示意图b区画出了F匀量化"处理的昱化箱示意图中文 word 文档库，海量 word 文档免费下载www.wordwendan 中文 word 文档库，海量 word 文档免费下载www.wordwendan XI X2 X3XA X5 X6采样输人译杠值C区的虽化箱K等宽，中间欠概率处II

11、窄，购边小樞血处箱宽t表示不均勾虽叱.量化器的量化特性曲线，有多种多样，下图给出一个八级均匀量化特性曲线:100101110()1101000100()F图是给出一个非均匀量化特性曲线: 中文 word 文档库，海量 word 文档免费下载www.wordwendan 100呈化输出样本a1（）1110011010001-I*I非均匀量化间隔000'-一亠XI X2X3X4X5采样输入样本值中文 word 文档库，海量 word 文档免费下载www.wordwendan 中文 word 文档库，海量 word 文档免费下载www.wordwendan 524 矢量量化矢量量化编码一

12、般是失真编码方法。矢量量化的名字是相对于标量量化而提出的，对于PCM数据，一个数一个数进行量化叫标量量化；若对这些数据分组，每组K个数构成一个K维矢量，然后以矢量为单元，逐个矢量进行量化，称矢量量化。矢量量化可有效提高压缩比，见下图：5.3统计编码本节介绍几种典型的熵编码方法，如Shannon与Fano编码法和Hufman编码法，算术编码法与游程编码法。其中尤以Hufman编码法为最佳，在多媒体编码系统中常用这种方法作熵保持编码。预备知识：信息论基础?今天有同学收到 EMAIL、TEL,.?今天有同学读报？海报？今天有同学WATCH TV、RADIO? ?什么是信息？信息量多大？信息单位是什

13、么？当我们收到一封信或一个电话、传真、电报、电子邮件时，便获得一定的信息，在此之前我们并不能肯定其中的内容，如果我们早知其内容，也就没有必要写信、发电子邮件或打电话了，这也就不存在信息问题。那么信息是什么？简单说：从上面可知信息就是消息，消息是由不知到知知的过程，信息量的大小就是消息的多少，也即由不知到知知的多少，这是一般定义上的理解，在数学怎么定义信息及信息量的大小。再从上面我们也可以知道，在信息中蕴含着不确性，这种不确性在数学上就是事件的概率，对确定事件（消息）概率大信息量少，否则信息量就大，所以一般而言，小概率事件信息量大，大概率事件信息量小，如果概率P=1信息

14、量则为0。例如：中文畑'd文會库（1）百年不遇事件，概率较小，一旦发生，必定信息量惊人；（2）两军对持，若势均力敌（等概率分布）很难判定谁是胜家，信息量大。如果两军实力相差较远（不等概率），则信息量小，易判定胜负，这说明：基本事件的个数相同者，以等概率分布场平均信息量大。信息可以识别，转换、存贮、传送、增值、信息既不是物质，也不是意识，信息的存在具有特殊性，同时与物质与意识又密切相关。信息的过程包含有发送、传输、接收三个基本过程。香农提出了如下模型称之为信息传播的基本模型。«? J陵道凝越评澳大殛从这个模型可知，信息量实际就是发送、传输、接收这个信息所要求表示这个事件（信

15、息）最小比特数。如发送某一事件A，需要3位（二进数）来表示，则说明该信息的信息量是 3bit，按 shannon 理论：信息源S的信息量用熵（entropy ）来定义：1H （s） = " R log2（） = -' FJ log2 RiRiiRi是符号Si在S中出现的概率1log2（）表示包含在Si中信息量，即编码 Si所需二进制位数，H（ s）是S的总信息量 R例如：（1）一幅256级灰度的黑白图像，每个象素点灰度概率为Pi=1/256，那么编码每个象素要Iog21/256=8bit 中文 word 文档库，海量 word 文档免费下载中文Word文档库1111000

16、0, 10101010, 0101010b 11111111- 00000000用烦变映射做的毎白閤1 中文 word 文档库，海量 word 文档免费下载(2)电视屏上约有 500 X 600=3 X 105个格点，按每个点 10种不同的亮度等级计算，则共组成多少个不同画面？按等概率计算，每个画面概率是多少？电视屏上约有2个格点，按每个点2种不同的亮度等级计算，则共组成多少个不同画面？按等概率计算，每个画面概率是多少？-个黑晤点卩rr个黑格点1n-个黑白格点 r二个黑白格点三个黑白辭点231 中文 word 文档库，海量 word 文档免费下载1 中文 word 文档库，海量 wor

17、d 文档免费下载(2)电视屏上约有 500 X 600=3 X 105个格点，按每个点 10种不同的亮度等级计算,1031。5H(s)二im则共组成多少个不同画面？按等概率计算，每个画面概率是多少平均每个画面可提供信息量为：=3 X 105X 3.32=106bitlOg21(3 105 )10310(3) 千字文章假定每字可从万字表中任选，则可有不同的千字文：N=100001000=104000篇，按等概率计算，平均每篇千字文可提供的信息量为：H (s) log2(N)= log2 N = 4 103 3.32 =1.3 104bit1 中文 word 文档库，海量 word 文档免费下

18、载www.wordwendan 中文 word 文档库，海量 word 文档免费下载www.wordwendan 中文Word文档库结论：可见一个电视画面的信息远远超过千字文，从计算可知前者是后者的loo倍，图像信息量是远远大于文本信息量。几种主要信息编码方法1、Sha nnon-Fa no 算法编码有一幅40象素组成的图像，每个象素灰度用 5级来表示，分别记为 A、B、C、D、E， 40个象素中出现 A级灰度数为15个，出现B级为7个，出现C级为7个，出现D和E级分别为6个和5个，按照Shsnnon理论，这幅图像的熵为：=2.196H(s)Wlog2 坐 Zog240Zog240log24

19、0 9og2 坐4015407407406405也就是说，这幅图像内每个象素平均可用2.196位表示，整个图像共需40 X2.196=87.84bit，下面按Shannon-Fano的编码方法进行编码，其基本步骤如下：(1) 计算各符号(A E)亦即灰度等级出现的概率，并排序，见表1(2) 列表并计算各自的比特数：log2()(3) 用递归法分成两部分，每部分具有近似相目同的次数，如图所示直至分到各种表示的符号级别，并给它们分配“0或“1；可以是概率大者为“0也可以是概率小者为 “ 0,”另外一个就对应为“1。符号出现的次数 )Lo亞1/PP分配的代码需要的比特数A15(0.375)

20、L41500030B7(0 J 75)2.514501147(0,175)2.51451014D6() J 50)2.736911018E5(0.125)3.000011115/91罔Shannon-Fano算法实例压缩比的计算利用这种算法，关键作用就是在传递这些信时，其传输比特位要少，亦即要求压缩比较大，这种算法及编码，简单方便，其压缩比为：如果不压缩，每个象素有5级(A 巳灰度，每个象素至少要用 3bit来表示。此画共有 40个象素，即要用120bit用Shsnnon-Fano算法则需共计91bit，因此压缩比是1.3:1，这种压缩比对图像而言还是很小的。2、Huffman编码算法前面介

21、绍的Sha nnon-Fa no是1948年提出的一种非定长编码，称为变长码 (Variable-Length code),由于是据概率进行的编码方法，所以又称为统计编码，或称为熵编码。Shannon-Fano编码只是指出存在一种无失真的编码，使得编码平均码长逼近熵值这个下限，但它并没有给出具体的编码方法。下面介绍另一种变长的统计熵编码的方法，这就是Huffamn编码方法。它是基于变字长编码的最佳编码定理。(定理)在变字长码中，对于出现概率大的信息符号编短字长的码，对于出现概率小的中文Word文档库信息符号编以长字长的码，如果码字长度严格按照符号概率的大小的相反顺序排列，则平均码字长度一定

22、小于按任意方式排列得到的码字长度。(证明)：设最佳排列方式的码字平均长度为L,则有m匚八mp(ai)i 4p(a)为信号源符号出现 ai的概率,ni是符号ai的编码长度且规定：p(a) > p(as) ,ni w ns , i=1,2,3 .m, s=1,2,3 m如果将ai的码字与 as的码字互换，其余码字不变，经过这样互换后，平均码字长度变成匸，即有：L =ni p(aj 爲*5 p(aj 爲卩(&)爲:;：rmpm)L ni p(aiK-n p(asK爲足 P(aJ ：nmP(am)L 匸=n P(aJ +n p(as) -ni p(a$) -nsP(aJ 匚二匚 hp(

23、as) nsp(aj - mp) - nsp(as)】 =L (ns -nJ Ip®) - p(a$)丨因为ns > ni , p(a)p(as),所以匚a l ，亦即l为是最短编码。Hufnnan编码方法于1952问世至今，经久不衰，广泛应用于各种数据压缩技术中，且仍不失为熵编码中最佳方法就是因为满足上述定理，下面举例来具体说明编码过程：假设要传的信息源是下：8个不同的电平值，而这个电平值xi(i=1-8)对应的概率事先已知如电平編号i络 x3X 4 x5x7出现概率Pi 0.40 0.20 0.15 0.10 0.071K04 0,03 0.011编码步骤是(1) 计算

24、各信号源符号的概率；(2) 将信源符号按概率递减顺序排列；(3) 把两个最小的概率相加作为新符号的概率，并按(2)重排；(4) 重复(2), (3)直至全部概率之和为1 ;(5) 在每次合并信源时，将两个信源分别赋于“(和“1”(一般概率大赋值 0，概率小赋1, 也可相反)；(6) 寻找每一个信源的符号直到概率为1处，记录其路径上的“1和“ 0<(如图所示。(7) 从尾部(含概率为1处)开始到信号源将其赋给的“ 0或 “ 1 代码写出，列于是表中文Word文档库信息Xi熵计算：1H(x)八 Pi log22.41bitPi亦即每个信息源（i=1-8）平均至少要 2.41bit，整个信息共

25、需要 2.41*8=19.28bits宿蕊i概率PjI IufTnnan 码码长ljbit码长概率p"i=pJiXx0.4110.4X20.200030.6X30J5(101rJ045X,0.1001130.30论0.070101斗0,28冬0.040100050.20X70,0301001060.18Xs110101001160.06Huffman平均每个信息源xi平均需码长为：L 八 Pih =2.47bit按定长编码：信息源有8个，每个信息源至少要N=3位，可见，Huffman编码比定长编码要少 3-2.47=0.53bit，节省18%存储空间编码效率 =M/L=2.41/2.

26、47=97.6%Huffman的编码虽然是可变的，但却不需要码同步信号，例如，码串中的第一位为1，那么肯定是电平 X1，因为没有其它电平代码开始是1,因此下一位是下一个电平代码的第一位。对Huffman编码只要事先编写一个解释各种代码意义的词典”即码薄即可依次解码。Huffman具有以下特点：（1）平均码长L - H （熵编码）（2）平均码长L N （等定长编码）采用Huffman编码时有几个问题值得注意：（1）Huffman编码没有错码保护，而不具纠错功能；（2）Huffman是可变长编码，因此很难随意查找或调用编码图象或文件之中的中间内容，然后再译码，就需要在存储代码之前加以考虑；中文Wo

27、rd文會库（3） Huffman进行编码解码也相当费时。复习Huffman 一下喔？哈夫曼（Huffman ）编码方法是利用了下面这个定理：在变字长码中，对于出现概率大的信息符号以短字长编码，对于出现概率小的信息符号以长字长编码。如果码字长度严格按照符号概率的大小的相反顺序排列，则平均码字长度一定小于按任何其他符号顺序排列方式得到的码字长度。Huffman编码的具体步骤归纳如下：（1）概率统计（如对一幅图像，或m幅同种类型图像作灰度信号统计），得到n个不同概率的信源信息符号；（2）将信源信息符号的n个概率，按概率大小排序；（3）将n个概率中，最后两个小概率相加，这时概率个数减为n-1个

28、；（4）将n-1个概率，按大小重新排序；（5）重复（3），将新排序后的最后两个小概率再相加，相加和与其余概率再排序；（6）如此反复重复 n-2次，最后只剩两个概率序列；（7）以二进制码元（0，1）赋值，构成 Huffman码字，编码结束。3、算术编码1. 算术编码基本原理此法比Huffman编码、行程长度等熵编码方法都复杂，但它不需要传送像Huffman编码那样的Huffman码表，同时算术编码还有自适应能力，所以算术编码是实现高效压缩数据中很有前途的编码方法。它跳出了分组编码的范畴，是从全序列出发，采用递推形式的连续编码。它不是将单个信源符号映射成一个码字，而是将整个输入符号序列

29、映射为实数轴上0，1区间内的一个间隔，其长度等于该序列的概率，并在该间隔内选择一个代表性的二进制小数，作为实际的编码输出，使其平均码长逼近信源的熵，从而达到高效编码的目的。算术编码（Orithmetic Coding ）是20世纪60年代初，由Elias提出的，1976年Rissanen 和Pasco首次介绍其实用技术。算术编码的基本原理是：将编码的信息表示成实数0和1之间的一个间隔（interval），信息越长，编码间隔就越小，表示这一间隔所需的二进制位数就越长。2. 举例说明设输入数据为eaio u,其出现概率和所设定的取值范围如下：a0.20,0.2eio0.2,0.

30、50.5,0.60.6,0.8u0.20.8,1.0Low=0 ； range为编码间隔 rangehigh为编码字符分配字符概率范围设high为编码间隔的高端，high=1;low为编码间隔的低端，的长度，range=high-low; rangelow为编码字符分配的间隔低端；的间隔高端。则一个字符编码后新的low和hogh按下式计算：low=low+range x rangelow ;high=low+range x rangehigh(1) 在第一个字符 e被编码时，e的rangelow=0.2 , rangehight=0.5 ,因此按公式:low=0+1 x 0.2=0.2high

31、=0+1 x 0.5=0.5ran ge=high-low=0.5-0.3=0.2此时分配给e的范围为0.2,0.5第二个字符 a编码时使用新生成范围 0.2,0.5, a的rangelow=0 , rangehigh=0.2 。中文Word文档库low=0.2+0.3 X 0=0.2high=0.2+0.3 X 0.2=0.26ran ge=high-low=0.26-0.3=0.06此时分配给a的范围为0.2, 0.26第三个字符i编码时用新生成范围，i的rangelow=0.5 , rangehigh=0.6，则:low=0.2+0.06 X 0.5=0.23high=0.2+0.06

32、X 0.6=0.236ran ge=high-low=0.236-0.23=0.006此时分配给i的范围为0.23,0.236第四个字符 o编码时o的rangelow=0.6, rangehigh=0.8,贝U:low=0.23+0.006 X 0.6=0.2336high=0.23+0.006 X 0.8=0.2348ran ge=high-low=0.2348-0.2336=0.0012此时分配给o的范围为0.23396 , 0.2342(5)第五个字符 u 编码时 u 的 rangelow=0.8 ,rangehigh=1.0,贝U：low=0.2336+0.0012 X 0.8=0.2

33、3396high=0.2348+0.0012 X 1.0=0.2342此时分配给u的范围为0.23396,0.2342编码结果如下表所示：输入字符的算术编码结果输入字符lowhighrangeea0.20.260.06i0.230.2360.006o0.23360.23480.0012u0.233960.2342(6)译码的时候又是如何处理的呢？例：根据上面给定字符的概率和取值范围，对代码0.23396进行译码，步骤如下：根据代码所在范围确定当前代码的第一个字符，并输出。由于0.23396在0.2,0.5的范围内，故代码对应的第一字符必定是e。输出字符e。用0.23396减去

34、e发生的概率取值下限 0.2,使代码变为0.03396，再除以e范围的宽度0.5-0.2=0.3。得到0.1132，落入区间0 , 0.2),所以对应后续字符为a。转到(2),将0.1132作为代码继续确定下一个译码字符的范围。3. 总结算术编码的过程实际上是用新加入的符号的取值范围来缩小代码的取值范围，而释放的过程与其相反。4、游程编码游程编码(Run Length Encoder , RLE )是种压缩编码，实现简单，还原后得到的数据与压缩前的数据完全相同，是无损压缩技术。但RLE所能获得的压缩比有多大，这主要取决于图像本身的特点。如图像中具有相同颜色的图像块越大，图像块数目越少，获得的

35、压缩比就越高，反之，压缩比就越小。对于重复色彩特别少的图像，如果仍然使用RLE编码方法,不仅不能压缩图像数据，反而可能使原来的图像数据变得更大。中文Word文档库010110101001101010100000000000000000001111111111111111111第一个字节S SS前后两个非零AC 系数之间连续零下一个非零AC系数幅值徧玛所需的个数的比特数符号2第二个字节中文 word 文档库，海量 word 文档免费下载www.wordwendan F个非o值的实际值5.4变换编码预测编码是一种较好地去除音频、图像信号相关性的编码技术，而变换编码也可有效去除图像信号的相关性，

36、而且其性能还往往优于预测编码。641 变换编码的原理变换编码不是直接对空域图像信号编码，而是首先在数据压缩前对原始输入数据作某种正交变换，把图像信号映射变换到另外一个正交向量空间，产生一批变换系数，然后再对这些变换系数进行编码处理。它首先在发送端将原始图像分割成n个子图像块，每个子图像块经过正交变换、滤波、量化和编码后送信道传输到达接收端，接收端作解码、逆变换、综合拼接，恢复出空域图像。Fourier Transformer， Laplace T，?直角坐标到时极坐标, 下图给出了其过程示意图:变换编、解码过程示意图灰度国像接送）正交变换对数字图像的处理到底有什么好处呢？如果有中文Word

37、文档库一个正弦波，用采样、量化的方法把它变换到空域上，或者说在空间上用一个个离散的量化值记录下来，随着时间的增长，数据量会呈海量”增长。但是换个思路，一个正弦波，只要记录频域上的幅度值、以及它的频率，就可以完全表示这个正弦波。可见在频域上描述信号，可大大减少数据相关性以及数据冗余。同理，设有两个相邻的数据样本 x1与x2，因为每个样本采用 3个比特编码，故共有23=8 个幅度等级。而两个样本的联合事件共有8 X 8=64种可能性，二维平面坐标表示，见下图：12 3 4 56 7(a)考虑到相邻样值的相关性，x1与 x2同时出现相近幅度的可能性最大。因此合成可能性往往落在图中以 x1=x2为对称

38、轴的圈内。相关性越强则圈子越扁；反之，圈越圆。一般情况下，要对圈内各点的位置进行编码，就要对两个差不多大的坐标值分别进行编码，说明x1处于某一幅度等级时，x2可能出现在不相同的任意幅度等级上。现在如对该数据进行正交变换，从几何上相当于坐标系旋转45°,变成y1、y2坐标系，那么此时相关圈正好处在y1坐标轴下，且该圈越扁长，其在y1上的投影就越大，而在 y2上投影就越小。见下图所示：中文Word文档库(b)由此可知，正交变换实现数据压缩的本质在于：经过坐标系适当的旋转和变换，能够把散布在各个坐标轴上的原始数据，在新的、适当的坐标系中集中到少数坐标轴上，因此，可用较少的编码位数来表示

39、一组信号样本，实现高效率的压缩编码。642K-L变换K-L变换(Karhunen-Loeve )亦称主分量变换，它从图像统计特性出发用一组不相关的系数来表示连续信号，实现正交变换。K-L变换使向量信号的各个分量互不相关，因而在均方误差准则下，它是失真最小的一种变换，故称为最佳变换。由于它的最佳”特性，所以常常作为对其他变换技术性能的评价标准。K-L变换的压缩性能是：对语音而言，用 K-L变换在13.5Kbit/s下得到的语音质量可与 56Kbit/s的PCM编码相拟：对图像来讲，2bit/pixel的质量可与7bit/pixel的PCM编码相当。6.4.3离散余弦变换离散余弦变换(Disc

40、rete Cosine Transform,DCT )是傅里叶变换的一种特殊情况。在傅里叶级数展开式中，如果被展开的函数是实偶函数，那么，其傅里叶级数中只包含余弦项，再将其离散化由此可导出余弦变换。变换原理：DCT是一种正交变换，它将信号从空间域变换到频率域。在频率域中，大部分的能量集中在少数几个低频系数上，而且代表不同空间频率分量的系数间的相关性大为减弱，只利用几个能量较大的低频系数就可以很好地恢复原始图像。对于其余的那些低能量系数，可允许其有较大的失真，甚至可将其置为0,这是DCT能够进行图像数据压缩的本质所在。644变换后的压缩1. 区域滤波和量化区域滤波是一个简单的数据压缩方法，它将

41、经过某种正交变换所得的系数矩阵分成几个区域，对每区域按照空间频率的权重取一种量化级数，然后根据这个量化级数进行量化。另一种更细致的量化方法是，根据视觉对图形的敏感程度(通过主观实验确定)，对于变换系数矩阵中的每个变换系数分别乘以一个视觉加权系数，由这一系数决定分配编码量的多少。2. “的游程编码见图所示：DCT变换后，变换系数矩阵中除主对角线外的元素很多是0,或接近于0，再加下视觉加权处理和量化，会产生更多的0。中文Word丈档库如果一行行编码，o在对角线附近，编码过程就会断掉，一个游程就会结束。怎样可使一连串的0的数目更多呢？用 zig-zag扫描读取方式即可。5.5 数据压缩编码国际标准

42、H.261是被可视电话、电视会议中采用的视频、图像压缩编码标准，由CCITT制定，1990年12月正式批准。JPEG是由ISO与CCITT成立的联合图片专家组（Joi nt Photograhpic Experts Grooup , JPEG） ”，制定的用于灰度图、彩色图的连续变化静止图像编码标准，于 1992年正式通过。而 MPEG则是以H.261为基础。发展而来的。它是由IEC和ISO成立的运动图像专家组（Moving Picture Experts Group ,MPEG ） ”制定，于 1992 年通过了 MPEG-1。6.5.1 JPEGJPEG是联合图像专家小组的英文缩写，其

43、算法称为JPEG算法，并且成为国际上通用的标准，因此又称为 JPEG标准。JPEG是一个适用范围很广的静态图像数据压缩标准，即可用于灰度图像又可用于彩色图像。它满足以下要求：（1）达到或接近当前压缩比图像保真度的技术水平，能覆盖一个较宽的图像质量等级范围，能得到很好”到极好”的评估，与原始图像相比，人的视觉难以区分。（2）能适用于任何种类的连续色调的图像，且长宽比都不受限制，同时也不受限于景物内容、图像的复杂程度和统计特性等。（3）计算机的复杂性是可控制的，其软件可在各种 CPU上完成，算法也可用硬件实现。（4）JPEG算法具有4种操作方式。第一，为顺序编码，每个图像分量按从左到右

44、，从上到下扫描，一次扫描完成编码；第二，累进编码，图像编码在多次扫描中完成，接收端收到图像是一个由粗糙到清晰的过程；第三，无失真编码；第四，分层编码，对图像按多个窨分辨率编码，接收端按其显示分辨率有选择地解码。JPEG压缩是有损压缩，它利用了人视觉系统的特性，去掉视觉冗余信息和数据本身的冗余信息，在压缩比为25： 1的情况下，压缩后的图像与原始图像相比较，非图像专家难辨真伪”。其算法框图如下：中文 word 文档库，海量 word 文档免费下载中文Word丈档库<a) DCT编码器压堀編码步骤(b) DCT編码器解压缩步骤中文 word 文档库，海量 word 文档免费下载中文

45、word 文档库，海量 word 文档免费下载JPEG的编码解码器及编码主要步骤如下图是JPEG的基于DCT的编码步骤框图，另一图是基于DCT的解码(译码)步骤框图，解码是编码的逆过程。这里由图可知其编码主要步骤：源图像数据分割成 8X8像块 DCT变换量化 Z字形编码成数据串使用DPCM对直流DC进行编码使用行程长度编码的RLE (run-Length Encoding )对交直流AC系数编码熵编码(Entropy encoding ) 中文 word 文档库，海量 word 文档免费下载中文 word 文档库，海量 word 文档免费下载图JPEG编码器过程中文 word 文档库，海

46、量 word 文档免费下载www.wordwendan 中文Word丈档库解码器IDCT 量化器爛编码压缩数据量化麦编码表图JPEG解码器过程离散余弦变换JPEG采用的是8X 8大小子块的二维离散余弦变换DCT，在编码器的输入端，把原始图像顺序地分割成8 X 8的子块系列。设原始采样精度为P位，是无符号整数，输入时把(0-2P-1 )范围变为(-2 P-1, 2 P-1-1),当P=8bit时，每个样本值减去128,数值范围为(-128 , 128)当 P=12 时，每个样本值减2048，数值范围为(-2048, 2048),然后送入FDCT，解码时IDCT输出是有符号的，要变换成无符号数用

47、于重构图像：变换公式为：厂1r 77164其中；16彌沁h)co®严亠+晦 lbu - v = 0,C(理)=C(v) =uv 0,C(w) = C(v) = 1F(0：0)珂工丫/(工丿)平均值dc系数V <u?v)I uO.vO,则为交流系数中文 word 文档库，海量 word 文档免费下载中丈Word文档库i ii 11 mu ii min2.使用加权函数对 FDCT系数进行量化这种量化是对经过 FDCT变换后的频率系数进行加权量化，这个加权函数对于人的视中文 word 文档库，海量 word 文档免费下载中文 word 文档库，海量 word 文档免费下载“o值

48、系数的数目，它是图像中文Word文档库觉系统是最佳的。量化的目的是减小非“o系数的幅度以及增加质量下降的最主要原因。对于有损压缩算法，JPEG算法使用如下表所增添的均匀量化器进行量化，量化步距是按照系数所在的位置和每种颜色分量的色调值来确定。17182447999999991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999亮度量化值16111016244051611212141926586055141316244057

49、6956141722295187806218223756681091037724355564811041139249647887103121120101729295987727100103993. Z字形编排量化后的DCT系数要重新编排，这样做可增加连续的“0系数的个数，也就是说尽量增加“0游程长度，最好的办法是采用“Z字蛇形”矩阵，见表所示。0156141527282471316262942381217253041439111824314044531019233239455254202233384651556021343747505659613536484957586263Z字型排列顺序图中文 word 文档库，海量 word 文档免费下载www.wordwendan

人人文库> 全部分类> 行业资料 > 管理策划

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第5章多媒体数据压缩技术.

文档简介

温馨提示

最新文档

评论

第5章多媒体数据压缩技术.

文档简介

温馨提示

最新文档

评论

相关文档