多媒体数据压缩(第5章)_第1页
多媒体数据压缩(第5章)_第2页
多媒体数据压缩(第5章)_第3页
多媒体数据压缩(第5章)_第4页
多媒体数据压缩(第5章)_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 预测编码(Predictive Coding) 预测编码是数据压缩技术中的一个重要分支,是利用前面的来预测当前的。5.1 DPCM的基本原理对于具有M种取值的符号序列 ,其第L个符号的熵满足: kx2112121log,LLLLLLLLLXXMH XHHXXXXHHXHX如果知道了当前的一些符号 ,再猜后面的一个符号 , 则 知道得越多, 越容易被猜中。容易猜中意味着该信源的不确定度减小了,数码率自然减少了。KXKLLXKXLX怎样才能理想预测呢?如果数据源可用一个数学模型完全代表,并且信源的输出始终和该模型的输出相匹配,我们就能精确的预测。 实际上没有一个实际信源符合这两个条件。我们

2、可以做到的最好的预测,只能是以某种最小的误差对下一个取样值进行预测。 例:利用信号的前一个取样值 来预测当前取样值 ,即 ,选择怎样的a使预测误差最小?1KX1KKaXXKX估计值的均方误差 22222112EKKKKKKEXXE XaE XXa E X自相关函数: ,ijR i jE XX在数据序列平稳过程条件下 )(,jiRjiR22(0)2(1)(0)ERaRa R求使 最小时的a2E22 (1)2(0)0(1)(0)ERaRaRaR 此时 222min(1)(0)(1) (0)(0)ERRaRR根据自相关函数的性质 (1)(0)RR2min1(0)EaR则当信号为零均值时,误差信号的方

3、差比原信号的方差小。 熵是概率分布的函数,分布越均匀熵越大,分布越集中,则熵越小。 用传输差值信号代替传输原始图像信号,会使传输的码率降低 预测法图像压缩编码的基本依据 原信号预测误差信号差分脉冲编码调制(Differential Pulse Code Modulation, DPCM) Xk+-量化器编码器ekekkk+预测器XX发送端S(k)解码器ek+预测器X接收端S(k)+X(k)KXkkkkKKKqeeeXXX量化误差 数个预测出的失真,完全由量化器产生。如果没有量化器,则DPCM可应用于无失真编解码中。 5.2 最佳线性预测设集合X表示信号序列,K时刻的信号值 用过去N个信号值的线

4、性组合来预测KX1NKiK irXaXKKKXXe22ekkEXX均方误差Niaaie.2 , 102 NRRRaaaRNRNRNRRRNRRRN1002120111021第六章 变换编码 在数字图象的处理中,通常有两类方法: 空间域(Spatial domain)处理法:直接对图象象素值进行处理,直观,简单频率域(Frequency domain)处理法:经正交变换后,对频率分量进行处理,更有效,更有实质性变换编码是图象编码的一个重要分支,是目前最有效、研究最热、应用最广泛的一类方法。6.1 正交变换的定义在频率域处理中,首先要对图象进行变换处理,要求这种变换是线性的、正交的。1. 线性:是

5、指处理后的输出量是由输入图象的象素的线形组合而成 11112211112200(,)(,). (,;,)MNmnP m nF m n O m n m n设有一个M*N大小的输入图象f(m1,n1),经线性运算后得到M*N的输出阵列p(m2,n2) 1122(,)O m n m n称之为核,代表加权系数 1.正交变换(也称酉变换),是线形变换的一种特殊形式上式是可逆的。满足正交性设M*N图象阵列f(m1,n1)的正向变换产生M*N的变换图象阵列, 11112211112200(,)(,). (,;,)MNmnP m nF m nA m n m n2200mMnN1122(,;,)A m n m

6、n表示正变换核 反变换则是从变换域映射回空间域22111122112200(,)(,). (,;,)MNmnF m nP m nB m n m n 1100mMnN1122(,;,)B m n m n表示反变换核 如果线性变换满足下面的正交条件,则称之为正交变换:222112211112212221112001111221222111200111122111221220011220(,;,). *( ,;,)(,)(,;,). *( ,;,)(,)(,;,). *(,;,)(,)(,;,MNmnMNmnMNmnnA m n m nAjj mmmj njB m n m nBjj mmmj njA

7、 m n m nAm n kkmk nkB m n m n 111111221220). *(,;,)(,)MNmBm n kkmk mk 如果变换的核可以写成下列形式,则说变换核是可分的。1122121211221212(,;,)(,).( ,)(,;,)(,).( ,)cRcRA m n m nA m nA n nB m n m nB m nBn n可分的二维酉变换可分两步运算,即分为两次一维变换来实现:11111122111122111212111212(,)(,). (,;,)(,).(,).( ,)(,).(,).( ,)cRmnmncRnmp m nF m nA m n m nF

8、m nA m mA n nF m nA m mA n n 正交变换的性质:l熵保持,不丢失信息l能量保持(parseval定理)l能量重新分配l去相关性,可将高度相关的空间样值变为相关性较弱的变换系数。正交变换编码 原始图象正交变换量化熵编码存 储 或传输熵解码反量化正 交 逆变换恢复图象常见的正交变换有:DFT、DCT、KLT等。2D DFT 正变换:)(2exp),(1),(1010NvyMuxjyxfMNvuFMxNy1,.,1 , 0Mu,1,.,1 , 0Nv)(2exp),(1),(1010NvyMuxjvuFMNyxfMxNy1,.,1 , 0Mx,1,.,1 , 0Ny反变换:

9、用傅立叶变换来分析图象信息具有很多优点,应用也相当普及。但是其具有一个大的缺点:变换结果是复数,在处理时,既要处理模,又要对相位作相应的处理,应用起来相当不便。12122( , , , )exp()exp.expA x y y vjuxvyjuxjvyNNNNN12122( , , , )exp()exp.expB x y y vjuxvyjuxjvyNNNNN6.3 2DDCT NvyMuxyxfvcucMNvuFMxNy2) 12(cos2) 12(cos),()()(4),(1010NvyMuxvuFvcucyxfMuNv2) 12(cos2) 12(cos),()()(),(1010D

10、CT的优点有:l全实数运算,处理容易;l去相关能力较强,仅次于KLT变换;l占用机时较多. 6.4 JPEG 标准标准 (Joint Photograph Experts Group)一、简介一、简介 1986年,CCITT(国际电话与电报顾问委员会International Telephone and Telegraph Consultative Committee)和ISO两个国际组织建立了联合图片专家组,其任务是建立第一个适用于连续色调图像压缩的国际标准。 JPEG的目标是开发一种用于连续色调图像压缩的方法,满足四种要求:应用当时的先进图像压缩技术,图像质量好;适用于所有的连续色调图像,

11、不受图像尺寸、色彩空间的限制具有适中的计算复杂性,适用于软硬件实现;具有四种操作模式:顺序编码累进编码无失真编码 层次编码 在全世界内征集方案,共提出了12种建议方案,第一轮评优,选出3种方案:l 自适应DCTl 自适应二进制算术编码l 块截断的累计编码 1988年1月又进行一次测试,JPEG专家一致同意以ADCT作为主要编码算法,该标准草案于1990年3月通过,1992年JPEG正式成为国际标准。 2JPEG操作模式 JPEG定义了4种操作模式:l基于DCT的顺序模式(Sequential encoding)l基于DCT的累进模式(Progressive encoding)l无失真模式(Lo

12、ssless encoding)l层次模式 (Hierarchical encoding)3JPEG的4种编码过程 JPEG根据4种操作模式定义了4种编码过程,其特征如下表所示: 预测过程源图像: p bit/pixel 162 p编码过程种类特征a. 基于DCT的基本过程基于DCT的过程源图像 8bit/pixel顺序模式Huffman编码b. 基于DCT的扩展过程基于DCT的过程源图像: 8 位或12位顺序或累进模式Huffman或算术编码c. 无失真过程预测过程源图像: p bit/pixel, 顺序 模式Huffman或算术编码d. 层次过程多帧使用基于DCT的扩展过程DCT分块4基于

13、DCT的基本过程 8888线性量化量化矩阵 DCAC1D预测预测误差Huffman编码Z 型扫描2D 游程-幅值编码多路器编码输出输入图像首先将原始图像分割成的 子块,对于彩色图像,它要求YUV 4:2:2格式 88常用的彩色空间有:与人眼视觉较为相符或或HSVHSIYUVYUVYUVYUVCYCYIQYUVBlackYellowMagentaCyanCMYKBlueGreendRGBrb420411422444)(),(),(Re转换:BGRVUY100. 0515. 0615. 0436. 0289. 0147. 0114. 0587. 0299. 0422 411 (1)2D DCT 为

14、消除直流电平的影响,首先将原始图像的所有像素减去128 16) 12(cos16) 12(cos),()()(41),(7070ljkijixlckclkXij16) 12(cos16) 12(cos),()()(41),(7070ljkilkXlckcjixkl00,21)()(lklckc正变换: 反变换: 其中(2)变换系统的量化),(),(),(lkQlkXroundlkXQround是四舍五入的取整整数,是图像质量下降的主要原因 , JPEG给出了量化系数矩阵表,在量化表设计时考虑了人眼的视觉特性 |9910310011298959272|1011201211038178644999

15、9999|921131048164553524996647|77103109685637221899362624|56695740241613149966262118|55605826191412129199999947241817|6151402416101116|为全度色度亮(3)编码输出对于直流系数预测,预测后进行熵编码1iiDIFFDCDC“ssss” + 附加位ssssDIFF001-1,12-3,-2,2,33-7,-4,4,74-15,-8,8,1515-32767,-16384,16384,32767附加位固定码表示 设 , 附加位为 的最低 SSSS位;若 ,则附加位为 -1的最低SSSS 位0DIFFDIFF0DIFFDIFFssss的Huffman码表 亮度色度00000101001201110310015对于交流AC系数 首先对交流系数进行Z型扫描,编码以游程幅值,Huffman编码的形式完成 JPEG给出了游程幅值的哈夫曼码表 游程/幅值(EOB)Huffman码字0/010100/1000/2010/31000/410111/111001/2110115基于DCT扩展过程与基本过程相同的是:源图像可以12bit/pixel可采用算术编码累进操作模式 6无失真编码过程 7层次过程把原

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论