




已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
JPEG(Joint Photographic Experts Group)是ISO和CCITT为静态图象建立的一个国际数字图象压缩标准.定义了基于DCT的失真(Lossy)方式和使用预测器(Predictor)的无失真(Lossless)方式.在失真方式中, 又分只处理取样比例为8位的基本模式(BaseLine Process)和可以处理取样比例12位的扩展模式(Extended Process). 使用失真方式,压缩比可调(一般在10-50内效果最好);使用无失真方式,压缩比大于2.JPEG使用的几种压缩模式一览:基于DCT的失真方式 DCT_Based基本系统 Baseline顺序编码 Sequential哈夫曼编码 Huffman累进编码 Progressie哈夫曼编码 Huffman扩展系统 Extended顺序编码 Sequential哈夫曼编码 Huffman算术编码 Arithmetic累进编码 Progressie哈夫曼编码 Huffman算术编码 Arithmetic阶梯编码 Hierachical哈夫曼编码 Huffman算术编码 Arithmetic无失真编码 Lossless一般编码 Normal哈夫曼编码 Huffman算术编码 Arithmetic阶梯编码 Hierachical哈夫曼编码 Huffman算术编码 Arithmetic我们现在讨论Baseline系统中的顺序编码模式.JPEG的编码主要有以下几个步骤:1.色彩转换 2.部分取样 3.离散余弦变换DCT 4.量化 5.熵编码 6.数据混合编码的时候,JPEG编码器先将一幅原始图象转换为自己的色彩系统,按照人眼特点对其中各个色彩分量作不同的取样,经由DCT转换从时域变为频域,接着将变换后的数据量化以丢弃无用信息,然后用哈夫曼编码或者算术编码对量化后的系数进行编码得到压缩数据,最后将色彩分量信息,量化表,编码表和各个色彩分量的压缩数据等混合成一个整体数据流,即形成JPEG文件.解码的时候,JPEG解码器先从数据流中获取解码所必须的信息(色彩分量信息,量化表和编码表等),然后将各个色彩分量分别解码,过程和编码的时候刚好相反.编码和解码的流程图如下:色彩系统(Color Space) 返回JPEG编解码流程计算机显示使用的是RGB三色系统,而JPEG文件使用的是 亮度-色调-饱和度 色彩系统,本节讲的就是它们之间的转换.(为何不直接使用RGB色彩系统,在下一节将会讲到).间接色彩直接色彩1.YIQ:YIQ是北美NTSC电视系统中采用的色彩系统,Y不是指Yellow,而是指颜色的明视度(Luminance),或者称做亮度(Brightness),也可以称做灰度值(Gray Value),I和Q分别是色调和饱和度.YIQ与RGB的转换关系如下:Y=0.299R+0.587G+0.114BR=Y+0.956I+0.621QI=0.596R-0.274G-0.322BG=Y-0.272I-0.647QQ=0.211R-0.523G+0.312BB=Y-1.106I-1.703Q2.YUV:YUV是欧洲PAL电视系统中采用的色彩系统,YUV的含义和YIQ的含义一一对应YUV与RGB的转换关系如下:Y=0.299R+0.587G+0.114BR=Y+1.140VU=-0.148R-0.289G+0.473BG=Y-0.395U-0.581VV=0.615R-0.515G-0.100BB=Y+2.032U3.YCbCr:JPEG的缺省色彩系统,它是从YUV色彩系统中衍生出来的,将U和V做少许调整就是Cb和CrYCbCr与RGB的转换关系如下:Y =0.2990R+0.5870G+0.1140BR=Y+1.40200(Cr-128)Cb=-0.1687R-0.3313G+0.5000B+128G=Y-0.34414(Cb-128)-0.71414(Cr-128)Cr=0.5000R-0.4187G-0.0813B+128B=Y+1.77200(Cb-128)下图表明该类色彩系统与RGB系统的对应关系:色调饱和度亮度部分取样(SubSampling) 返回JPEG编解码流程研究表明:人类眼睛对亮度变化的敏感度比对色彩变化的敏感度要高的多.例如在光线不足的情况下,人眼看到的物体都是黑白的,只有光线足够强的时候,才能感觉到色彩的存在.从上一节的叙述我们知道,间接色彩可以用亮度,色调和饱和度来表示颜色.如果我们对于亮度处理比较精细,而对色调和饱和度只做粗略的处理,那么就可以提高压缩比而不会太影响视觉效果.这也是不用RGB色彩系统的原因.不过也不是绝对,JPEG还支持一种色彩系统CMYK属于直接色彩,那就不在我们现在讨论的范围里了.JPEG使用部分数据取样来完成这个过程.用取样因子描述.用一个例子来说明:如果一幅图,它的水平取样因子为2,1,1.则表示在水平方向上亮度、色调和饱和度的取样数据量比例为2:1:1.垂直取样因子为2,1,2.则表示再垂直方向上亮度、色调和饱和度的取样数据量比例为2:1:2.那么总的取样数据量比例为2*2:1*1:1*2 = 4:2:1.这个比例被称为YUV421.JPEG规定每种色彩成分取8*8个样值(为何要取8*8见下一节)为一个单位(Unit).按取样比例的几个色彩成分的单位组合,称为最小编码单位MCU(Minimum Coded Unit)下图表示一个16*16的图象块是怎样按YUV412被取样为一个MCU的:在上图中:原图象数据(16*16RGB矩阵)首先被转化为三个色彩成分数据(16*16YUV矩阵),然后对于Y成分(Component1),数据不变. 对于U成分(Component2),每2*2个数据求平均,取样为一个数据.对于V成分,每2*1个数据求平均,取样为一个数据,最后得到2*2个Y单位,1*1个U单位,1*2个V单位.这4+1+2个单位就是最小编码单位(MCU)通过部分取样可以看出,原来3*16*16=768个像素数据,变为16*16+8*8+8*16=448个,再未编码前就有约40%的压缩比.如果用YUV411则有50%的压缩比,用YUV422也有33%.理论上讲,如果取YUV911,YUV16 11可以达到更高的压缩比,但是这样图象品质就会受到影响,因此JPEG规定一个MCU里Unit的个数不能大于10离散余弦变换-DCT(Discrete Consine Transform) 返回JPEG编解码流程研究表明:人眼对低频数据比对高频数据有更高的敏感度.人们很早就使用这一特点,例如报纸上印刷照片是由很多黑色小圆点组成,这些小圆点代表高频数据,人眼看上去是一幅图象,即低频数据.如果我们对图象的高频数据作些修饰(将小圆点变为小方点),人眼是不容易辨认的(看上去还是原来的图象).一般图象(照片)有很大部分信息熵都在高频区.DCT的作用即是将一组光强数据(Intensity Data)转换为频率数据(Frequency Data),以便以后流程对高频数据进行修饰处理.由于DCT变换的运算量比较大,JPEG将每一个色彩分量的数据分割成8*8的小块,然后对这个8*8矩阵做DCT原始图象数据Ixy:变换后DCT系数Duv:I00 I01 I02 I03 I04 I05 I06 I07I10 I11 I12 I13 I14 I15 I16 I17I20 I21 I22 I23 I24 I25 I26 I27I30 I31 I32 I33 I34 I35 I36 I37I40 I41 I42 I43 I44 I45 I46 I47I50 I51 I52 I53 I54 I55 I56 I57I60 I61 I62 I63 I64 I65 I66 I67I70 I71 I72 I73 I74 I75 I76 I77-FDCT-FDCT 235 -1 -12 -5 2 -1 -2 1-22 -17 -6 -3 -2 0 0 -1-10 -9 -1 1 0 0 0 0-7 -1 0 1 0 0 0 00 0 1 1 0 0 0 11 0 1 0 0 1 1 -1-1 0 0 1 0 1 1 0-2 1 -3 -1 1 1 0 0量化表:量化16 11 10 16 24 40 51 6112 12 14 19 26 58 60 5514 13 16 24 40 57 69 5614 17 22 29 51 87 80 6218 22 37 56 68 109 103 7724 35 55 64 81 104 113 9249 64 78 87 103 121 120 10172 92 95 98 112 100 103 99- 15 0 -1 0 0 0 0 0-2 -1 0 0 0 0 0 0-1 -1 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 0我们假设上一个DCT的DC系数为20,则经过预处理(ZigZag,DPCM)后,系数排列为-5,0,-2,-1,-1,-1,0,0,-1,在这个地方,可以看出后面的系数全部为零,JPEG定义了一个块结束标记(EOB)来表示后面的数据全是零.重建过程如下:量化表:解码后系数:16 11 10 16 24 40 51 6112 12 14 19 26 58 60 5514 13 16 24 40 57 69 5614 17 22 29 51 87 80 6218 22 37 56 68 109 103 7724 35 55 64 81 104 113 9249 64 78 87 103 121 120 10172 92 95 98 112 100 103 99- 15 0 -1 0 0 0 0 0-2 -1 0 0 0 0 0 0-1 -1 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 0重建图象数据:反量化144 146 149 152 154 156 156 156148 150 152 154 156 156 156 156155 156 157 158 158 157 156 155160 161 161 162 161 159 157 155163 163 164 163 162 160 158 156163 1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业互联网平台SDN网络性能优化与安全防护策略报告
- 2025年市政工程考试须知试题及答案
- 结构化中级经济师考试答疑技巧与试题及答案
- 社区参与市政学试题及答案
- 2025年文化创意产业资金申请政策分析与项目申报建议报告
- 2025年餐饮行业绿色餐厅运营成本控制与效益分析报告
- 2025年市政工程行业发展试题及答案
- 行政管理中的公共关系学绩效评估方法及试题及答案
- 年产20万卷纤维素膜生产基地项目实施方案
- 工程投资的环境影响评估试题及答案
- 行政能力测试常识题库及答案
- 小学生反诈知识宣传课件
- 高血压脑出血专家共识
- NB-T 47013.1-2015 承压设备无损检测 第1部分-通用要求
- 西格列汀二甲双胍缓释片-药品解读
- 多因素身份认证
- 铁路基本建设工程设计概(预)算编制办法-国铁科法(2017)30号
- 汽车修理厂台账表格范本
- 颜真卿《劝学》ppt课件1
- 400字作文稿纸20x20格A4标准稿纸
- 管道燃气客服员(高级工)技能鉴定考试题库大全(含答案)
评论
0/150
提交评论