版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数字图像基础与压缩编码第一页,共76页。数字图像概述图像:与视觉相关的媒体表现形式静态图像动态图像——视频图像数字化:将自然景物的形象信息转换成计算机可以处理的数字信息,包括颜色信息。图像数据压缩图像数据中有许多重复的数据,使用数学方法来表示这些重复数据就可以减少数据量(无损压缩技术)人的眼睛对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,这也能达到压缩数据的目的(有损压缩技术)第二页,共76页。4.1图像颜色模型颜色:视觉系统对可见光的感知结果。可见光是波长在380nm~780nm之间的电磁波图像的颜色模型:颜色的表示模型,用来描述能感知的和处理的颜色。不同的颜色模型具有不同的说明和度量颜色的坐标系。彩色空间:颜色模型中所有被定义的颜色形成的坐标系空间。颜色用坐标系中的一个点表示。常用颜色模型:RGB(红色、绿色、蓝色)——显示设备CMYK(青色、品红、黄色、黑色)——印刷设备HSB(色调、饱和度、亮度)——视觉处理YUV——彩色全电视信号数字化第三页,共76页。一个能发出光波的物体称为有源物体,它的颜色由该物体发出的光波决定,使用RGB相加混色模型;显示彩色图像用RGB相加混色模型颜色F=r[R](红色的百分比)+g[G](绿色的百分比)+b[B](蓝色的百分比)4.1.1RGB颜色模型第四页,共76页。当三基色等量相加时,得到白色;等量的红绿相加而蓝为0值时得到黄色;等量的红蓝相加而绿为0时得到品红色;等量的绿蓝相加而红为0时得到青色。RGB颜色相加第五页,共76页。颜色相加列表:第六页,共76页。标准的电视图形阵列适配卡的16色
第七页,共76页。标准的电视图形阵列适配卡的16色第八页,共76页。图象的相加色一幅彩色图像可以看成由许多的点组成的每个像素都有一个值,称为像素值,它表示特定颜色的强度。一个像素值往往用R,G,B三个分量表示RGB图像第九页,共76页。RGBR数组—8bit表示(256阶梯)G数组—8bit表示(256阶梯)B数组—8bit表示(256阶梯)最大表示:28×28×28=224=16777216(16.7M)RGB图像示例第十页,共76页。一个不发光波的物体称为无源物体,它的颜色由该物体吸收或者反射哪些光波决定,用CMYK相减混色模型。任何一种颜色都可以用三种基本颜料按一定比例混合得到:青色(Cyan)、品红(Magenta)和黄色(Yellow),通常写成CMY,称为CMY模型。用彩色墨水或颜料进行混合,这样得到的颜色称为相减色。4.1.2CMYK颜色模型第十一页,共76页。当三基色等量相减时得到黑色;等量黄色(Y)和品红(M)相减而青色(C)为0时,得到红色(R);等量青色(C)和品红(M)相减而黄色(Y)为0时,得到蓝色(B);等量黄色(Y)和青色(C)相减而品红(M)为0时,得到绿色(G)。第十二页,共76页。相减色列表第十三页,共76页。C数组—8bit表示(256阶梯)M数组—8bit表示(256阶梯)Y数组—8bit表示(256阶梯)K数组—8bit表示(256阶梯)
最大表示:28×28×28×28=232=4294967296(4294M)CMYKCMYK图像示例第十四页,共76页。HSB(Hue、Saturation、Brightness)色彩空间是用H、S和B3个参数来生成颜色。其中,H为颜色的色调,改变它的数值可以生成不同的颜色;S为颜色的饱和度,改变它可以改变颜色的深浅;B为颜色的亮度,改变它可以使颜色变亮或变暗。
HSB色彩空间更符合人的视觉特性,更接近人对彩色的认识和解释。对某一颜色,人眼分辨不出其中R、G、B的比例,但可以感觉到它的颜色的种类、深浅和明暗程度。4.1.3HSB色彩空间第十五页,共76页。色调:是当人眼看到一种或多种波长的光时所产生的彩色感觉,它反映颜色的种类,是决定颜色的基本特性,如红色、棕色就是指色调;饱和度:指的是颜色的纯度,即掺入白光的程度,或者说是指颜色的深浅程度,对于同一色调的彩色光,饱和度越深颜色越鲜明或说越纯。通常我们把色调和饱和度通称为色度。亮度:颜色的相对明暗程度。HSB色彩空间第十六页,共76页。YUV彩色空间——电视系统中常用Y表示亮度,U、V用来表示色差,U、V是构成彩色的两个分量。YUV表示法的重要特性:①它的亮度信号(Y)和色度信号(U、V)是相互独立的,也就是Y信号分量构成的黑白灰度图与用U、V信号构成的另外两幅单色图是相互独立的。②可以利用人眼的特性来降低数字彩色图像所需要的存储容量。(用Y传送细节,UV进行大面积着色,以减少所需要的数据量。PAL制中,Y的带宽4.43MHz,UV为1.3MHz)4.1.4YUV(YIQ)彩色空间第十七页,共76页。彩色空间变换:适应不同设备的要求利用人的视觉特性以降低数据量,通常把RGB空间表示的彩色图像变换到其他彩色空间。主要的彩色空间变换:YUV-RGB:YUV适用于PAL和SECAM彩色电视制式YIQ-RGB:YIQ适用于NTSC彩色电视制式YCrCb-RGB:YCrCb适用于数字电视和计算机用数字视频图像HSB-RGB:计算机视觉处理和识别4.2彩色空间的线性变换第十八页,共76页。YUV与RGB彩色空间变换
Y=0.299R+0.587G+0.114BU=-0.147R-0.289G+0.436BV=0.615R-0.515G-0.100B第十九页,共76页。YIQ与RGB彩色空间变换
Y=0.299R+0.587G+0.114BI=0.596R-0.275G-0.321BQ=0.212R-0.523G+0.311B
第二十页,共76页。YCrCb与RGB彩色空间变换Y=0.299R+0.578G+0.114BCr=(0.500R-0.4187G-0.0813B)+128Cb=(-0.1687R-0.3313G+0.500B)+128第二十一页,共76页。HSI(HSB)与RGB彩色空间变换第二十二页,共76页。图像的属性:包含分辨率、像素深度、真/伪彩色。分辨率:显示分辨率和图像分辨率。显示分辨率:指显示屏上能够显示出的像素数目。例如,显示分辨率为640×480表示显示屏分成480行,每行显示640个像素,整个显示屏就含有307200个显像点。图像分辨率:指一幅图像在水平和垂直方向上的最大像素点的个数。若图像像素点距固定,则图像分辨率越大则图像越大;若图像大小一样,图像分辨率越大,则组成该图的图像像素数目越多,图像看起来就越细致逼真。4.3图像的三个基本属性4.3.1分辨率第二十三页,共76页。图像分辨率与显示分辨率是两个不同的概念。图像分辨率是确定组成一幅图像的像素数目,而显示分辨率是确定显示图像的区域大小。如果显示屏的分辨率为640×480,那末一幅320×240的图像只占显示屏的1/4。显示分辨率与图像分辨率的区别
第二十四页,共76页。扫描分辨率:扫描仪扫描图像的扫描精度,单位为每英寸多少点(DotsPerInch,DPI)表示。扫描分辨率越大,扫描得到的图像越大:300DPI扫描8”x10”的彩色图像,将产生2400x3000像素的图像打印分辨率:图像打印时每英寸可识别的点数,单位为DPI。打印分辨率越大,在纸张大小不变的情况下,打印的图像越精细。扫描分辨率与打印分辨率第二十五页,共76页。像素深度:指存储每个像素所用的位数,它是用来度量图像的分辨力。颜色深度:决定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。一幅彩色图像的每个像素用R,G,B三个分量表示,若每个分量用8位,那末一个像素共用24位表示,就说像素的深度为24,每个像素可以是224=16777216种颜色中的一种。在用二进制数表示彩色图像的像素时,除R,G,B分量用固定位数表示外,往往还增加1位或几位作为属性(Attribute)位。例如,RGB5∶5∶5表示一个像素时,用2个字节共16位表示,其中R,G,B各占5位,剩下一位作为属性位。在这种情况下,像素深度为16位,而颜色深度为15位。4.3.2颜色深度(像素深度)第二十六页,共76页。真彩色(truecolor)真彩色是指在组成一幅彩色图像的每个像素值中,有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。伪彩色(pseudocolor)伪彩色图像的含义是,每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表(colorlook-uptable,CLUT)的表项入口地址,去查找一个显示图像时使用的R,G,B强度值,用查找出的R,G,B强度值产生的彩色称为伪彩色。4.3.3真彩色、伪彩色与直接色第二十七页,共76页。真彩色和伪彩色图像之间的差别
第二十八页,共76页。直接色(directcolor)每个像素值分成R,G,B分量,每个分量作为单独的索引值对它作变换。也就是通过相应的彩色变换表找出基色强度,用变换后得到的R,G,B强度值产生的彩色称为直接色。它的特点是对每个基色进行变换。试验结果表明,使用直接色在显示器上显示的彩色图像看起来真实、很自然。4.3.3真彩色、伪彩色与直接色第二十九页,共76页。矢量图是用一系列计算机指令来表示一幅图,如画点、画线、画曲线、画圆、画矩形等。这种方法实际上是用数学方法来描述一幅图。矢量图的优点是:缩放、旋转、移动时图像不会失真。存储和传输时数据量较小。矢量图的缺点是:图像显示时花费时间比较长。真实世界的彩色图像难以转化为矢量图。4.3.4图像种类矢量图第三十页,共76页。矢量图示例第三十一页,共76页。位图是将一副图像在空间上离散化,即将图像分成许许多多的像素,每个象素用若干个二进制位来指定该像素的颜色或灰度值。位图的优点是:扫描仪、数码相机、摄像机等设备方便地转化为点位图显示速度快。真实世界的图像可以通过位图表示。位图的缺点是:存储和传输时数据量比较大。缩放、旋转时算法复杂且容易失真。位图第三十二页,共76页。位图示例第三十三页,共76页。RGB彩色图像●RGB——红、绿、蓝R
GBRGBR数组—8bit表示(256阶梯)G数组—8bit表示(256阶梯)B数组—8bit表示(256阶梯)最大表示:28×28×28=224=16777216(16.7M)第三十四页,共76页。CMYK彩色图像●CMYK青、品红、黄、黑CKMYC数组—8bit表示(256阶梯)M数组—8bit表示(256阶梯)Y数组—8bit表示(256阶梯)K数组—8bit表示(256阶梯)
最大表示:28×28×28×28=232=4294967296(4294M)CMYK第三十五页,共76页。灰度图象是按照灰度的等级数目进行划分进行如果灰度等级用8位表示,则灰度等级就是256级如果每个象素值用1位表示,只有黑白两种颜色的图像,则称为单色图象灰度图象与单色图像第三十六页,共76页。由ISO和IEC两个组织联合组成的一个专家组,负责制定静态的数字图象数据压缩编码标准可用于静态图象,也可以用于动态图象基本压缩算法:基于离散余弦变换的有损压缩算法基于空间预测技术的无损压缩算法4.4JPEG压缩编码4.4.1JPEG压缩标准第三十七页,共76页。基于DPCM的无损压缩编码算法源图像数据预测器熵编码器表说明压缩后图像数据无失真编码器(a)三领域采样值(b)预测方式第三十八页,共76页。●压缩比——10:1~100:1(一般压缩比≯40:1)●压缩原理——采用无失真预测编码、有失真DCT编码等混合编码方式●无失真预测编码——线性预测编码,压缩比2:1●有失真DCT编码——[1]离散余弦变换压缩编码,压缩比40:1[2]霍夫曼编码(增强型编码)[3]自适应算术编码(增强型编码)●特点
[1]压缩比可调
[2]对CPU的响应速度要求不高
[3]压缩算法复杂(可同时使用四种压缩编码方式)基于DCT的有损压缩编码算法第三十九页,共76页。JPEG核心是“离散余弦变换(DiscreteCosineTransform,DCT)”JPEG压缩算法的基本步骤为:1、离散余弦变换DCTTransformation2、系数量子化CoefficientQuantization
3、Huffman无损压缩LosslessCompression4.4.2JPEG有损压缩算法第四十页,共76页。静态图象压缩原理图第四十一页,共76页。正向离散余弦变换(FDCT)。量化(quantization)。Z字形编码(zigzagscan)。使用差分脉冲编码调制(differentialpulsecodemodulation,DPCM)对直流系数(DC)进行编码。使用行程长度编码(run-lengthencoding,RLE)对交流系数(AC)进行编码。熵编码(entropycoding)。
JPEG算法步骤第四十二页,共76页。正向离散余弦变换对每个单独的彩色图像分量,把整个分量图像分成8×8的图像块,并作为两维离散余弦变换DCT的输入。通过DCT变换,把能量集中在少数几个系数上。第四十三页,共76页。正向离散余弦变换DCT变换使用下式计算逆变换使用下式计算C(u),C(v)=1/,当u,v=0;
C(u),C(v)=1,其他。
第四十四页,共76页。一个真实的编码和解码过程第四十五页,共76页。量子化QuantizationDCT变换的输入是8位的象素值(0~255,JPEG实现时将其减去128,范围变成-128~127)。量子化即通过整除运算减少输出值的存储位数。使用量子化矩阵(QuantizationMatrix)来实现量子化。量子化公式为:量化后的值(i,j)=ROUND(DCT(i,j)/量子(i,j))逆量子化公式为:DCT(i,j)=量化后的值(i,j)*量子(i,j)量子化是JPEG算法中损失图像精度的根源,也是产生压缩效果的源泉第四十六页,共76页。量子表QuantumTablequality=4quality=9Quantum[i][j]=1+((1+i+j)*quality)第四十七页,共76页。一个真实的编码和解码过程第四十八页,共76页。Zig-Zag编码(0,0)->(0,1)->(1,0)->(2,0)->……
量化后的系数要重新编排,目的是为了增加连续的“0”系数的个数,就是“0”的游程长度,方法是按照Z字形的式样编排。这样就把一个8x8的矩阵变成一个1x64的矢量,频率较低的系数放在矢量的顶部。第四十九页,共76页。DC系数和AC系数第五十页,共76页。直流系数编码8x8图像块经过DCT变换之后得到的DC直流系数有两个特点:一是系数的数值比较大二是相邻8x8图像块的DC系数值变化不大。JPEG算法使用了差分脉冲调制编码(DPCM)技术,对相邻图像块之间量化DC系数的差值(Delta)进行编码Delta=DC(0,0)k-DC(0,0)k-1第五十一页,共76页。交流系数编码量化AC系数的特点是1x63矢量中包含有许多“0”系数,并且许多“0”是连续的游程长度编码(RLE)对它们进行编码JPEG使用了1个字节的高4位来表示连续“0”的个数,而使用它的低4位来表示编码下一个非“0”系数所需要的位数,跟在它后面的是量化AC系数的数值。0的个数下个非“0”系数位数量化AC系数的数值第五十二页,共76页。熵编码使用熵编码还可以对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩。在JPEG有损压缩算法中,使用霍夫曼编码器或算术编码器来减少熵。使用霍夫曼编码器的理由是可以使用很简单的查表(lookuptable)方法进行编码。
第五十三页,共76页。哈夫曼编码(查表法)
第五十四页,共76页。组成位数据流JPEG编码的最后一个步骤是把各种标记代码和编码后的图像数据组成一帧一帧的数据,这样做的目的是为了便于传输、存储和译码器进行译码,这样组织的数据通常称为JPEG位数据流(JPEGbitstream)。第五十五页,共76页。一个真实的编码和解码过程第五十六页,共76页。JPEG的其他问题将原始图像划分成多个8X8或16X16的矩阵进行处理要求矩阵中每个点的像素值范围是0~255二值、16级灰度等均转换为256级灰度图像进行处理对非256色的彩色图象,先转换成真彩色图像,然后使用分色法将图像分成红、蓝、绿三个256级灰度图像,再进行处理JPEGCommittee
第五十七页,共76页。■BMP格式——Bitmap,Microsoft公司开发,用于Windows环境●使用要点
(1)用于表现打印、显示用图像
(2)不适于网络传送
(3)不适于提供印刷文件文件头调色板数据(反向排列)图像数据●特点
(1)扩展名采用“.bmp”(2)文件描述单一(静止)图像
(3)彩色模式:24~232(4)调色板RGB数据顺序反向排列
(5)以图像左下角为起点排列数据
(6)一般采用非压缩数据格式4.5图像文件格式及其转换4.5.1基本图像文件格式第五十八页,共76页。●TIFF格式TagImage,Aldus公司开发,用于精确描述图像的场合●使用要点
(1)平面设计作品的最佳表现形式
(2)用于提供印刷文件
(3)不适于网络传送文件头标识信息区图像数据●特点
(1)扩展名采用“.tif”(2)文件描述单一(静止)图像
(3)彩色模式:21(单色)
~232(4)支持多平台(PC&Macintosh)(5)可采用多种压缩数据格式第五十九页,共76页。●TGA格式TagaImageFormat,Truevision公司开发,用于屏显和动画帧显示●使用要点
(1)用于表现影视广播级动画的帧
(2)不适于保存高质量印刷文件
(3)不适于网络传送●特点
(1)扩展名采用“.tga”(2)文件描述单一(静止)图像
(3)彩色模式:20(1色)
~232(显示模式依赖显示卡)(4)图像分辨率固定为96dpi文件头调色板信息图像数据数据补充区第六十页,共76页。●GIF格式GraphicsInterchangeFormat,CompuServe公司开发,用于屏显和网络●使用要点
(1)用于屏幕显示图像和电脑动画
(2)用于网络传送
(3)不适于保存高质量印刷文件●特点
(1)扩展名采用“.gif”(2)具有87a、89a两种格式
87a——描述单一(静止)图像
89a——描述多帧图像
(3)彩色模式:28(256色),分辨率96dpi(4)采用改进的LZW压缩算法文件头逻辑屏幕描述图像数据结束标志调色板信息第六十一页,共76页。PSD格式是Adobe公司开发的图像处理软件PhotoShop中自建的标准文件格式,是PhotoShop的默认文件格式,它支持PhotoShop的所有功能,能保存没有合并的图层、通道和蒙板等信息。●PSD格式第六十二页,共76页。●JPEG格式JointPhotographicExpertsGroup,联合专家小组开发,用于彩色图像的存储和网络传送●使用要点
(1)用于保存表现自然景观的图像
(2)用于网络传送
(3)不适于表现有明显边界的图形
(4)不适用于高质量印刷文件●特点
(1)扩展名采用“.jpg”(2)采用有损压缩编码形式,数据量小
(3)彩色模式:232(真彩色)(4)经解压缩,方可显示图像,显示速度慢经压缩的图像数据各类压缩算法第六十三页,共76页。英文版+中文补丁程序ACDSee32Version2.4注册码文件Sn.txt安装程序Acdc3224中文补丁Pacdsee3224●浏览对象BMP
DIBRLEEMFGIFGIF89a(网页动画)IFFLBMILBMJPGJPEGJPEJIFJFIKDCPCDPCXDCXPICPIXPNGPSDSGIBWRGBRGBATGATIF
TIFFWMF(剪贴画)4.3静态图像处理软件
4.3.1图像浏览器第六十四页,共76页。●(1)选择路径(3)单击图片标记观看小图片(2)选择“图片预览”(4)双击图片标记正式观看图片(5)双击图片返回浏览图片画面浏览图片●操作步骤4.3静态图像处理软件
4.3.1图像浏览器第六十五页,共76页。Windows的公用剪贴板Word/画图●获取整屏画面PrintScreenAlt●+
获取当前窗口PrintScreen●使用图形●
如果在Word中使用,先粘贴到画图工具中,保存文件后,再在Word中插入图片
(若直接粘贴到Word中,转移介质时,图片可能会丢失)●粘贴到画图工具后,选择“24位位图(BMP)”保存图形画图工具4.3静态图像处理软件
4.3.2获取Windows界面(抓图)第六十六页,共76页。●[操作要点]获取界面举例●粘贴到Word2000中,并添加注释文字
(插入文件,使用文本框)●若直接粘贴到Word中,当转移介质时,图片可能会丢失●获取资源管理器界面
(整个窗口)4.3静态图像处理软件
4.3.2获取Windows界面(抓图)第六十七页,共76页。●AldusPhotoStyler(1)简单绘图
(2)位图图像加工
(3)滤镜集成效果●AdobePhotoShop(1)简单绘图
(2)位图图像分层加工
(3)滤镜集成效果●MacromediaFREEHAND(1)强大的绘制图形功能
(2)矢量图形处理
(3)格式转换(图形→图像)流行的图像处理软件4.3静态图像处理软件
4.3.3图像处理第六十八页,共76页。典型的图像处理软件PhotoShop●扫描输入功能——运行扫描驱动程序,驱动扫描仪,进行扫描编辑●图像编辑功能——色彩变换,尺寸变换,抠图,组合等●图层编辑功能——变换图层,图层融合,合并图层●打印输出功能——彩色RGB输出●文件管理功能——打开各类文件、保存多种文件格式●傻瓜编辑功能——图像调整,丰富多彩的滤镜图像处理软件的特点
使用条件●硬盘≮150MB,内存≮64MB●彩色模式≥16位,显示≥800×600●若安装到C:盘以外的驱动器时,C:盘至少保留16MB的可用空间4.3静态图像处理软件
4.3.3图像处理第六十九页,共76页。●双击PhotoShop图标等待启动启动与界面●PhotoShop界面功能菜单辅助工具栏工具盒图像编辑窗口导航器窗口颜色窗口历史纪录窗口图层窗口状态栏
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 国美电器的人力管理
- 超声影像解释指南
- 铸牢中华民族共同体意识“开学第一课”教育大纲
- 谱写生命之歌弘扬运动精神
- 2026年3月临泉皖能环保电力有限公司社会招聘1人备考题库(第二次)附答案详解(典型题)
- 2026广东华南理工大学前沿软物质学院文韬课题组科研助理岗位招聘1人备考题库及答案详解(必刷)
- 预防医学科:疫苗接种指南
- 2026长影集团有限责任公司招聘9人备考题库附答案详解(b卷)
- 2026浙江温州医科大学附属第一医院泌尿外科(男性科)康复技师招聘1人备考题库附参考答案详解(预热题)
- 精神科危急值的护理管理
- 2025年南京房地产市场分析报告
- 会计师事务所组织机构设置及工作职责
- 眼球震颤的计算机建模
- 资源教室工作方案设计
- 工程经济学第2版杜春艳习题答案
- 《走进文言文》八年级1-7单元的翻译
- GB/T 12451-2023图书在版编目数据
- 那垌小学内部控制考核评价报告
- 星火英语四级词汇
- 物业品质服务提升计划表最终版
- 人教版(2022)高中语文必修上册同步训练第八单元综合检测word版含答案
评论
0/150
提交评论