02 数字图像处理基础资料_第1页
02 数字图像处理基础资料_第2页
02 数字图像处理基础资料_第3页
02 数字图像处理基础资料_第4页
02 数字图像处理基础资料_第5页
已阅读5页,还剩86页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第2章 图像处理基础本章重点:图像的数字化以及数字化图像表示方法图像存储格式第2章 图像处理基础2.1 人眼成像过程2.2 简单的图像形成模型2.3 图像的数字化2.4 数字图像的基本类型2.5 数字图像的基本文件格式2.6 傅里叶变换2.1 人眼成像过程 人眼是一个平均半径为20mm的球状器官。它由三层薄膜包围着,如右图所示。最外层是坚硬的蛋白质膜,其中,位于前方的大约16部分为有弹性的透明组织,称为角膜,光线从这里进入眼内。 其余56为白色不透明组织,称为巩膜,它的作用是巩固和保护整个眼球。中间一层由虹膜和脉络膜组成。虹膜的中间有一个圆孔,称为瞳孔。它的大小可以由连接虹膜的环状肌肉组织来调

2、节,以控制进入眼睛内部的光通量大小,其作用和照相机中的光圈一样。最内一层为视网膜,它的表面分布有大量光敏细胞。 除了三层薄膜,在瞳孔后面有一个扁球形的透明体。水晶体的作用如同可变焦距的一个透镜,它的曲率可以由睫状肌的收缩进行调节,从而使景象始终能刚好地聚焦于黄斑区。眼睛的晶状体和普通光学透镜之间的主要差别在于前者的适应性强。用眼睛看建筑物侧面的图解,C点是晶状体的光心近视眼远视眼2.2 简单的图像形成模型一幅图像实际上记录的是物体辐射能量的空间分布,这个分布是空间坐标、时间和波长的函数,即:I=(x,y,z,t) 当一幅图像为平面单色图像时,空间坐标变量z ,波长可以从函数中去除,一幅图像可以

3、用一个二维分布函数表示: f (x, y, t)一幅平面静态单色图像,可以将时间函数t 从函数中去除,图像可以用f (x, y)来表示。2.3 图像的数字化几个名词:图象、图像、图片、影象、图形 Image, Picture, Pattern连续图像 照片、电视、录象、电影 数学表达式:f (x, y, t) 是一个二维分布函数,t是时间变量。 2.3 图像的数字化连续图像数字图像离散化目的:便于计算机处理。离散化: 空间采样:512512 象素 Pixel 分辨率 Resolution 幅值量化:256级, 28级, 8bit 灰度级 Grey level数字图像可以理解为对二维函数f(x,

4、y)进行采样和量化(即离散处理)后得到的图像,因此,通常用二维矩阵来表示一幅数字图像。 将一幅图像进行数字化的过程就是在计算机内生成一个二维矩阵的过程。数字化过程主要包括两个步骤:采样和量化。 2.3.1 采样 采样(Sampling):是对图像空间坐标的离散化, 它决定了图像的空间分辨率。 用一个网格把待处理的图像覆盖,然后把每一小格上模拟图像的各个亮度取平均值,作为该小方格中点的值。 图像的采样对一幅图像采样时,若每行(即横向)像素为M个,每列(即纵向)像素为N个,则图像大小为MN个像素,从而f(x,y)构成一个MN实数矩阵: 每个元素为图像f(x,y)的离散采样值,称之为像元或像素。 类

5、比一维信号电压流量txy二维图象二维采样定理(Nyguist 准则)1/x,1/y2倍的图象函数上限频带。2.3.2 量化把采样后所得的各像素灰度值从模拟量到离散量的转换称为图像灰度的量化。量化是对图像幅度坐标的离散化,它决定了图像的幅度分辨率。曹冲秤象与离散化量化量化的方法包括:等间隔量化和非非等间隔量化。等间隔量化就是简单地把采样值的灰度范围等间隔地分割并进行量化。也称为均匀量化或线性量化。为了减小量化误差,引入了非均匀量化的方法。非均匀量化依据一副图像具体的灰度值分布的概率密度函数,按总的量化误差最小的原则来进行量化。具体做法是:对图像中像素灰度值频繁出现的灰度值范围,量化间隔取小一些;

6、对那些像素灰度值极少出现的范围,则量化间隔取大一些。(a) 量化 (b) 量化为8 bit量化示意图(a) 256级灰度图象 (b) 子图 (c) 子图对应的量化数据图像量化实例对一幅图像,当量化级数一定时,采样点数对图像质量有着显著的影响。采样点数越多,图像质量越好; 当采样点数减少时,图上的块状效应就逐渐明显。同理,当图像的采样点数一定时,采用不同量化级数的图像质量也不一样。量化级数越多,图像质量越好,当量化级数越少时,图像质量越差,量化级数最小的极端情况就是二值图像,图像出现假轮廓。 采样点数和量化级数的关系:(a) 采样点256256时的图像 (b) 采样点6464时的图像(c) 采样

7、点3232时的图像(d) 采样点1616时的图像 采样点数与图像质量之间的关系(a) 量化为2级的Lena图像 (b) 量化为16级的Lena图像(c) 量化为256级的Lena图像 量化级数与图像质量之间的关系 1972年2019年 分辨率不同 的图象比较分辨率 640 x480分辨率 320 x240分辨率 160 x120分辨率 80 x60从粗到细地观察分辨率 640 x480分辨率 320 x240分辨率 160 x120分辨率 80 x60 查视力=检测分辨率?Clockwise from top left:Standard Lena;Lena with aGaussian blu

8、r;Lena convertedto polar coordinates;Lenas edges;Lena spherized, concave;Lena spherized, convex.1972年2019年2.4 数字图像的基本类型矢量图(Vector),也称矢量存储模式。矢量图是用一系列计算机指令来表示的一幅图。矢量图只存储图像内容的轮廓部分,而不是图像数据的每一点。途中每一个形状都是一个完整的公式,称为一个对象。文件数据量小。图像质量与分辨率无关。不易制作色调丰富或色彩变化太多的图像,而且图像不是很逼真。2.4.1 二值图像二值图像也叫黑白图像,就是图像象素只存在0,1两个值。二进制

9、的lena图像2.4.2 灰度图像灰度图像是包含灰度级的图像,如64级,256级等。如当像素灰度级用8 bit表示时,每个像素的取值就是256种灰度中的一种,即每个象素的灰度值为0到255中的一个。通常,用0表示黑,255表示白,从0到255亮度逐渐增加。 2.4.3 索引图像索引图像把像素值直接作为索引颜色的序号,根据索引颜色的序号就可以找到该像素的实际颜色。索引颜色也称为映射颜色。当把索引图像读入计算机时,索引颜色将被存储到调色板中。调色板是包含不同颜色的颜色表,每种颜色以红,绿,蓝三种颜色的组合来表示。调色板的单元个数是与图像的颜色数一致的。256色图像有256个索引颜色,相应的调色板就

10、有256个单元。 2.4.4 RGB图像RGB图像是一类图像的总称,也称为真彩色。这类图像不使用单独的调色板,每一个像素的颜色由存储在相应位置的红,绿,蓝颜色分量共同决定。RGB图像是24位图像,红绿蓝分量分别占用8位,理论上可以包含1670万种不同的颜色。2.5 数字图像的基本文件格式每一种图像文件均有一个文件头, 在文件头之后才是图像数据。文件头的内容一般包括文件类型、文件制作者、制作时间、版本号、文件大小等内容。图像文件还涉及图像文件的压缩方式和存储效率等。常用的图像文件存储格式主要有BMP文件、JPG文件、PCX文件、TIF文件以及GIF文件等。 2.5.1 BMP图像文件格式第一部分

11、为位图文件头BITMAPFILEHEADER,它是一个结构体,其定义如下: typedef struct tagBITMAPFILEHEADER WORD bfType; /文件类型,必须是0 x424D DWORDbfSize; /指定文件大小 WORDbfReserved1; WORDbfReserved2; DWORDbfOffBits; /从文件头到实际位图数据的偏移字节数 BITMAPFILEHEADER;这个结构的长度是固定的,为14个字节(WORD为无符号16位二进制整数,DWORD为无符号32位二进制整数)。 第二部分为位图信息头BITMAPINFOHEADER,也是一个结构,

12、其定义如下:typedef struct tagBITMAPINFOHEADER DWORD biSize; /该结构的长度,为40 LONGbiWidth; LONGbiHeight; WORDbiPlanes; /位平面数,必须为1 WORDbiBitCount; /指定颜色位数 DWORD biCompression; /指定是否压缩 DWORD biSizeImage; /实际位图数据字节数 LONGbiXPelsPerMeter; /目标设备水平分辨率 LONGbiYPelsPerMeter; /目标设备垂直分辨率 DWORDbiClrUsed; /实际使用的颜色数 DWORDbiC

13、lrImportant; /图像中重要的颜色数 BITMAPINFOHEADER; 这个结构的长度是固定的,为40个字节(LONG为32位二进制整数)。其中,biCompression的有效值为BI_RGB、 BI_RLE8、 BI_RLE4、BI_BITFIELDS。第三部分为调色板(Palette) 。真彩色图像不需要调色板。调色板实际上是一个数组, 共有biClrUsed个元素。数组中每个元素的类型是RGBQUAD结构,占4个字节,其定义如下: typedef struct tagRGBQUAD BYTE rgbBlue; /该颜色的蓝色分量 BYTE rgbGreen;/该颜色的绿色分

14、量 BYTE rgbRed;/该颜色的红色分量 BYTE rgbReserved;/保留值 RGBQUAD; 第四部分就是实际的图像数据。对于用到调色板的位图,图像数据就是该像素颜色在调色板中的索引值,对于真彩色图像,图像数据就是实际的R、G、B值。对于2色位图,用1位就可以表示该像素的颜色(一般0表示黑,1表示白),所以一个字节可以表示8个像素。对于16色位图,用4位可以表示一个像素的颜色,所以一个字节可以表示2个像素。对于256色位图,一个字节刚好可以表示1个像素。 2.5.2 TIF图像文件格式标记图像文件格式TIF (Tag Image File Format)是现存图像文件格式中最复

15、杂的一种,是目前流行的图像文件交换标准之一。TIF格式文件的设计考虑了扩展性、 方便性和可修改性,因此非常复杂,要求用更多的代码来控制它,结果导致文件读写速度慢, TIF代码也很长。TIF文件由文件头、参数指针表与参数域、参数数据表和图像数据四部分组成。 2.5.3 GIF图像文件格式GIF(Graphics Interchange Format)文件的全称是图形交换文件格式。该形式存储的文件主要为不同的系统平台交流和传输图像提供方便,是Web及其他联机服务上常用的一种文件格式,用于 HTML文档中的索引颜色图像。图像最大不能超过64 M,颜色最多为256色。GIF图像文件采取LZW压缩算法,

16、存储效率高,支持多幅图像定序或覆盖,交错多屏幕绘图以及文本覆盖。GIF主要是为数据流而设计的一种传输格式,而不是作为文件的存储格式。GIF有五个主要部分以固定顺序出现,所有部分均由一个或多个块(block)组成。每个块第一个字节中存放标识码或特征码标识。这些部分的顺序为:文件标志块、逻辑屏幕描述块、可选的“全局”色彩表块(调色板)、各图像数据块(或专用的块)以及尾块(结束码)。 2.5.4 PCX图像文件格式PCX文件格式由ZSoft公司设计, 是最早使用的图像文件格式之一。PCX支持256种颜色,结构较简单,存取速度快,压缩比适中,适合于一般软件的使用。PCX 格式支持RGB、索引颜色、灰度

17、和位图颜色模式,支持 RLE 压缩方法, 图像颜色的位数可以是 1、 4、8 或 24。 PCX图像文件由三个部分组成:文件头、图像数据和256色调色板。2.5.5 JPEG图像文件格式JPEG(Joint Photographers Experts Group联合图像专家组)格式, 是由ISO和CCITT为静态图像所建立的第一个国际数字图像压缩标准,主要是为了解决专业摄影师所遇到的图像信息过于庞大的问题。JPEG 格式支持 24 位颜色,并能保留照片和其他连续色调图像中存在的亮度和色相的显著和细微的变化。2.6 傅里叶变换数字图像处理的方法主要分成两大类:空间域处理法(空域法)频域法(变换域

18、法)傅里叶变换定义设f(x)为x的函数,如果f(x)满足下面狄里赫莱条件:具有有限个间断点。具有有限个极值点。绝对可积。变换处理傅里叶变换则有下列两式成立:式中x是时域变量,u为频率变量。如令 =2u , 则有傅里叶变换如令 =2u , 则有通常把以上公式称为傅里叶变换对。傅里叶变换 函数f(x)的傅里叶变换一般是一个复量,它可以由下式表示傅里叶变换把 叫做 的傅里叶谱,而 叫相位谱。或写成指数形式傅里叶变换由上面的例子可以建立起下面几个概念: ()只要满足狄里赫莱条件,连续函数就可以进行傅里叶变换,实际上这个条件在工程运用中总是可以满足的。 ()连续非周期函数的傅里叶谱是连续的非周期函数,连续的周期函数的傅里叶谱是离散的非周期函数。 傅里叶变换 傅里叶变换可推广到二维函数。如果二维函数 f (x , y) 满足狄里赫莱条件,那么将有下面

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论