




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
图象和视觉基础第1页,课件共74页,创作于2023年2月2.1视觉基础2.1.1人眼与亮度视觉人眼是人类视觉系统的重要组成部分,由晶状体和视网膜组成。晶状体相当于光学镜头(但是要灵活得多),视网膜相当于胶片。视网膜表面分布着许多光接受细胞,这些细胞负责接受光的能量并形成视觉图案。第2页,课件共74页,创作于2023年2月光接受细胞有两种:锥细胞和柱细胞。锥细胞在亮度较高时活跃,可以分辨光的颜色,但数量较少;柱细胞对低亮度较为敏感,不感受颜色,只提供视野的整体信息,这就是为什么人眼在天色较暗时看到的物体都是黑白剪影的原因。由于数字图象是以亮度点集合的形式显示的,眼睛区分不同亮度的能力在表达图象处理结果时是很重要的。第3页,课件共74页,创作于2023年2月
人的视觉系统能够适应的光强度级别范围是很宽的。从夜视阈值到强闪光约有1010量级。但是人的视觉系统并不能同时在这么大范围工作,确切地说,它是利用改变其整个灵敏度来完成这一大变动的,这就是所谓的亮度适应现象。与整个适应范围相比,能同时鉴别的光强度级的总范围很小。在一定的条件下,一个视觉系统当前的灵敏度叫做亮度适应级。人眼在某一时刻所能感受到的主观亮度范围是以此适应级为中心的一个小范围。第4页,课件共74页,创作于2023年2月2.1.2颜色视觉1、RGB模型(面向彩色显示器或打印机)
视觉三基色假说:C=R+G+B视网膜锥细胞感红,感绿,感蓝色素波长:R:700nmG:546.1nmB:435.8nm利用三基色叠加可产生光的三补色:品红:红+蓝蓝绿:绿+蓝黄:红+绿第5页,课件共74页,创作于2023年2月区分颜色的3种基本特征量*辉度:辉度与物体的反射率成正比*色调:是与混合光谱中主要光的波长相联系的*饱和度:与色调的纯度有关,纯光谱色是完全饱和的,随着白光的加入饱和度逐渐减少。色调和饱和度合起来称为色度。颜色可用辉度和色度共同表示。为组成某种颜色所需的红、绿、蓝的量称为3个刺激量,用X,Y,Z表示。从而,一种颜色可用它的3个色系数表示,分别为:第6页,课件共74页,创作于2023年2月1931年,国际照度委员会(CIE)制定了一个色度图,用组成某种颜色的三原色的比例来规定这种颜色(如图)。色度图中,边界上的点代表纯颜色,移向中心表示混合的白光增加而纯度减少。到中心点C处各种光谱能量相等而显为白色,此处纯度为零。某种颜色的纯度一般称为该颜色的饱和度。色度图中,连接任2端点的直线上的点表示由这2端点的颜色相加而组成的一种颜色。3点可组成一个三角形。第7页,课件共74页,创作于2023年2月2、HSI模型(面向彩色处理,如动画中的彩色模型)
H—色调(hue)S—饱和度(saturation)I—密度(intensity,对应成象亮度和图象灰度)这个模型有两个特点:(1)I分量与图象的彩色信息无关;(2)H和S分量与人感受颜色的方式是紧密相连的。上述特点使得HSI模型非常适合于借助人的视觉系统来感知彩色特性的图象处理算法。第8页,课件共74页,创作于2023年2月对色点P,H的值对应指向该点的矢量与R轴的夹角。S与指向该点的矢量长成正比,越长越饱和。I的值是沿1根通过三角形中心并垂直于三角形平面的直线来测量的。从纸面出来越多越白,进入纸面越多越黑。第9页,课件共74页,创作于2023年2月3、从RGB转换到HSI
(Smith1978)第10页,课件共74页,创作于2023年2月4、从HSI转换到RGB第11页,课件共74页,创作于2023年2月例2.1彩色图象的R、G、B和H、S、I各分量的图示图2.1一幅彩色图象的R、G、B和H、S、I各分量
(a)(b)(c)分别为R、G、B分量
(d)(e)(f)分别为H、S、I分量第12页,课件共74页,创作于2023年2月2.2成象基础2.2.1成象模型图象代表一个2-D的亮度函数,记为
。在特定的坐标处,的值或幅度是一个正的标量,其物理意义由图像源决定。当一幅图像从物理过程产生时,它的值正比于物理源的辐射能量(如电磁波)。因此,一定是非零和有限的,这就是:第13页,课件共74页,创作于2023年2月函数可由两个量来表征:(1)入射到观察场景的光源的量和(2)场景中物体反射光的量。相应地称为入射分量和反射率,并分别表示为和。因为与和都成正比,所以可以认为是由这两个函数相乘得到的:其中反射分量限制在0(全吸收)和1(全反射)之间。的性质取决于照射源,而取决于成象物体的特性。第14页,课件共74页,创作于2023年2月没有颜色的光叫消色或单色光。这种光的属性是它的强度或大小。灰度级这一词汇通常用来描述单色光强度,因为它的范围从黑到灰,最后到白。单色图象在坐标处的强度称为图象在那一点的灰度值,即:的要求仅仅是正的,要求为有限。区间称为灰度级。实际常常令该区间为,为黑,在灰度级中为白。所有中间值是从黑到白的各种灰度值。第15页,课件共74页,创作于2023年2月2.2.2成象变换
摄象机坐标系统中的图象平面与平面重合,光学轴沿轴。
图象平面的中心处于原点,镜头中心的坐标是是镜头的焦距。假设摄象机坐标系统与世界坐标系统平行。第16页,课件共74页,创作于2023年2月设是3-D空间中任意点的世界坐标。,即所有客观场景中感兴趣的点都在镜头的前面。点与其投影到图象平面的坐标间的关系为:第17页,课件共74页,创作于2023年2月2.2.3采样和量化
图象函数f(x,y)在空间和取值(灰度)上必须数字化才能被计算机处理.图象的采样空间坐标(x,y)的数字化被称为图象采样确定水平和垂直方向上的象素个数N、MMN1、均匀采样和量化第18页,课件共74页,创作于2023年2月图象采样的形式化定义设Z表示整数集合。采样过程:将xy平面分配到一个网格上,且每一个网格中心的坐标是一个笛卡儿乘积ZxZ的元素对,即所有有序元素对(m,n)的集合,其中m和n属于整数集合Z。xy平面(m,n)第19页,课件共74页,创作于2023年2月图象的量化◀取值的数字化被称为图象灰度级量化◀量化处理:将f映射到Z的处理(均匀量化、最佳量化)◀Z的最大取值,确定象素的灰度级数
G=2k,如256存储1幅数字图象所需的位数(bit)
当一幅图象有2k灰度级时,通常称该图象是k比特图象。第20页,课件共74页,创作于2023年2月空间分辩率与图象质量256x256x256128x128x25664x64x25632x32x256第21页,课件共74页,创作于2023年2月幅度分辩率与图象质量256x256x256256x256x128256x256x64256x256x32第22页,课件共74页,创作于2023年2月采样分辨率和灰度级与图象质量之间的关系Huang[1965]实验:实验方法选取一组细节多少不同的、不同N、M、G的图象让观察者根据他们的主观质量感觉给这些图象排序实验结论随着采样分辨率和灰度级的提高,主观质量也提高对有大量细节的图象,质量对灰度级需求相应降低第23页,课件共74页,创作于2023年2月2、非均匀采样采用自适应的采样方法来改善图象质量在尖锐的灰度过渡区采用较密的采样在平滑区域采用较稀采样MN第24页,课件共74页,创作于2023年2月2.3图象基础2.3.1象素间联系1、象素的邻域:位于坐标(x,y)的一个象素p有4个水平和垂直的相邻象素,其坐标由下式给出:(x+1,y),(x-1,y),(x,y+1),(x,y-1)这个象素集称为p的4邻域,用N4(p)表示。每个象素距(x,y)一个单位距离,如果(x,y)位于图象的边界,则p的某一邻域象素位于图象的外部。第25页,课件共74页,创作于2023年2月p的4个对角近邻象素有如下坐标:(x+1,y+1),(x+1,y-1),(x-1,y+1),(x-1,y-1)并用ND(p)表示。与4个邻域点一起把这些点叫做p的8邻域,用N8(p)表示。与前边一样,如果(x,y)位于图象的边界,则ND(p)和N8(p)中的某些点落入图象的外边。第26页,课件共74页,创作于2023年2月2、连接性、连通性
象素间的连通性是一个基本概念,它简化了许多数字图象概念的定义,如区域和边界.为了确定两个象素是否连接,必须确定它们是否相邻及它们的灰度值是否满足特定的相似性准则(或者说,它们的灰度值是否相等)。例如,在具有0,1值的二值图象中,两个象素可能是4-近邻象素,但是,仅当它们具有同一灰度值时才能说是连接的。第27页,课件共74页,创作于2023年2月令V表示定义连接的灰度值集合。在二值图像中,如考虑灰度值为1的象素之间的连通性,则V={1}。在灰度图象中,考虑灰度值在8到16之间象素的连通性,则V={8,9,…,15,16}。(a)4-连接:2个象素p和r在V中取值且r在N4(p)中。(b)8-连接:2个象素p和r在V中取值且r在N8(p)中。(c)m-连接(混合连接}:2个象素p和r在V中取值且满足下列条件之一:
(i)r在N4(p)中;(ii)r在ND(p)中且集合N4(p)∩N4(r)没有V中的值。第28页,课件共74页,创作于2023年2月混合连接是8-连接的改进。混合连接的引人是为了消除采用8-连接常常发生的二义性。例如,下图中(a)对于V={1}所示的象素安排。位于(b)上部的三个像素显示了多重(二义性)8-连接,如虚线指出的那样。这种二义性可以通过m-连接消除,如(c)所示。第29页,课件共74页,创作于2023年2月如果图象子集S1中的某些象素与S2中的某些象素毗邻,则SI和S2是毗邻的。如果一个象素p与另一个象素q相连接,则他们相毗邻。从具有坐标(x,y)的象素p到具有坐标(s,t)的象素q的通路是由一系列特定象素组成的,这些象素具有坐标(x0,y0),(x1,y1)….(xn,yn)这里(x0,y0)=(x,y),(xn,yn)=(s,t),并且象素(xi,yi)与(xi-1,yi-1)毗邻。在这种情况下,n是通路的长度。第30页,课件共74页,创作于2023年2月令S代表一幅图象中象素的子集.
如果在S中p,q象素之间存在一个通路,则说两个象素p和q在S中是连通的。对于S中的任何象素p,S中连通到该象素的象素集叫做S的连通分量(组元,component)。第31页,课件共74页,创作于2023年2月3、距离量度对于像素p,q和r,其坐标分别为(x,y),(s,t)和(v,w),如果:(a)D(p,q)≥0,D(p,q)=0,当且仅当p=q(b)D(p,q)=D(q,p)(c)D(p,r)≤D(p,q)+D(q,r)
则D是距离量度函数。第32页,课件共74页,创作于2023年2月p和q间的欧氏距离定义如下:De(p,q)=[(x-s)2+(y-t)2]1/2(2.5.1)对于距离量度,距点(x,y)的距离小于或等于某一值d的象素是,中心在(x,y)半径为d的圆平面。p和q间的D4距离(城市街区距离)如下式定义:D4(p,q)=|x-s|+|y-t|
在这种情况下,距(x,y)的D4距离小于或等于某一值d的象素形成一个中心在(x,y)的菱形。第33页,课件共74页,创作于2023年2月例如,距(x,y)的D4距离小于或等于2的象素形成固定距离的下列轮廓:
2212210122122D4=1的象素是(x,y)的4邻域。第34页,课件共74页,创作于2023年2月p和q间的D8距离(也叫棋盘距离)定义为下式:D8(p,q)=max(|x-s|,|y-t|)
在这种情况下,距(x,y)的D8距离小于或等于某一值d的象素形成中心在(x,y)的正方形。例如,距点(x,y)(中心点)的D8距离小于或等于2的象素形成下列固定距离的轮廓:2222221112210122111222222D8=1的象素是(x,y)的8邻域。第35页,课件共74页,创作于2023年2月注意:p和q之间的D4和D8距离与任何通路无关,因为这些距离仅与点的坐标有关。然而,如果选择考虑m-连通,则两点间的Dm距离用点间最短的通路定义。在这种情况下,两象素间的距离将依赖于沿通路的象素值以及它们的邻点值。例如,考虑下列安排的象素:
tqs1pp=1,q=1
0q01pDm(p,q)=2
1q01pDm(p,q)=3
0q11p
1q11pDm(p,q)=4第36页,课件共74页,创作于2023年2月2.3.2图象运算(算术运算、逻辑运算)1、算术运算加法、减法乘法、除法图象的算术运算是逐象素进行的。一般用于灰度图象。图象象素的坐标也可以进行算术运算(如:图象平移、旋转与缩放等)第37页,课件共74页,创作于2023年2月加法运算的定义C(x,y)=A(x,y)+B(x,y)主要应用举例去除“叠加性”噪声生成图象叠加效果图象的加法运算第38页,课件共74页,创作于2023年2月去除“叠加性”噪声设有一幅混有噪声的图g(x,y)是由原始图f(x,y)和噪声图e(x,y)叠加而成,即g(x,y)=f(x,y)+e(x,y)这里假设每个坐标点(x,y)上的噪声都不相关且均值为零.我们处理的目标就是通过加入一系列噪声图像{gi(x,y)}来减少噪声。如果噪声符合上述限制,若对M幅不同的图象取平均得:第39页,课件共74页,创作于2023年2月可以证明:可见,随着平均图数量M的增加,噪声在每个象素位置(x,y)的影响逐步减少。例2.3.1:用图象平均消除随机噪声(练习)第40页,课件共74页,创作于2023年2月图象叠加对于两个图象f1(x,y)和f2(x,y)的加权组合
g(x,y)=αf1(x,y)+βf2(x,y)其中α+β=1得到各种图象合成的效果,也可以用于两张相片的衔接。第41页,课件共74页,创作于2023年2月减法运算的定义
C(x,y)=A(x,y)-B(x,y)主要应用去除不需要的叠加性图案检测同一场景两幅图象之间的变化第42页,课件共74页,创作于2023年2月去除不需要的叠加性图案设:背景图象b(x,y),前景背景混合图象f(x,y)
g(x,y)=f(x,y)–b(x,y)g(x,y)为去除了背景的图象。第43页,课件共74页,创作于2023年2月检测同一场景两幅图象之间的变化
设:时间1的图象为T1(x,y), 时间2的图象为T2(x,y)g(x,y)=T2(x,y)-T1(x,y)=-如:运动检测、运动估计等第44页,课件共74页,创作于2023年2月2、逻辑运算图象象素之间的逻辑运算求反异或、或与
逻辑运算是对二值图象的象素值进行处理的一种图象运算第45页,课件共74页,创作于2023年2月求反的定义
g(x,y)=255-f(x,y)
主要应用
获取一个阴图象(反色图像)
获取一个子图像的补图像第46页,课件共74页,创作于2023年2月反色获取阴图象第47页,课件共74页,创作于2023年2月子图象的补图象第48页,课件共74页,创作于2023年2月异或运算的定义g(x,y)=f(x,y)h(x,y)
(相同输出0,相异输出1)获取相交子图象=黑色代表1,白色代表0第49页,课件共74页,创作于2023年2月或运算的定义
g(x,y)=f(x,y)\/h(x,y)合并子图象=黑色代表1,白色代表0第50页,课件共74页,创作于2023年2月图象的非几何变换非几何变换(针对图像象素灰度)-非几何变换的定义:对于原图象f(x,y),灰度值变换函数T唯一确定了非几何变换:
g(x,y)=T(f(x,y))g(x,y)是目标图象,图像没有几何位置的改变,只是图像的灰度取值发生了变化。-对于彩色原图象f(x,y),颜色值变换函数Tr(f(x,y));Tg(f(x,y));Tb(f(x,y));第51页,课件共74页,创作于2023年2月基于模板的图象运算(T为卷积模板)模板的定义模板大小模板系数模板运算的定义模板运算举例:均值变换第52页,课件共74页,创作于2023年2月模板的定义(二维滤波器的系数构成模板)所谓模板就是一个系数矩阵模板大小:通常是奇数,如:
3x35x57x7模板系数:矩阵的元素
w1w2w3 w4w5w6 w7w8w9第53页,课件共74页,创作于2023年2月模板运算的定义
对于某图象的子图像:
z1z2z3 z4
z5z6 z7z8z9
象素z5的模板运算公式为:R=w1z1+w2z2+...+w9z9第54页,课件共74页,创作于2023年2月模板运算例:均值变换(均值滤波)
模板系数:wi=1/9
计算公式:R=(z1+z2+...+z9)/9
均值滤波第55页,课件共74页,创作于2023年2月灰度级变换(点运算)
定义:对于输入图象f(x,y),灰度级变换T将产生一个输出图象g(x,y),且g(x,y)的每一个象素值,都是由f(x,y)的对应输入象素点的值决定的,与其邻域点的取值无关。
g(x,y)=T(f(x,y))灰度级变换(点运算)的实现通过灰度级映射关系R=T(r)(R,r取值范围为0-255)来实现灰度级变换。输入象素值与输出象素之间的映射关系可以通过查表来实现。因此灰度级变换也被称为LUT(LookUpTable)变换。第56页,课件共74页,创作于2023年2月例如:图象求反R=T(r)=255-r第57页,课件共74页,创作于2023年2月如:对比度拉伸与动态范围压缩
根据图象直方图(图象的灰度统计分布)改变图象质量第58页,课件共74页,创作于2023年2月2.3.3图象坐标变换
-平移变换
-放缩变换
-旋转变换镜象变换:水平镜象、垂直镜象第59页,课件共74页,创作于2023年2月1、平移变换第60页,课件共74页,创作于2023年2月2、缩放变换3、旋转变换绕原点旋转度(逆时针),可表示为第61页,课件共74页,创作于2023年2月图象的平移与旋转第62页,课件共74页,创作于2023年2月4、水平镜象与垂直镜象水平镜象垂直镜象第63页,课件共74页,创作于2023年2月2.3.4图象格式1、调色板
调色板是包含不同颜色的颜色表,每种颜色以红、绿、蓝三种颜色的组合来表示,图象的每一个象素对应一个数字,而该数字对应调色板中的一种颜色。如某象素值为1,则表示该颜色为调色板的编号为1的颜色。
16色或256色需要调色板。真彩色图象的每个象素直接用R、G、B三个字节来表示颜色,不需要调色板。第64页,课件共74页,创作于2023年2月2、图象格式
图象格式指的是存储图象采用的文件格式。常用的图象格式有:
(1)BMP(Bitmap)文件;(2)GIF(GraphicsInterchangeFormat)文件;(3)TIFF(TagImageFileFormat)文件;(4)PCX文件;(5)JPEG格式;
(6)PSD格式;
(7)PCD格式;
(8)WMF矢量格式。第65页,课件共74页,创作于2023年2月(1)、BMP文件
BMP文件是MicrosoftWindows所定义的图象文件格式,最早应用在Microsoft公司的MicrosoftWindows窗口系统中。BMP图象文件的特点:
■该结构只能存放一幅图象;
■只能存储四种图象数据:单色、16色、256色、真彩色
■图象数据有压缩和不压缩两种处理方式,压缩方式有:RLE4和RLE8;
■调色板的数据存储结构与文件头的某些参数有关BMP图象文件的文件结构可分为三部分:
■表头;长度固定为54个字节
■调色板;真彩色没有调色板
■图象数据。第66页,课件共74页,创作于2023年2月(2)、GIF文件
GIF文件是CompuServe公司为了方便网络用户传输图象数据而制定的一种图象文件格式。GIF图象文件经常用于网页的动画、透明等特技制作。其特点为:
■具有多元化结构,能够存储多幅图象;
■调色板数据有通用调色板和局部调色板之分;
■采用LZW压缩法;
■图象数据一个字节存储一点;
■文件内的各种图象数据区和补充区多数没有固定的数据长度和存放位置;■图象数据有顺序排列和交叉排列两种方式;
■最多只能存储256色图象。第67页,课件共74页,创作于2023年2月GIF图象文件的文件结构一般由七个数据单元组成:
■表头;
■通用调色板;真彩色没有调色板
■图象数据区以及四个补充区。表头和图象数据区是文件不可缺少的单元,其它是可选内容。第68页,课件共74页,创作于2023年2月(3)、TIFF文件
TIFF文件是Aldus公司与微软公司共同开发设计的图象文件格式。其特点为:
■善于应用指针功能,能够存储多幅图象
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高压锚索施工方案
- 贞丰公路施工方案
- 消防强电施工方案
- 电子商务产品推广协议
- 亚临界水提取沉香叶多糖的工艺及其物性研究
- 基于迁移学习的人脸活体检测方法研究
- 幼儿园健康教育家长会
- 基于能耗预测的电动汽车动态路径规划研究
- 沙井子垦区不同林果-花生间作模式下花生主要害虫发生动态及其防控研究
- 直肠癌前切除术后预防性皮桥回肠袢式造口术与传统回肠袢式造口术的临床对比研究
- 财务机器人开发与应用实战 课件 任务5 E-mail人机交互自动化-2
- 【华为】通信行业:华为下一代铁路移动通信系统白皮书2023
- Python 程序设计智慧树知到期末考试答案章节答案2024年四川师范大学
- 03D201-4 10kV及以下变压器室布置及变配电所常用设备构件安装
- 城乡环卫保洁投标方案(技术标)
- 充值合同范本
- MSDS中文版(锂电池电解液)
- 《职业病防治法》知识考试题库160题(含答案)
- 全国初中数学青年教师优质课一等奖《反比例函数的图象和性质》教学设计
- 2023-2024学年人教版数学八年级下册期中复习卷
- 环境监测仪器安装施工方案(更新版)
评论
0/150
提交评论