版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2.1人类视觉系统视觉是一种人类的基本功能,它不仅帮助人类获取信息,而且还帮助人类处理分析信息。视觉进一步可分为视感觉和视知觉。其中感觉是较低层次的,它主要接收外部刺激,所考虑的主要是刺激的物理特性和对视觉感受器官的刺激程度;知觉则处于较高层次,它要将外部刺激转化为有意义的内容。人类的视觉系统对不同的刺激会产生不同形式的反应,所以视知觉又分亮度知觉、颜色知觉、形状知觉、空间知觉等。在很多情况下,视觉主要指视感觉。了解人类视觉的构成、信息处理过程,对图像分析处理研究人员来讲是非常具有启发性和吸引力的。本节从人类视觉系统的基本构造出发,介绍视觉通路及视觉感知的基本过程。下一页返回2.1人类视觉系统2.1.1人类视觉系统的构造人类视觉系统是由眼球、视神经系统及大脑视觉中枢构成。1)眼球人眼的形状像一个小球,通常称为眼球,其平均直径约20
mm。眼球主要由光学系统和三层膜组成。光学系统由角膜、房水、晶状体、玻璃体构成,又称为屈光介质。三层膜中最外层前部是角膜,后部为巩膜,中层由前向后分为3部分:虹膜、睫状体和脉络膜。内层为视网膜,简称网膜。眼球的横断面结构图如图2.1所示。
角膜:眼球最前端是弹性透明的是角膜,它是平均折射率为1.336的透明体,俗称眼白,微向前突出,具有屈光作用,光由这里折射进入眼球而成像。上一页下一页返回2.1人类视觉系统虹膜:虹膜在角膜的后面,位于晶状体的前面,虹膜中央的圆孔叫做瞳孔。虹膜内有两种肌肉可以控制瞳孔扩大和缩小,其作用如同照相机的自动光圈装置,而瞳孔的作用好似光圈。晶状体:晶状体在眼睛正面中央,光线投射进来以后,经过它的折射传给视网膜。所谓近视眼、远视眼、老花眼以及各种色彩、形态的视觉或错觉,大部分都是由于晶状体的伸缩作用所引起。它像一种能自动调节焦距的凸透镜一样。晶状体含黄色素,其含量随年龄的增加而增加,它影响对色彩的视觉。玻璃液体:把眼球分为前后两房,前房充满透明的水状液体,后房则是浓玻璃体。外来的光线,必须顺序经过角膜、水状液体、晶状体、玻璃体,然后才能到达网膜。它们均带有色素,其含量随环境和年龄而变化。上一页下一页返回2.1人类视觉系统睫状体:睫状体位于虹膜后面,其内部有睫状肌,起调节晶状体的作用。睫状体的收缩可改变晶状体的屈光力,使外界的物体能在视网上形成清楚的影像。巩膜:眼球壁外层的后面5/6是白色的不透明膜,叫做巩膜,它主要起巩固及保护眼球的作用。脉络膜:眼球壁中层的后面5/6是脉络膜。脉络膜含有丰富的色素细胞,呈黑色,起着吸收外来散光的作用,消除光线在眼球内部的乱反射,同时脉络膜中分布有大量毛细血管,内有血液为眼球提供营养。上一页下一页返回2.1人类视觉系统视网膜:视网膜是一种透明薄膜,成人厚度0.1~0.5
mm,是眼球的感光部分。眼球内具有特殊的折光系统,使进入眼内的可见光汇聚在视网膜上,其结构图如图2.2所示。黄斑与中央凹:视网膜可分为以视轴为中心直径约6
mm的中央区和周边区。中央区有一直径约2
mm(折合6°视角)呈黄色区域,称为黄斑。黄斑中央有一小凹,叫做中央凹,面积约1
mm2。人类视觉的中央凹没有杆体细胞,只有锥体细胞,其密度高达每平方毫米150
000。离开中央凹,锥体细胞急剧减少,而杆体细胞急剧增多,在离开中央凹20°的地方,杆体细胞最多。中央凹的锥体细胞密度很高,是产生最清晰视觉的地方。上一页下一页返回2.1人类视觉系统2)视觉细胞视网膜由锥体细胞和杆体细胞两种视觉细胞组成。锥体细胞:锥体细胞明亮条件时灵敏度很高;具有辨别光波波长的能力,对颜色敏感,分辨率高;主要集中在中央凹周围,数目约为650万;提供明视觉。人的视网膜中,含有三种不同的锥体细胞,每一种锥体细胞对不同的光谱的敏感性是不同的,内含有感光色素——红敏素、绿敏素、青蓝色素等。三种锥体细胞对光谱的敏感峰值分别在430
nm,540
nm和570
nm,这3个峰值段正对应着光谱中的红、绿、蓝区域,如图2.3所示。实验进一步表明,当3种颜色按一定比例同时刺激人眼时,会产生各种颜色感觉。其中有一种比例会使得颜色感觉完全消失,只有亮度感觉。这就是所谓的色觉三变量性(Tri-varianceofColorVision),说明颜色只取决于3个基本的输入量,这也是色觉三基色原理的基础。上一页下一页返回2.1人类视觉系统杆体细胞:杆体细胞在黑暗环境下灵敏度较高;对颜色不敏感,可以分辨明和暗,分辨率低;主要集中在视网膜外围,数目为1亿~1.2亿;提供暗视觉,同时还负责察觉物体的运动。这两种视觉细胞把接受到的色光信号传到神经节细胞,再由视神经传到大脑皮层枕叶视觉神经中枢,产生色感。据两种细胞的不同特点,故我们所看到的物体在白天有鲜明的色彩,而在夜里却看不到颜色,且往往模模糊糊。3)视神经系统视神经系统由视网膜中的神经节细胞和视神经组成。神经节细胞(见图2.2)是视觉神经传导(或视路)的起点,80万~100万个。与视网膜一起完成低层次的视觉感知。视神经为视觉信息传导通路,将视网膜上的低层次视觉感知传递给大脑视觉中枢。4)大脑视觉中枢
加工处理并综合由视神经传导过来的视觉感知信息。上一页下一页返回2.1人类视觉系统2.1.2视觉通路到达视网膜的光线经杆体和锥体细胞转换为神经信号,并经视网膜中的神经节细胞加工,传出视网膜。经神经节细胞加工的神经信号,经过视交叉部分的交换神经纤维后,再形成视束,传到中枢的许多部位,其中包括丘脑的外膝体或外膝核、四叠体上丘、顶盖前区和皮层等。上丘与眼动等视反射有关,顶盖前区与调节反射、瞳孔反射有关,外膝体和视皮层都直接与视觉知觉有关。神经节细胞轴突在外膝体换神经元后,由外膝体神经元直接经放射到视皮层,这是视束的大部分纤维去向,称为视觉通路,如图2.4所示。上一页下一页返回2.1人类视觉系统2.1.3视觉感知过程外界光线进入眼球,经过屈光折射后刺激视网膜,产生的神经信号经初步整合后传送到视觉中枢,在视觉中枢形成视觉感知。视觉的产生与后天的学习和训练有很大关系,并不是对输入刺激的简单复制。视觉是对外部物体的综合反应,其产生的机理还不清楚。但是通过研究人类视觉的一些外在表象(视觉现象或视觉特点),仍有利于对外部世界的观察。上一页返回2.2人类视觉成像2.2.1光学成像过程人眼前端有一个晶状体,后部内壁有一层视网膜,从光学成像的角度,可将眼睛和照相机比较一下,其中晶状体相当于镜头而视网膜相当于胶片。当眼睛聚焦在前方物体上时,从外部射入眼睛内的光在视网膜上成像。入射光到达视网膜之前,是主要折射在角膜和晶状体的两个面上的。眼睛内部各处的距离都固定不变,只有晶状体可以突出外张,所以有聚像于视网膜上的功能,这完全靠晶状体曲率的调整。如果起调节作用的睫状肌处于松弛状态,从远处射来的光线经折射后,恰好自动聚焦在网膜的感光细胞上。假如眼睛有病,聚焦就落在较前方或较后方,落在网膜前面叫近视眼,落在网膜后方叫远视眼。正常人眼在观察近处物体时,可调节收缩睫状肌,使晶状体突出一些,这样由近处物体射来的光线,经晶状体凸出面的折射后,仍然可以汇集在视网膜上成像。下一页返回2.2人类视觉成像2.2.2神经处理过程每个视网膜接收单元都与一个神经元细胞借助突触相连,每个神经元细胞借助其突触与其他细胞连接,从而构成光神经网络。光神经进一步与大脑中的侧区域连接,并到达大脑中的纹状皮层,对光刺激产生的响应进行一系列处理,最终形成关于场景的表象,从而将对光的感觉转化为对景物的知觉。
上一页下一页返回2.2人类视觉成像2.2.3整体视觉过程视觉过程从光源发光开始,光的模式通过场景中的物体(反射)进入作为视觉感受器官的左右眼睛,并同时作用在视网膜上引起视感觉。视网膜是含有光感受器和神经组织网络的薄膜。光刺激在视网膜上,经神经处理产生的神经冲动沿视神经纤维传出眼睛,通过视觉通道传到大脑皮层进行处理并最终引起视知觉,或者说在大脑中对光刺激产生响应——形成关于场景的表象。大脑皮层的处理要完成一系列工作,从图像存储直到根据图像做出响应,具体见图2.5所示。上一页返回2.3人类视觉特性2.3.1亮度适应和鉴别由于数字图像是以亮度点集合的形式显示的,眼睛区分不同亮度的能力在表达图像处理结果时是很重要的。人的视觉系统有很大的亮度适应范围,从暗视觉极限到眩目极限之间的范围在106量级,即刚能感觉到的亮度到刚能忍受的亮度相差很大。但需要注意人的视觉系统并不能同时在这么大范围工作,它是靠改变它的总体敏感度来实现亮度适应的。人的视觉系统在同一时刻所能够区分的亮度的具体范围比总的适应范围要小得多,一般仅在几十级亮度左右。在一定的条件下,一个视觉系统当前的敏感度叫做亮度适应级。人眼在某一时刻所能感受到的主观亮度范围是以此适应级为中心的一个小范围。下一页返回2.3人类视觉特性人的视觉系统所感知的亮度称为主观亮度,其与光源亮度是不同的,而正在一定范围内与人眼所得到的照度基本成对数关系,即随着照度的线性增加所感知的亮度以对数关系缓慢增加(对暗光时亮度的增加比对亮光时亮度的增加更敏感)。这点可以由以下两个现象证明。第1个现象是马赫(Mach)带效应。基于视觉系统有趋向于过高或过低估计不同亮度区域边界值的现象,图2.6给出1个这种现象的明显例子,图中5个不同灰度的条带给出实际的亮度分布情况。尽管各条带内部的亮度是常数(如图2.6中的亮度折线所示),人们实际中总会观察到带有强烈边缘效应的灰度模式,即在条带的边界区域,靠更亮的一侧显得比较黑,而靠更暗的一侧显得比较白,正如图中的主观亮度曲线所示。这种感觉到强烈边缘效应的现象称为马赫带效应。上一页下一页返回2.3人类视觉特性第2个现象称为同时对比度。此现象基于人眼对某个区域感觉到的亮度并不仅仅依赖于区域本身的亮度,也同时受到背景的影响。图2.7给出1个例子,4个图中位于中心的圆形有完全—样的亮度,但是当背景暗时,它们看起来要亮些;而当背景亮时,它们看起来要暗些。2.3.2视觉错觉视觉错觉是指人们对外界事物的不正确的视觉感觉或知觉,最常见的是视觉方面的错觉。产生错觉的原因,除来自客观刺激本身特点的影响外,还有观察者生理上和心理上的原因。其机制现在尚未完全弄清。来自生理方面的原因是与我们感觉器官的机构和特性有关;来自心理方面的原因是和我们生存的条件以及生活的经验有关。上一页下一页返回2.3人类视觉特性视觉错觉常见的有几大类型。1)形状和尺度错觉如图2.8(a)所示,两个内部的圆大小完全一样。当一个圆被几个较大的同心圆包围时,它看起来要比那个被一些圆点包围的圆小一些。如图2.8(b)所示,竖线似乎是弯曲的,但其实他们是笔直而相互平行的。如图2.8(c)所示,你所看到的好像是个螺旋,但其实它是一系列完好的同心圆。如图2.8(d)所示,正方形看起来是变形了,但其实它们的边线都是笔直而彼此平行的。上一页下一页返回2.3人类视觉特性2)前景和背景错觉(先入为主)如图2.9(a)所示,杯子和人脸是一个主体和背景可互换的两可图形,它既可以看做是白色背景上3个杯子,也可以看做是黑色背景上的3对互相对视的人脸。在图2.9(a)中,线条有两种外形,轮廓的外形取决于线条被认为图像的哪一方面——背景还是前景。具体的视觉效果与个人偏好也有关系,有些人第一眼看到的是杯子,而有些人第一眼看到的是人脸,称为先入为主。
又如图2.9(b)所示,如果第一眼看到的是上面图案,则为飞鸟,如果第一眼看到的是下面图案,则为飞鱼。上一页下一页返回2.3人类视觉特性3)凹凸错觉在图片上由于明暗和阴影的影响,我们得到凸出或凹入的知觉。同一张图片中的物体明亮部分在上方,阴影部分在下方,看上去这个物体是凸出的。把这张图片上下倒置过来,便会得到凹进去的知觉,如图2.10所示。
4)动静错觉如图2.11(a)所示,仔细凝视图片的时候就会感觉图纹在转动,其实这仅仅是一张静态的图片,是视觉错觉而已。如图2.11(b)所示,当你的眼睛环顾图像时,连接处的圆片将会一闪一闪。上一页返回2.4颜色视觉基础和色度学2.4.1颜色基础颜色是外界光刺激作用于人的视觉器官而产生的主观感觉。除了光源对眼睛的刺激,还需要人脑对刺激的解释。人感受到的物体颜色主要取决于反射光的特性,如果物体比较均衡地反射各种光谱,则看起来物体是白的;而如果物体对某些光谱反射得较多,则看起来物体既呈现相对应的颜色。颜色分两大类:非彩色和彩色。非彩色是指黑色、白色和介于这两者之间深浅不同的灰色,也称为无色系列;彩色是指除了非彩色以外的各种颜色。下一页返回2.4颜色视觉基础和色度学根据人眼结构,所有颜色都可看做是3个基本颜色——红(R,red),绿(G,green)和蓝(B,blue)的不同组合。为了建立标准,国际照度委员会(CIE)早在1931年就规定了3种基本色的波长分别为R:700
nm,G:546.1
nm,B:435.8
nm。利用三基色的不同叠加可产生光的三补色,品红(M,magenta,即红加蓝)、蓝绿(C,cyan,即绿加蓝)、黄(Y,yellow,即红加绿)。按一定的比例混合三基色或将1个补色与相对的基色混合就可以产生白色。人们区分颜色常用三种基本特性量:亮度、色调和饱和度。亮度与物体的反射率成正比,如果无彩色就只有亮度1个自由度的变化。对彩色来说,颜色中掺入白色越多就越明亮,掺入黑色越多亮度就越小。色调是与混合光谱中主要光波长相联系的。饱和度与一定色调的纯度有关,纯光谱色是完全饱和的,随着白光的加入,饱和度逐渐减少。上一页下一页返回2.4颜色视觉基础和色度学色调和饱和度合起来称为色度。颜色可用亮度和色度共同表示。当把红、绿、蓝色光混合时,通过改变三者各自的强度比例可得到白色以及各种彩色
(2.1)其中,C代表某一特定色,
表示匹配,R、G、B表示三原色,r、g、b代表比例系数,且有
(2.2)上一页下一页返回2.4颜色视觉基础和色度学2.4.2颜色模型及空间2.4.2.1颜色模型为了科学地定量描述和使用颜色,还需要建立颜色模型。颜色模型(彩色空间或彩色系统)是表示颜色的一种数学方法,人们用它来指定和产生颜色,使颜色形象化。由于1种颜色可用3个基本量来描述,所以建立颜色模型就是建立1个三维坐标系统,形成不同的颜色坐标系,其中每个空间点都代表某1种颜色。上一页下一页返回2.4颜色视觉基础和色度学目前常用的颜色模型按用途可分为两类,一类面向诸如视频监视器、彩色摄像机或打印机之类的硬设备,另一类面向以彩色处理为目的的应用,如动画中的彩色图形。面向硬设备的最常用彩色模型是RGB模型,而面向彩色处理的最常用颜色模型是HSI模型,其中H表示色调(Hue),S表示饱和度(Saturation),I表示密度(Intensity,对应成像亮度和图像灰度)。这2种颜色模型也是图像技术中最常见的模型。另外,在印刷工业上和电视信号传输中,经常使用CMYK和YUV色彩系统。下面分别讨论。上一页下一页返回2.4颜色视觉基础和色度学1)RGB彩色模型RGB模型可表示在笛卡尔坐标系统中,3个轴分别为R、G、B,用三维空间中的一个点来表示一种颜色,如图2.12所示。每个点有3个分量,分别代表该点颜色的红、绿、蓝亮度值,亮度值限定在[0,1]。在RGB模型立方体中,原点所对应的颜色为黑色,它的3个分量值都为零。距离原点最远的顶点对应的颜色为白色,它的3个分量值都为1。从黑到白的灰度值分布在这两个点的连线上,该线称为灰色线。立方体内其余各点对应不同的颜色,可用从原点到该点的矢量表示。彩色立方体中有三个角对应于三基色——红、绿、蓝。剩下的3个角对应于三基色的3个补色——黄色、青色(蓝绿色)、品红(紫色)。上一页下一页返回2.4颜色视觉基础和色度学2)HSI(HSB)彩色模型HSI模型是Munsell提出的,它反映了人的视觉系统观察彩色的方式,在艺术上经常使用HSI模型。这个模型的建立基于两个重要的事实:(1)I分量与图像的彩色信息无关;(2)H和S分量与人感受颜色的方式是紧密相联的。这些特点使得HSI模型非常适合借助人的视觉系统来感知彩色特性的图像处理算法。图2.13中的色相环描述了色调和饱和度两个参数。色调:色调指颜色的外观,用于区别颜色的名称或颜色的种类,又称为色相。在颜色坐标或在颜色圆上用圆周表示,圆周上的颜色具有相同的饱和度和明度,但它们的色调不同,如图2.14所示,H取值为0°~360°。上一页下一页返回2.4颜色视觉基础和色度学色调由角度表示,它反映了该彩色最接近什么样的光谱波长。一般假定0°表示的颜色为红色,120°的为绿色,240°的为蓝色。0°~240°的色调覆盖了所有可见光谱的彩色,在240°~300°为人眼可见的非光谱色(紫色)。饱和度:指一个颜色的鲜明程度,饱和度越高,颜色越深,如深红,深绿。饱和度参数是色环的原点(圆心)到彩色点的半径的长度。由色相环可以看出,环的边界上纯的或饱和的颜色,其饱和度值为1。在中心是中性(灰色)阴影,饱和度为0。S取值为0~1。饱和度可用来区别颜色亮丽的程度,表示方法如图2.15所示。
亮度:指光波作用于感受器所发生的效应,其大小由物体反射系数来决定,反射系数越大,物体的亮度愈大,反之愈小。亮度是一种主观感觉,无法用物理设备测定,表示方法如图2.16所示,I取值为0~1。上一页下一页返回2.4颜色视觉基础和色度学3)CMYK减色模型CMYK表色系统也是一种常用的表示颜色的方式。计算机屏幕显示通常用RGB表色系统,它是通过相加来产生其他颜色,这种做法通常称为加色合成法(AdditiveColorSynthesis)。而在印刷工业上则通常用CMYK表色系统,它是通过颜色相减来产生其他颜色的,所以称这种方式为减色合成法(SubtractiveColorSynthesis)。CMYK模式的原色为青色(Cyan)、品红色(Magenta)、黄色(Yellow)和黑色(Black)。在处理图像时,一般不用CMYK模式,主要是因为这种模式的文件大,占用的磁盘空间和内存大。这种模式一般在印刷时使用。上一页下一页返回2.4颜色视觉基础和色度学4)其他模型(1)YUV电视信号彩色坐标系统YUV彩色电视信号传输时,将R、G、B改组成亮度信号和色度信号,其中Y信号表示亮度,U、V信号是色差信号。RGB与YUV之间的对应关系如下:
(2.3)
(2.4)上一页下一页返回2.4颜色视觉基础和色度学(2)Lab表色系。Lab颜色模型是CIE于1976年推荐的设计成符合孟塞尔彩色系统的表色系。Lab颜色由亮度或光亮度分量L和a、b两个色度分量组成。其中a在正向的数值越大表示越红,在负向的数值越大则表示越绿;b在正向的数值越大表示越黄,在负向的数值越大表示越蓝。Lab颜色与设备无关,无论使用何种设备(如显示器、打印机、计算机或扫描仪)创建或输出图像,这种模型都能生成一致的颜色。上一页下一页返回2.4颜色视觉基础和色度学(2.5)式中,X0、Y0、Z0为标准白色,对应的X、Y、Z值。
上一页下一页返回2.4颜色视觉基础和色度学2.4.2.2颜色模型的转换1)RGB和CMY模型的转换(1)RGB转换为CMYK。
K=min(1-R,1-G,1-B)
C=(1-R-K)/(1-K)
M=(1-G-K)/(1-K)(2.6)
Y=(1-B-K)/(1-K)(2)CMYK转换为RGB。
R=1-min(1,C
×
(1-K)
+
K)
G=1-min(1,M
×
(1-K)
+
K) (2.7)
B=1-min(1,Y
×
(1-K)
+
K)上一页下一页返回2.4颜色视觉基础和色度学2)RGB模型与HSI模型的转换(1)RGB转换为HSI公式。
(2.8)上一页下一页返回2.4颜色视觉基础和色度学(2)HSI转换为RGB公式HSI到RGB的转换更复杂一些,根据两个坐标系间的关系,需要在3个区间展开,即将H分为3个区间,即0°~120°,120°~240°,240°~360°,变换公式略有不同。①当H在[0°,120°]之间
(2.9)上一页下一页返回2.4颜色视觉基础和色度学②当H在[120°,240°]之间
(2.10)③当H在
[240°,360°]
之间
(2.11)上一页返回2.5像素间联系2.5.1像素的邻域对1个坐标为(x,y)的像素p,由与其关系最密切的邻近像素(或近邻像素)可组成它的邻域。通常有以下3种邻域:1)4-邻域N4(p)若像素p的坐标为
(x,y),由像素p的水平(左,右)和垂直(上,下)4个近邻像素r的坐标分别是
(x+1,y)、(x-1,y)、(x,y+1)、(x,y-1))组成p的4-邻域,记为N4(p)。像素p与它的4-邻域近邻像素是1个单位距离,如图2.17所示。下一页返回2.5像素间联系2)对角邻域ND(p)若像素p的坐标为
(x,
y),由像素p的对角(左上,右上,左下,右下)4个对角近邻像素s的坐标分别是(x+1,
y-1)、(x+1,
y+1)、(x-1,
y+1)、(x-1,
y-1))组成p的4-对角邻域,记为ND(p),如图2.18所示。3)8-邻域N8(p)若像素p的坐标为(x,
y),由像素p的4个4-邻域像素和4个对角邻域像素合起来组成p的8-对角邻域,记为N8(p),如图2.19所示。如果像素p本身处于图像的边缘,则它的若干个像素会落在图像之外。上一页下一页返回2.5像素间联系2.5.2像素间的邻接、连接和连通1)像素的邻接如果一个像素和在它邻域中的像素是接触的,称其是邻接的。邻接仅考虑了像素间的空间关系,如上述N4(p)和N8(p)都是邻接。2)像素的连接如果两个像素满足两个条件:它们在空间上是接触的(即它们是邻接的);它们的灰度值(或者其他属性值)满足某个特定的相似准则(如它们的灰度值相等),则称这两个像素连接。设V表示定义连接的灰度值的集合,可以定义以下3种连接情况:(1)4-连接:2个像素p和r在V中取值,且r在N4(p)中,则它们为4-连接。上一页下一页返回2.5像素间联系(2)8-连接:2个像素p和r在V中取值,且r在N8(p)中,则它们为8-连接。(3)m-连接(混合连接):2个像素p和r在V中取值,且满足下列条件之一。①r在N4(p)中。②r在ND(p)中且N4(p)∩N4(r)是空集,不包含V中取值的像素,则它们为混合连接。具体示例为r不在N4(p)中,r在ND(p)中,N4(p)中包括标有a,b,c,d四个像素,N4(r)中包括标有
c,d,e,f四个像素,且N4(p)∩N4(r)包括标有c,d的两个像素,如图2.20所示。例如,设V={1},图2.20(b)所示满足条件二,为混合连接;图2.20(c)所示不满足条件二,不是混合连接。上一页下一页返回2.5像素间联系混合连接的实质:在像素之间同时存在4-连接和8-连接时,优先采用4-连接,并屏蔽两个和同一像素间存在4-连接的像素之间的8-连接。混合连接是8-连接的变形,引进它是为了消除使用8-连接时出现的多路问题。如图2.21(a)所示的像素排列,设V={1},中心像素与8邻域像素连接关系如图2.21(b)所示,由于8-连接产生歧义性(中心与右上角像素有两条通路),可用混合连接消除,因为中心像素与右上角像素之间直接的混合连接不能成立,所以线路如图2.21(c)所示。上一页下一页返回2.5像素间联系3)像素的连通由一些彼此邻接的像素组成的集合称为区域,更具体地说是:如果定义像素p和像素q的路径为一个像素序列
,其中
,
且Ai+1是Ai的邻接点,i
=
1,
2,
n-1,且其中任意两个像素的颜色属性满足某个特定的相似准则(如颜色相同)。那么,区域是指这样的集合,其中任意两个像素之间都存在着完全属于该集合的路径。如果两个像素之间存在一条路径,则称这些像素是连通的。因此,区域也可以认为是彼此连通的像素的集合。像素之间的连通性是建立图像中物体的边界和确定区域的元素时一个重要概念,它可以进一步分成连接和连通,连接是连通的一个特例。要确定2个像素是否连接时,需要在某种意义上确定它们是否邻接以及它们的颜色属性是否满足某个特点的相似准则(如颜色距离在一定的范围内)。如果这条通路上的所有像素的灰度值均满足某个特定的相似准则,则说明两个像素p和q是连通的。上一页下一页返回2.5像素间联系4)像素集合的邻接和连通图像的子集合:图像中的一部分,根据像素间的联系,可将图像中某些像素结合组成图像的子集合。图像子集的邻接:如果图像子集S中的一个或一些像素与图像子集T中的一个或一些像素邻接,则两个图像子集S和T是邻接的。根据所采用的像素邻接定义,可得到图像子集4-邻接或8-邻接。图像子集的连接:如果S中的一个或一些像素与T中的一个或一些像素连接,则两个图像子集S和T是连接的。上一页下一页返回2.5像素间联系要考虑是否是邻接子集,它们中邻接像素的灰度值是否满足某个特定的相似准则。设p和q是一个图像子集S中的两个像素,如果存在一条完全由在S中的像素组成的从p到q的通路,那么就称p在S中与q相连通。对S中任一像素p,所有与p相连通且又在S中的像素的集合(包括p)合起来称为S中的一个连通组元。如果S中只有一个连通组元,即S中所有像素都互相连通,则称S是一个连通集。两个互不邻接但与同一图像子集都邻接(在同一个V下)的图像子集是互相连通的。图像中同一个连通集中的任两个像素互相连通,而不同连通集中的像素互不连通。上一页下一页返回2.5像素间联系2.5.3像素间的距离像素之间的联系与像素在空间的接近程度有关,像素在空间的接近程度可用像素之间的距离来测量,一般常用距离量度函数来测量距离。设给定3个像素p,q,r,其坐标分别为(x,
y),(s,
t),(u,
v),函数D为一个距离量度函数,它要满足3个条件。(1)
(当且仅当
,
)。(2)
。(3)
。上一页下一页返回2.5像素间联系条件(1)表明两像素之间的距离总是正的(两像素空间位置相同时,其间的距离为0)。条件(2)表明两像素之间的距离与起终点的选择无关,或者说距离是相对的。条件(3)表明两像素之间的最短距离是沿直线的。设数字图像中两个像素p和q,坐标分别为(x,
y),(s,
t),二者之间的距离(即距离量度函数)常用欧氏距离(范数为2的距离)表示。与坐标为
(x,
y)
的像素的欧氏距离小于或等于某个值d的像素都包括在以
(x,
y)
为中心以d为半径的圆中。具体公式为
(2.12)上一页下一页返回2.5像素间联系(1)城区距离:在数字栅格中,如果只允许水平和垂直方向移动,称为城区距离,记为D4,它类似在与具有栅格状街道和封闭房屋块的城市里两个位置的距离。D4定义为
(2.13)城区距离(范数为1的距离)是与坐标为
(x,
y)
的像素的城区距离小于或等于某个值d的像素组成以
(x,
y)
为中心的菱形。D4
=
1的像素就是
(x,
y)
的4-近邻像素,所以像素p的4-邻域可定义为
(2.14)上一页下一页返回2.5像素间联系(2)棋盘距离:在数字栅格中,如果允许对角线方向移动,称为棋盘距离,记为D8。D8定义为
(2.15)棋盘距离(范数为∞的距离)是与坐标为
(x,
y)
的像素的棋盘距离小于或等于某个值d的像素组成以
(x,
y)
为中心的正方形。D8
=
1的像素就是
(x,
y)
的8-近邻像素,所以像素p的8-邻域可定义为 (2.16)上一页下一页返回2.5像素间联系(3)范数与距离:范数是测度空间的一个基本概念,一个函数
的范数可表示为(其中w称为指数或指标)
(2.17)在距离计算中,可定义两点之间的Minkowski距离度量为
(2.18)当w
=
1时,得到一个菱形,即对应城区距离;当w
=
2时,得到一个圆形,即对应欧氏距离;当w
=
时,得到一个正方形,即对应棋盘距离。上一页返回2.6算术和逻辑运算2.6.1算术运算1)加法运算两幅图像的加法运算定义为
(2.19)加法运算主要应用在以下两个方面:(1)用于图像平均,去除“叠加性”噪音。对于原图像
f(x,y),有一个带噪声图像集{gi(x,y)},i=1,2…M,有
gi(x,y)=f(x,y)+h(x,y),其中h(x,y)为噪声。M个图像的均值定义为
(2.20)当噪声
为互不相关,且均值为0时,上述图像均值将降低噪音的影响。下一页返回2.6算术和逻辑运算例2.1图2.22给出1组用图像平均消除随机噪声的例子。图2.22(a)为l幅叠加了零均值高斯随机噪声('')的8
bit灰度级图像。图2.22(b),图2.22(c)和图2.22(d)分别为用4、8和16幅同类图(噪声均值和方差一样的不同样本)进行相加平均的结果。可见随着平均图像数量的增加,噪声影响逐步减少。(2)生成图像叠加效果。对于两个图像
f(x,y)和h(x,y),叠加公式为:
,其中
,可以得到各种图像合成的效果,也可以用于两张图像的衔接,如图2.23所示。上一页下一页返回2.6算术和逻辑运算2)减法运算两幅图像的减法运算定义为
(2.21)减法运算主要应用在以下3个方面。(1)去除固定的背景信息或不需要的叠加性图案。设背景图像
b(x,y),前景背景混合图像f(x,y),则
为去除了背景的图像g(x,y)=f(x,y)-b(x,y),如图2.24所示。如图2.25所示。上一页下一页返回2.6算术和逻辑运算3)乘法运算两幅图像的乘法运算定义为
(2.22)乘法运算主要应用在以下两个方面:(1)图像的局部显示即用二值蒙板图像与原图像做乘法,如图2.26所示。(2)校正由于照明或传感器的非均匀性造成的图像灰度阴影。上一页下一页返回2.6算术和逻辑运算4)除法运算两幅图像的除法运算定义为
(2.23)除法运算主要应用在校正由于照明或传感器的非均匀性造成的图像灰度阴影。对整幅图像的算术运算是逐像素进行的,每次运算只涉及1个空间像素位置,所以可以“原地”完成,即在
(x,
y)
位置做1个算术运算的结果可以存在其中1个图像的相应位置。上一页下一页返回2.6算术和逻辑运算2.6.2逻辑运算1)补或求反两幅图像的补或求反运算定义为
(2.24)补或求反运算主要应用在以下3个方面。(1)获得一个阴图像,如图2.27所示。(2)获得一个子图像的补图像,如图2.28所示。(3)绘制区别于背景的、可恢复的图形。上一页下一页返回2.6算术和逻辑运算2)异或、或运算(1)两幅图像异或运算定义为
(2.25)即当2个像素之一(但不同时)为1时结果为1,其他为0。异或运算主要应用在以下两个方面。①获得相交子图像(黑色代表1,白色代表0,若在黑板上画则相反),如图2.29所示。上一页下一页返回2.6算术和逻辑运算②绘制区别于背景的、可恢复的图形。(2)或运算。两幅图像的或运算定义为
(2.26)当两个输入图像相应的像素之一为1或同时为1时,或运算结果才为1,否则为0。或运算主要应用于合并两幅子图像。上一页下一页返回2.6算术和逻辑运算3)与运算两幅图像的与运算定义为
(2.27)当两个输入图像相应的像素都为1时,与运算结果才为1,否则为0。与运算主要应用于求两个子图像的相交子图,如图2.30所示。基本逻辑运算可以组合起来构成所有其他各种逻辑运算。逻辑运算只适用于二值图像。同算术运算一样,对整幅图像的逻辑运算也是逐像素进行的,运算每次涉及1个空间像素位置,所以可以“原地”完成。上一页下一页返回2.6算术和逻辑运算2.6.3邻域运算邻域运算主要以模板运算的形式实现,故又称模板运算。模板运算的思想是将赋予某个像素的值作为它本身灰度值和其相邻像素灰度值的函数。模板实际上是一个系数矩阵,其大小与使用的图像区域大小相同,通常为奇数,如3×3,5×5,7×7等。模板通常表示为
(2.28)上一页下一页返回2.6算术和逻辑运算模板运算实质上是一个模板与原图像的卷积运算,即加权求和的过程,原图像区域中的每个像素分别与模板(权矩阵)的每个元素对应相乘,所有乘积之和作为区域中心像素的新值。例如:对于某图像的子图像有
(2.29)3×3区域中心像素z5的模板运算公式为
(2.30)恰当的选择系数并在图像的各个像素位置运用模板可以得到一系列有用的运算,如噪声消除、细化区域和边缘提取等,但其运算量很大。上一页返回2.7坐标变换2.7.1平移变换设平移量
(x0,
y0,
z0)
将原坐标点由(x,
y,
z)
平移到新的位置(x’,
y’,
z’),这个平移可用下面3个等式表示
(2.31)以矩阵形式表示为
(2.32)下一页返回2.7坐标变换一般常将几个变换级连起来以产生组合效果,如平移后面接上尺度变换和旋转。方矩阵的运用能极大地简化级连操作的表示,故上式也可简化等价为
(2.33)上一页下一页返回2.7坐标变换若设
(2.34)
(2.35)则平移变换可写成
(2.36)上一页下一页返回2.7坐标变换2.7.2镜像变换图像的镜像变换是以图像垂直中轴线或水平中轴线交换图像的变换,分为垂直镜像变换和水平镜像变换,两者的矩阵形式分别如下。垂直镜像变换
(2.37)水平镜像变换
(2.38)上一页下一页返回2.7坐标变换若设
(2.39)镜像矩阵为
(2.40)则尺度变换可写成
(2.41)上一页下一页返回2.7坐标变换2.7.3尺度(放缩)变换用Sx,Sy和Sz沿x,y和z轴进行放缩变换可用下列矩阵实现。
(2.42)若设尺度矩阵为
(2.43)上一页下一页返回2.7坐标变换则尺度变换可写成
(2.44)注意:图像的缩小操作是在现有的信息里挑选所需要的有用信息。图像的放大操作,则需对尺寸放大后所多出来的空格填入适当的值,这是信息的估计问题,所以较图像的缩小要难一些。例如需要将原图像放大k1×k2倍,则将一个像素值添在新图像的k1×k2的子块中。图2.31是放大5倍的效果图。如果放大倍数太大,按照前面的方法处理会出现马赛克模糊效应,如图2.32所示。上一页下一页返回2.7坐标变换2.7.4旋转变换图像旋转变换定义为以图像中某一点为原点以逆时针或顺时针方向旋转一定角度q。对二维图像,其变换矩阵为
(2.45)该变换矩阵是绕坐标轴原点进行的,如果是绕一个指定点
(a,
b)
旋转,则先要将坐标系平移到该点,再进行旋转,然后平移回到新的坐标原点。同样原理推广至三维,将点
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《延安颂》教案-2025-2026学年赣美版小学美术四年级下册
- 医药小核酸药物行业市场前景及投资研究报告:奇点已至小核酸药物平台多维纪元
- 电子行业市场前景及投资研究报告:AI需求加速增长PCB升级机遇
- 临床助理医师-综合笔试-儿科营养和营养障碍疾病
- 麻纺生产过程安全控制办法
- 非遗竹编灯罩制作与灯光搭配
- 某橡胶厂硫化监控准则
- 2026年文言文翻译的未来发展:传承与创新的融合路径
- 防爆接线盒检修规程
- 中医消化不良调理规范
- 项目管理 课件 第十四章-项目干系人与项目治理管理
- 2026届新高考化学热点冲刺复习:共价键的极性与有机反应
- 英语四级介绍课件
- 《气凝胶保温隔热系统》
- 企业节能工作管理制度
- 家具配送安装合同协议书
- TSG G7002-2015 锅炉定期检验规则
- 2024-2025学年江苏省南京市联合体八年级(下)期中数学练习试卷(含答案)
- 注册验船师历年真题答案2025
- 泥水平衡-沉井-顶管及沉井施工方案
- 《华为OLT产品介绍》课件
评论
0/150
提交评论