第二章图像和视觉基础教材_第1页
第二章图像和视觉基础教材_第2页
第二章图像和视觉基础教材_第3页
第二章图像和视觉基础教材_第4页
第二章图像和视觉基础教材_第5页
已阅读5页,还剩102页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章图像和视觉基础数字图像基础知识人类的视觉感知系统2.1视觉基础桂林理工大信科院1.人眼成像结构图

桂林理工大信科院2.亮度视觉

人眼的结构机理使人能感觉到亮度和颜色人眼成像的结构Ciliarybody睫状体眼睛血管膜的增厚部分,在脉络膜和虹膜之间Ciliarymuscle睫状肌Retina视网膜Lens晶状体Fovea中央凹Sclera巩膜choroid脉络膜桂林理工大信科院视网膜上的锥细胞产生适亮视觉(photopicvision);柱细胞产生适暗视觉(scotopicvision)Cones-锥细胞Rods-柱细胞桂林理工大信科院亮度视觉范围很宽:1010数量级光强度与主观亮度的对应关系强光极限夜间白天夜视阈值桂林理工大信科院刻画亮度分辨率的基本实验韦伯率,亮度区分能力桂林理工大信科院韦伯率是灰度的函数可知人眼区分亮度的能力在低照明的情况下较差,在背景亮度增加后得到改善;但不与照明的情况成一简单的函数关系-基于下面两个事实桂林理工大信科院桂林理工大信科院事实1:马赫带效应-边缘效应人眼过高估计了不同亮度区域边界的值桂林理工大信科院

imagesc(1:8)colormap(gray)桂林理工大信科院事实2:同时对比度人眼感觉到的亮度还和对比度有关桂林理工大信科院桂林理工大信科院2.2.1图象和数字图象

图象:

用各种观测系统以不同形式和手段观测客观世界而获得的,可以直接或间接作用于人眼并进而产生视知觉的实体粗略地说,图像是二维或三维景物在视网膜上的影像,人类采用计算机技术接受并加工这种视觉信息的理论、方法和应用称为计算机图像处理和分析 图象(广义/抽象)

图像(狭义/具体)

图象和信息:

人类从外界(客观世界)获得的信息约有75%来自视觉系统

桂林理工大信科院1.1.1图象和数字图象图象类型

{广义}

图片,动画,绘图,文字/档,...

{狭义}

单幅

序列图象,...

静止

运动图象(视频),... 2-D

3-D,彩色,立体对, 多光谱,多视场图象,...

灰度

深度,纹理图象,...

桂林理工大信科院1.1.1.3图象的表达图象表示

2-D数组 f(x,y)

x,y:2-D空间XY中坐标点的位置

f:代表图象在(x,y)的性质F的数值

f,x,y的值可以是任意实数

性质F:可对应不同物理量(例如灰度、红、绿、兰)

灰度图象里用灰度表示桂林理工大信科院连续图像:f,x,y的值可以是任意实数数字图像:f,x,y的值是整数图像数字化空间坐标离散化(采样):连续坐标(x,y)离散坐标(i

,j)

i=0,1,2,

,M-1;

j=0,1,2,

,N-1灰度值离散化(量化):对每个样本值进行二进制编码连续图像离散图像数字图像一般取:行(或列)的样点数:;

灰度量化级数:

桂林理工大信科院图像数字化过程桂林理工大信科院f(x,y)X,单位:mycr,单位:pixelf(5,4)CCD传感器上的连续图像采样量化后的数字图像桂林理工大信科院桂林理工大信科院1.1.1.3图象的表达图象的矩阵和矢量表示一幅2-D图像可以用2-D数组f(x,y)表示,实际中将2-D图像写成2-D的M×N的矩阵

矩阵

矢量

桂林理工大信科院1.1.1.3图象的表达离散点集灰度区域二维数组桂林理工大信科院屏幕显示坐标系统灰度区域迪卡尔坐标系统桂林理工大信科院桂林理工大信科院MATLAB图像及其操作开发图像处理的应用系统不可能由一个人完成,而是一个群体协作的工程。设计方法通常采用结构化或面向对象方法。如果只就图象处理的某个算法而言,就是一项软件工程设计中的模块设计工作,用MATLAB工具做这样的算法编程工作是一件轻而易举的事情。任何一个图像处理算法都可以是一个自定义的函数,MATLAB提供了一个创建用户函数的结构,并以M文件的形式存储下来,运行M文件,就是让计算机一次完成M文件规定的操作。桂林理工大信科院例:图像文件读取和显示函数的编制函数文件,文件的开头第一行为function的文件。1.建立函数文件在编辑/调试窗口键入:桂林理工大信科院2.保存函数文件保存的函数文件名应与用户定义的函数名一致,此例中定义的函数名为“RGBimread”,则文件保存为“RGBimread.m”桂林理工大信科院桂林理工大信科院3.调用函数文件

在命令窗口输入:命令窗口图形窗口桂林理工大信科院MATLAB图像及其操作开发图像处理的应用系统不可能由一个人完成,而是一个群体协作的工程。设计方法通常采用结构化或面向对象方法。如果只就图象处理的某个算法而言,就是一项软件工程设计中的模块设计工作,用MATLAB工具做这样的算法编程工作是一件轻而易举的事情。MATLAB图像文件格式MATLAB图像类型MATLAB图像文件的读写MATLAB图像对象属性桂林理工大信科院1.MATLAB图像文件格式MATLAB的图像文件格式有两种:一种是矢量形式另一种是光栅形式矢量文件像程序,通过执行命令画出图案,适合图形数据文件;光栅文件,描述图像的像素信息,比较适合色彩、阴影或形状变化复杂的图像。MATLAB支持以下几种图像文件格式:PCX格式,分为1、4、8、16、24位图像数据,文件内容包括:文件头(128字节)、图像数据、扩展颜色映射表数据。BMP(独立位图文件格式),分为1、4、8、24位非压缩图像数据,8位RUNLENGTHENCODED图像,文件内容包括:文件头(数据结构)、位图信息数据块(信息头和一个颜色表)和图像数据。GIF(图形交换各式)文件结构较复杂,可以存放多幅图像(对实现网页动画有利),图像数据均为压缩过。HDF(层次数据格式)JPEG格式(联合图像专家组),是一种对静止灰度和彩色图像的压缩标准,在数码相机中采用。TIFF格式(标志图像文件格式)是一种独立于操作系统和文件系统的格式,很便于在软件之间进行图像数据的转换。分为1、4、8、24位非压缩图像数据,1、4、8、24位packbit压缩图像,1位CCITTT压缩图像,文件内容包括:文件头(一个数据结构)、图像数据、扩展颜色映射表数据。XWD格式(XWindows格式)PNG格式(可移动网上图像)桂林理工大信科院2.图像数据类型MATLAB中图像数据矩阵的存储方式为双精度(double)类型即64位浮点数。而存储图像时MATLAB有时采用无符号整型(uint8)即图像矩阵中的每个数据占用一个字节。由于大多数运算和函数(比如最基本的矩阵加减运算)都不支持uint8类型,所以运算时通常要将图像转换成double型。函数double将数据转换为双精度浮点类型,调用格式为:X64=double(x8)/256桂林理工大信科院举例:从一幅颜色模型为HSV真彩色图片取出6X6的数据其为浮点类型的数据,转换为uint8类型桂林理工大信科院数据类型转换s1=s([1:6],[1:6],1)s1=0.28240.28240.27840.27840.27450.27450.28240.28240.27840.27840.27450.27450.28240.28240.27840.27840.27450.27450.28240.28240.27840.27840.27450.27450.28240.28240.27840.27840.27450.27450.28240.28240.27840.27840.27450.2745s8=uint8(round(s1*256))%双精度转换为无符号整型,值域为[0,255]s8=727271717070727271717070727271717070727271717070727271717070727271717070桂林理工大信科院数据类型转换s64=double(s8)/256%uint8转换为双精度型64位,值域为0~1s64=0.28130.28130.27730.27730.27340.27340.28130.28130.27730.27730.27340.27340.28130.28130.27730.27730.27340.27340.28130.28130.27730.27730.27340.27340.28130.28130.27730.27730.27340.27340.28130.28130.27730.27730.27340.2734桂林理工大信科院3.图像类型图像类型是指图像在MATLM数据文件中的存储方式。MATLAB支持4种图像类型,它们是:真彩色图像-真彩色图像又称RGB图像,它是利用R、G、B3个分量表示一个像素的颜色,对—个尺寸为m×n的彩色图像来说,在MATLAB中则存储为——个m×nx3的多维数组。如果需要知道图像A中(x,y)处的像素RGB值,则使用A(x,y,1:3)来提取。索引色图像灰度图像-存储灰度图像只需要一个数据矩阵,矩阵的每个元素表示对应位置像素的灰度值,灰度图像的数据类型可以是doubIe类型,这时值域为[0,1],也可以uint8类刑,值域是[0,255]

二值图像桂林理工大信科院转换图像类型1、rgb2gray函数用于将一幅真彩色图像转换成灰度图像,如果输入的是真彩色图像,则图像可以是uint8或double类型,输出图像I与输入图像类型相同。如果输入的是调色板,则输入和输出的都是double类型。其语法格式为:I=rgb2gray(RGB)%输入RGB为图像数据矩阵newmap=rgb2gray(map)%输入map为真彩色图像的调色板

桂林理工大信科院图像类型转换2、im2bw格式:BW=im2bw(I,level)%I代表图像的数据矩阵,level图像二值化域值桂林理工大信科院4.用于读写图像的函数imreadimread函数用于读入各种图像文件,其语法格式为:A=imread(‘filename.格式’)%注意默认的文件存放目录为x:\\matlab6.0\work,图像的格式可选:bmp,hdf,jpg,png,tif,xwd等imwriteimwrite函数用于输出图像格式为:imwrite(A,‘filename.格式’)桂林理工大信科院MATLAB程序:RGB=imread('flowers.tif');subplot(1,2,1),imshow(RGB),axis('image');RGB2=imcrop(RGB,[64,64,64,64]);subplot(1,2,2),imshow(RGB2),axis('image')RGB3=double(RGB2(1:6,1:6,1))RGB4=double(RGB2(1:6,1:6,2))RGB5=double(RGB2(1:6,1:6,3))RGB3=146146144148154150143143145143137140144138135131124120137126122112104103114114100898788959182888177RGB4=3736383937373640404140393941404039384039383734333737333636393636

36343738RGB5=676563605963645956565759595654555249565148484543484844454551464546444649运行结果桂林理工大信科院5.显示图像文件imageimage是MATLAB提供的最原始的图像显示函数,格式为:image(x);%显示有矩阵X表示的图像Colormap(gray);%调色板矩阵imshowimshow函数是最常用的显示各种图像的函数,格式为:imshow(I,n);%显示灰度矩阵I,n设置显示的灰度值范围(级数)imshow(RGB)%显示真彩色图像Imshowfilename%直接显示图像,但图像数据不在MATLAB的workspace中桂林理工大信科院4.显示图像文件例显示灰度图片和真彩色图片参考程序:RGB=imread('hr.jpg');subplot(2,2,1)imshow(RGB)subplot(2,2,3)gray1=rgb2gray(RGB);imagesc(gray1),colormap(gray)桂林理工大信科院4.显示图像文件colorbar用于显示颜色条格式为:colorbar%将颜色条在放置在坐标轴上subimagesubimage函数在用subplot分割的图像中使用多个调色板显示图像.subplot(m,n,l)%将图形窗口分解为mXn个部分,l为序号桂林理工大信科院2.颜色视觉

颜色基础人眼对于彩色的观察和处理是一种生理和心理现象,其机理还没有完全搞清楚,因而对于彩色的许多结论都是建立在实验基础之上的。可视光--电磁波波长范围很大,但是只有波长在400~760nm这样很小范围内的电磁波,才能使人产生视觉,感到明亮和颜色。把这个波长范围内的电磁波叫可见光。当光谱采样限制到三个人类视觉系统敏感的红、绿、蓝光波段时,对这三个光谱带的光能量进行采样,就可以得到一幅彩色图像。400nm700nm紫外光红外光可见光区546.1nm435.8nm780nm桂林理工大信科院三原色

1931年,国际照明委员会(CIE)规定用波长为700nm、546.1nm和435.8nm的单色光作为红(R)、绿(G)、蓝(B)光波三原色。则任意彩色的颜色方程为:桂林理工大信科院XYZ三刺激值

XYZ三刺激值的概念是以色视觉的三元理论为根据的,它说明人眼具有接受三原色(红、绿、蓝)的接受器,而所有的颜色均被视作该三原色的混合色。1931年CIE制定了一种假想的标准观察者,配色函数

XYZ三刺激值是利用这些标准观察者配色函数计算得来的。

色度图桂林理工大信科院区分颜色的特征量亮度-与物体的反射率成正比色调-与光谱中的主要颜色的光波长有关饱和度-色调的纯度其中色调和饱和度和起来为色度桂林理工大信科院颜色模型指的是某个三维颜色空间中的一个可见光子集。它包含某个色彩域的所有色彩。任何一个色彩域都只是可见光的子集,任何一个颜色模型都无法包含所有的可见光。线性感知的,如HSI颜色空间;非线性感知的,如在计算机上通常采用的RGB三颜色模型设备依赖之分:RGB空间是一个依赖于显示设备的彩色空间;CIEL*a*b色标体系是一个不依赖于显示设备的颜色空间桂林理工大信科院一、RGB颜色模型

国际照明委员会(CIE)规定以700nm(红)、546.1nm(绿)、435.8nm(蓝)三个色光为三基色。又称为物理三基色。自然界的所有颜色都可以通过选用这三基色按不同比例混合而成。桂林理工大信科院一、RGB颜色模型R:200G:50B:120黄(255,255,0)黑(0,0,0)绿(0,255,0)青(0,255,255)蓝(0,0,255)品红(255,0,255)白(255,255,255)红(255,0,0)RGB颜色模型是三维直角坐标颜色系统中的一个单位正方体;RGB颜色模型通常用于彩色阴极射线管和彩色光栅图形显示器。RGB三原色是加性原色任意一种颜色可以分解为三个分量,一幅彩色图像可以分解到三个平面桂林理工大信科院桂林理工大信科院二、HIS颜色模型这种彩色系统格式的设计反映了人类观察彩色的方式。如:红色又分为浅红和深红色等等。

桂林理工大信科院二、HSI色系I:表示光照强度或称为亮度,它确定了像素的整体亮度,而不管其颜色是什么。

桂林理工大信科院二、HSI色系H:表示色度,由角度表示。反映了该颜色最接近什么样的光谱波长(既彩虹中的那种颜色)0o为红色,120o为绿色,240o为蓝色。0o到240o覆盖了所有可见光谱的颜色,240o到300o是人眼可见的非光谱色(紫色)。桂林理工大信科院二、HSI色系

S:表示饱和度,饱和度参数是色环的原点到彩色点的半径长度。在环的外围圆周是纯的或称饱和的颜色,其饱和度值为1。在中心是中性(灰)影调,即饱和度为0。桂林理工大信科院二、HSI色系黑白IS思考问题:在这个圆柱体上,红色的点逆(顺)时针旋转会变成什么样?上下移动呢?向圆心方向移动呢?桂林理工大信科院桂林理工大信科院(a)HIS的三棱锥模型(b)HIS的圆锥模型桂林理工大信科院二、HSI色系

1.RGB到HSI的转换:

桂林理工大信科院二、HSI色系2.HSI到RGB的转换1)桂林理工大信科院二、HSI色系2.HSI到RGB的转换2)桂林理工大信科院二、HSI色系2.HSI到RGB的转换3)桂林理工大信科院桂林理工大信科院彩色图像各分量用灰度图形式表示桂林理工大信科院RGB分量灰度图桂林理工大信科院HIS分量灰度图桂林理工大信科院

桂林理工大信科院

桂林理工大信科院桂林理工大信科院

红点顺时针移动的效果桂林理工大信科院

红点逆时针移动的效果桂林理工大信科院

红点上、下移动的效果桂林理工大信科院

红点向圆心方向移动的效果桂林理工大信科院2.2图像的数字化及表达图象的矩阵和矢量表示一幅2-D图像可以用2-D数组f(x,y)表示,实际中将2-D图像写成2-D的M×N的矩阵

矩阵

矢量

桂林理工大信科院

2.2.1数字图像的描述

1.黑白图像

是指图像的每个像素只能是黑或者白,没有中间的过渡,故又称为2值图像。2值图像的像素值为0、1。桂林理工大信科院2.2.1数字图像的描述2.灰度图像

灰度图像是指每个像素的信息由一个量化的灰度级来描述的图像,没有彩色信息。桂林理工大信科院灰度图像描述示例桂林理工大信科院2.2.2图像的的采样和量化1.采样

是将在空间上连续的图像转换成离散的采样点(即像素)集的操作。由于图像是二维分布的信息,所以采样是在x轴和y轴两个方向上进行。采样时的注意点是:采样间隔的选取。采样间隔取得不合适除了画面出现马赛克之外,还会发生频率的混叠现象。

桂林理工大信科院

2.与采样相关的分辨率的概念

分辨率:是指映射到图像平面上的单个像素的景物元素的尺寸。

单位:像素/英寸,像素/厘米或者是指要精确测量和再现一定尺寸的图像所必需的像素个数。

单位:像素*像素2.2.2图像的的采样和量化桂林理工大信科院3.量化

是将各个像素所含的明暗信息离散化后,用数字来表示称为图像的量化,一般的量化值用整数来表示。充分考虑到人眼的识别能力之后,目前非特殊用途的图像均为8bit量化,即用0~255描述“黑~白”。量化等级越多图像层次越丰富,灰度分辨率高,但数据量大在3bit以下的量化,会出现伪轮廓现象,图像质量变差桂林理工大信科院4.量化技术量化可分为均匀量化和非均匀量化。均匀量化是简单地在灰度范围内等间隔量化。非均匀量化是对像素出现频度少的部分量化间隔取大,而对频度大的量化间隔取小。

2.2.2图像的的采样和量化桂林理工大信科院空间图像分辨率变化的结果桂林理工大信科院将不同分辨率图像放大显示图像出现锯齿边缘桂林理工大信科院减少图像幅度分辨率桂林理工大信科院幅度分辨率降到32级以下出现虚假轮廓桂林理工大信科院不同细节的图像桂林理工大信科院N和K的分布桂林理工大信科院非均匀采样N值固定时(空间分辨率给定),在许多情况下,利用自适应的方案有可能改善图象的视觉质量,该方案的采样过程取决于图象的特性。一般来说,在灰度级变化大的过渡区附近需要较密的精确采样,而在相对平滑的区域可采用较稀的采样。其缺点之一是需要确定非均匀采样的边界,尽管只需非常粗糙地确定。这种方法对包含较少均匀区域的图象也不实用。桂林理工大信科院均匀量化效果示意图桂林理工大信科院当必须的灰度级较少时,常常希望在量化过程中采用非等间隔灰度级,可采用与上面介绍的非均匀采样技术类似的方法分配灰度级。由于眼睛在剧烈灰度级变化区估计灰度的能力相对较差,在这种情况下边缘区可用较少的灰度级,剩下的灰度级可以用在灰度变化平缓区。这样可以避免或减少由于量化过稀而在某些区域产生的虚假轮廓。非均匀量化效果示意图桂林理工大信科院2.2.3像素间的基本关系1.像素邻域图像信息中空间相邻像素间的密切相关,某个象素空间相邻的象素称为其邻域。例4-邻域是指:对于1个坐标为(x,y)的象素p,它可以有4个水平和垂直的近邻象素,它们的坐标分别为(x+1,y),(x-1,y),(x,y+1),(x,y-1)。这些象素(用r表示)组成p的4-邻域,记为N4(p),见下图

(a)。象素p的4个对角近邻象素(用s表示)的坐标是(x+1,y+1),(x+1,y-1),(x-1,y+1),(x-1,y-1)。它们记为ND(p),见下图

(b)。N4(p)和ND(p)象素合称为p的8-邻域,记为N8(p),见下图

(c)。若(x,y)在图象的边缘,N4(p)、ND(p)和N8(p)中的若干象素会落在图象外。桂林理工大信科院像素的邻域rrprrsspsssrsrprsrsabc桂林理工大信科院2.像素的邻接性判断像素的邻接性是指两个像素是否接触并且灰度相似,有4-邻接,8-邻接,m-邻接4-邻接:2个像素p和r在V中取值,且在N4(p)中8-邻接:2个像素p和r在V中取值,且在N8(p)中m-邻接:2个像素p和r在V中取值,且满足以下两个条件之一:(1)r在N4(p)中;(2)r在ND(p)中且N4(p)∩N4(r)是空集桂林理工大信科院像素毗邻如果两个像素相邻接,则它们相毗邻。相互邻接的像素形成一条通路4-毗邻8-毗邻m-毗邻4-连通8-连通m-连通像素毗邻相互邻接的像素形成一条通路,所有与p相连的像素集合称为连通组元,连通组元的两个像素相互连通。桂林理工大信科院4邻域N4(P)、对角邻域ND(P)、8邻域N8(P)0101110104邻域101010101对角邻域1111111118邻域桂林理工大信科院4邻接、8邻接、m邻接0101110104邻接0110100018邻接11111M邻接m邻接-(1)r在N4(P)中

(2)r在ND(P)中且N4(P)N4(r)是空集桂林理工大信科院3.像素连通连接是连通的一种特例通路 由一系列依次连接的象素组成 从具有坐标(x,y)的象素p到具有坐标(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论