图像的识别和应用课件_第1页
图像的识别和应用课件_第2页
图像的识别和应用课件_第3页
图像的识别和应用课件_第4页
图像的识别和应用课件_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数字图像技术

(DigitalImageProcessingTechnology)1整理ppt本课程的主要内容

1、图像的获取

2、图像变换

3、图像的增强与滤波4、图像的边缘检测5、图像的分割6、图像形态学7、图像的特征提取与分析8、图像识别与应用9、计算机视觉初步2整理ppt

第8章图像的识别技术3整理ppt

主要内容8.1模式识别概述8.2一些常用的基本概念8.3基于决策理论的图像识别8.4基于模板匹配的图像识别8.5基于神经网络的图像识别8.6基于支持向量机的图像识别4整理ppt8.1模式识别概述

模式识别(PatternRecognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,模式识别分为有监督的分类(SupervisedClassification)和无监督的分类(UnsupervisedClassification)两种。二者的主要差别在于,各实验样本所属的类别是否预先已知。一般说来,有监督的分类往往需要提供大量已知类别的样本,无监督的分类就是根据样本特征(features)将同类特征样本归类于同一类。5整理ppt

一般狭义的模式识别所指的主要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物传感器等对象的具体模式进行辨识和分类。6整理ppt模式识别的一般过程原始信息输入特征提取分类器识别结果识别的关键是分类器的设计7整理ppt图像识别与模式识别的关系1、模式识别包含了、波形、语音、图形、图像等各种信息输入形式,图像识别属于模式识别的一部分;2、模式识别的许多方法如:决策理论、贝叶斯分类器、神经网络分类器、支持向量机等都可以用到图像识别中来;3、图像识别有自己独特的方法。8整理ppt8.2一些常用的基本概念1、特征向量---用于描述对象的一组特征参数,以n×1维的向量形式表示出来。如:9整理ppt1、向量的相似性度量---距离(1)两向量的欧式距离设两向量则它们之间的欧式距离用下式度量10整理ppt(2)向量与向量族组成员的距离

设则距离d11整理ppt则它们之间的欧式距离用下式度量可用下列MATLAB语句实现:12整理ppt(2)向量族与向量族成员的距离

设向量族Xp×n

向量族Yq×n

则向量族X的i行与向量族Y的第j列间欧式距离用下矩阵表达13整理ppt(3)Mahalanobis距离----向量与向量组均值的相似性度量则它们之间的欧式距离用下式度量均值:协方差矩阵:14整理ppt8.3基于决策理论的图像识别图像识别的方式基于决策理论方法空间模板匹配最小距离分类器基于结构的识别频域模板匹配贝叶斯分类器神经网络分类器支持向量机分类器使用基元符号使用数值向量串结构识别树、图结构识别15整理ppt1、基于最小距离分类器的图像识别

决策理论的基本思想:将图像进行特征提取,用提取的特征构成一个特征向量x={x1,x2,…,xn},对于W个模式分类ω1,ω2,ωw,设计W个决策函数d1(x),d2(x),…,dw(x),满足下列条件:将x归于ωi类16整理ppt最小距离分类器就是将每个模式分类用它的均值向量来表示,设x是待分类的模式向量,分别求模式向量到各类均值向量的距离,将x归属于距离最小的那个类别。用决策函数表示:这里,mj是均值向量,它计算如下:17整理ppt求Dj(x)最小,等价于求最大。因此我们可以选择决策函数18整理ppt对于:将其归于ωi

类。不难看出,在ωi

和ωj之间的边界为19整理ppt8.4基于模板匹配的图像识别

模板匹配(TemplateMatching)是图像识别方法中最具代表性的基本方法之一,它是将从待识别的图像或者图像区域S(i,j)中提取的若干特征量逐个进行比较,计算它们之间规格化的相关性系数,其中相关性系数最大的一个就表示其相似程度最高,可以将图像归与相应的类。20整理ppt模板匹配的基本概念:模板就是一幅已知的具有标准尺寸和标准内容的图像。模板匹配就是在一幅图像中按一定算法搜寻目标,将目标的特征和已知模板比较,从而确定目标是否存在以及存在目标所在的坐标位置。以8位灰度图像(1个像素由1个字节描述)为例,模板T(m*n个像素)叠放在被搜索图S(M*N个像素)上平移,模板覆盖被搜索图的那块区域叫子图Sij。i,j为子图左上角在被搜索图S上的坐标,如图所示。搜索范围是MXN。通过比较模板T和Sij的相似性,完成模板匹配过程。(1)普通模板匹配算法21整理pptmnMN模板及其搜索图子图Sij(a)搜索图模板T一般可以采用下面测度来衡量T和Sij的相似度:

22整理ppt展开则有右边第三项表示模板的总能量,是一个和位置(i,j)无关的常数,第一项是模板下的子图的能量,它随搜索位置的改变缓慢变化,第二项是子图像和模板的互相关,随(i,j)而变,T和Sij匹配时这一项取得最大值,因此可以采用下列归一化相关函数作为相似测度:23整理ppt为了减少图像强度绝对值的影响,可先分别计算T和Sij的均值Tm和Sm,然后在上式中减去均值,可得下列相关函数24整理ppt

按灰度匹配的计算量是很大的,一般将原始图像按比例缩小,采用相对较小的模板来进行匹配。尽管模板匹配有很多不足的地方,但目前仍然是一种较为可靠的模式识别方法,在工业机器视觉中得到广泛应用[].对常用焊接结构灰度图象可以通过二值化填充得到由0和1组成的黑白图象,因此进行模板匹配可以相当于比较待识别图象和模板为“1”的相同个数,比较相同可以采用“点异或”的方式进行。如果模板与待识别图象相同,则相关系数可用下式表达:25整理ppt(2)快速模板匹配---序贯相似性检测算法

由于普通模板计算量大,速度慢,人们提出一类叫序贯相似性检测的算法,简称SSDA。SSDA的要点如下:1)定义绝对误差值,有式中,2)取一个不变阈值;26整理ppt3)在子图Sij(m,n)中随机选取像点(mk

,nk),计算它同T中对应点的误差值ε(i,j,mk

,nk),然后把这个差值和其他点对的差值累加起来,当累加r次误差超过Tk,则停止累加,并记下次数r。定义SSDA的检测曲面为I(i,j)=r4)把取值最大的I(i,j)对应的(i,j)点作为匹配点,因为这点上需要很多次累加才使总误差超过,如下图所示。图中给出了在A,B,C三参考点上得到的误差累计增长曲线。A,B反映模板T不在匹配点上,这时总误差增长很快,超出阈值,曲线C中总误差增长很慢,很可能是一匹配的候选点。27整理pptABCI(i,j)010204030Tk图4-2-2误差累计曲线28整理ppt3、基于频域模板匹配的图像识别在频域分析中,我们将空间域的相关运算转化为频域的的共轭相乘,即:空间域上的相关频率域上的相乘

如果将f(x,y)视为待识别的图像,g(x,y)视为标准模板则就可以采用频域上的相乘,取代空间域上基于相关运算的模板匹配,可以缩短匹配计算的时间。29整理ppt8.5基于神经网络的图像识别W=p=输入的R维向量对应的权值行向量b是偏置8.5.1神经网络基础30整理pptn是输入向量元素的加权求和,定义如下:写成向量内积的形式:a

是神经元的输出,f是神经元的传递函数,定义如下:31整理ppt进行神经网络分析时,可以将上面的神经元简略表达如下:32整理ppt

包含多个神经元的一层神经元33整理ppt34整理ppt一层具有S个神经元简约表示35整理ppt多层神经网36整理ppt多层神经网的简约表示37整理ppt用IW表示输入的权值矩阵,LW表示层间的权值矩阵,而用上标表示层间的关系则有:在MATLAB中把IW和LW设置成Cell单元类型38整理ppt同时向量(无顺序)顺序向量(按顺序)两种基本类型的输入向量输入数据的结构形式39整理ppt同时向量的仿真所谓仿真SIM是指神经网络的结构参数:权值矩阵W、偏置b、和传递函数f确定后,在给定输入激励下,神经网络的输出。40整理pptnet=newlin([13;13],1);使用下列函数建立一个线性神经网络设定网络的权值和偏置为:net.IW{1,1}=[12];net.b{1}=0Net是一个结构,可以设定它的权值和偏置41整理ppt设有4组输入向量,它们是:P=[1223;2131];4组输入向量,以一个矩阵的形式产生输入42整理pptA=sim(net,P)A=5485使用产生的网络net,和同时输入向量P为参数,用sim函数进行神经网络的仿真,上例的结果为:43整理ppt顺序向量的仿真所谓仿真SIM是指神经网络的结构参数:权值矩阵W、偏置b、和传递函数f确定后,在给定输入激励下,神经网络的输出。44整理pptBP神经元结构和简约画法45整理ppt具有输入、隐层、输出层结构的BP神经网络隐层4个神经元输出层3个神经元2维输入向量46整理ppt常用传递函数f类型47整理pptnet=newff([-12;05],[3,1],{'tansig','purelin'},'traingd');在MATLAB7.0下使用newff创建BP神经网。例如我们创建一个2维输入向量,具有3个隐层节点和一个输出节点的3层结构的BP神经网络:隐节点数输出节点数8.5.2BP神经网络的创建、训练与仿真1、BP神经网络的创建隐层传递函数输出层传递函数输入分量范围训练方式48整理ppt2、BP神经网络的训练

当确定完神经网络的具体结构—输入向量维数、隐层节点数、输出节点数,就要采用一定的训练方法对神经网络进行训练,目前应用最多的是—梯度下降法。在Matlab神经网络工具箱中,设置了这一算法。并通过train()函数来实现神经网络的训练。基本语法为:Trained_net=train(net,P,T)待训练的网完成的训练网输入的特征向量训练目标49整理ppt3、BP神经网络的仿真仿真是对已经训练完成的BP神经网络进行应用模拟,以检查神经网络的响应性能。即当网络权值w,偏移值确定后,通过给定输入Pgiven,检查实际输出y与期望是否相符。对于仿真结果满足要求的网络就可定型。仿真采用下列函数:y=sim(trained_net,P);完成的训练网输入的特征向量网络的实际输出50整理ppt8.5.3基于BP神经网络的图像识别实例1、手写数字字符的识别2、人脸的识别3、车型的识别4、车牌的识别5、指纹的识别6、虹膜的识别6、刚体目标的识别7、人体目标的识别51整理ppt

第九章计算机视觉初步1、基本概念计算机视觉就是用各种视觉传感器代替视觉器官作为输入感应手段,由计算机来代替大脑完成所得到的图像信息的处理和解释。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力。目前二维机器视觉和三维立体视觉两大类。52整理ppt2、摄像机成像模型摄像机的景物成像应该基于物理学的透镜成像原理,由于透镜成像较为复杂,目前基本采用针孔成像模型来近似处理。如图所示,Oc为摄像机的光轴中心点,π'为摄像机的成像平面,按针孔成像原理,摄像机前的物体在像平面π'上的像是倒立的实像。像的尺寸和物体实际的大小成正比,与物体到光心的距离成反比。为方便分析,将像平面π'沿光轴移到光心前面的对称平面,这样物体的像就和实物方向相同,根据这样的假设,下面建立物象的透射投影关系。以摄像机的光心Oc为摄像机的坐标原点,以光轴作为摄像机的Zc轴,取从摄像机到景物的方向为Zc轴正方向,Xc轴方向取图像坐标沿水平增加的方向。在摄像机的坐标系中,设空间点P的坐标为,P在像平面π的像点p的物理坐标为,则按小孔成像的比例关系有:53整理ppt摄像机小孔成像简化模型:按小孔成像的比例关系有:54整理ppt

应用齐次坐标的概念,将以上关系用矩阵的形式表达如下:

一般摄像机是放在某个空间坐标里(一般称世界坐标),因此可用坐标变换的平移—旋转关系,表达摄像机坐标(xc,yc,zc)和世界坐标(xw,yw,zw

)的关系:55整理ppt

摄像机采集的图像以数字图像的形式存储的,一般每幅数字图像在计算机内以M行N列的图像像素坐标(Pixel)来表达的,图像坐标的原点一般设在左上角或左下角。由于(9-2)是以物理单位(如毫米)建立的透射投影关系,需要将其转化为计算机的图像坐标,设数字图像的像素坐

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论