




已阅读5页,还剩82页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
遥感图像处理,赵泉华,知识库,第五章:图像识别,第五章:图像识别,模式识别要解决的问题用计算机代替人去识别图像和找出一幅图像中人们感兴趣的目标。,模式识别分类模板匹配(最基本)统计模式识别结构模式识别模糊模式识别智能模式识别(神经网络识别),5.1模板匹配5.2统计模式识别5.3遥感影像分类5.4Matlab监督分类实例5.5神经网络分类5.6遥感专题制图,第五章:图像识别,5.1模板匹配,根据图案与一幅图像的各部分的相似度判断其是否存在,并求得对象物在图像中位置的操作叫模板匹配,匹配的用途几何变换中检测图像和地图之间的对应点不同的光谱或不同的摄影时间所得的图像之间的位置的配准(图像配准)在立体影像分析中提取左右影像间的对应关系运动物体的跟踪图像中对象物位置的检测,5.1模板匹配,模板匹配方法,设检测对象的模板为t(x,y),另其中心与图像f(x,y)中的一象素(i,j)重合,检测t(x,y)和图像重合部分的相似度,对图像中所有的象素进行这样的操作,根据相似度为最大或超过某一阈值来确定对象物是否存在,并求得对象物所在位置。,5.1模板匹配,模板匹配实现思路之一:基于模板和图像重合部分的非相似度,5.1模板匹配,模板匹配实现思路之二:基于模板和图像重合部分的相似度,5.1模板匹配,高速模板匹配,序贯相似性检测法(SequentialSimiliarityDetectionAlgorithm)计算图像f(x,y)在象素(u,v)的非相似度m(u,v)作为匹配尺度。,(u,v)表示的不是模板与图像重合部分的中心坐标,而是重合部分左上角象素坐标。有模板图案,则m(u,v)很小,反之很大,如果很不一样,m(u,v)就会持续增大,通过域值进行运算是否终止。,5.2统计模式识别,统计模式识别是研究每一个模式的各种测量数据的统计特性,按照统计决策理论来进行分类。,良好的特征应具有的特点:可区分性:对于属于不同类别的图像,他们的特征应该具有明显的差异性。可靠性:对于同类的图像,它们的特征值应比较相近。独立性:所使用的各特征之间应彼此无关。数量少:图像识别的复杂度随着特征的个数迅速增长。“特征维数灾难”,特征处理,5.2统计模式识别,特征处理,特征选择穷举法最大最小类对距离法特征选择特点:不改变原始特征值的物理意义,因此不会影响分类器设计者对所用特征的认识,有利于分类器设计,便于对分类结果的进一步分析特征提取:从减少特征之间的相关性和浓缩信息量的角度出发,根据原始数据的统计特性,用尽可能少的特征来最大限度的包含所有原始数据的统计特征。,5.2统计模式识别,统计模式识别之监督分类法,根据预先已知类别的训练样本,求出各类在特征空间的分布,然后利用它对未知数据进行分类的方法。,5.2统计模式识别,统计模式识别之监督分类法,根据类别名称确定训练样本,求各类特征矢量分布判别函数,对于待分类的特征矢量计算各判别函数的值,将模式X归入到中的最大类中。,5.2统计模式识别,统计模式识别之判别函数,常用的判别函数,距离判别函数:特征空间中像元数据和分类类别特征的相似程度。距离最小即相似程度最大。绝对值距离欧氏距离马氏距离混合距离,5.2统计模式识别,线性判别函数,线性判别函数是图像所有特征量的线性组合,即g(X)=aX+b采用线性判别函数进行分类时,一般将m类问题分解成(m-1)个两类识别问题。方法是先把特征空间分为1类和其他类,如此进行下去即可。两类分类是最基本的。其中线性判别函数的系数可通过样本试验来确定。,5.2统计模式识别,两类问题,关键:权值系数的确定线性分类器的训练过程:先设所有的权值为1,把已经分类的标准样本输入分类器进行判别,根据分类的结果不断的调整权值系数,直到实际分类结果和标准样本的分类结果基本吻合。,5.2统计模式识别,权值系数调整的方法:,5.2统计模式识别,采用误差修正法对权值系数进行调整对于任意一个,5.2统计模式识别,最大似然分类器又称为高斯最大似然分类器,也称贝叶斯(Bayes)分类器。最大似然分类法的基本思想和数学原理:最大似然分类法将卫星遥感多波段数据的分布当作多维正态分布来构造判别分类函数。其基本思想是:各类的已知像元的数据在平面或空间中构成一定的点群;每一类的每一维数据在自己的数轴上形成一个正态分布,该类的多维数据就构成该类的一个多维正态分布;,最大似然分类器,5.2统计模式识别,对于m维的正态分布密度函数,可表示为,式中,m是波段数;是第k类的m维正态分布密度函数,由它可以看出在第K类中m维随机变量x出现各种可能值的概率大小。像元的m维数据向量可表示为:,是第K类每个波段的均值所构成的均值向量,5.2统计模式识别,5.2统计模式识别,有了g个概率密度函数(也叫类分布函数),对任何一个已知的m维数据向量(即1个像元)都可反过来计算它属于g个类中第k类的概率。根据概率公式,即贝叶斯公式有,式中,是任何一个m维数据向量(即像元)属于第k类的概率;是第k类的m维正态分布密度(概率密度)函数;是在所考虑的全部数据中出现该数据向量x的概率;是第k类在所考虑的全部数据中出现的概率,或者说第k类在g个类中出现的概率,称为先验概率。,5.2统计模式识别,简化后,取对数,即,5.2统计模式识别,假定所有各类的协方差矩阵都相等,即,则可用所有各类的协方差矩阵S来代替各个,反求,5.2统计模式识别,5.2统计模式识别,Bayes判别分类实验,5.2统计模式识别,5.2统计模式识别,5.2统计模式识别,分类结果见Word文档,5.2统计模式识别,5.3遥感影像分类,遥感图像分类是遥感图像信息提取的一种方法。,5.3.1遥感图像分类原理遥感图像分类:将图像中的每个像元按照其性质特征,应用某种规则或者算法划分为不同的类别。遥感图像计算机分类:以遥感数字图像为研究对象,在计算机系统支持下,综合运用地学分析、遥感图像处理、地理信息系统、模式识别与人工智能技术,实现地学专题信息的智能化获取。其基本目标是将人工目视解译遥感图像发展为计算机支持下的遥感图像理解。,遥感图像分类原理,A,B,分类结果,C,图像,分类,5.3.1遥感图像分类原理,遥感图像,分类后结果,匀质的像元组,5.3.1遥感图像分类原理,5.3.2遥感图像计算机分类方法监督分类法选择具有代表性的典型实验区或训练区,用训练区中已知地面各类地物样本的光谱特性来“训练”计算机,获得识别各类地物的判别函数或模式,并以此对未知地区的像元进行分类处理,分别归入到已知的类别中。非监督分类在没有先验类别(训练场地)作为样本的条件下,即事先不知道类别特征,主要根据像元间相似度的大小进行归类合并(即相似的像元归为一类)的方法。,监督分类,优点:可根据应用目的和区域,有选择地决定分类类别。可通过检查样本来决定是否精确分类避免了非监督分类对光谱群组的重归类缺点:分类系统的确定和样本的选择,人为主观因素较强训练样本的选择和评估需要花费较多的人力和时间只能识别训练样本所定义的类别。,非监督分类,优点不需要对所要分类的区域有广泛的了解人为误差的机会较少独特的、覆盖量较小的类别也能被识别缺点分析者较难对类别进行控制图像中的光谱特征会随时间和空间发生变化,不同的图像之间的对比困难。,监督分类与非监督分类方法比较,根本区别在于是否利用训练场地来获取先验的类别知识。监督分类的关键是选择训练场地。训练场地要有代表性,样本数目要能够满足分类要求。有时很难做到,这是监督分类的不足之处。非监督分类不需要更多的先验知识,据地物的光谱统计特性进行分类。当两地物类型对应的光谱特征差异很小时,分类效果不如监督分类效果好。,5.3.3分类的基本过程,制定分类系统,确定分类类别。选择合适的图像数据收集和分析地面参考信息与有关数据。选择合适的图像分类方法和算法。找出代表这些类别的统计特征对遥感图像中各像素进行分类。分类后处理分类精度检验,分类后处理,不管是监督分类还是非监督分类,其结果都会产生一些面积很小的图斑。无论从专题制图的角度还是实际应用的角度,都有必要对这些小图斑进行剔除。处理方法:聚类统计(Clump)过滤分析(Sieve)去除分析(Eliminate)分类重编码(Recode),分类精度评价,图像精度指的是一幅不知道其质量的图像和一幅假设准确的图像(参考图)之间的吻合度。如果一幅分类图像中的类别和位置都和参考图接近,就称这幅图像的精度高。参考图本身的准确性很重要;精度评价最好是比较两幅图像中每个像元之间一一致性。但多数情况下,很难得到一整幅精确的参考图像,因此大多数精度评价都是对图像采样的一部分像元进行评价。参考类别可以通过野外考察、更详细的航空像片,或者其它来源的分类图上得到。,分类误差:一是位置误差,即各类别边界的不准确;另一类是属性误差,即类别识别错误。图像中各类别的特性直接影响分类精度。一般来说,简单、均一的地表景观比较容易取得高的分类精度,而复杂、异质、破碎的地表则容易形成高的分类误差。,分类精度评价,分类精度评价的采样方法,简单随机采样即在分类图上随机地选择一定数量的像元,然后比较这些像元的类别和其标准(或实际)类别之间的一致性;最大优点在于其统计上和参数估计上的简易性;适用于研究区出现空间上内各种类型分布均匀,且面积差异不大的情况;如果地域内类型的空间分布不均匀,或稀少并群集的类型,采用简单随机采样就有可能遗漏这些类型,或抽取不到足够数量的样本。,分层采样分别对每个类别进行随机采样;保证每个类别都能在采样中出现,在采样空间或类型选取上的均匀性及代表性;分层的依据可因精度评价的目标而异,常用的分层有地理区、自然生态区、行政区域或分类后的类别等。,分类精度评价的采样方法,聚点或集群采样先在样本空间内抽取一定数量的主样本,每个主样本可以是一个多边形、一平方公里范围或一张航空像片等,然后在每一个主样本内再抽取若干个二级样本作为地面实地考察的对象。聚点采样可以节省一定的人力物力资源,如果设计合理,也可以取得能够满足需要的总体参数估计。,分类精度评价的采样方法,采样数量,用于精度评价的像元数量通常难以统一决定;对于每个类别应有一定的数量保证,如Congalton(1991)建议精度评价的每个类别至少有50个像元;当区域很大或者分类类别较多时,每类的最小数量应增加到75-100个;数量要根据每个类别各占多少而有所调整。,分类精度评价的采样方法,误差矩阵,混淆矩阵,是用来表示精度评价的一种标准格式,是n*n的矩阵,其中n代表类别的数量。,分类精度评价的采样方法,总体分类精度具有概率意义的一个统计量,表述的是每一个随机样本,所分类的结果与地面所对应区域的实际类型相一致的概率。用户精度(对于第i类)(使用者精度)表示从分类结果中任取一个随机样本,其所具有的类型与地面实际类型相同的概率。制图精度(对于第j类)(生产者精度)表示相对于地面获得的实际资料中的任意一个随机样本,分类图上同一地点的分类结果与其相一致的条件概率。,漏分误差:指对于地面观测的某种类型,在分类图上任取一样本,其被错划分为其它不同类型的概率,即实际的某一类地物有多少被错误地分到其它类别;错分误差:指对于所分出的某一类型,任取一样本,它与实际地面观测类型不同的概率,即图像中被划为某一类地物实际上有多少应该是别的类别。,分类精度评价的采样方法,分类精度评价的采样方法,5.4Matlab监督分类实例,菜地,农田,居民地,5.4Matlab监督分类实例,5.5神经网络识别,人工神经网络的研究与发展,生物神经元,生物神经系统是一个有高度组织和相互作用的数量巨大的细胞组织群体。人类大脑的神经细胞大约在1011一1013个左右。神经细胞也称神经元,是神经系统的基本单元,它们按不同的结合方式构成了复杂的神经网络。通过神经元及其联接的可塑性,使得大脑具有学习、记忆和认知等各种智能。,5.5神经网络识别,生物神经元的结构,5.5神经网络识别,神经元由细胞体(Soma)和延伸部分组成。延伸部分按功能分有两类,一种称为树突(Dendrite),用来接受来自其他神经元的信息;另一种用来传递和输出信息,称为轴突(Axon)。神经元之间的相互连接从而让信息传递的部位被称为突触(Synapse),突触的联接是可塑的,也就是说突触特性的变化是受到外界信息的影响或自身生长过程的影响。,5.5神经网络识别,生物神经元的特征并行分布处理神经系统的可塑性和自组织性从生理学的角度看,它体现在突触的可塑性和联接状态的变化。例如在某一外界信息反复刺激下,接受该信息的神经细胞之间的突触结合强度会增强。这种可塑性反映出大脑功能既有先天的制约因素,也有可能通过后天的训练和学习而得到加强。,5.5神经网络识别,(3)信息处理与信息存贮合二为一由于大脑神经元兼有信息处理和存贮功能,所以在进行回忆时,不但不存在先找存贮地址而后再调出所存内容的问题,也不像现行计算机那样,存贮地址和存贮内容是彼此分开的。,5.5神经网络识别,(4)信息处理的系统性大脑的各个部位是一个大系统中的许多子系统。各个子系统之间具有很强的相互联系,一些子系统可以调节另一些子系统的行为。例如,视觉系统和运动系统就存在很强的系统联系,可以相互协调各种信息处理功能。(5)能接受和处理模糊的、模拟的、随机的信息,5.5神经网络识别,网络结构下图是一个神经元的结构图,生物神经元中的神经体(Soma)与人工神经元中的结点相对应,神经末梢(Dendrites,树突)与输入相对应,轴突(Axon)与输出相对应,突触(Synapse)与权值相对应。,5.5神经网络识别,y,这个细胞总的输入量为:,阈值,当总输入量则y1当总输入量y0,5.5神经网络识别,归纳MP模型假设神经元有n个输入,称为突触强度,称为激励函数或响应函数,确定的过程称为神经元的学习,5.5神经网络识别,1、网络学习算法提出60年代末,Minsky和Papert指出了感知机的功能和处理能力的局限性,在感知机中引入隐含神经元,增加神经网络的层次,提高神经网络的处理能力,但却无法给出相应的网络学习算法。1986年,Rumelhart等人在多层神经网络模型的基础上,提出了多层神经网络模型的反向传播学习算法BP(Backpropagation)算法,实现了Minsky的多层网络设想。,BP神经网络理论,5.5神经网络识别,2、隐层传递函数BP网络的隐层传递函数通常是S型函数,常用logsig()和tansig()函数,也可以采用线性传递函数purelin()。函数如下图:,5.5神经网络识别,BP神经网络是一个多层网络,它的拓扑结构如下图所示。,5.5神经网络识别,这一神经网络模型中,引入了中间隐含神经元层。标准的BP神经网络的拓扑结构由三层组成,最左层称为输入层,中间层称为隐含层,最右层称为输出层。输入层、输出层的个数可以由所求的问题决定,而中间层的神经元个数的确定需要探讨。各层次的神经元之间形成全互连连接,各层次内的神经元之间没有连接。三层神经网络已经足以模拟输入与输出之间的复杂的非线性映射关系。更多的网络层虽然能提高神经网络学习复杂映射关系的能力,但因为随着网络层的增加,神经元及其连接权将大规模增加,所占用的计算机资源过多,网络学习收敛反而慢了。,5.5神经网络识别,各个神经元之间的连接并不只是一个单纯的传输信号的通道,而是在每对神经元之间的连接上有一个加权系数,这个加权系数就是权值,它起着生物神经系统中神经元的突触强度的作用,它可以加强或减弱上一个神经元的输出对下一个神经元的刺激。修改权值的规则称为学习算法,它可以根据经验或学习来改变。,5.5神经网络识别,假定:,数学模型,5.5神经网络识别,,,5.5神经网络识别,5.5神经网络识别,5.5神经网络识别,计算流程图,5.5神经网络识别,5.5神经网络识别,5.5神经网络识别,9)调整输出层神经元的偏差,10)调整隐含层神经元的偏差,11)重复第3)步至第10)步的内容,直到对于k=1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论