模式识别实习报告_第1页
模式识别实习报告_第2页
模式识别实习报告_第3页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.;.【问题描述】一、贝叶斯估计做分类实习题目一:用贝叶斯估计做分类。问题描述:给出试验区裸土加水田的tif 图像,要求通过贝叶斯估计算法对房屋、水田及植被进行分类。问题分析:首先通过目视解译法对图像进行分类,获取裸土、水田和植被的 dn 值,在此基础上, 通过该部分各个类别的面积计算先验概率, 然后带入公式进行计算, 从而对整个图像进行分类。【模型方法】与分布有关的统计分类方法主要有最大似然/贝叶斯分类。 最大似然分类是图像处理中最常用的一种监督分类方法, 它利用了遥感数据的统计特征, 假定各类的分布函数为正态分布, 在多变量空间中形成椭圆或椭球分布, 也就是和中个方向上散布情况不同, 按正态分布规律用最大似然判别规则进行判决, 得到较高准确率的分类结果。否则 , 用平行六面体或最小距离分类效果会更好。【方案设计】确定需要分类的地区和使用的波段和特征分类数, 检查所用各波段或特征分量是否相互已经位置配准;根据已掌握的典型地区的地面情况, 在图像上选择训练区;计算参数 , 根据选出的各类训练区的图像数据, 计算和确定先验概率;分类 , 将训练区以外的图像像元逐个逐类代入公式, 对于每个像元, 分几类就计算几次,最后比较大小 , 选择最大值得出类别;产生分类图, 给每一类别规定一个值, 如果分 10 类, 就定每一类分别为1 ,210 , 分类后的像元值便用类别值代替, 最后得到的分类图像就是专题图像.由于最大灰阶值等于类别数 , 在监视器上显示时需要给各类加上不同的彩色;检验结果 , 如果分类中错误较多, 需要重新选择训练区再作以上各步, 直到结果满意为止。【结果讨论】如图所示, 通过贝叶斯算法,较好地对图像完成了分类,裸土、植被和水田三个类别清晰地判别出来。在计算先验概率时,选择何种数据成为困扰我的一个问题。既有envi 自身提供的精确的先验概率值, 也可以自己通过计算各个类别的面积,从而获取大致的先验概率值。最后,在田老师的讲解下, 我知道了虽然数据可能不太精确,但是, 计算先验概率时,总体的倾向是一致的,所以在最后判别时,因此而引起的误差是微乎其微的,所以, 一定要弄清楚算法原理, 才能让自己的每一步工作都有理可循。以上是精度评价,由于目视解译的效果有瑕疵,再加上计算先验概率时存在偏差,导致精度只有七十多,有待改善。【问题描述】二、用 fisher准则判别实习题目二:用fisher准则进行判别。问题描述:给出试验区裸土加水田的tif 图像,要求通过fisher 准则进行分类。问题分析: 首先通过目视解译法对图像进行分类,获取植被和非植被的dn 值,在此基础上, 通过一系列矩阵求逆等数学公式的计算,求出可以分开二类样本的直线,然后在此基础上从而对整个图像进行分类。【模型方法】如果在二维空间中一条直线能将两类样本分开,或者错分类很少, 则同一类别样本数据在该直线的单位法向量上的投影的绝大多数都应该超过某一值。而另一类数据的投影都应该小于 ( 或绝大多数都小于) 该值,则这条直线就有可能将两类分开。准则:向量 w的方向选择应能使两类样本投影的均值之差尽可能大些,而使类内样本的离散程度尽可能小。这就是fisher准则函数的基本思路。ywtw0评价投影方向w的函数: jf (w )w t sbw wt sw w最佳 w值的确定:求取使j 达极大值时的w * : w*s-1 ( m1- m2)wfw 0 的确定:w0- m1m2 2当 w 0 确定之后,则可按以下规则分类,wt x wt xw0xw1w0xw2【方案设计】考虑 fisher线性判别方法,利用实验1 中程序产生的数据(分别在各类样本数均为50 及500 时),计算:1) 求解最优投影方向w;2) 求出表示最优投影方向的直线,并且标记出投影后的点在直线上的位置;3) 计算投影后的阈值权;4) 计算分类器的各类错误率及总的平均错误率;5) 计算按最小错误率bayes 决策的错误率(设各类先验概率相同)【结果讨论】通过运用三个波段的植被和非植被的dn 值,从而获取fisher 判别的分类直线。首先由于计算时需要运用矩阵求逆等各种公式,这一步困扰了我很久,后来在同学的帮助下,自己对算法不断改正, 初步达到了计算的要求。计算出投影方向和分割阈值后,对图像进行分类就很轻松了。但是, 由于时间的紧迫和自己能力的不足,并没有再对非植被类完成裸土和水田的分割。运用 fisher 准则对多类地物进行分割时,可以将多维降低,从而一步步完成分类,这一思路是需要我在实习结束后好好琢磨并完善的。以上是精度评价,用fisher 判别对植被和非植被进行判别,效果较好。三、k 均值聚类判别【问题描述】实习题目三:用k 均值聚类对图像进行分类。问题描述:给出试验区裸土加水田的tif 图像,要求通过k均值聚类算法进行分类。问题分析:首先通过目视解译法对图像进行分类,获取裸土、水田和植被的 dn 值,在此基础上, 可分为三个聚类中心, 将图像上的每个像素点依次分类到三个聚类中, 从而完成对图像裸土、水田和植被的分类。【模型方法】k-均值算法的主要思想是先在需要分类的数据中寻找k 组数据作为初始聚类中心,然后计算其他数据距离这三个聚类中心的距离,将数据归入与其距离最近的聚类中心,之后再对这k 个聚类的数据计算均值,作为新的聚类中心,继续以上步骤, 直到新的聚类中心与上一次的 聚类中心值相等时结束算法。【方案设计】1、从图像中随机选取三个像素点,作为三个簇的各自的中心。2、分别计算剩下的元素到三个簇中心的相异度,将这些元素分别划归到相异度最低的簇。3、根据聚类结果,重新计算三个簇各自的中心,计算方法是取簇中所有元素各自维度的算术平均数。4、将图像中全部像素点按照新的中心重新聚类。5、重复第4 步,直到每个簇的中心基本不再变化。6、将结果输出。【结果讨论】如图所示,首先随机选取三个图像的像素点作为聚类中心,在一次次根据距离判断分类后,最后得到三个聚类中心就分别是植被、水田和裸土。 在这样的基础上,对图像上每个像素点的 dn值进行判断,再根据划分的聚类中心将其归类,最后将图像分成三类,较好地达到了既定目的。以上是精度评价,由于k 均值聚类中心较为简单,所以评价精度较高,达到了既定目的。总结通过本次上机,我对模式识别这门课程有了更深层次的理解。首先是学习并使用envi, 对这个图像处理软件有了初步的掌握。在目视解译时,由于经验不足,错误率较高,以后有 待加强。在设计算法时,由于写代码的能力不是很强,所以一些关键代码无法写出来,只能够简单化处理,勉强达到题目的要求。但是,在短短的几次上机中,我收获了很多知识,bayes 二类判别, fisher 判别准则, k均值聚类分析,对这些算法的思路有所了解并加以应用,获益良多。遇到问题时,在同学、学长和老师的帮助下,我一步步攻坚克难,最终完成了老师的要求,比较满意。先说说最大似然估计和贝叶斯估计:这两种方法的前提条件是各类别的条件概率密度的形式已知, 而参数类未知。在此情况下,对现有的样本进行参数估计。参数估计在统计学中是很经典的算法, 而最大似然估计和贝叶斯估计也是参数估计中常用的方法。最大似然估计是把待估参数看作确定性的量,只是其取值未知, 最大似然估计方法所寻找的是能最好解释训练样本的那个参数值,贝叶斯估计把待估参数看作是符合某种先验概率分布的随机变量,而训练样本的作用就是把先验概率转化为后验概率。实际生活中, 用的更多的还是最大似然估计,因为此方法更容易实现,而且样本数据充足的情况下,得到的分类器效果比较好。再说说 fisher 判别分析法: fisher 判别分析法的基本原理是将多维空间样本点分布的图像投影到二维或者一维,投

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论