数字图象处理-第10章模式识别的理论与方法.ppt_第1页
数字图象处理-第10章模式识别的理论与方法.ppt_第2页
数字图象处理-第10章模式识别的理论与方法.ppt_第3页
数字图象处理-第10章模式识别的理论与方法.ppt_第4页
数字图象处理-第10章模式识别的理论与方法.ppt_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第 10 章 模 式 识 别 的 理 论 和 方 法 一个图像识别系统可分为三个主要部分。其框图如图(10.1)所示。(1)图像 信息的获取;(2)信息的加工和处理,抽取特征;(3)判断或分类。 图101 图像识别系统框图 被识图像图像获取 信息处理 特征抽取 判决结果 10. 1 概述 模式识别的主要方法可分为两大类: l 统计学方法 l 语言学方法 两类方法的不足: l 第一种方法没有利用图像本身的结构关系 l 第二类方法没有考虑图像在环境中受噪声的干扰 10. 2 统计模式识别法 1)常用的决策规则 l 基于最小错误率的贝叶斯决策 在图像识别中,我们总希望尽量减少分类错误,利用贝叶斯( Bayes)公式能够得到错误率最小的分类规则,这就是基于最小错 误率的贝叶斯决策。 10. 21 决策理论方法 设: 为 状态下观察 X 类的条件概率密度; 为 状态下观察 X 类的条件概率密度; 利用贝叶斯公式: 得到的条件概率 称为状态的后验概率。 基于最小错误率的贝叶斯决策规则为: 如果 ,则把X归类为 ; 如果 ,则把X归类为 。 l 基于最小风险的贝叶斯决策 最小风险的贝叶斯决策是考虑各种错误造成损失而提出的决策规则 。 2 线性判别函数 线线性判别别函数是指判别别函数是图图像所有特征量的线线性组组合,即 式中 代表第i个判别函数; 是系数或权; 为常数项或称为阈值。在 两类之间的判决界处有下式的形式。 (104) (105) 3. 最小距离分类器 线性分类器中重要的一类是用输入模式与特征空间中作为模板的点之间的 距离作为分类的准则。假设有m类,给出m个参考向量 与模式类 相联系。 4. 最近邻域分类法 在最小距离分类法中,取一个最标准的向量作为代表。将这类问题稍微 扩张一下,一类不能只取一个代表,把最小距离的概念从一个点和一个 点间的距离扩充到一个点和一组点之间的距离。这就是最近邻域分类法 的基本思路。 (1020) 式(1020)是一个二次型判别函数。通常二次型判别函数的决策边界是一个 超二次曲面。 5. 非线性判别函数 统计学习理论是一种小样本统计理论,它为研究有限样本情况下 的统计模式识别和更广泛的机器学习问题建立了一个较好的理论 框架,同时也发展了一种新的模式识别方法支持向量机,能 够较好地解决小样本学习问题。 1024 统计学习理论与支持向量机 图1034 机器学习的基本模型 有三类基本的机器学习问题: 模式识别 函数逼近 概率密度估计 经验风险最小化并不一定意味着期望风险最小,学习机器的复杂 性不但与所研究的系统有关,而且要和有限的学习样本相适应。 l支持向量机 支持向量机(Support Vector Machines,简称SVM方法)是实现 统计学习理论的一种具体方法,其主要内容在1992年1995年间 才基本完成,目前仍处在不断发展阶段。 设:线性可分样本为 ,i=1,n, 是类别标号。d维空间中线性判别函数的一般为 ,分类面方程为: (10161) 而要求分类线对所有样本正确分类,就是要求它满足 i=1,2,n (10162) 因此,满满足上述条件且使 最小的分类类面就是最优优分类类面。 过两类样本中离分类面最近的点且平行于最优分类面的超平面H1 、H2上的训练样本就是式(10162)中使等号成立的那些样本,它 们叫做支持向量(Support Vectors)。 因为它们支撑了最优分类面,最优分类面的示意图如下图,图中用圆 圈标出的点为支持向量。 图1039 D4和D84组成的纹理图像 图1040 D5和D92组成的纹理图像 图1042 自建的测试图像 图1041 D12和D17组成的纹理图像 图1043 自建的测试图像 1 0 . 3 句 法 结 构 模 式 识 别 统计决策识别法的基本做法是首先从待识别模式中提取特征参数, 然后用这些特征参数把模式表达为特征空间中的点,然后再根据各 点之间的距离进行分类和识别。 缺点: l 对比较复杂的模式需要较多的特征才能描述它,而特征提取 是比较困难的环节,对于同一模式往往有不同的抽取方法,就 目前来看尚没有统一的理论依据。 l简单的分类并不能代表识别,对于复杂的模式,识别的目的并 不是仅仅要求把它分配到某一类别中去,而且还要对不同的对 象加以描述,在这方面统计决策法就有极大的局限性。 l 句法结构模式识别法主要着眼于模式结构,采用形式语言理论来 分析和描述模式结构,因此,它具有统计识别法所不具备的优点 。 10.3.1 形式语言概述 所谓句法结构就是将一个复杂的模式一部分一部分地加以描述,将复 杂的模式分成若干子模式,如此分下去直至最简单的子模式(或称基 元)为止。 10.3.2 句法结构方法 预处理主要包括编码、滤波、复原、增强及缝隙填补等一系列操作。 基元抽取包括分割、特征(基元)抽取。基元的选择要尽可能少,而且 容易被识别。 结构分析可判别所得到的表达式在句法上是否正确。如果句法是正确的 , 就能得到模式的完整描述,即一个剖析式或剖析树。 句法方法在以下领域多有应用: )波形分析; )声音识别与理解; )文字识别; )二维数学表示式; )指纹分类; )图像分析与理解; )机器部件识别; )自动视觉检查; )LANDSAT资源勘探用陆地卫星数据解释等。 10.4 模糊集识别法简介 在模式识别中,有些问题是极其复杂的,要使计算机识别某一模式, 就要分析综合所有的特征,计算和比较大量的信息后才能作出判断。 而人在识别过程中只根据一些模糊的印象就可以做到较准确的识别。 10.4.1 模糊集合及其运算 1. 模糊子集 l没有明确外延的概念就称作模糊概念 l论域是指被讨论的全体对象,有时也称为空间,论域元素总是分明的 l论域中元素从属于模糊集合的程序不是绝对的0或1,它可介于0和1之间 l在模糊数学中,把元素对普通集合的绝对隶属关系加以灵活化,提出隶属度的 概念 l隶属度用隶属函数来描述 1. 隶属原则和模糊模式识别的直接方法 设 是论域U上的n个模糊子集,若对每一个 都建立 一个从属函数 ,对于任一元素 ,若满足 (10106) 则认为 隶属于 ,这就是隶属原则。 10.4.2 模糊模式识别的方法 例子: 任何三角形都可用三个边a、b、c及三个顶角A、B、C来表示 。把等腰三角形、等边三角形、直角三角形、等腰直角三角形看成是 模糊集 、 、 、 。要运用直接方法识别 ,首先要确定它们的从属函数。 取论域: , 其中A、B、C表示三角形的三个内角,由此,可定义它们的从属函 数,进一步求得模糊几何图形的从属度。 设 、 、 、 、 分别为等腰三角形、直角三角形、等边三角形、 等腰直角三角形及非典型一般三角形的从属函数,则有: (10107) (10108) (10109) (10110) (10111) 如果有三角形甲,其内角分别为 、 、 ;三角形乙,其内角分别为 、 、 ,根据隶属原则能确定它们分属哪一类三角形。 由隶属原则,判定三角形甲是直角三角形。 由隶属原则,判定三角形乙是一般三角形。 相似系数有夹角余弦、相关系数等几种定义。如果用 表示样本 与样本 之间的距离,则也有如下一些距离的定义: 3. 模糊聚类分析 ()绝对值距离 (10125) ()欧氏距离 (10126) ()马氏距离 (10127) 式中V是一个 阶的协方差矩阵, 其元素为: (4) 兰氏距离 (10128) 聚类分析的基本思想是将比较接近的样本归为一类。系统聚类法可分三个 步骤进行: l第一、计算各样本之间距离,将距离最近的两点合并为一类; l第二、定义类与类间的距离,将最近的两类合并为新的一类; (类与类之间的定义有最小距离法、最大距离法、中间距离法、重心法等) l第三、反复做第二步,使类与类之间不断合并,最后完成聚类分析。 10.5 模式识别的几种应用 模式识别的应用较广,大致可有如下几个方面:字符识别;医学诊 断;遥感图像解译;人脸和指纹鉴别;污染监测;自动检查和自动 化;可靠性;社会经济;语音识别和理解;考古等。 1051 生物特征识别 l 指纹识别 指纹具有两大特性: 1) 没有两个人的指纹是相同的; 2) 当指纹不受损伤时终生不变。 首先,指纹分为七类(平斗、左箕、右箕、平弓、帐弓、左双箕、右双 箕)。第一类再分为十八个小类,然后测量斜率。总的过程是分类、分层 、分窗口,在这个过程中包括细化,连接断线等处理; 尔后整个窗口用一个树代表,树的每一个分支是窗口中的一根隆线,然 后找出文法; 最后做一树状自动机。 (1) 人脸识别系统的基本组成 参 数 人脸图像库人脸检测 定位 特征提取和 选择 训练图像 预处理 识别特征提取和 选择 图像 预处理 人脸检测 定位 待测人脸图像 训练过程 识别过程 l 人脸识别 (2). 人脸识别基本算法 基于几何特征的方法 该方法要求选取的特征矢量有一定的独特性,既要反映不同人脸的差 异,还要具有一定的弹性,以减少或者消除光照差异等影响。几何特征 向量是以人脸器官的形状和几何关系为基础的特征向量,其分量通常包 括人脸指定两点间的欧式距离、曲率、角度等。 基于神经网络的方法 早期用于人脸识别的神经网络主要是Kohonen自联想映射神经网络 ,当人脸图像受噪声污染严重或部分缺损时,用Kohonen网络恢复 完整的人脸的效果较好。Cottrell等人使用级联BP神经网络进行人 脸识别,对部分受损的、光照有所变化的人脸图像识别能力也较好 。 基于代数特征的方法 这类算法是采用代数特征向量,即人脸图像在由“特征脸”张成 的降维子空间上的投影。基于代数特征识别的主要原理是利用统 计方法提取特征,从而形成子空间进行识别。 (3) 当前主流算法 1) 特征脸(eigenface)算法 特征脸方法的优点: 图像的原始灰度数据直接用来学习和识别,不需要任何低级或中 级处理; 不需要人脸的几何和反射知识; 通过低维可以有效的对高维数据进行压缩; 与其它匹配方法相比,识别简单有效。 特征脸方法存在的不足: 图像中所有的像素被赋予了同等的地位,可是角度、光照、尺寸 及表情等干扰会导致识别率下降,因此,须先进行尺度归一化处 理; 在姿态和光照变化时识别率明显下降; 要求背景单一,; 学习时间长,只能离线计算。 2) 弹性图匹配方法 弹性图匹配方法(Elastic Graph Matching)是一种基于动态链 接结构(Dynamic Link Architecture,DLA)的方法。它将人脸用 格状的稀疏图(即拓扑图)表示,图中的节点用图像位置的Gabor 小波分解得到的特征向量标记,图的边用连接节点的距离向量标 记。 其优点是: 人脸稀疏图(即拓朴图)的顶点采用了小波变换特征,对光照、 位移、旋转及尺度变化都不敏感。 弹性图匹配法能保留二维图像的空间相关信息。而特征脸方法在 将图像排成一维向量后,丢失了很多空间相关信息。 (4). 人脸识别的统计结果 根据图5.1和图5.2所示的训练和识别的流程图在Microsoft Visual C+ 6.0环境下编程测试KPC

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论