模式识别第一讲-绪论_第1页
模式识别第一讲-绪论_第2页
模式识别第一讲-绪论_第3页
模式识别第一讲-绪论_第4页
模式识别第一讲-绪论_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

模式识别

PatternRecognition计算机学院

第一章绪论

模式识别的研究内容、方法和应用

模式识别的例子人的识别能力是司空见惯的。如何使机器具有人和动物的识别能力?使机器具有智能是人类的愿望。(机器是人手的延长,智能机是人脑的延长。)但使机器具有智能这个工作很不容易,仍然有许多谜,人脑的识别机制不明。尽管已有近五十年的历史,但仍有许多问题有待解决,也可以说刚起步。一.什么是模式识别

识别的本质是分类。使机器具有能够自动地对物体描述、分类、分组的能力是科技、工程中的重要问题。模式——模式可以是一个手写的字符、一幅指纹图像、一幅人脸的图像、一段语音信号等。模式识别——研究模式的分类、聚类、和估计问题。模式识别中的两大类问题

1、分类。(有监督的分类/识别,SupervisedClassification):把模式分到预先定义好的类里去。

2、聚类。(无监督的分类/识别,UnsupervisedClassification,clustering):基于相似性,把模式聚合成一定的类。二.模式识别的应用在社会科学、生物学、心理学、医学、市场分析预测、自动化、计算机视觉、人工智能、遥感、军事、生物特征识别等问题中有重要应用。随着计算机性能的提高、Internet的迅速发展,模式识别的应用不仅在它的传统领域,如文字识别、语音识别、指纹识别、遥感图像、医学…等领域越做越好,而且涌现了很多新的应用。例如数据挖掘(datamining)、文档的分类(documentclassification)、财政金融、股票的预测、预报,多媒体数据库的检索,基于biometrics(生物统计学)的人的身份鉴别,甚至有的人研究识别人的情感。模式识别应用的一些例子问题的领域应用输入模式模式类生物信息科学序列分析DNA/蛋白质(Protein)序列DNA/蛋白质(Protein)序列数据挖掘搜索有用的模式多维空间的点紧凑(Compact)且分得开的聚类文档分类(document)Internet搜索文本文件语义(semantic)类,如商业、体育、文娱等

模式识别应用的一些例子(续)文本图像分类盲人阅读机,OCR,支票阅读,邮件分拣文本图像字符工业自动化(计算机视觉)印刷电路板的质量检查,装配线灰度或距离(深度)图像缺陷有/无,抓、装配零件模式识别应用的一些例子(续)多媒体数据库检索Internet搜索VideoclipVideo生物特征识别(biometric)身份鉴别指纹、面部、虹膜(iris)人的认证,访问控制遥感农作物等的预测、预报多频谱图像地形地貌的分类,生长情况模式识别应用的一些例子(续)语音识别电话的自动应答,翻译机,人机通信语音波形语音的单字(词)计算机辅助诊断X-片、CT、fMRI、ECG、EEG、机器故障一维、两维信号正常/异常三.几个例子(字符识别)印刷体、手写体

通过OCR(OpticalCharacterReader)等设备获取字符的图像G1.字符识别特征空间特征向量特征:每一个区域中,属于字符部分的面积占该区域面积的比例。统计性、紧致性与可分性模式不是确定性的,具有一定的统计分布。假设同一类别的样本在特征空间中较为相近,而与其他类别的样本分得较开。此即紧致性假设。分类区域、形式线性(或分段线性)R1R2R3二次的R3R2R1R2一般的R1R3R4小结:

模式可以用多维向量空间中的一个矢量(一个点)来表示。要用到线性代数等工具。

模式不是确定性的,而是具有统计分布。要用到概率论与数理统计等工具。

分类就是要把特征空间划分为一些区域,不相交,类间不重迭。

2.两类字符识别10原始特征向量:0000.3...000.6...作直方图,可以得到“0”和“1”的分布分界面的确定:使错误率最小

小结:

设计分类器时不是要求没有错分类的,而是在一定意义下使错误率最小

下面我们再看一个稍微复杂的问题

3.三类字符识别---除了“0”、“1”之外,还要识别“x”

X一个特征(占的总面积)就不够了。“0”、“x”的覆盖面积近似相等。加上另一特征(对角线上1、7、13、19、25面积之和)10分类规则:

ifelse特征提取两类字符识别:从25维原始特征→1维的特征矢量三类字符识别:从25维原始特征→2维的特征矢量特征提取:对原始特征进行变换,得到对给定分类问题更有效的新特征,并实现降维。

例子小结:

通过上面几个例子,我们接触到了如下几个重要概念:特征向量,特征空间,特征提取,决策区域

也看到了一个模式识别系统的基本工作过程。

四.模式识别系统在解决不同的具体问题时,要根据该问题的性质,确定传感器、预处理、特征提取和分类的算法。信息获取预处理特征提取与选择分类器设计、训练分类决策特征提取与选择:应区分能力强、特征数较少。运用先验知识。分类器设计:采用何种分类方法?五.常用的模式识别方法

模板匹配(templatematching)统计的方法(statisticalP.R.)人工神经网络的方法(artificialneuralnetwork,ANN)句法或结构的方法(syntacticorstructuralP.R.)这些方法不是绝对独立的,同一种方法有不同的解释,有时要混合使用。

1.模板匹配

模式识别中使用最早、最简单、直观的方法

所谓匹配是一类运算,用来确定两个对象间的相似性。在模板匹配中,要有一个模板(一般是一个二维形状)或一个模式原型(prototype),待匹配的模式和这个预先存储好的模板相匹配

模板匹配一般要花费较大的计算量,随着计算机速度的加快,这种方法变得更可行了

1.模板匹配(续)例子:字符匹配刚性模板匹配的缺点:处理畸变模式难使用变形模板2.统计模式识别

在统计模式识别中,每一模式是用一个d维的测量值、特征向量来表示的,它是d维特征空间的一个点。目标是选择这样的一些特征,使同一类的模式在空间中尽量紧凑,而不同类的模式间尽量分开、不相交。给定一组样本,模式识别的任务是要确定决策(分界)面、边界,以把不同的类分开。

三类统计模式识别方法在统计决策理论的方法下,决策边界是根据模式的概率分布确定的。这些概率分布是事先知道,或通过学习估计得到。另外一种统计模式识别的工具是判别分析(discriminantanalysis)。这种方法是先假定决策边界的数学形式(一次、二次…),然后利用训练样本确定最好的边界(方程中的一些参数)。再一种方法是从样本中直接构造决策边界。如Vapnik的支撑向量机(supportvectormachine,SVM)推广(泛化,generalization)能力:如何使设计的分类器具有较好的推广能力?3.人工神经网络的方法

模拟人脑的计算。人工神经网络由大量简单的计算单元相互连接组成。输入层隐层输出层人工神经网络的突出优点是它可以学习复杂的非线性输入输出关系(从样本序列中)尽管统计的方法和人工神经网络在基本原理上有很多不同,但它们在方法上是等价或相似的。4.句法或结构的方法

句法模式识别的方法来源于这样的思想:复杂的模式是由简单的子模式组成的,而子模式又可能由更简单的子模式组成。最简单的子模式称为基元(primitives),复杂模式就是由这些基元以及它们间的相互关系确定。例:医疗诊断问题-心电图正常/异常

句法模式识别的方法来源于形式语言和自动机:模式—句子,基元—字母表,模式结构—语法规则,模式分类—语法分析。结构模式识别的优点是它的层次结构,用少量的基元和规则来描述物体。这种方法常用在有一定结构的模式上,例如心电图(ECG)、物体轮廓的分析上

本章小结

介绍了模式模式识别的一些基本概念。

模式识别的一些常用方法:

六、课程内容统计决策理论概率密度估计线性判别分析近邻法特征提取与选择聚类实际模式识别例子课程总结与研究前沿简介参考书:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论