版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数字图像处理与模式识别主讲:相明西安交通大学电信学院计算机系E-Mail: Mxiang绪论一、模式识别的基本概念二、模式识别系统的基本设计方法三、模式识别问题的一般描述四、模式识别的应用五、数字图像处理与模式识别六:本课程的主要研究内容一、模式识别的基本概念1、什么是模式识别?单地说,模式识别就是对观察到的物理对象进 行识别与分类。模式识别无所不在,我们每一天 都在进行着成功的模式识别。一个简单的例子是 根据声音识别汽车的类别。再如读书看报。2、如何让机器自动进行模式识别?模式识别的定义:根据对某个物理对象的观测信 息,利用计算机对该物理对象进行分类,从而给 出该物理对象所属的类别。在这里,
2、“模式”就 是指存储于计算机内的有关物理对象的观测信息, 它可以是图像、声音、温度、压力等任何可以测 量的观测量。为了让机器自动完成模式识别任务, 我们需要(1)数据采集设备(2)模式识别算法。 一个简单的问题:如何让机器可以认字?3、模式识别研究的意义对外界事物的感知与识别是智能的基础。如果 我们能够很好的解决模式识别问题,就能够制 造岀更高级的智能系统。一个例子是手写体识 另U。另一个例子是自动驾驶系统。模式识别在计算机学科中的地位:模式识别是 计算机科学与控制科学的一个交叉学科,是智 能系统及智能信息处理的一个重要基础。1、模式识别系统的基本设计方法模式识别问题的一个例子:设计一个自动分
3、类 系统,实现对两种不同类别鱼类的自动分类 (salmon,sea bass)o结合该例子,我们讨论以 下几个问题(1)观测量的获取(2)特征提取(3)分类器的训练(4)分类器的测试(5)分 类器的设计过程(6)分类器设计过程中需要考 虑的一些关键因素。1、观测量的获取(图像获取):首先通过摄像 机获取图像,然后采用图像分割技术,得到单个 惣理对象的图像。2、特征提取:抽取关键特征,并根据这些特征 对物理对象进行分类。 I I I I 丨 1111 | i i ! i | i i i |长度特征:璽据长度进行分类一salmon一般较短,sea bass般较长亮度特征:根据亮度进行分类J sal
4、mon一般较暗,sea bass般较亮lighr/tess特征向亮:提取一组特征,构成特征向量,根据 特征向量进行分类。特征向量=(亮度、宽度);x=(xl,x2);fcEWijr特征向量所有可能的取值的集合样 本:(x,y), x:该样本对应的特征向量Y:该样本的类另L y=+l(salmon),或=-l(bass)widtfi22-21 20 19 :18 ;17-16 15 -14 -salmon sea bassfightness10在特征空间中构造一个分类面,对两类样本进行3、分类器的训练:根据已有的一组样本(样本集), 构造一个判决函数d(x),根据d(x)实现对两类样本的 评确分
5、类。我们希望d(x)尽可能满足:对于第一类样本(x,y),y= 1: d(x)0或sign(d(x)= 1对于第二类样本(x,y),y=-l: d(x)0则分类正确。如 果d(x) 0则产生一个分类错误。分类器对测试样本集进行分类时的错误率,称为测试误 差。采用所得分类器对训练样本进行分类吋的错误率, 称为训练误差训练误差、测试误差统称为经验误差。分类器优化的原 则应该是使测试误差近可能小。因此,判决函数d(x)应 根据训练样本及测试样本共同确定。分类器的应用:在对分类器进行训练及测试,并 最终确定了分类器的判决函数以后,就可将分类 器投入实际应用。在实际应用中,我们只能观测 却物理対彖的特征
6、向量,但是弄不知道该对喙J勺 类别。为此,我们采用分类器的判决函数对其类 别进行预测(即分类)。对于观测到的特征向量X:如果d(x)0,贝I判y=l (物理对象属于第一类) 如果d(x)0,贝I判y=l (物理对象属于第二类)5、分类器的设计过程prior knowledge(e.g., invariances)吠份类器设计过程中需要考虑的一些关键因素:(1) 两类不同样本的特征向量的真实分布:特 征向量的概率分布决定了分类器在实际应用中 的真实分类能力(泛化能力)。特征向量的概 率分布通常是未知的。因此分类器的泛化能力 也是未知的。但是,分类器的真实分类能力可 以通过测试误差进行初步的估计。
7、(2) 训练样本及测试样本的数量:越多越好, 但是在实际应用中,获取大量的样本通常需要 付岀很大的代价。(3)分类器的复杂度选择:采用复杂度高的分类 器可以获得较小的训练误差。但是,随着分类 I覆杂度的进一步提高,伴随着训练误差的降 低,分类器的测试误差却会开始变大。这一现 象称为过度拟合(过学习)。过度拟合的出现, 意味着分类器泛化能力的降低。它说明在分类 器的设计过程中,分类器(也即判决函数)的 复杂度应该受到适当的限制。分类器复杂度选择的两个基本原则:1、Occam razor原则:为了保证泛化能力, 在经验误差相近的条件下,应该选择复杂度较 低的分类器。2、统计学习理论:为了保证泛化能
8、力,分类 器的复杂產应与可用样未的数量相平衡。样未 数量较多时,采用复杂度高的分类器才更可靠。牛分类器复杂度过高:分类器复杂度过高,出现过 度拟合,泛化能力可能会有所降低。分类器复杂度过低:由于分类器的复杂度过低,无 遴有效表示不同类别训练样本之间的分界面,从而 导致训练误差无法得到充分的降低,这一现象称为 矢学习。欠学习同样无法保证较好的泛化能力。分类器复杂度适中:分类器的复杂度与可用样本的 朝量相旺配,复杂度的选择符合Occam razor原则, 这样得到的分类器最有可能获得较好的分类能力。三、模式识别问题的一般描述(1)构建样本集:获取物理对象的观测量,从观测量中提 沖有斑壬进行分类的特
9、征向量,根据特征向量及物理对 象的类别构成一个样本。对不同类别的多个物理对象重 复上述过程,获得一个样本集。样本集是分类器设计的 基础。:2)将样本集分为训练集及测试集。选择一个合适的分类器模型,根据训练集及测试集共同确定该分类器模型的参数。这一过程称为有监督学习。有监督学习是一种基于样本的学习方法。基于样本的学习方法是解决复杂问 题的一个重要手段(例如中医诊脉)。(3)与有监督学习相对应的是无监督学习(聚类分析)。在聚类分析中,没有样本的类别信息可资利用,只有一 组可能是来自于多个不同类别对象的观测量(也称为特 征向量或样本)。聚类分析的目的,就是根据样本分布 的自然结构,根据样本之间的相似性,将样本分为多个 不同的类。一个聚类分析的例子:只有观测信息,没有类别信息。 我们希望根据样本的分布,将样本划分为若干个自然类, 从而发现隐藏于样本集中的可能的类别信息。width salmonsea bass19if : KS13ligthnessa jo叽濮式识别的应用手写体识别:邮政编码指纹识别:人脸识别:故障诊断:语
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年四川省阆中市高二生物下册期末考试试卷含答案【培优B卷】
- 2026年辽宁省开原市高二生物下册期末考试检测卷及参考答案
- 2026年安徽省明光市高二生物下册期末考试试卷【培优B卷】附答案
- 2026年江苏省兴化市高二生物下册期末考试试卷附答案(综合题)
- 2026年吉林省蛟河市高二生物下册期末考试试卷含答案(综合卷)
- 2025年江苏省常熟市高二生物下册期末考试模拟卷附参考答案(培优B卷)
- 2025年辽宁省盖州市高二生物下册期末考试模拟卷完整附答案
- 2025年湖北省恩施市高二生物下册期末考试试卷附参考答案(精练)
- 2026年江苏省宜兴市高二生物下册期末考试模拟卷及完整答案【名师系列】
- 2026年湖南省洪江市高二生物下册期末考试模拟卷附答案【培优A卷】
- 2026年科技成果转化能力考试卷及答案
- 全科医师培训试题及答案2026年
- 2026北京天坛生物制品股份有限公司校园招聘备考题库完整答案详解
- 2026关于开展树立和践行学习教育工作情况的报告汇编(9篇)
- 2026年榆林米脂县婴幼儿照护管理中心招聘(10人)笔试参考题库及答案详解
- 浙江省宁波市鄞州区 2024-2025学年七年级下学期期末英语统考试题(6月)(含答案)
- (期末复习)2025-2026学年统编版八年级历史下册复习提纲
- 2026年北京市丰台区初三二模语文试卷(含答案)
- 2026年托福口语测试题及答案
- 2026中国临时晶圆键合材料市场现状调查及未来趋势专项咨询报告
- 2026年长沙信息技术考前冲刺练习题库及答案详解【新】
评论
0/150
提交评论