判别分析(第1、2节绪论、距离判别法).ppt_第1页
判别分析(第1、2节绪论、距离判别法).ppt_第2页
判别分析(第1、2节绪论、距离判别法).ppt_第3页
判别分析(第1、2节绪论、距离判别法).ppt_第4页
判别分析(第1、2节绪论、距离判别法).ppt_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一节引言,什么是判别分析?,在我们的日常生活和工作实践中,常常会遇到判别分析问题,即根据历史上划分类别的有关资料和某种最优准则,确定一种判别方法,判定一个新的样品归属哪一类。例如,在医学诊断中,一个病人肺部有阴影,医生要判断该病人患的是肺结核、肺部良性肿瘤还是肺癌?这里三种病人的集合体可看做是三个总体,病人是来源于三个总体之一的样本。判别分析的目的是通过检测病人的一些指标(如阴影大小、边缘的光滑度、体温等)来判定该病人应属于那个总体.又如,在天气预报中,我们有一段较长时间关于某地区每天气象的记录资料(晴阴雨、气温、气压、湿度等),现在想建立一种用连续五天的气象资料来预报第六天是什么天气的方法。这些问题都可以应用判别分析方法予以解决。,第一节引言,这类问题可用数学语言来表达如下:设有n个样品,对每个样品测得p项指标(变量)的数据,已知每个样品属于k个类别(或总体)G1,G2,Gk中的某一类,且它们的分布函数分别为F1(x),F2(x),Fk(x)。我们希望利用这些数据,找出一种判别函数(或判别准则),使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来,并对测得同样p项指标(变量)数据的一个新样品(待判样品),能判定这个样品归属于哪一类。,直观上讲,判别分析是用来判别样品所属类型的一种多元统计分析方法。,第二节距离判别法,马氏距离,第二节距离判别法,第二节距离判别法,更一般地,设总体G1的分布为,设总体G2的分布为,则利用统计距离,可以找出分界点,且不妨设,所以若令,按这种距离最近的判别准则:,第二节距离判别法,因为是单指标的问题,这时判别函数设为:,在此例中因,故判。,下面给出对于m元总体的这种相对距离即所谓的马氏距离定义,第二节距离判别法,1、两个总体的距离判别问题(1)情形:有协方差矩阵相等的两个总体G1和G2,其均值分别是1和2,对于一个新的样品X,要判断它来自哪个总体。一般的想法是计算新样品X到两个总体的马氏距离D2(X,G1)和D2(X,G2),并按照如下的判别规则进行判断这个判别规则的等价描述为:求新样品X到G1的距离与到G2的距离之差,如果其值为正,X属于G2;否则X属于G1。,第二节距离判别法,第二节距离判别法,第二节距离判别法,第二节距离判别法,第二节距离判别法,作为特殊情形,我们考虑:,第二节距离判别法,我们用这种特殊情形,说明错判概率的有关概念。,从图上可直观地看到,用距离判别法会发生错判,如样本X虽然来自于总体,但却落入区域,所以按照判别准则被判别为属于。错判的概率为图中阴影左半部分面积,记为,另一个错判概率。,第二节距离判别法,从错判概率公式可看出,当两个总体的均值相差甚微,即越小,错判概率变得越大,这时作判别分析没有意义。因此只有当两个总体的均值有显著性差异时,做判别分析才有意义。,第二节距离判别法,第二节距离判别法,我们用p=1时的特殊情形,说明两总体协方差不等时的归

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论