




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多元统计分析学第八讲第一页,共五十七页,编辑于2023年,星期五判别分析原理及模型
判别分析概述
判别分析方法
第二页,共五十七页,编辑于2023年,星期五判别分析概述
(一)什么是判别分析
判别分析是多元统计中用于判别样品所属类型的一种统计分析方法。是一种在一些已知研究对象用某种方法已经分成若干类的情况下,确定新的样品的观测数据属于那一类的统计分析方法。
判别准则:用于衡量新样品与各已知组别接近程度的思路原则。常用的有,距离准则、Fisher准则、贝叶斯准则。判别函数:基于一定的判别准则计算出的用于衡量新样品与各已知组别接近程度的描述指标,即判别函数。(二)判别分析的种类按照判别组数划分有两组判别分析和多组判别分析;按照区分不同总体的所用数学模型来分有线性判别分析和非线性判别分析;按照处理变量的方法不同有逐步判别、序贯判别等;按照判别准则来分有费舍准则与贝叶斯判别准则。第三页,共五十七页,编辑于2023年,星期五判别分析方法
(一)距离判别法1.基本思想:首先根据已知分类的数据,分别计算各类的重心,即分组(类)均值,判别准则是对于任给一次观测值,若它与第i类的重心距离最近,就认为它来自第i类。因此,距离判别法又称为最邻近方法(nearestneighbormethod)。距离判别法对各类总体的分布没有特定的要求,适用于任意分布的资料。
第四页,共五十七页,编辑于2023年,星期五第五页,共五十七页,编辑于2023年,星期五第六页,共五十七页,编辑于2023年,星期五第七页,共五十七页,编辑于2023年,星期五第八页,共五十七页,编辑于2023年,星期五第九页,共五十七页,编辑于2023年,星期五第十页,共五十七页,编辑于2023年,星期五第十一页,共五十七页,编辑于2023年,星期五第十二页,共五十七页,编辑于2023年,星期五第十三页,共五十七页,编辑于2023年,星期五第十四页,共五十七页,编辑于2023年,星期五第十五页,共五十七页,编辑于2023年,星期五第十六页,共五十七页,编辑于2023年,星期五第十七页,共五十七页,编辑于2023年,星期五第十八页,共五十七页,编辑于2023年,星期五第十九页,共五十七页,编辑于2023年,星期五第二十页,共五十七页,编辑于2023年,星期五第二十一页,共五十七页,编辑于2023年,星期五第二十二页,共五十七页,编辑于2023年,星期五第二十三页,共五十七页,编辑于2023年,星期五第二十四页,共五十七页,编辑于2023年,星期五3.多组费舍判别分析
第二十五页,共五十七页,编辑于2023年,星期五第二十六页,共五十七页,编辑于2023年,星期五第二十七页,共五十七页,编辑于2023年,星期五第二十八页,共五十七页,编辑于2023年,星期五第二十九页,共五十七页,编辑于2023年,星期五第三十页,共五十七页,编辑于2023年,星期五(三)贝叶斯判别法
第三十一页,共五十七页,编辑于2023年,星期五第三十二页,共五十七页,编辑于2023年,星期五第三十三页,共五十七页,编辑于2023年,星期五第三十四页,共五十七页,编辑于2023年,星期五第三十五页,共五十七页,编辑于2023年,星期五第三十六页,共五十七页,编辑于2023年,星期五第三十七页,共五十七页,编辑于2023年,星期五第二节逐步判别分析一、逐步判别分析的基本概念及基本思想二、逐步判别的理论基础三、引入和剔除变量计算四、建立判别式,对样品判别分类五、具体计算步骤
第三十八页,共五十七页,编辑于2023年,星期五一、基本概念及基本思想
在判别问题中,当判别变量个数较多时,如果不加选择地一概采用来建立判别函数,不仅计算量大,还由于变量之间的相关性,可能使求解逆矩阵的计算精度下降,建立的判别函数不稳定。因此适当地筛选变量的问题就成为一个很重要的事情。凡具有筛选变量能力的判别分析方法就统称为逐步判别法。第三十九页,共五十七页,编辑于2023年,星期五逐步判别法和通常的判别分析一样,也有许多不同的原则,从而产生各种方法。这里讨论的逐步判别分析方法是在多组判别分析基础上发展起来的一种方法,判别准则为贝叶斯判别函数,其基本思路类似于逐步回归分析,采用“有进有出”的算法,即按照变量是否重要,从而逐步引入变量,每引入一个“最重要”的变量进入判别式,同时要考虑较早引入的变量是否由于其后的新变量的引入使之丧失了重要性变得不再显著了(例如其作用被后引入地某几个变量的组合所代替),应及时从判别式中把它剔除,直到判别式中没有不重要的变量需要剔除,剩下来的变量也没有重要的变量可引入判别式时,逐步筛选结束。也就是说每步引入或剔除变量,都作相应的统计检验,使最后的贝叶斯判别函数仅保留“重要”的变量。第四十页,共五十七页,编辑于2023年,星期五二、逐步判别分析的理论基础第四十一页,共五十七页,编辑于2023年,星期五第四十二页,共五十七页,编辑于2023年,星期五
第四十三页,共五十七页,编辑于2023年,星期五第四十四页,共五十七页,编辑于2023年,星期五当增加第p个变量后,p个变量的维尔克斯统计量第四十五页,共五十七页,编辑于2023年,星期五三、引入和剔除变量计算
假定计算了l步,已入选了L个变量,不妨设为第四十六页,共五十七页,编辑于2023年,星期五第四十七页,共五十七页,编辑于2023年,星期五由附加信息准则,则得引入变量的检验统计量为:第四十八页,共五十七页,编辑于2023年,星期五第四十九页,共五十七页,编辑于2023年,星期五如果第五十页,共五十七页,编辑于2023年,星期五逐步判别过程,就是不断的引入和剔除变量的过程,可以证明,前三步都只引入,而不必考虑剔除,在以后的各步中则首先考虑剔除,如果不能剔除则再考虑引入,当既不能剔除又不能引入时,逐步计算的过程即告终止,将已选中的变量建立判别函数。第五十一页,共五十七页,编辑于2023年,星期五四、建立判别式,对样品判别分类经过第二步选出重要变量后,可用各种方法建立判别函数和判别准则,这里使用Bayes判别法建立判别式,假设l+1步,最终选出L个变量,设判别式为:第五十二页,共五十七页,编辑于2023年,星期五五、具
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湖北省2025届数学七下期末学业质量监测试题含解析
- 企业战略影响下的可持续发展路径试题及答案
- 续方管理中的难点与对策计划
- 重庆十一中2025届数学八下期末达标检测模拟试题含解析
- 学期工作总结与展望计划
- 江苏省苏州市立达中学2025届数学七下期末学业质量监测试题含解析
- 急诊医学志愿者的参与计划
- 新年实现财务管理的工作安排计划
- 紧贴时事的计算机二级VB试题及答案
- 水务管理数字化转型分析计划
- 北京北大方正软件职业技术学院《实践中的马克思主义新闻观》2023-2024学年第二学期期末试卷
- 煤炭产品质量保障措施
- 2025年陕西咸阳亨通电力(集团)有限公司招聘笔试参考题库附带答案详解
- 【水利水电】李想 案例专项班教案 04-案例专项班(四)
- 光影中国学习通超星期末考试答案章节答案2024年
- DLT 572-2021 电力变压器运行规程
- 山西省义务教育阶段中小学文科教学仪器设备配备标准
- 高效液相色谱法分析(纽甜)原始记录
- DB5132∕T 76-2022 熊猫级民宿的划分与评定
- 国家开放大学《思想道德与法治》社会实践参考答案
- 计数型MSA计算分析(假设试验法入门实例讲解)
评论
0/150
提交评论