




已阅读5页,还剩24页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,第十六章 观察对象的分类分析方法 -判别分析 (Discriminant Analysis),2,主要有判别分析和聚类分析 判别分析:事物的分类是清楚的,目的是通过已知分类建立判别函数,预测新的观察对象所属类别。 聚类分析:事物分类不清楚,分几类不清楚,目的希望将事物进行分类(探索性研究)。,事物分类的统计方法:,3,判别分析(discriminant analysis)是在已知分为哪若干类的前提下,通过现有数据建立判别方程(函数),根据对象若干个指标的观测结果判定其应属于哪一类的多元统计学方法。常用的判别分析的方法有Bayes判别、Fisher判别、非参数判别、最大似然判别等。 当事先并不知道观察对象应分为哪若干类别时,采用聚类分析方法进行分类。,一、判别分析的基本概念,4,与聚类分析有所不同的是: 判别分析法首先需要对所研究对象进行分类,进一步选择若干对观测对象能够较全面地描述的变量,建立判别函数。对一个未确定类别的个案只要将其代入判别函数就可以判断它属于哪一类总体。,5,二、医学中的分类问题:,1.疾病诊断,例:用电感耦合等离子体发射光谱法测定肺癌患者和健康人尿液中的铬、铁、锰、铝、镉、铜、锌、镍,用原子荧光光谱法测定硒。对肺癌患者和健康人尿液中9种微量元素进行判别分析,为肺癌的早期诊断提供科学依据。-陈丹丹等.对肺癌患者和健康人尿液中9种微量元素的判别分析.药物分析杂志.2009, 29 (6).,6,预测病人的预后(好或差),提出早期治疗方法,降低严重后果。,例如根据新生儿出生后1 分钟阿氏评分(X1) 、窒息复苏时间(X2 ) 、惊厥持续天数(X3 ) 、急性期CT 改变(X4) 及治疗3 天后原始反射情况(X5)判别新生儿缺血缺氧性脑病的预后(脑性瘫痪 、严重智能低下、正常)。,2.疾病的预测,7,用途:通过数据建立判别方程,对研究事物进行分类和预测。 对资料要求: 要求建立方程的观察对象分类(y)已经明确(用金标准确定),收集建模对象(训练样本)的m个变量(x)建立判别方程。,三、判别分析的特点,8,根据自变量(x)资料性质: 自变量(x)为定量数据: Fisher判别、Bayes判别(SPSS、SAS统计软件可实现)。 自变量(x) 为定性数据: 最大似然判别法、Bayes公式判别(统计软件不能自动实现)。,四、判别分析建模的方法,9,五、判别分析方法的基本步骤,1.建立判别函数(方程) 2.规定判别(分类)准则 判别新个体为某类 3.评价判别方程的效果,10,主要用于定量数据的两类或多类判别. Bayes判别的思想: 基于Bayes准则,假定已知各类出现的先验概率P(Yk),且各类变量近似服从多元正态分布,获得Bayes判别函数。计算各个体出现的后验概率进行判别。,第一节 Bayes判别,11,一、分析步骤,1.筛选判别指标 选择其中相互独立的部分指标建立判别函数. 在建立判别函数之前,要先进行逐步判别分析,筛选出主要的判别指标,然后再对主要的判别指标作判别分析 .,SAS中的STEPDISC过程用来筛选判别指标,用Wilks Lambda统计量及对应P值来衡量.,12,决定某变量是否入选:,以已进入模型的变量作为协变量,将待考察的某变量作为应变量,以各类别作为对比组,采用协方差分析来判断扣除协变量的影响后,待考察的变量在各类别间有无差别。如果有差别,待考察的变量可进入方程;反之,则不能入选。,13,协方差分析:将对应变量Y有线性影响但未加控制或难以控制的定量变量X看做协变量,把X化为相等后比较各组Y的修正均数,是线性回归与方差分析结合起来的一种统计分析方法。模型中无任何变量时即为方差分析。,14,2.建立Bayes判别函数,已知判别对象分为g类,有m个判别指标Xj(j=1,2,m),要求各类的m个判别指标均近似服从多元正态分布。当各类的协方差矩阵相等时,计算合并协方差矩阵,表示判别指标Xi、Xj的合并协方差,按公式(16-1)计算。,15,表示第k类中变量Xi、Xj的均数;nk为第k类的例数,16,求解 (k=1,2,g),由,17,计算,为第k类(k=1,2, g)出现的先验概率,当不知道各类的先验概率时,一般取等概率1/g,也可取频率 (当样本较大且无选择性偏倚)。,18,建立线性Bayes判别函数:,(j=0,1 2,m; k=1,2, ,g)为需要估计的参数,用SAS的 DISCRIM过程可得到这些参数的估计值。,19,当各类的协方差阵不等时,应计算非线性二次型Bayes判别函数,在SAS的DISCRIM过程名后加选项POOL=TEST, SAS先经过检验,若各类的协方差阵满足齐性,则合并且给出线性Bayes判别函数;若各类的协方差阵不满足齐性,则不合并,且自动用非线性二次型Bayes判别函数取代线性Bayes判别函数。,3.确定判别规则,(1)按判别函数值判别:对每一个判别对象,将其m个判别指标的取值分别代入g个判别函数,计算判别函数值,将判别对象判为函数值最大的哪一类。 (2)按后验概率判别:按公式计算每一个判别对象属于第k类的后验概率, 将该判别对象判为后验概率值最大的那一类。,其中,21,二、应 用 实 例,例161 脑中风是急诊医学中较为常见的严重疾病,一般分为脑出血和脑缺血两类,对中风类型的早期正确诊断具有十分重要的临床意义。目前,医生临床分类诊断的正确率只有70左右;以头颅CT和核磁共振检查诊断较为可靠,但其价格昂贵;且因CT和核磁共振检查需搬动病人,易加重病情;尤其是CT和核磁共振检查对早期脑缺血常出现假阴性。我们收集了某医院近年78例脑中风病人的数据见表162, 判别指标与分类变量(以头颅CT和核磁共振检查诊断为依据)见表161。,表161 脑中风病人判别指标与分类变量,23,表16-2 某医院近年78例脑中风病人判别指标与分类变量数据,24,表16-2 横向续表,三、SAS程序及结果解释,1.逐步判别分析SAS程序,data stepdiscli16_1; input X1X23 g; cards; 1 72 20 10 2 1 1 2 1 1 2 1 2 2 1 2 2 2 5.671 9.493 1.875 42 32 1 2 70 20 12 1 3 1 2 1 1 2 1 2 2 1 1 2 2 6.040 8.056 2.000 40 35 1 ; proc stepdisc /*调用逐步判别分析过程stepdisc*/ sle=0.2 sls=0.2; /*选入、剔除变量的概率临界值均定为0.2*/ class g; var X1-X23;run;,data discrimli16_1; input X1-X23 g; cards; 1 72 20 10 2 1 1 2 1 1 2 1 2 2 1 2 2 2 5.671 9.493 1.875 42 32 1 2 70 20 12 1 3 1 2 1 1 2 1 2 2 1 1 2 2 6.040 8.056 2.000 40 35 1 ; proc discrim /*调用SAS判别分析过程discrim*/ distance /*计算两类别平方距离*/ manova /*对判别效能作假设检验*/ listerr; /*列出判错的样本信息*/ class g; var x9 x6 x17 x16 x21 x13 x10 x4 x7 x15 x12 x5 x3; run;,2.Bayes判别分析SAS程序,27,第二节 非参数判别分析,当各类的m个判别指标不服从多元正态分布时,应采用非参数判别分析 .,28,一、SAS程序,非参数判别分析SAS程序在过程discrim后加入选项method=npar,采用k个最近邻法,k的个数需经多次调试方可获得最好的判别效果 .,data li16_1; input x1-x23 g; cards; 1 72 20 10 2 1 1 2 1 1 2 1 2 2 1 2 2 2 5.671 9.4
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 国际高中考试及答案
- 2025年山东化学中考试卷及答案
- 2025年精麻处方考试试题及答案
- 慢性病防治知识培训课件
- 慢性咽炎课件
- 金融学基础考试大题及答案
- 情景再现法课件
- 青华中学考试试题及答案
- 护理评估单考试题及答案
- 航空航天概论考试及答案
- 车辆安全培训课件
- 2025年商标审查协作中心面试模拟题答案
- esg考试试卷问题及答案
- 2025年徐州市中考数学试题卷(含答案及解析)
- 统编版五升六语文开学摸底测试卷(十二)(含答案)
- 2025-2026学年北师大版(2024)初中物理八年级上册教学计划及进度表
- 2025年度哈尔滨“丁香人才周”(春季)哈尔滨新区教育系统专项招聘80人考试备考试题及答案解析
- 军用电台知识培训方案课件
- 外科面试题目及答案
- 院前急救工作制度及流程
- 2025年留置辅警考试题库及答案
评论
0/150
提交评论