已阅读5页,还剩69页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
28.05.2020,医学统计,1,第18章判别分析,孟虹,分类学是人类认识世界的基础科学。判别分析是研究事物分类的基本方法,广泛应用于自然科学和社会科学的各个领域。28.05.2020,医学统计学,2,判别分析的内容,*第1节费希尔判别,第2节最大似然判别,第3节贝叶斯公式判别,第4节贝叶斯判别,第5节逐步判别,第6节判别分析注意事项(SPSS统计软件:的补充操作和结果)*重点:判别分析概念、应用、结果解释和注意事项。28.05.2020,医学统计,3,概述,不同治疗的事物分类。然而,事物的分类往往需要多个指标。判别分析是一种通过多个变量对事物进行分类的方法。医学分类预测:种疾病预测患者预后(好或差),提出早期治疗方法,减少严重后果。28.05.2020,医学统计,4,例新生儿缺氧缺血性脑病(HIE)预后(山东某医院,2004),出生后1分钟判别指数:Arz评分(X1),窒息复苏时间(X2),惊厥持续天数(x 3),急性期CT改变(X4)和治疗后3天原始反射(X5)。获得判别值Z=77。Z77被认为是预后不良的标准。预后不良:脑性瘫痪,重度精神发育迟滞,28.05.2020,医学统计学,5,疾病诊断:疾病的诊断和进一步治疗的决定。例:判别分析在糖尿病周围神经病变早期诊断中的应用(广州南方医院内分泌科,2004)管理与经济分类:研究单位分类,区分类别,为管理者制定政策提供依据。例:根据经济指标、人均收入、工农人均产值、人均消费水平等。判断不同地区经济发展水平的类型。28.05.2020,医学统计学,6,事物分类的统计方法,主要是判别分析和聚类分析判别分析:事物的分类是明确的,目的是通过已知的分类建立判别函数,并预测新观察对象的类别。聚类分析:事物的分类不清楚,几种类型的分类也不清楚。目的是对事物进行分类(探索性研究)。28.05.2020,医学统计学,7,判别分析的特征和用途:通过数据建立判别方程,对研究对象进行分类和预测。数据要求:要求建立方程的观测对象的分类(Y)已经明确(由金本位制确定),并收集建模对象(训练样本)的M个变量(X)以建立判别方程。28.05.2020,医学统计学,8,判别分析建模方法,根据自变量(x)数据的性质:自变量(x)作为测量数据:Fisher判别,Bayes判别(SPSS,SAS统计软件可实现)。自变量(x)是定性数据:最大似然判别法和贝叶斯公式判别法(统计软件不能自动实现)。,28.05.2020,医学统计,9,1。判别函数(方程)的建立2。判别(分类)标准的规定,将新个人区分为某些类别3。判别方程效果的评估,判别分析方法的基本步骤,28.05.2020,医学统计学,10,第1节费希尔判别一类或两类判别,费希尔判别(标准判别)使用X1,X2.已知类别(A或B)的受试者的XM指数,在判别方程(z):方程中的系数C被建立为判别系数,C2 C1.CM,(18-1),28.05.2020,医学统计学,11,Fisher判别原理,正常人,冠心病人,z1,z2,Z,28.05.2020,医学统计学,12,Fisher方差分析思想,标准:找出组间方差(类间均值)/组内方差的最大比值。英国统计学家费雪拉爵士(1890 1962),28.05.2020,医学统计学,13,判别系数(c),(18-3)是通过求解下列矩阵获得的。Sij是指数I和指数J的组合协方差,类别间的平均差异,28.05.2020,医学统计学,14.2,建立判别规则和判别值(ZC),(18-5),类别A的判断,类别B的判断,任何类别的判断,28.05.2020,医学统计学,15个病例,33,360个课堂讲稿,表18-1,两种疾病的22名患者的三个指标的观察结果。数字类别(y)x1x 2 x 31 a 23802 a-19-23a-105013 B9-5114 B2-1-115 b 17-6-1,28.05.2020,医疗统计,16,计算步骤:1。计算各种平均值和组合(a,b)的协方差矩阵,28.05.2020,医学统计学,17,变量的组合方差和协方差,28.05.2020,医学统计学,18.2。求解正态方程得到判别系数c,类间平均差,28.05.2020,医学统计学,19.3。计算判别边界值Zc,将各个个体的变量值代入判别方程得到zi,得到zA和zB的平均值。预测:位患者测得的x1、x2、x3值,代入方程Z,计算出z -0.004为A类,28.05.2020,医学统计学,20,33,360表18-1 22位患者两类疾病的三项指标预测结果,x1x2x3z类值判别结果A 23800.19 aa-19-22.73 aa-10501.83 ab 9-51-2.07 bb 2-2 原始分类判别分类AB总A10212B2810总121022类误判率=2/12=16.6% b类误判率=2/10=20.0%方程总误判率=4/22=18.2%,28.05.2020,医学统计学,23,1。 确定研究:收集指数的目的是否与建立判别分析的目的一致(从专业角度)2。统计测试建模数据要求:测试鉴别变量鉴别能力数据满足正态和协方差同质性3。建立判别方程来评价判别效果。4.模型结果的解释和预测。SPSS统计软件的判别分析和结果(Fisher判别或典型判别),28.05.2020,医学统计学,24,课堂讲稿18-1示例,28.05.2020,医学统计学,25,28.05.2020,医学统计学,26,课堂讲稿18-1示例,SPSS统计软件结果分析,变量判别的调查和统计描述,表1,28.05.2020,医学统计学,27,单变量统计测试,表2,28.05.2020,医学统计学,28,测试建模数据变量的变化是否在类之间是同质的?协方差的Box SM检验,在这种情况下P 0.05,满足同质性条件。表3,28.05.2020,医学统计学,29,两个群体差异之间的不均匀距离的指示,Z1,z2,28.05.2020,医学统计学,30,鉴别规则和鉴别值的建立(ZC),(18-5),类别A的判断,类别B的判断,任何类别的判断,28.05.2020,医学统计学,31,表4和5反映了通过建立鉴别方程提取的信息。以及是否有统计学意义。表4,5,28.05.2020,医学统计,32,标准判别函数。判别方程是表7,系数绝对值反映重要性,28.05.2020,医学统计学,34,判别效果评估,表8,敏感性,特异性,28.05.2020,医学统计学,35,软件给出判别结果和判别值,28.05.2020,医学统计学,36,当前判别分析效果评估方法,1。回顾性评估:将原始数据带入判别方程的误判率的评估中。2.前瞻性:将原始数据分为0.85(训练样本)和0.15(验证样本),以建立判别方程。计算误判率(需要大量案例)。3.误判率总误判率低于0.2。相信可以使用判别函数。28.05.2020,医学统计,37,例如:世界经济统计研究的人文科学指数(1995)反映了国家的综合水平。28.05.2020,医学统计,38。第二节最大似然法适用于两种及两种以上定性指标的判别。似然函数方程:Xm:x1。X2.m个判别变量。Yk:y1,y2k.k类案件。S:个人处于某种状态(状况)。(18-7),P=特定状态下个体的条件概率,28.05.2020,医学统计学,39,2。判别规则:原理:根据独立事件概率乘法原理进行判别。在计算个体的k似然函数时,其中p的概率最大,该个体被判定为k类。例18-2:见课堂讲稿第388-389页。采用7项指标对4种阑尾炎进行鉴别诊断。收集了5668例确诊病例的病史资料(见表18-3)。28.05.2020,医学统计,40,表18-35668不同类型阑尾炎症状的发生率。可变症状卡他性细胞坏疽性腹膜炎SlY1Y2Y3Y4X1右下57343521腹痛下腹15131227位置上腹部12353534脐周121096全腹48912X2恶心(-)-(7333813呕吐()(-) 16303722 () 11375565,100%,28.05.2020,医学统计,41,示例:区分新个体(16303722)症状和体征变量。1例腹痛症状位置x1右下腹部呕吐x2排便x3正常腹部压痛x4右下腹部肌肉防御x5体温x636.6白细胞x723.7(单位),28.05.2020,医学统计学,42。根据最大似然法和判别规则,预测病例为3型坏疽。这种方法主要获得表18-3中的条件概率,需要大量的情况。28.05.2020,医学统计学,43,第三节中的贝叶斯公式判别法。贝叶斯:的基本思想是利用已知的先验概率来推断将要发生的后验概率。Bayes公式:k类先验概率,事件中的比例,28.05.2020,医学统计,44,表18-35668例不同阑尾炎,不同类型阑尾炎构成各种先验概率的百分比,估计2020年卡他性蜂窝组织炎5050坏疽2525腹膜炎55共100100,28.05.2020,医学统计,45。判别规则:计算个体A在Sij条件下属于类别K的后验概率,其中具有最大概率的P被分类为类别K。例如,18-2,参见课堂讲稿第390页,结果与先前方法的结果相同,28.05.2020,医学统计学,46,第4节贝叶斯判别,主要测量数据的两种或多种判别。贝叶斯判别思想:基于贝叶斯准则,假设每一类事件的先验概率P(Yk)是已知的,并且各种变量近似服从多元正态分布,从而得到贝叶斯判别函数。每个个体出现的后验概率被计算用于区分。28.05.2020,医学统计学,47,贝叶斯判别方程,如果要判别G类,其判别方程是:28.05.2020,医学统计学,48,如果先验概率未知,假设:建立各种判别方程YG、(18-9),其中C是判别系数。系数C与费希尔的计算相同。28.05.2020,医学统计,49,贝叶斯判别规则,和预测方法:1。个人被认为是YG价值观中最大的阶层。2.各种类型个体的后验概率被计算为最大的概率类别。两种方法的结果相当2.最好有各种各样的先验概率。各种样本的频率是无法替代的。28.05.2020,医学统计学,51,例表18-43疾病分类的4个指标数据,28.05.2020,医学统计学,52.1,计算每个指标的平均数和组合协方差矩阵,X1X2X3X4,2。根据讲义公式18-11计算每个系数C,28.05.2020。医学统计,53,3。根据讲义公式18-12(假设:28.05.2020,医学统计学,54,示例18-4贝叶斯判别方程)计算常数项C0的先验概率,并应用:将个体的M变量值替换为上述3个判别方程,并将个体分类为最大Y值类别。见表18-4,28.05.2020,医学统计学,55,表18-43疾病分类数据和判别结果,28.05.2020,医学统计学,56,表18-6回顾性判别效果评价,原始分类判别分类123总计161072040431056总计75517类型1误判率=1/7=14.2%类型3误判率=1/6=16.7%等式总误判率该方法的目的是选择具有判别效率的指标建立判别函数,使判别函数简洁,判别效果稳定。基本步骤:类似于多元回归。28.05.2020,医学统计学,58,逐步判别法的思想。判别方程是通过筛选具有判别效率的指标,通过偏离平均值的平方和(W)与总偏差的平方和(T)之比(威尔克斯统计量)建立的。(18-14),r指变量的数量,28.05.2020,医学统计,59,步骤和方法。1.设置变量选择方程和消去方程的边界值,输入边界值F,常用=0.05,0.1,0.2消去边界值F,常用=22。筛选步骤(见讲义第395页)。有关结果,请参见讲义,28.05.2020,医疗统计,60,参见第395页的W和T矩阵,28.05.2020,医疗统计,61,在第一步中选择X3,在第二步中选择X4,选择F=5.714,在第三步中,选择X2,选择F=2.192,在第四步中,消除X3,F=0.1174。方程中选择了X4和X2。参见第396页,28.05.2020,医学统计学,62,逐步判别分析和SPSS统计软件的结果(贝叶斯判别法),28.05.2020,医学统计学,63,逐步判别分析,28.05.2020,医学统计学,64,选择和拒绝方程的概率分别为0.2和0.3,贝叶斯判别,28.05.2020,医学统计学,65,贝叶斯逐步判别部分结果,方程中变量的条件在仅使用x2和x4判别函数的回顾性效果评估中,总正确率=94.1%,28.05.2020,医学统计学,68
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安全出行美术课件
- 中学生消防安全教育课件
- 意外安全知识课件
- 《中药学综合知识与技能》模拟试卷(五)
- 中班安全课课件
- 工程类国企考试题及答案
- 国企《战略管理岗》招聘考试SWOT分析实战演练卷
- 2019年国考申论真题及解析
- 1、外来人员安全教育试题
- 国家金融监管参考文献集
- 急性阑尾炎伴有弥漫性腹膜炎的护理查房
- 环境礼仪培训课件
- +2.2+更好发挥政府作用高中政治统编版必修二经济与社会+
- 十五五林业草原发展规划纲要
- 农户生计韧性的新挑战与应对策略
- GB/T 12406-2022表示货币的代码
- WPS图文并茂技巧2025年考试要点试题及答案
- 拆旧建屋合同协议书
- 2025年春江苏开放大学维修电工实训第3次形考作业答案
- 2025年CSCO胰腺癌诊疗指南解读
- 蜜雪冰城加盟合同(2025年版)
评论
0/150
提交评论