已阅读5页,还剩69页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
判别分析 DiscriminantAnalysis 分类学是人类认识世界的基础科学 判别分析是研究事物分类的基本方法 广泛应用于自然和社会科学各个领域 1 判别分析内容 第一节Fisher判别第二节最大似然判别法第三节Bayes公式判别法 第四节Bayes判别 第五节逐步判别 第六节判别分析中应注意的问题 补充 SPSS统计软件的操作和结果 重点 判别分析概念 应用 结果解释 注意的问题 2 概述 对事物分类 以便给予不同的处理 但事物的分类常需要多个指标 判别分析是通过多变量对事物进行分类方法 医学中的分类问题 疾病的预测预测病人的预后 好或差 提出早期治疗方法 降低严重后果 3 例 新生儿缺氧缺血性脑病 HIE 预后 山东某医院 2004年 判别指标 生后1分钟阿氏评分 X1 窒息复苏时间 X2 惊厥持续天数 X3 急性期CT改变 X4 及治疗3天后原始反射情况 X5 求得判别值Z 77 以Z 77作为预后不良的标准 不良预后 脑性瘫痪 严重智能低下 4 疾病诊断 对疾病的诊断 确定进一步的治疗 例 判别分析在糖尿病周围神经病变早期诊断中的应用 广州南方医院内分泌科 2004年 管理和经济学上分类 对研究单位分类 判别所属类别 为管理者制定政策提供依据 例 根据经济指标 人均收入 人均工农产值 人均消费水平等判断不同地区经济发展程度类型 5 事物分类的统计方法 主要有判别分析和聚类分析判别分析 事物的分类是清楚的 目的是通过已知分类建立判别函数 预测新的观察对象所属类别 聚类分析 事物分类不清楚 分几类不清楚 目的希望将事物进行分类 探索性研究 6 判别分析的特点 用途 通过数据建立判别方程 对研究事物进行分类和预测 对资料要求 要求建立方程的观察对象分类 y 已经明确 用金标准确定 收集建模对象 训练样本 的m个变量 x 建立判别方程 7 判别分析建模的方法 根据自变量 x 资料性质 自变量 x 为计量数据 Fisher判别 Bayes判别 SPSS SAS统计软件可实现 自变量 x 为定性数据 最大似然判别法 Bayes公式判别 统计软件不能自动实现 8 1 建立判别函数 方程 2 规定判别 分类 准则判别新个体为某类3 评价判别方程的效果 判别分析方法的基本步骤 9 第一节Fisher判别一 两类判别 Fisher判别 典则判别canonicaldiscriminant 用已知类别 A或B 研究对象的x1 x2 xm指标 建立判别方程 z 方程中系数c为判别系数 c1 c2 cm 18 1 10 Fisher判别的原理 正常人 冠心病人 z1 z2 Z 11 Fisher方差分析的思想 准则 寻找组间变异 类间均数 组内变异的比值最大化 英国统计学家FisherRA爵士 1890 1962 12 通过解下列距阵得到判别系数 c 18 3 Sij为第i指标和第j个指标的合并协方差 类间均数差值 13 2 建立判别规则和判别值 Zc 18 5 判为A类判为B类判为任意一类 14 例 讲义表18 1两类疾病22例患者三项指标观察结果 编号类别 y x1x2x31A23802A 19 23A 105013B9 5114B2 1 115B17 6 1 15 计算步骤 1 计算各类均数和合并 A B 的协方差距阵 S 16 变量的合并方差和协方差 17 2 解正规方程得出判别系数C 类间均数差值 18 3 计算判别界值Zc 将各类每个个体的变量值代入判别方程 得到zi 得到zA和zB的均数 预测 某病人测定了x1 x2 x3值 代入方程z 计算的z 0 004 为A类 19 例 表18 1两类疾病22例患者三项指标预测结果 类别x1x2x3z值判别结果A23800 19AA 19 22 73AA 10501 83AB9 51 2 07BB2 1 1 0 05AB17 6 1 2 22B z 0 004 为A类 20 二 判别效果的评价 用误判率评价 21 表18 1资料回顾性判别效果评价 原分类判别分类AB合计A10212B2810合计121022第A类误判率 2 12 16 6 第B类误判率 2 10 20 0 方程总误判率 4 22 18 2 22 1 确定研究的目的 收集指标与建立判别分析目的一致 从专业考虑 2 统计检验建模数据的要求 检验判别变量的区别能力数据满足正态和协方差齐性3 建立判别方程 评价判别效果 4 模型结果解释和预测 SPSS统计软件的判别分析与结果 Fisher判别或典则判别 23 讲义18 1实例 24 25 讲义18 1实例分析SPSS统计软件结果 变量判别能力的考察和统计描述 表1 26 各变量在类间的单因素统计检验 F检验 单变量检验提示 X2和x3在区别不同类别人群有统计学意义 表2 27 检验建模数据变量的变异在类间是否齐性 协方差的Box sM检验 本例p 0 05 满足齐性条件 表3 28 两总体方差不齐距离示意 z1 z2 29 建立判别规则和判别值 Zc 18 5 判为A类判为B类判为任意一类 30 表4和表5反映建立判别方程提取信息量 和有无统计意义 表4 表5 31 典型判别函数 canonicaldiscriminantfunction 根据表6系数建立判别方程 表6 32 表7提供了各变量对判别分类的重要性 表7 系数的绝对值反映重要性 33 评价判别效果 表8 灵敏度 特异度 34 软件给出判别结果和判别值 35 目前判别分析效果评价方法 1 回顾性评价 将原始数据带入判别方程得误判率评价 2 前瞻性 将原始数据分为0 85 训练样本 建立判别方程和0 15 验证样本 计算误判率 要求例数较多 3 误判率总误判率低于0 2 认为判别函数可用 36 例 世界经济统计研究 1995年 人文指数反映国家综合水平 37 第二节最大似然法判别 适用于定性指标的两类和多类判别 似然函数方程 Xm x1 x2 m个判别变量 Yk y1 y2 k个类型例数 S 个体为某种状态 条件 18 7 P 个体在某状态的条件概率 38 2 判别规则 原理 根据独立事件概率乘法原理进行判别 在计算个体k个似然函数 其中概率最大的p 判个体为第k类 例18 2 见讲义388 389页有人用7个指标对4种类型阑尾炎的鉴别诊断 收集5668例确诊的病史数据 见表18 3 39 表18 35668例不同型阑尾炎症状发生频率 变量症状卡他性蜂窝炎坏疽腹膜炎SlY1Y2Y3Y4X1右下57343521腹痛下腹15131227部位上腹12353534脐周121096全腹48912X2恶心 7333813呕吐 16303722 11375565 100 40 例 对某个新个体做判别 讲义388页 症状与体征变量某病例的症状腹疼部位x1右下腹呕吐x2有排便x3正常腹部压痛x4右下部腹部肌防御x5有体温x636 6 白细胞x723 7 单位 41 某病例根据最大似然法和判别规则 该病例预测为第3类 坏疽型 该法主要得到表18 3条件概率 要求例数较多 42 第三节Bayes公式判别法 Bayes基本思想 是利用已知先验概率 去推证将要发生的后验概率 Bayes公式 第K类的先验概率 在事件中的比例 43 表18 35668例不同型阑尾炎 不同型所占各类先验概率阑尾炎构成 估计卡他性2020蜂窝炎5050坏疽2525腹膜炎55合计100100 44 判别规则 计算个体a在Sij的条件下 属于k类的后验概率 其中概率最大的p 判个体为第k类 例 18 2见讲义390页 结果与前法相同 45 第四节Bayes判别 主要计量数据的两类或多类判别 bayes判别的思想 基于bayes准则 假定已知各类出现的先验概率P Yk 且各类变量近似服从多元正态分布 获得bayes判别函数 计算各个体出现的后验概率进行判别 46 Bayes判别方程 假如要判别G类 其判别方程为 47 如先验概率未知 假定 建立各类的判别方程yG 18 9 其中C为判别系数 系数c的与fisher计算相同 48 Bayes判别规则 预测方法 1 将个体判为YG值中最大的类 2 计算个体各类后验概率 判为概率最大类 两方法结果等价 公式18 13 49 Bayes判别对数据的要求 1 各类建立方程的m个自变量 指标 近似服从正态分布 各类协方差距阵相同 2 最好有各类别的先验概率 无可用各类样本的频率代替 50 例表18 43个疾病分类的4个指标数据 51 1 计算各指标的均数和合并协方差阵 X1X2X3X4 2 按讲义公式18 11计算出各系数C 52 3 按讲义公式18 12计算常数项C0先验概率假定 53 例18 4Bayes判别方程 应用 将个体的m个变量值代入上面3个判别式 个体归为最大y值类 见表18 4 54 表18 43个疾病分类数据与判别结果 55 表18 6回顾性判别效果评价 原分类判别分类123合计161072040431056合计75517第1类误判率 1 7 14 2 第3类误判率 1 6 16 7 方程总误判率 2 17 11 76 56 第五节逐步判别 该方法目的 选取具有判别效能的指标建立判别函数 使判别函数简洁 判别效果稳定 基本步骤 与多元回归相似 57 逐步判别方法的思想 通过类内离均差平方和 W 与总离差平方和 T 比值 Wilks统计量 筛选具有判别效能的指标建立判别方程 18 14 r指变量个数 58 步骤与方法 1 设定变量选入方程和剔除方程的界值进入界值F 常用 0 05 0 1 0 2剔除界值F 常用 2 2 筛选步骤 见讲义395页 本例 0 2 0 3结果见讲义 59 见395页的W和T距阵 60 第一步X3选入 第二步 X4选入 F 5 714第三步 X2选入 F 2 192第四步 X3剔除 F 0 1174 方程内选入X4 X2 建立方程结果见396页 61 SPSS统计软件的逐步判别分析与结果 Bayes判别法 62 逐步判别分析 63 选入和剔除方程的概率用0 2和0 3 为Bayes判别 64 Bayes逐步判别部分结果 变量在方程内的情况 65 Bayes判别函数方程 66 表18 7在只有x2 x4判别函数的回顾性效果评价 总正确率 94 1 67 4个变量判别方程回顾性判别效果评价 原分类判别分类123合计161072040431056合计75517第1类误判率 1 7 14 2 第3类误判率 1 6 16 7 方程总误判率 2 17 11 76 总正确率 88 24 68 表18 4数据根据x2和x4判别得到结果 给出判别后个体是各类的概率和判别结果 判为第1 第2 第3的概率 69 第六节判别分析的注意问题 1 判别分析中所用的样本资料视为总体的估计 样本足够大 有较好的代表性 2 样本原始分类必须正确无误 否则得不到可靠的判别函数 3 判别指标的选择要适当 必要时应对判别指标进行筛选 对判别的指标要求高 70 4 判别函数的判别能力不能只由训练样本的回代情况得出结论 要预留足够的验证样品以考察判别函数的判别能力 5 bayes判别和Fisher判别都是线性方程 要求自变量为计量数据 满足近似正态 协方差距阵近似 71 判别分析小结 判别分析主要用于分类和预测指标为计量数据 可用Fisher判别和Bayes判
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 演出公益合同补充协议
- 货物买卖担保合同范本
- 课时5:数的大小比较和数的改写(教案)-2024-2025学年四年级下册数学苏教版
- 美欧签能源协议签合同
- 维修资金施工合同范本
- 家长健康意识提升培训工作方案
- 美容美发消费合同范本
- 货物供应担保合同范本
- 牧区住宅出租合同范本
- 监控立杆采购合同范本
- GB/T 21782.4-2025粉末涂料第4部分:爆炸下限的计算
- 2025年宏观经济学试题库及练习题及答案
- 2025黑龙江齐齐哈尔市龙沙区南航街道公益性岗位招聘1人笔试考试参考题库附答案解析
- 高中化学教学质量分析与提升策略
- 2025年机场货运区安全生产月试题及答案
- 2025国家公务员政治理论应知应会知识试题库及答案
- 2025年给排水科学与工程专升本水处理试卷(含答案)
- 《中国乳腺癌诊疗指南》(2025版)
- 高三试卷:山东省名校考试联盟2024-2025学年高三上学期期中考试政治试题
- 《翅片式换热器生产制造工艺规范》
- 长沙市一中2026届高三10月月考试卷(二)生物试卷(含答案详解)
评论
0/150
提交评论