




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第十四章第十四章 判别分析判别分析(discriminant analysis)(discriminant analysis)上海第二医科大学上海第二医科大学生物统计教研室生物统计教研室第一节第一节 判别分析的基本概念判别分析的基本概念l 1.什么是判别分析l 判别分析是根据观测到的某些指标对所研究的对象进行分类的一种多元统计分析方法。在医学研究中经常遇到这类问题;例如, 临床上常需根据就诊者的各项症状、 体征、实验室检查、病理学检查及医学影像学资料等对其作出是否有某种疾病的诊断或对几种可能患有的疾病进行鉴别诊断,有时已初步诊断为某种疾病,还需进一步作出属该类疾病中哪一种或哪一型的判断。(1)
2、有无某种疾病例:计算机用于胃癌普查,用于中风预报。(2)疾病的鉴别诊断例:计算机用于对肺癌,肺结核和肺炎进行鉴别诊断。(3)患有某疾病中的哪一种或哪一型例:鉴别诊断单纯性或绞窄性肠梗阻。 鉴别诊断阑尾炎中的卡他性,蜂窝织炎, 坏疽性和腹膜炎。 用一个实例来说明判别分析的基本思想 2. 判别分析步骤 欲用显微分光光度计对病人细胞进行检查以判断病人是否患有癌症。(1)根据研究目的确定研究对象(样本)及所用指标例:110例癌症病人和190例正常人。 指标:x1,x2和x3。 x1: 三倍体的得分,x2: 八倍体的得分,x3: 不整倍体的得分。(0-10分)(2)收集数据,得到训练样本 对于若干已明确
3、诊断为癌症的110个病人和无癌症的190个正常人均用显微分光光度计对细胞进行检测,得到x1,x2和x3的值。这就是训练样本。 例号 x1 x2 x3 y(类别) 1 1 2 2 0 2 2 5 6 1 。 300 3 3 3 0 (3)用判别分析方法得到判别函数 根据实测资料(训练样本)用判别分析方法可建立判别函数,本例用fisher判别分析方法得到: y=x1+10x2+10x3 并确定判别准则为: 如有某病人的x1,x2,x3实测值,代入上述判别函数可得y值,y100则判断为癌症,y100则判断为癌症,yy(a2)时判为a1类,y(a1)0时判为a1类,y0时判为a2类。只需用一个线性函数
4、来判别,应用起来就更方便了。 某样品属于a1类的后验概率的计算中, 分子分母同除以exp(y(a1), 就可简写成:p(a1/s1s2sm)=exp(y(a1)/(exp(y(a1)+exp(y(a2) =1/(1+exp(-y(a1)+y(a2) =1/(1+exp(-y) 而属于a2类的后验概率为p(a2/s1s2sm)=1-p(a1/s1s2sm) 二类判别也可用回归分析来解决 -1当某样品属a1类时例如定义 y= 1当某样品属a2类时再用逐步回归分析,得到回归方程。 该回归方程可作为判别函数用于判别分类,本例中的判别准则为y0时判为a2类。通过简单的计算,该判别函数可与事先概率相等(或
5、不考虑 )的逐步判别分析得到的结果化成一致。第六节第六节 用于判别分析的用于判别分析的sassas过程及其应用实例过程及其应用实例 (一)stepdisc过程的使用 1. 功能 stepdisc过程用于逐步判别分析中对变量的剔选。本过程不能计算判别函数。用剔选后得到的变量再调用discrim过程计算判别函数等。 2. 语句 proc stepdisc 选择项; class 变量; var 变量;3. 语句说明 (1)proc stepdisc语句中主要的选择项如下:data=sas数据集名 指定用于分析的sas数据集,即训练样本slentry=p值,指定选入方程的显著性水平,默认值为0.15s
6、lstay=p值, 指定剔出方程的显著性水平,默认值为0.15start=n值, 指定var语句中前n个变量先进入方程,然后 再开始剔选include=n值,指定var语句中前n个变量必须包含在方程中simple, 打印各变量总的及每一类内的简单描述性统计量 (2)class语句指定判别分析用的分类变量名,该变量可以是数字型, 也可以是字符型。 (3)var语句指定判别分析用的各指标的变量名。 (二)discrim过程的使用 1. 功能 discrim过程用于判别分析,计算判别函数,进行组内和组外考核等。该过程不能剔选变量。 2. 语句 proc discrim 选择项; class 变量; var 变量; priors 选择项: 3. 语句说明 (1)proc discrim语句中主要的选择项如下:data=sas数据集名 指定用于训练样本的sas数据集testdata= sas数据集名 指定用于组外考核的sas数据集simple, 打印训练样本中各变量总的及每一类内的简单 描述性统计量threshold=p值,指定判别分类时最小的可接受的事后概率p 默认值为0crossvalidate 要求进行刀切法考核 (2)class语句指定判别分析用的分类变量名,该变量可以是数字型, 也可以是字符型。 (3)var语句指定判别分析
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高新技术产业科技创新成果展示表
- 外贸英语和商务谈判技巧试题库
- 人工智能辅助环保政策制定与执行协议
- 制造业企业数字化转型与绿色投资效率研究
- 《现代汉语语法结构解析:小学语文教学教案》
- 各省市地区GDP收入比较表
- DB14-T 3408-2025 羊草根茎建植草地技术规程
- 跨境物流配送服务合作协议
- 低空经济对城市规划与建设的影响
- 零售市场销售趋势预测表
- D502-15D502等电位联结安装图集
- 外研版(一起)英语二年级上册 Module 3 Unit 1 Unit 1 Do you like bananas(教案)
- 供货、安装进度计划及保证措施方案
- 糖尿病中医护理查房教学内容
- 逻辑判断推理口诀
- 关于明确公司安全生产相关责任人的通知
- 球墨铸铁管及配件理论重量表
- (自己编)丝网除沫器计算
- 城市道路人行道设施设置规范
- 小学二年级下册道德与法治-11我是一张纸-部编ppt课件
- 智能化系统维护保养计划
评论
0/150
提交评论