版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、一、基本回归诊断,1、残差诊断(残差=观测值-预测值),例某房主记录了21天中每天电表读数(kwh)以及空调使用的小时数(ac)和烘干机使用的次数(dryer),以kwh为因变量,ac和dryer为自变量拟合线性回归,用残差分析的方法进行回归诊断,判断模型中是否需要增加一些项。 进入分析员应用环境 并打开数据集 单击Statistics/Regression/Linear kwhDependent; ac,dryerExplanatory /backward(选后退法) /Residual /plot residuals vs variables (请求绘制残差图 ) Residuals/Or
2、dinary,绘制标准化残差 variables栏下选择Independents,绘制自变量的残差图 结果:要考虑dryer的二次项,例对上题数据,在INSIGHT中进行二次项的分析。 进入SAS/INSIGHT,打开数据集 Analyze/Fit(y x) kwhy acx dryerExpand(选择3次) OK 结果分析:二次项与三次项都不显著。,Type Tests与Type Test,Type III Tests 检验:所有自变量加入的情况下检测各自变量的显著性 Type I Tests 检验:加入高次项,所有的底次项才可引入。 多项式回归不宜用Type III Tests 检验。
3、在结果窗口中选择Tables/Type I Tests 结果分析:二次项显著,三次项不显著,可在结果窗口中删除三次项。,例对于学生体检数据,进行共线性诊断。 进入INSIGHT打开Children数据集 Analyze/Fit(y x) Weighty age,height,bustx Ok 结果表明应去掉截距项,再作共线性分析 Tables/collinearity Diaghostics 结果:Height与bust具有共线性,2、共线性分析,二、Logistic回归,当因变量的值是阴性与阳性、是与否的情况时,用Logistic回归分析 某种结果发生与否的概率为因变量,影响结果发生的因素为
4、自变量建立回归模型,二、Logistic回归,Logit变换:,当p在(0,1)中变化时,Logit(p)就在(-,)中变化,二、Logistic回归,Logit变换就可以将变量Y取某个值的概率p的Logit变换表示为自变量的线性函数,该模型就称为Logistic回归模型 在拟合Logistic回归模型时,是要建立因变量概率pi关于自变量的关系式,优比率,Logistic回归模型是一种概率模型,在临床医学中可用于鉴别诊断 令:,将发病的概率记为P,可知不发病的概率为1-P 令:,xi=1时的优势为:P1/(1-P1);xi=0时的优势为:P0/(1-P0),优比率,流行病学的常用指标优势比(o
5、dds ratio),即:暴露人群发病优势与非暴露人群发病优势之比 ,也称优比率。,例饮酒与食道癌发病关系的分析,1977年Tuyns等在法国llle-et-Vilaine(Brittany)地区的一所医院收集了200例食道癌患者与775例对照进行病例对照研究,探讨饮食与发病的关系,考虑到年龄这一混杂因素的干扰,按每10岁一组共分为6组。危险因素饮酒分为两个水平:每天饮酒量少于80克者为非接触(x=0),80克为接触(x=1),年龄组范围为:1组:25,2组:35,3组:45,4组:55,5组:65,6组:75 (数据集为logit),饮酒与食道癌发病关系资料(200例食道癌与775例对照数据
6、),二、Logistic回归,进入分析员应用环境 并打开数据集 选择Statistics/Regression/Logisti YDependent,xQuantitative /countFrequency 点击Model右侧的箭头,并选0(y=0为发病) ok,例50例急性淋巴细胞性白血病病人,在入院治疗时取得了外周血中的细胞数x1(千个/mm3)、淋巴结浸润等级x2(分别为0,1,2,3四级),出院后巩固治疗x3(有巩固治疗为1,无巩固治疗为0),并随访取得病人的生存时间T(月),变量Y(生存时间1年以内为0,1年以上为1),分析过程,进入分析员应用环境 并打开数据集 选择Statist
7、ics/Regression/Logisti YDependent,x1,x2,x3Quantitative 点击Model右侧的箭头,并选0(y=0) Ok 结果中有不显著的自变量,用逐步法选择自变量 /selection/stepwise selection X1,x2移出模型。结果:x3的优比为0.064,表示无巩固治疗一年内的生存时间为有巩固治疗的0.064倍。,三、判别分析,判别分析是多元统计分析中用于判别样品所属类型的一种统计分析方法 进行判别分析时通常是根据已知样本的分类及所测的指标,筛选出能提供较多信息的指标,从而建立判别方程,使其错判率最小 DISCRIM过程:用于不筛选变量的多类别判别分析 STEPDISC过程:逐步判别分析。它通过筛选变量,舍弃包含信息量少的变量,将能充分揭示各类之间判别的变量引入判别函数,DISCRIM过程,PROC DISCRIM DATA=数据集名 TESTDATA=数据集名 LIST TESTLIST ; CLA
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 综合复习与测试教学设计高中物理鲁科版2019必修 第一册-鲁科版2019
- 《烙饼问题》教学设计四年级下册数学北师大版
- 高中生法制安全2025年说课稿
- 广西崇左市、钦州市名校2023-2024学年高一上学期期末考试历史试题
- 小学信息技术第三单元 系统中的计算第12课 条件计算表格教案设计
- 环保工程技术标准
- 过梁施工工艺流程
- 高中自主招生说课稿2025年指导
- 2026年模具技术岗新员工入职培训手册
- 模具厂仓库管理员岗位职责说明书
- 合肥市庐阳区2023年小升初数学考试真题与参考答案
- 教师伦理教学课件
- 2022年版义务教育劳动新课程标准试题与答案
- 超星尔雅学习通人工智能语言与伦理(复旦大学)网课章节测试答案
- 国开大学《房屋建筑混凝土结构设计》章节小测1-4章答案
- 办公楼修缮工程施工组织设计施工方案
- LY/T 2065-2012百合种球生产技术规程
- GB/T 12241-2021安全阀一般要求
- 蓄电池安装及充放电施工方案
- 灾难救护课件
- 危险源辨识、风险评价清单(市政(管道)工程)
评论
0/150
提交评论