研究生医学统计中logistic回归.ppt_第1页
研究生医学统计中logistic回归.ppt_第2页
研究生医学统计中logistic回归.ppt_第3页
研究生医学统计中logistic回归.ppt_第4页
研究生医学统计中logistic回归.ppt_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

研究生医学统计学,Logistic regression,Logistic回归,流行病与卫生统计学系,第一节.非条件logistic回归 第二节.条件logistic回归 第三节. 应用及其注意事项,流行病与卫生统计学系,医学研究中常碰到应变量的可能取值仅有两个(即二分类变量),如发病与未发病、阳性与阴性、死亡与生存、治愈与未治愈、暴露与未暴露等,显然这类资料不满足多元(重)回归的条件,什么情况下采用Logistic回归,流行病与卫生统计学系,Brown(1980)在术前检查了53例前列腺癌患者,拟用年龄(AGE)、酸性磷酸酯酶(ACID)两个连续型的变量,X射线(X_RAY)、术前探针活检病理分级(GRADE)、直肠指检肿瘤的大小与位置(STAGE)三个分类变量与手术探查结果变量NODES(1、0分别表示癌症淋巴结转移与未转移 )建立淋巴结转移的预报模型。,实例,流行病与卫生统计学系,(一)53例接受手术的前列腺癌患者情况,流行病与卫生统计学系,(二)26例冠心病病人和28例对照进行病例对照研究,流行病与卫生统计学系,26例冠心病病人和28例对照者进行病例对照研究,流行病与卫生统计学系,一、logistic回归模型,流行病与卫生统计学系,概率预报模型,流行病与卫生统计学系,二、模型的参数估计,Logistic回归参数的估计通常采用最大似然法(maximum likelihood,ML)。最大似然法的基本思想是先建立似然函数与对数似然函数,再通过使对数似然函数最大求解相应的参数值,所得到的估计值称为参数的最大似然估计值。,流行病与卫生统计学系,参数估计的公式,流行病与卫生统计学系,三、回归参数的假设检验,流行病与卫生统计学系,优势比及其可信区间,流行病与卫生统计学系,标准化回归参数,用于评价各自变量对模型的贡献大小,流行病与卫生统计学系,SAS程序,流行病与卫生统计学系,The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates,流行病与卫生统计学系,预报模型,流行病与卫生统计学系,The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates,流行病与卫生统计学系,预报模型,流行病与卫生统计学系,四、回归参数的意义,当只有一个自变量时,以相应的预报概率 为纵轴,自变量 为横轴,可绘制出一条S形曲线。回归参数的正负符号与绝对值大小,分别决定了S形曲线的方向与形状,流行病与卫生统计学系,流行病与卫生统计学系,优势比改变exp(bj)个单位,流行病与卫生统计学系,流行病与卫生统计学系,流行病与卫生统计学系,五、整个回归模型的假设检验,流行病与卫生统计学系,似然比检验(likelihood ratio test),流行病与卫生统计学系,ROC曲线模型评价,流行病与卫生统计学系,ROC曲线模型评价,图16-2 Logistic回归预报能力的ROC曲线,流行病与卫生统计学系,六、logistic逐步回归(变量筛选),MODEL语句加入选项“ SELECTION=STEPWISE SLE=0.10 SLS=0.10;” 常采用似然比检验: 决定自变量是否引入或剔除。,流行病与卫生统计学系,模型中有X5、X6、X8, 看是否引入X1,模型含X5、X6、X8的模型的负二倍 对数似然为: 50.402 模型含X1、X5、X6、X8的模型的负二倍 对数似然为: 46.224,流行病与卫生统计学系,第二节.条件logistic回归,流行病与卫生统计学系,条件似然函数,流行病与卫生统计学系,1:3配对的例子,流行病与卫生统计学系,1:2配对的例子,流行病与卫生统计学系,表16-7条件logistic回归的SAS程序,流行病与卫生统计学系,结果,流行病与卫生统计学系,第三节 应用及其注意事项,应变量为(二项)分类的资料 (预测、判别、危险因素分析等等),流行病与卫生统计学系,注意事项,分类自变量的哑变量编码 为了便于解释,对二项分类变量一般按0、1编码,一般以0表示阴性或较轻情况,而1表示阳性或较严重情况。如果对二项分类变量按+1与-1编码,那么所得的 ,容易造成错误的解释。,流行病与卫生统计学系,西、中西、中三种疗法哑变量化,原资料,哑变量化,流行病与卫生统计学系,注意事项,2.自变量的筛选 不同的筛选方法有时会产生不同的模型。实际工作中可同时采用这些方法,然后根据专业的可解释性、模型的节约性和资料采集的方便性等,决定采用何种方法的计算结果。,流行病与卫生统计学系,注意事项,3.交互作用 交互作用的分析十分复杂,应根据临床意义与实际情况酌情使用。,流行病与卫生统计学系,注意事项,4. 多分类logistic回归 心理疾病分为精神分裂症、抑郁症、神经官能症等(名义变量nominal variables);疗效评价分为无效、好转、显效、痊愈(有序变量ordinal variables)。 参见第17章,应变量,SPSS软件计算,Analyze Regression Binary Logistic Dependent: y Covariates: x1 x8 Method: Forward Ward Save Predicted Values Probabilities Group membership Option CI for exp 95% Probability for Stepwise Entry: 0.1 Removal 0.15,DATA samp16_1; INPUT x_ray grade stage age acid nodes; CARDS; ; PROC LOGISTIC DESCENDING; MODEL nodes=x_ray grade stage age acid/RISKLIMITS; OUTPUT OUT=pred PROB=pred; PROC PRINT DATA=pred; RUN;,The SAS System 22:07 Monday, November 29, 2005 1 The LOGISTIC Procedure Model Information Data Set WORK.SAMP16_1 Response Variable nodes Number of Response Levels 2 Number of Observations 53 Model binary logit Optimization Technique Fishers scoring Response Profile Ordered Total Value nodes Frequency 1 1 20 2 0 33 Probability modeled is nodes=1.,Model Convergence Status Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics Intercept Intercept and Criterion Only Covariates AIC 72.252 60.126 SC 74.222 71.948 -2 Log L 70.252 48.126 Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr ChiSq Likelihood Ratio 22.1264 5 0.0005 Score 19.4514 5 0.0016 Wald 13.1406 5 0.0221,The SAS System 22:07 Monday, November 29, 2005 2 The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr ChiSq Intercept 1 0.0618 3.4599 0.0003 0.9857 x_ray 1 2.0453 0.8072 6.4208 0.0113 grade 1 0.7614 0.7708 0.9759 0.3232 stage 1 1.5641 0.7740 4.0835 0.0433 age 1 -0.0693 0.0579 1.4320 0.2314 acid 1 0.0243 0.0132 3.4230 0.0643,The SAS System 22:07 Monday, November 29, 2005 2 The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr ChiSq Intercept 1 0.0618 3.4599 0.0003 0.9857 x_ray 1 2.0453 0.8072 6.4208 0.0113 grade 1 0.7614 0.7708 0.9759 0.3232 stage 1 1.5641 0.7740 4.0835 0.0433 age 1 -0.0693 0.0579 1.4320 0.2314 acid 1 0.0243 0.0132 3.4230 0.0643 Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits x_ray 7.732 1.589 37.614 grade 2.141 0.473 9.700 stage 4.778 1.048 21.783 age 0.933 0.833 1.045 acid 1.025 0.999 1.051,Association of Predicted Probabilities and Observed Responses Percent Concordant 84.5 Somers D 0.694 Percent Discordant 15.2 Gamma 0.696 Percent Tied 0.3 Tau-a 0.332 Pairs 660 c 0.847 Wald Confidence Interval for Adjusted Odds Ratios Effect Unit Estimate 95% Confidence Limits x_ray 1.0000 7.732 1.589 37.614 grade 1.0000 2.141 0.473 9.700 stage 1.0000 4.778 1.048 21.783 age 1.0000 0.933 0.833 1.045 acid 1.0000 1.025 0.999 1.051,Obs no x_ray grade stage age acid nodes _LEVEL_ pr

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论