各种回归模型适用条件,logistic回归.ppt_第1页
各种回归模型适用条件,logistic回归.ppt_第2页
各种回归模型适用条件,logistic回归.ppt_第3页
各种回归模型适用条件,logistic回归.ppt_第4页
各种回归模型适用条件,logistic回归.ppt_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

LOGISTIC 回归 线性模型一般线性模型 线线性回归归方差分析协协方差分析 响应变应变 量 连续连续 ,正态态连续连续 ,正态态连续连续 ,正态态 解释变释变 量连续连续离散连续连续 和离散 连连接函数恒等式恒等式恒等式 SAS实现实现 REG/GLM MIXED ANOVA /MIXED GLM / GENMOD GLM / MIXED GENMOD 线性模型广义线性模型 logistic回归归对对数线线性模型 响应变应变 量 离散型, B(n,)事件发发生频频数 解释变释变 量 离散型,连续连续 型分类变类变 量 联联接函数logit lnP/(1-P)log 线性模型的条件 LINE L Linear I Independence N Normal distribution E Equal variance LOGISTIC 模型 二值变量(0,1)资料的logit变换 设P为事件发生的概率 事件发生的优势odds和 样本率的关系 图 1 事件发生的优势odds和样本率的关系 图 2 logit 函数图 图 2 logit 函数图 图 3 logistic曲线 例1. 饮酒与高血压 年龄组龄组25357585 高血压压+ 饮饮 + 酒 1942650 01065164831 Data a; Input y drink a1 a2 a3 a4 a5 count; Cards; 1 1 0 0 0 0 0 1 1 0 0 0 0 0 0 0 1 1 1 0 0 0 0 4 1 0 1 0 0 0 0 5 1 1 0 1 0 0 0 25 1 0 0 1 0 0 0 21 1 1 0 0 1 0 0 42 1 0 0 0 1 0 0 34 1 1 0 0 0 1 0 19 1 0 0 0 0 1 0 36 1 1 0 0 0 0 1 5 1 0 0 0 0 0 1 8 0 1 0 0 0 0 0 9 0 0 0 0 0 0 0 106 0 1 1 0 0 0 0 26 0 0 1 0 0 0 0 164 0 1 0 1 0 0 0 29 0 0 0 1 0 0 0 138 0 1 0 0 1 0 0 27 0 0 0 0 1 0 0 138 0 1 0 0 0 1 0 18 0 0 0 0 0 1 0 88 0 1 0 0 0 0 1 0 0 0 0 0 0 0 1 31 ; proc logistic descending; freq count; model y=a1 a2 a3 a4 a5 drink; run; S A S 程 序 1 例1 SAS结果解释-变量赋值 Response Profile Ordered Total Value y Frequency 1 1 200 2 0 774 Probability modeled is y=1. 模型中假(哑)变量的定义问题 年龄龄 组组 25354555657585 Age123456 a1010000 a2001000 a3000100 a4000010 a5000001 模型中假变量的向量表示 或 参数估计及模型检验 最大似然法:使似然函数L达到最大。 拟合优度检验: H0:模型拟合观察资料; H1:模型不拟合观察资料。 拟合优度检验统计量: -2ln(L) 在大样本条件下近似服从=N-m-1的2分布 变量筛选 似然比检验(最常用) 记分检验: 统计量:SCORE (公式略) Wald检验 例1 模型检验统计量 Model Fit Statistics Intercept Intercept and Criterion Only Covariates AIC 991.029 802.456 SC 995.910 836.626 -2 Log L 989.029 788.456 例1 模型检验结果 Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr ChiSq Likelihood Ratio 200.5731 6 ChiSq Intercept 1 -5.0534 1.0094 25.0637 ChiSq Ratio x1 1 0.78547 0.25686 9.3513 0.0022 2.193 x2 1 0.81411 0.30679 7.0420 0.0080 2.257 例2 条件logistic sas结果变量筛选 Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr ChiSq Likelihood Ratio 22.0017 2 ChiSq Ratio x1 1 0.82351 0.26700 9.5130 0.0020 2.278 x2 1 0.82561 0.31141 7.0290 0.0080 2.283 x3 1 0.49890 0.51744 0.9296 0.3350 1.647 有序多分类logistic模型 累积logistic模型: 设结果变量y有c个等级, 如 1显效;2有效;3无效 则用c-1个方程描述y与x的关系 累 积 模 型 程 序 3 data a; input y x1 x2 count; cards; 1 1 1 16 1 0 1 5 2 1 1 5 2 0 1 2 3 1 1 6 3 0 1 7 1 1 0 6 1 0 0 1 2 1 0 7 2 0 0 0 3 1 0 19 3 0 0 10 ; proc logistic; freq count; model y= x1 x2/scale=none aggregate; run; X1 性别 x2 方法 y 疗效: 1 显效 2 有效 3无效 有序多分类变量赋值 Response Profile Ordered Total Value y Frequency 1 1 28 2 2 14 3 3 42 累积logistic模型参数估计例 Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Sq Pr ChiSq Intercept 1 1 -2.6671 0.5997 19.7800 ChiSq Intercept 1 -0.9826 0.5707 2.96 0.0851 2 -0.3461 0.5413 0.41 0.5226 x1 1 0.6281 0.1799 12.19 0.0005 2 0.3454 0.1728 4.00 0.0456 x2 1 -0.6494 0.2833 5.26 0.0219 2 -0.6352 0.2725 5.4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论