




已阅读5页,还剩25页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Logistic回归分析(LogisticRegressionAnalysis),1,问题提出,多重线性回归分析的前提条件线性;独立;正态;等方差(Y:正态随机变量)Y为分类变量,多重线性回归不适用研究二分类因变量(如患病与未患病、阳性与阴性等)或多分类因变量与一组自变量(X1,X2,Xm,)的关系,线性回归分析方法就无能为力。,2,问题提出,Logistic回归分析可解决应变量为:二分类;无序多分类;有序多分类;本次教学主要介绍应变量为二分类的Logistic回归分析,3,分类,按设计,Logistic回归分析分为:成组:非条件Logistic回归分析配对:条件Logistic回归分析,4,Logistic回归模型,例:大肠癌患者临床病理因素对其预后可能产生影响。收集了158例经手术治疗大肠癌患者的性别、年龄、组织学分类、肿瘤大小、Dures分期、淋巴管浸润、血管浸润、5年生存状态等资料目的:预测经手术治疗大肠癌患者5年生存概率。,5,变量,性别:女=0,男=1年龄:实测值组织学分类:乳头状腺癌=0,管状腺癌=1肿瘤大小:6cm及以上=0,6cm以下=1Dures分期:A=1,B=2,C=3,D=4)淋巴管浸润:无=0,有=1血管浸润:无=0,有=15年生存状态:存活=0,死亡=1,6,Logistic回归模型,因变量为二分类变量,不满足线性回归分析条件,首先进行数据变换:这个变换将取值在0-1间的值转换为值域在()的值。建立与X的线性模型:,7,Logistic回归模型,求解右端在数学上属于Logistic函数,所以称其为Logistic回归模型。,8,模型参数,0:常数项(截距),表示模型中所有自变量均为0时,的值;1,2、P:回归系数,表示在控制其他自变量时,自变量变化一个单位所引起的改变量。,9,模型参数,10,模型参数,一般地,根据多个自变量的回归模型,在其他变量取值不变的情形下,与变量Xj的二个水平C1与C2(C2C1)相对应的事件的优势比为:当XJ的二个水平相差1个单位时,,11,模型参数,当变量Xj的回归系数j0时,Xj增加1个单位后与增加前相比,事件的优势比ORj1,表明Xj为危险因素;j0时,Xj增加1个单位后与增加前相比,事件的优势比ORj1,表明Xj为保护因素;j=0,Xj增加1个单位后与增加前相比,事件的优势比,ORj=1,表明Xj对结果变量不起作用。,12,Logistic回归的参数估计,Logistic回归模型中的参数1,2、P需要通过样本资料,按照一定方法进行估计,估计量记为b1,b2、bP。参数估计方法有多种,极大似然估计(MLE)最为常用,13,Logistic回归的参数估计,极大似然估计基本思想选择能有最大概率获得当前样本的参数值作为参数的估计值。,14,假设检验,检验整个模型:检验因变量与自变量之间的关系能否用所建立的回归方程来表示;单个回归系数是否为0:检验单个自变量对因变量的影响是否存在。最常用的检验方法有似然比检验WALD检验,15,假设检验-似然比检验,似然比检验常用于对整个模型的检验,检验的假设为H0:所有自变量的总体回归系数均为0H1:自变量的总体回归系数不全为0,16,假设检验-似然比检验,假设模型A含有P个自变量,相应的达到极大的对数似然函数值LnL0;模型B是在模型A的P个自变量基础上新加入一个或几个自变量,自变量个数变为Q,相应的达到极大的对数似然函数值LnL1;比较模型A与模型B的极大似然函数值,构建似然比检验统计量在H0成立的条件下,如果样本量较大,G近似地服从自由度为Q-P的2分布,17,假设检验-WALD检验,WALD检验常用于对单个回归系数的检验,检验的假设为:H0:j=0H1:j0WALD检验统计量为等价于2近似地服从自由度为1的2分布,18,回归系数的区间估计,总体回归系数的置信区间为OR的置信区间为,19,条件Logistic回归模型,医学研究中,常采用匹配设计,即为病例组的每一个研究对象匹配一个或几个有同样特征的未患病者,作为该病例的对照,这样,除了研究因素外,病例与对照的其他特征相同,从而消除“其他特征”的混杂作用。常用的匹配形式为1:1,即一个病例匹配1个对照。,20,21,条件Logistic回归模型,例为探讨女性乳腺癌危险因素,研究者在某市19961997年间确诊的女性乳腺癌患者中随机抽取350名病例,对每一病例配以一名性别相同、年龄差别不超过2.5岁的对照。收集的信息包括:文化程度(大专以下:0,大专及以上:1)、体质指数(小于等于27:0,大于27:1)、近年精神压抑(无:0,有:1)、乳腺良性疾病史(无:0,有:1)、恶性肿瘤家族史(无:0,有:1)、初潮年龄(大于等于14岁:0,小于14岁:1)、哺乳史(有:0,无:1),22,23,假定同一层的2个人中,只有1人患病。在只有1人患病的条件下,恰好第1个人“患病”而第2个人“未患病”的条件概率为,24,若自变量扩展到个P个,25,条件Logistic回归模型,公式左端为条件概率,相应的Logistic回归称为条件回归,前述非匹配资料的Logistic回归则称为非条件回归;条件Logistic模型中,不含常数项0。,26,应用,Logistic回归分析广泛用于流行病学中前瞻性的队列研究、回顾性的病例-对照研究以及现况研究。,27,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年智能制造工程技术人员初级笔试预测题
- 2025年安全工程师招聘常见问题解析
- 2025年安全培训题库案例解析大全
- 2025年安全管理技能题及答案集
- 九江市瑞昌市2024-2025学年中考数学模拟试题含解析
- 2025年项目经理面试模拟题及答案详解手册
- 加盟商庆典致辞模板
- 2025年司法鉴定助理笔试模拟题及解析物证
- 2025年企业管理顾问资格认证考试试题及答案解析
- 2025年农林专业采伐技师水平考核试题及答案解析
- 自考英语一单词
- 派出所纪律作风整顿工作总结
- 新人教版高中物理选择性必修第一册课时作业及答案
- 呼吸系统疾病所致精神障碍
- 青光眼小梁切除手术
- 2024(统编版)语文六年级上册 开学第一课 课件
- 招标代理服务服务方案
- 风力发电技术的发展现状和未来发展趋势
- 财税公司报告
- 脱发患者的头皮及头发护理方法
- 球囊扩张支架植入术
评论
0/150
提交评论