已阅读5页,还剩81页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Logistic回归分析,内容提要,非条件logistic回归条件logistic回归无序多分类logistic回归有序多分类logistic回归,非条件logistic回归模型,“子宫内膜癌”的危险因素研究横断面研究病例对照设计队列设计,非条件logistic回归模型,子宫内膜癌的病例对照研究,子宫内膜癌的病例对照研究变量编码,非条件logistic回归模型,非条件logistic回归模型,研究目的:X1,X2,X3等因素对子宫内膜癌有无影响?建立Y与X的多重线性回归模型?,(取值0和1),非条件logistic回归模型,建立p(Y=1/X)与X的多重线性回归模型?,(取值范围01),非条件logistic回归模型,Logit(P),P,非条件logistic回归模型,建立logit(p)与X的多重线性回归模型:,(取值范围-+),优势(odds),非条件logistic回归模型,Logistic回归模型:,p(Y=1/X=1)=a/(a+b);p(Y=0/X=1)=b/(a+b)p(Y=1/X=0)=c/(c+d);p(Y=0/X=0)=d/(c+d),非条件logistic回归模型,用于队列研究,非条件logistic回归模型,优势比(oddsratio),非条件logistic回归模型,常数项表示当所有自变量均为0时优势的对数。队列研究中,表示基线状态下,个体的发病率;病例对照研究中,表示基线状态下,病例在研究对象中所占比例;横断面研究中,表示基线状态下,个体的患病率。,回归系数表示当其它自变量固定不变时,X每改变一个单位,优势对数的改变量(优势比的对数)。,非条件logistic回归模型,子宫内膜癌的病例对照研究,P1:病例组中暴露比例P0:对照组中暴露比例,P1/1-P1:病例组中暴露优势P0/1-P0:对照组中暴露优势,非条件logistic回归模型,可以证明:病例对照研究中的不同疾病状态下暴露于危险因素这一事件的优势比(OR)等于队列研究中不同暴露水平下发病这一事件的优势比;在发病率很低的情况下,后者接近相对危险度。这两点是病例对照研究可用于病因学研究的重要理论依据。,非条件logistic回归模型,用于病例对照研究,表示X每改变一个单位,logit(p)的改变量;OR表示暴露者发病的危险性是非暴露者的若干倍。,非条件logistic回归模型,X为两分类变量(取值为1和0)时,暴露者发病的危险性是非暴露者的exp()倍;X为等级变量(0,1,2,3)时,X每增加一个等级,发病的危险性是前一个等级的exp()倍;X为连续变量时,X每增加1,发病的危险性是增加前的exp()倍(注意实际意义);X为无序多分类变量时,采用哑变量形式。,非条件logistic回归模型,参数估计最大似然估计(maximumlikelihoodestimate,MLE)先建立似然函数或对数似然函数,求似然函数或对数似然函数达到极大时参数的取值,称为参数的最大似然估计值。,非条件logistic回归模型,例四格表资料的求解,四格表的似然函数,极大似然求解,非条件logistic回归模型,优势比估计置信区间,非条件logistic回归模型,假设检验似然比检验(最可靠)G=-2(lnL1-lnL2)G服从X2分布,自由度两模型自变量个数差。,非条件logistic回归模型,似然比检验检验模型有无统计学意义模型1:不含协变量;模型2:含协变量比较两个模型的拟合效果模型1和模型2可嵌套,也可不嵌套比较单个变量有无统计学意义模型1:不含该变量;模型2:含该变量,非条件logistic回归模型,Wald检验(较保守)检验单个回归系数有无统计学意义,例食道癌危险因素研究,在食道癌危险因素研究中,采用病例-对照设计,调查了200个食道癌患者和788个非食道癌患者,调查因素及编码如下。,logistic回归系数的解释,12个logistic回归模型及其对数似然函数值,似然比检验,检验变量ALC是否有统计学意义:模型3与模型1G2-494.74421(-422.42460)144.6392,=1,P0.001,检验在控制AGE的影响后,变量ALC是否有统计学意义:模型5与模型2G2-451.09778(-375.674484)150.8466,=1,P0.001,检验在控制AGE和TOB两变量的影响后,ALC是否有统计学意义:模型7与模型8G2-416.34959(-365.15673)102.3858,=1,PChiSqLikelihoodRatio21.72963ChiSqIntercept12.08580.351335.2624ChiSqLikelihoodRatio197.53034.0001Score183.46794.0001Wald131.34584ChiSqIntercept12.15150.345038.8977.0001age11-1.97190.370528.3306.0001age21-2.48710.357948.2970.0001age31-2.74090.362757.0930.0001drink11.68030.189378.7966.0001,OddsRatioEstimatesPoint95%WaldEffectEstimateConfidenceLimitsage10.1390.0670.288age20.0830.0410.168age30.0650.0320.131drink5.3673.7047.778,条件logistic回归,用于配比的病例对照研究控制混杂因素,1:m配比设计的资料格式,软组织肉瘤与接触苯氧乙酸或氯酚的原始数据,2=7.2,P=0.0073。,软组织肉瘤与接触苯氧乙酸或氯酚的频数表数据,个体A患病概率为PA,个体B患病概率为PB,条件logistic回归,条件logistic回归,一对中有一人患病的概率一对中有一人患病的条件下,恰好是A患病的概率,条件logistic回归,条件logistic回归,没有常数项回归系数解释同非条件logistic回归模型不能做预测,只能做因素分析,SAS程序,procphreg;modely=x1-x9/ties=discrete;strataid;run;,无序多分类logistic回归,因变量Y:无序多分类例如:病例组医院对照和社区人群对照多个病例组(肝癌,胃癌,食管癌)共享一个对照,y=1表示A类,y=2表示B类,y=0表示C类。设C类为参照组。,无序多分类logistic回归,无序多分类logistic回归,无序多分类logistic回归,产后大出血与妊高症的关系,无序多分类logistic回归,logitP宫/对-1.6206+0.889755xlogitP胎/对-3.2806+1.776555xe0.889755=2.4345331e1.776555=5.9094650,无序多分类logistic回归,无序多分类logistic回归,X对logit(Y=1/X)的影响和logit(Y=2/X)的影响是否相同?logitP宫/对-1.6396+1.0952xlogitP胎/对-3.1865+1.0952x似然比检验G=-2(lnL1-lnL2)=2.4964,P=0.1141合并ORexp(1.0952)=2.9898,两类产后大出血与妊高症、人流史的关系,无序多分类logistic回归,无序多分类logistic回归,logitP宫/对-1.5548+0.9483x1-0.3882x2logitP胎/对-3.5489+1.5972x1+0.9375x2log-likelihood=-544.4177,无序多分类logistic回归,限制条件1121:logitP宫/对-1.5660+1.1100 x1-0.4077x2logitP胎/对-3.4968+1.1100 x1+0.9841x2log-likelihood=-545.0718,G2=2-544.4177-(-545.0718)=1.3082,P=0.2527,无序多分类logistic回归,无序多分类logistic回归,限制条件120:logitP宫/对-1.6206+0.8898x1logitP胎/对-3.5641+1.5900 x1+1.0059x2log-likelihood=-545.7795,G2=2-544.4177-(-545.7795)=2.7236,P=0.0989,无序多分类logistic回归,SAS程序:Proccatmod;Weightf;Directx1x2;Modely=x1x2;Run;,有序多分类logistic回归,因变量Y:有序多分类例如:治疗效果:治愈、显效、有效、无效住院费用:高、中、低,设结果变量y为k个等级的有序变量,k个等级分别用1,2,k表示。累积概率(cumulativeprobability),有序多分类logistic回归,有序多分类logistic回归,k等级分为两类:1,j与j+1,k在这两类的基础上定义的logit表示:属于后k-j个等级的累积概率与前j个等级的累积概率的优势的对数,故该模型称为累积优势模型(cumulativeoddsmodel)。,回归系数i表示自变量xi每改变一个单位,y值提高一个及一个以上等级之优势比的对数值。,有序多分类logistic回归,有序多分类logistic回归,模型假定:第一种:无效,有效、显效、治愈第二种:无效、有效,显效、治愈第三种:无效、有效、显效,治愈无论对哪种分法,治疗方案的效应是相同的。即自变量的回归系数与分割点j无关。,有序多分类logistic回归,儿童智力等级与母亲文化程度的关系,有序多分类logistic回归,有序多分类logistic回归,x=1时,有序多分类logistic回归,二分类结果的回归第一种,1,2、3、4,得:=1.4653,=0.6309第二种,1、2,3、4,得:=1.2143,=0.6279第三种,1、2、3,4,得:=3.6844,=0.7197,有序多分类logistic回归,营养与智力的关系,有序多分类logistic回归,单因素分析结果,有序多分类logistic回归,多因素分析结果,OR0/1=0.7355OR2/1=0.6795,有序多分类logistic回归,SAS程序:Proclogistic;Freqf;Modely=x1x2/scale=noneaggregate;Run;,logistic回归的应用条件独立性。各观察对象间是相互独立的。logitP与自变量的关系是线性关系。累积比数logistic回归模型假设,自变量的回归系数与分割点j无关。可通过建立多个二分类的logistic回归模型来考察。队列资料,建议用Poisson回归。,Logistic回归的正确应用,回归系数的检验似然比检验:最可靠Wald检验:未考虑各因素的综合作用,当存在共线性时,结果不可靠。故在筛选变量时应慎重。可信区间是基于Wald统计量计算的。比分检验。与似然比检验一致在对混杂因素进行分析时,如协变量对回归系数的影响较
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年航运专员岗位招聘面试参考试题及参考答案
- 多模态影像诊断精度-洞察与解读
- 2025年创业公司首席技术官岗位招聘面试参考试题及参考答案
- 储能电站试题题库及答案
- 验电笔实操考试题及答案
- 2025年信息管理员岗位招聘面试参考题库及参考答案
- 2025年互动媒体设计师岗位招聘面试参考试题及参考答案
- 国际市场场地准备策略研究-洞察与解读
- 2025年汽车销售经理岗位招聘面试参考试题及参考答案
- 2025年研发项目主管岗位招聘面试参考试题及参考答案
- 12D101-5110KV及以下电缆敷设工程
- 《平方差公式》说课课件
- 《PDCA培训教材》课件
- 作为大学生如何践行总体国家安全观1500字
- 07第七讲 发展全过程人民民主
- 数独题目中级90题(后附答案)
- 宁骚公共政策学
- 机电安装工程预留预埋施工方案改用于上传
- 第9章 钢中的回火转变
- 门诊病历管理规定
- 腹直肌分离康复(产后康复课件PPT)
评论
0/150
提交评论