版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Logistic回归分析(Logistic Regres)主讲温州医学院预防医学系Logistic归分析解决医学研究中,有关生存与阳性等结果的产生,可能与 惯、体质、遗传、心理等许多,发病与未发病,与的、生活习有关。如何找出其中哪些对结果有影响?以及影响有多大?回Logistic回归:概率型回归用于分析某类事件发生的概率与自变量之间的关系。适用于因变量是分类变量的资料,尤其是二分类的情形。线性回归:应变量是连续型变量分类二分类logistic回归模型非条件logistic回归模型成组资料条件logistic回归模型配对资料多分类logistic回归模型内容提要非条件logistic回归数据库格
2、式Logistic回归模型的基本结构参数估计假设检验变量筛选模型拟合效果的判断条件logistic回归应用及其注意事项1、数据库格式2、Logistic 回归模型的基本结构设X1,X2,Xp是一组自变量,Y是应变量(阳性记为y1,果的概率。则:记为y0),用P表示发生阳性结exp(0 1 X1 p X p )1 exp(0 1 X1 p X p )P 11 e( 0 1 X1 p X p )Logistic函数P P) logit P ln(x0k1 P0:常数项,表示在不接触任何潜在保护条件下,效应指标发生与不发生事件的概率之比的自然对数值。j:偏回归系数,其流行病学意义是在其他自变量不变的
3、情况下,自变量Xi 每改变一个所引起logitP的改变。它与衡量影响因量。+表示,-表示保护素作用大小的比数比OR之间有一个对应的关系。Logistic回归系数的意义OR = elnOR =OR:是病例对照研究中表示疾病与之间联系强度的指标。是病例组的比值与对照组的比值之比。表示组的疾险性是非组的多少倍。,其优势比的自然对i:表示自变量每改变一个数值的改变量。例如,吸烟与肺癌的关系的研究11令吸烟肺癌x=y=00不吸非肺癌若求得:= 1,OR=e表明:吸烟患肺癌的性是不吸烟的2.71828倍。对于病、很低的慢如心脑疾等,由于P很小,优势比OR度RR的近似估计值。可以作为相对Pi (/1-Pi)
4、PiOR RRPj (/1-Pj)Pj参数估计方法:最大似然法(ML)um likelihood ,基本:先建立似然函数或对数似然函数,求似然函数或对数似然函数达到极大时参数的取值,称为参数的最大似然估计值。选入应变量选入自变量SPSS分析结果:Variableshe Equationa. Variable(s) entered on step 1: x1, x2, x3, x4, x5, x6, x7, x8.BS.E.WalddfSig.Exp(B)Satepx11x2x3 x4 x5 x6 x7 x8Constant.644.910.970.995.7413.456.3021.917-5
5、.890.4991.6691.196.8361.1841.277.9061.1461.2841.209.6771.411.880.7091.4001.4155.9631.015.591.2611.609.9194.3521.0371.9728.9191.0031.9052.4842.6372.7042.09831.6881.3526.800.003假设检验似然比检验用于比较两个模型的拟合效果Wald 检验 用于回归系数的假设检验优势比的区间估计SPSSSPSS分析结果:Variableshe Equationa. Variable(s) entered on step 1: x1, x2, x
6、3, x4, x5, x6, x7, x8.BS.E.WalddfSig.Exp(B)Satepx1.644.4991x2.910.836x3.970.906x4.9951.209x5.741.880 x63.4561.415x7.302.591x81.917.919Constant-5.8901.9721.6691.1841.146.677.7095.963.2614.3528.919111111111.196.277.284.411.400.015.609.037.0031.9052.4842.6372.7042.09831.6881.3526.800.003SPSS分析结果:Variab
7、leshe EquationSatep 1x1 x2 x3 x4 x5 x6 x7 x8Constant.644.910.970.995.7413.456.3021.917-5.890.499.836.9061.209.8801.415.591.9191.9721.6691.1841.146.677.7095.963.2614.3528.919111111111.196.277.284.411.400.015.609.037.0031.9052.4842.6372.7042.09831.6881.3526.800.003.717.482.447.253.3741.978.4251.1235.0
8、6212.79215.56828.94311.774507.6334.30341.178a. Variable(s) entered on step 1: x1, x2, x3, x4, x5, x6, x7, x8.BS.E.WalddfSig.Exp(B)95.0% C.I.for EXP(B)LowerUpper自变量筛选Forward:Conditional Forward:LRForward:Wald(应当慎用)Backward: ConditionalBackward:LRBackward:Wald(应当慎用)SPSS模型拟合效果的判断对数似然值与伪决定系数模型正确率ROC曲线对数
9、似然值对于同一数据,当数据库的自变量中不存在缺失值时,可直接用-2倍对数似然值对所建立的不同模型拟合效果进行比较。当自变量存在缺失值时,因为统计在进行计算时会把含有缺失值的能直接应用-2予以剔除,不参与统计分析。这时,不likelihood对不同模型的拟合效果进行log比较。条件Logistic回归模型适用情况:匹配设计的资料非条件logistic回归:logit P=b0 b1x1 b2x2 bk xk条件logistic回归:logit P=b1x1 b2x2 bk xk统计的操作Multinominallogistic过程只适用于1:1配对的情况,而且数据库结构与通常的格式不同分层Cox
10、模型拟合 适用范围广案例2,用12。现选某北方城市研究喉癌发病的配对的病例对照研究方法进行了取了6个可能的并节录25对数据,各的赋值说明见下表,试做条件logistic逐步回归分析。变量赋值情况变量名赋值说明X1 X2 X3 X4 X5X6无=1,偶尔=2,经常=30=1,1=2,5=3,10=4,20=5咽炎吸烟量(支/日)声嘶史摄食新鲜蔬菜Y无=1,偶尔=2,经常=3少=1,经常=2,每天=3 很少=1,少量=2,经常=3无=0,有=1摄食水果史Y对照=0,病例=1是否患喉癌Variableshe EquationBSEWalddfSig.Exp(B)x1 x2 x3 x4 x5x62.5
11、891.6882.319-3.889-.4913.5092.5021.0711.30113.314.6856.0641.0145.4081.2613.3831.06610.1701.9074.1601.041.0201.190.1701.680.6122.1372.6961.10133.414Logistic回归的应用1.2.3.4.筛选校正混杂-临床试验疾病或事件发生的概率判别应变量为分类变量的资料注意事项:该模型的自变量可以是无序分类变量、有序分类变量、定量变量。需要足够的样本含量来保障参数估计的稳定性。不能完全依赖于计算机筛选自变量。条件logistic回归模型不能用于。模型评价交互作用
12、偏差deviance和Pearson 卡方分类自变量的处理二分类自变量:一般按0、1编码,一般以0表示阴性或较轻情况,而1表示阳性或较严重情况。如果对二项分类变量按+1与-1编码,那么所得的exp(2),容易造成错误的解释。对于无序多分类自变量的处理哑变量OR对于有序多分类自变量的处理选入无序分类变量Variableshe EquationBS.E.WalddfSig.Exp(B)Stepa1 racerace(1) race(2)Constan4.9223.3233.34523.3302111.085.068.067.000.845.636-1.155.463.348.2392.3281.889.315a.Variable(s) entered on step 1: race.设置哑变量应注意:选用“其他”作为参照水平最好要有实际意义,不参照水平参照水平组应有一定的频数作保证(不少于30或50例)哑变量同进同出简答题1.Logistic回归的用途?Logistic回归模型的基本结构? e的意义2.3.案例分析题为了分析影响医院抢救急性心肌梗死(AMI)患者能否成,某医院收集了5年中所有的AMI患者的抢救病功的很多,由于篇幅有限,本例仅列出3个),史(有关共200例见下表。其中P=0表示抢救成功,P=1表示抢救;X1=1表示抢救前已发生休
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江西省南昌市2026届九年级上学期期末测试道德与法治试卷(含答案)
- 黑龙江省齐齐哈尔市部分学校2025-2026学年高一上学期1月期末英语试卷(含答案)
- 福建省宁德市2025-2026学年高三上学期期末考试语文试题(含答案)
- 马上有喜市-2026马年游园打卡、年货大集
- 有限空间作业安全培训
- 钢柱安装技术操作要领
- 钢结构工程验收标准解析
- 2026年铜陵市中医医院招聘5名护理人员笔试备考试题及答案解析
- 2026广州银行人才招聘笔试备考题库及答案解析
- 2026广东佛山市顺德区均安镇国资企业副总经理岗位招聘4人备考考试试题及答案解析
- 食品生产余料管理制度
- 2026年浦发银行社会招聘备考题库必考题
- 专题23 广东省深圳市高三一模语文试题(学生版)
- 2026年时事政治测试题库100道含完整答案(必刷)
- 2025年CFA二级公司估值真题试卷(含答案)
- 2026年肉类零食市场调查报告
- 高考成语积累+(语序不当)病句修改训练小纸条(原卷版)-2026年高考语文一轮复习讲练测
- 产权无偿划转协议书
- 2025《义务教育体育与健康课程标准(2022年版)》测试题库及答案
- 装配式建筑可行性研究报告
- 新人教部编版一年级下册生字表全册描红字帖可打印
评论
0/150
提交评论