




已阅读5页,还剩34页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Logistic回归 首都医科大学流行病与卫生统计学系罗艳侠 1 Logistic回归分类 按照反应变量类型二分类反应变量的logistic回归多分类有序反应变量的logistic回归多分类无序反应变量的logistic回归按照研究设计类型非条件logistic回归 研究对象未经匹配 条件logistic回归 研究对象经过匹配 2 一 基本概念和原理 1 应用背景Logistic回归模型是一种概率模型 适合于病例 对照研究 随访研究和横断面研究 且结果发生的变量取值必须是二分的或多项分类的 可用影响结果变量发生的因素为自变量与因变量 建立回归方程 3 设资料中有一个因变量y p个自变量x1 x2 xp 对每个实验对象共有n次观测结果 可将原始资料列成表1形式 2 Logistic回归模型的数据结构 4 表1Logistic回归模型的数据结构实验对象yX1X2X3 XP1y1a11a12a13 a1p2y2a21a22a23 a2p3y3a31a32a33 a3p nynan1an2an3 anp 5 表2肺癌与危险因素的调查分析例号是否患病性别吸烟年龄地区101030020014613100351 30100261注 是否患病中 0 代表否 1 代表是 性别中 1 代表男 0 代表女 吸烟中 1 代表吸烟 0 代表不吸烟 地区中 1 代表农村 0 代表城市 6 表3配对资料 1 1 对子号病例对照x1x2x3x1x2x3113010120311303012020 10222000注 X1蛋白质摄入量 取值 0 1 2 3X2不良饮食习惯 取值 0 1 2 3X3精神状况 取值 0 1 2 7 3 Logistic回归模型 令 y 1发病 阳性 死亡 治愈等 y 0未发病 阴性 生存 未治愈等 将发病的概率记为P 它与自变量x1 x2 xp之间的Logistic回归模型为 8 经数学变换得定义Logistic变换Logistic回归方程 9 4 回归系数 i的意义流行病学的常用指标优势比 oddsratio OR 或称比数比 定义为 暴露人群发病优势与非暴露人群发病优势之比 即Xi的优势比为 10 解释 设第i个因素的回归系数为bi 表示当有多个自变量存在时 其它自变量固定不变的情况下 自变量Xi每增加一个单位时 所得到的优势比的自然对数 也就是其它自变量固定不变的情况下 自变量Xi每增加一个单位时 影响因变量Y发生的倍数 当bi 0时 对应的优势比 oddsratio 记为ORi ORi exp bi 1 说明该因素是危险因素 当bi 0时 对应的优势比ORi exp bi 1 说明该因素是保护因素 11 二 Logistic回归类型及其实例分析 1 非条件Logistic回归当研究设计为队列研究 横断面研究或成组病例对照研究时 要用非条件Logistic回归 12 例为了探讨糖尿病与血压 血脂等因素的关系 某研究者对56例糖尿病病人和65例对照者进行病例 对照研究 收集了性别 年龄 学历 体重指数 家族史 吸烟 血压 总胆固醇 甘油三酯 高密度脂蛋白 低密度脂蛋白11个因素的资料 完整数据见SPSS数据文件 2020 3 19 13 2020 3 19 14 表2糖尿病影响因素赋值说明 2020 3 19 15 建立数据库 2020 3 19 16 多因素的logistic回归 2020 3 19 17 1 基本数据描述 2 因变量的编码 2020 3 19 18 回归模型的整体检验 2020 3 19 19 2020 3 19 20 Logistic回归模型的拟合优度检验 2020 3 19 21 Logistic回归模型的预测准确度 2020 3 19 22 2020 3 19 23 逐步Logistic回归分析 1 向前法 forwardselection 开始方程中没有变量 自变量由少到多一个一个引入回归方程 按自变量对因变量的贡献 P值的大小 由小到大依次挑选 变量入选的条件是其P值小于规定进入方程的P界值Enter 缺省值P 0 05 24 2 后退法 backwardselection 开始变量都在方程中 然后按自变量因变量的贡献 P值的大小 由大到小依次剔除 变量剔除的条件是其P值小于规定的剔除标准Remove 缺省值p 0 10 25 3 逐步回归法逐步引入 剔除法 stepwiseselection 前进逐步引入 剔除法是在前进法的思想下 考虑剔除变量 因此有两个p界值Enter Remove 26 SPSS无论是条件还是非条件Logistic回归 在多变量分析时均可以采用逐步回归方法 实现的方法是 在method后加选项 Enter 所有变量一次全部进入方程 Forward 逐步向前法Backward 后退法变量移出方程所采取的检验方法 Conditional LR Ward 尽量不用 27 调试法 P从大到小取值0 5 0 1 0 05 一般实际用时 Enter Remove应多次选取调整 28 2 条件logistic回归分析 配对设计的类型 1 1 1 m n m 可采用分层COX模型来拟合 例如 某市调查三种生活因素与胃癌的关系 资料见表5 29 表5配对资料 1 1 对子号病例对照x1x2x3x1x2x3113010120311303012020 10222000注 X1蛋白质摄入量 取值 0 1 2 3X2不良饮食习惯 取值 0 1 2 3X3精神状况 取值 0 1 2 30 配对Logistic回归SPSS操作步骤 Analyze Survival COXRegression Time框 outcome Status框 Status DefineEvent Singlevalue1 continue Covariates框 x1 x2 x3 Method ForwardStepwise LikelihoodRatio Strata框 id Options atlaststep ok 31 32 33 34 35 在本例中不良饮食习惯X2 取值 0 1 2 3 b 1 727 OR 5 624 表示不良饮食习惯 每增加一个单位时 发病的可能性提高到5 624倍 精神状况X3 取值 0 1 2 b 2 284 OR 9 821 表示精神状况不良影响发病 精神状况每增加一个单位时 发病的可能性提高到2 284倍 36 Logistic回归的注意事项 1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 砀山一中会考试卷及答案
- 淳安县二年级试卷及答案
- 建筑工程师职业道德与质量控制计划
- 博物馆2025年展览策划计划
- 小学实验室资源管理与分配计划
- 新北师大版五年级数学课堂互动计划
- 三年级图书馆阅读推广计划
- 青蓝结对科技创新项目计划
- 线上教学环境下班主任沟通技巧提升计划
- 2025年度急诊科患者沟通技巧培训计划
- 2025年河北承德辰飞供电服务有限公司招聘笔试参考题库含答案解析
- 视觉训练原理与概述吴飞课件
- 中药药膳餐厅连锁经营行业深度调研及发展战略咨询报告
- 深圳高级中学(集团)2025届高三第三次诊断考数学试题+答案
- 黄金卷02(天津专用)备战2025年中考英语模拟卷
- 个人对赌协议合同范本
- 公立医院成本核算指导手册
- 第16课《有为有不为》公开课一等奖创新教学设计
- 第10章 Web服务器与Ajax
- 2025届高考物理二轮复习:微专题6 电磁场中的空间立体问题和摆线问题-专项训练 【含答案】
- DB3311T 183-2021 急流救援人员培训技术规范
评论
0/150
提交评论