




已阅读5页,还剩71页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 第十六章Logistic回归分析 Logisticregression 2 复习多元线性回归 multiplelinearregression 在医学实践中 常会遇到一个应变量与多个自变量数量关系的问题 如医院住院人数不仅与门诊人数有关 而且可能与病床周转次数 床位数等有关 儿童的身高不仅与遗传有关还与生活质量 性别 地区 国别等有关 人的体表面积与体重 身高等有关 3 表 多元线性回归分析的数据结构实验对象yX1X2X3 XP1y1a11a12a13 a1p2y2a21a22a23 a2p3y3a31a32a33 a3p nynan1an2an3 anp 其中 y取值是服从正态分布 4 多元线性回归模型 通过实验测得含有p个自变量x1 x2 x3 xp及一个因变量y的n个观察对象值 利用最小二乘法原理 建立多元线性回归模型 其中b0为截距 b1 b2 bp称为偏回归系数 bi表示当将其它p 1个变量的作用加以固定后 Xi改变1个单位时Y将改变bi个单位 5 logisticregressionanalysis Logistic回归分析及其应用 6 一 基本概念和原理 1 应用背景Logistic回归模型是一种概率模型 适合于病例 对照研究 随访研究和横断面研究 且结果发生的变量取值必须是二分的或多项分类 可用影响结果变量发生的因素为自变量与因变量 建立回归方程 7 设资料中有一个因变量y p个自变量x1 x2 xp 对每个实验对象共有n次观测结果 可将原始资料列成表2形式 2 Logistic回归模型的数据结构 8 表2Logistic回归模型的数据结构实验对象yX1X2X3 XP1y1a11a12a13 a1p2y2a21a22a23 a2p3y3a31a32a33 a3p nynan1an2an3 anp 其中 y取值是二值或多项分类 表3肺癌与危险因素的调查分析例号是否患病性别吸烟年龄地区111030021014613000351 30000261注 是否患病中 0 代表否 1 代表是 性别中 1 代表男 0 代表女 吸烟中 1 代表吸烟 0 代表不吸烟 地区中 1 代表农村 0 代表城市 表4配对资料 1 1 对子号病例对照x1x2x3x1x2x3113010120311303012020 10222000注 X1蛋白质摄入量 取值 0 1 2 3X2不良饮食习惯 取值 0 1 2 3X3精神状况 取值 0 1 2 11 Logistic回归 Logistic回归与多重线性回归联系与区别 联系 用于分析多个自变量与一个因变量的关系 目的是矫正混杂因素 筛选自变量和更精确地对因变量作预测等 区别 线性模型中因变量为连续性随机变量 且要求呈正态分布 Logistic回归因变量的取值仅有两个 不满足正态分布 12 3 Logistic回归模型 令 y 1发病 阳性 死亡 治愈等 y 0未发病 阴性 生存 未治愈等 将发病的概率记为P 它与自变量x1 x2 xp之间的Logistic回归模型为 可知 不发病的概率为 经数学变换得 定义 为Logistic变换 即 14 4 回归系数 i的意义流行病学的常用指标优势比 oddsratio OR 或称比数比 定义为 暴露人群发病优势与非暴露人群发病优势之比 即Xi的优势比为 故对于样本资料OR exp 95 置信区间为 可见是影响因素Xi增加一个单位所引起的对数优势的增量 反映了其对Y作用大小 如果要比较不同因素对Y作用大小 需要消除变量量纲的影响 为此计算标准化回归系数 5 假设检验 1 回归方程的假设检验H0 所有H1 某个计算统计量为 G 2lnL 服从自由度等于n p的分布 2 回归系数的假设检验H0 H1 计算统计量为 Wald 自由度等于1 17 二 Logistic回归类型及其实例分析 1 非条件Logistic回归当研究设计为队列研究 横断面研究或成组病例对照研究时 可以用非条件Logistic回归 18 实例1 某研讨究者调查了30名成年人 记录了同肺癌发病的有关因素情况 数据见表4 其中是否患病中 0 代表否 1 代表是 性别中 1 代表男 0 代表女 吸烟中 1 代表吸烟 0 代表不吸烟 地区中 1 代表农村 0 代表城市 试分析各因素与肺癌间的关系 19 表5肺癌与危险因素的调查分析例号是否患病性别吸烟年龄地区111030021014613000351 30000261注 是否患病中 0 代表否 1 代表是 性别中 1 代表男 0 代表女 吸烟中 1 代表吸烟 0 代表不吸烟 地区中 1 代表农村 0 代表城市 20 SPSS操作步骤 Analyze Regression BinaryLogistic Dependent框 y Covariates框 x1 x2 ok 非条件Logistic回归SPSS操作步骤 21 22 23 结果表明 性别 吸烟 年龄三个因素都与肺癌有关 由于在对某一因素进行单因素分析时没有控制其它因素的干扰 因此结果不可靠 单因素分析的结果 24 多因素分析的结果 25 26 由上最大似然估计分析知因素X2 吸烟 X3 年龄 对肺癌的发生有影响 所得的回归方程为 Logit P 9 7544 2 5152X1 3 9849X2 0 1884X3 1 3037X4 27 2 条件logistic回归分析 配对设计的类型 1 1 1 m n m 可采用分层COX模型来拟合 例如 某市调查三种生活因素与胃癌的关系 资料见表5 表6配对资料 1 1 对子号病例对照x1x2x3x1x2x3113010120311303012020 10222000注 X1蛋白质摄入量 取值 0 1 2 3X2不良饮食习惯 取值 0 1 2 3X3精神状况 取值 0 1 2 29 配对Logistic回归SPSS操作步骤 Analyze Survival COXRegression Time框 outcome Status框 Status DefineEvent Singlevalue1 continue Covariates框 x1 x2 x3 Strata框 id Options atlaststep ok 30 31 32 33 34 35 36 37 3 逐步Logistic回归分析 1 向前法 forwardselection 开始方程中没有变量 自变量由少到多一个一个引入回归方程 按自变量对因变量的贡献 P值的大小 由小到大依次挑选 变量入选的条件是其P值小于规定进入方程的P界值Enter 缺省值P 0 05 38 2 后退法 backwardselection 开始变量都在方程中 然后按自变量因变量的贡献 P值的大小 由大到小依次剔除 变量剔除的条件是其P值小于规定的剔除标准Remove 缺省值p 0 10 39 3 逐步回归法逐步引入 剔除法 stepwiseselection 前进逐步引入 剔除法是在前进法的思想下 考虑剔除变量 因此有两个p界值Enter Remove 40 无论是条件还是非条件Logistic回归 在多变量分析时均可以采用逐步回归方法 实现的方法是 在model后加选项 selection forward backward或stepwise再给出SLE SLS的界值 调试法 P从大到小取值0 5 0 1 0 05 一般实际用时 SLE SLS应多次选取调整 41 解释 设第i个因素的回归系数为bi 表示当有多个自变量存在时 其它自变量固定不变的情况下 自变量Xi每增加一个单位时 所得到的优势比的自然对数 也就是其它自变量固定不变的情况下 自变量Xi每增加一个单位时 影响因变量Y 0发生的倍数 当bi 0时 对应的优势比 oddsratio 记为ORi ORi exp bi 1 说明该因素是危险因素 当bi 0时 对应的优势比ORi exp bi 1 说明该因素是保护因素 42 在本例中不良饮食习惯X2 取值 0 1 2 3 b 1 2218 OR 3 393 表示不良饮食习惯是危险因素 精神状况X3 取值 0 1 2 b 2 2947 OR 9 922 表示精神状况是危险因素 43 SPSS无论是条件还是非条件Logistic回归 在多变量分析时均可以采用逐步回归方法 实现的方法是 在method后加选项 Enter 所有变量一次全部进入方程 Forward 逐步向前法Backward 后退法变量移出方程所采取的检验方法 Conditional LR Ward 尽量不用 44 45 二分类Logistic回归 46 SPSS软件实现方法 File Open 相应数据 已存在 Analyze Regression BinaryLogistic Dependent y Covariates 自变量 Mothod 逐步回归方法 Specifymodel 单因素或多因素 save 欲保存的内容 Options 输出选项 OK 47 调试法 P从大到小取值0 5 0 1 0 05 一般实际用时 Enter Remove应多次选取调整 48 Block1 Method ForwardStepwise LikelihoodRatio 49 50 51 52 53 54 4 Logistic回归 Logistic回归种类 55 对于成组资料的非条件Logistic回归 两分类反应变量的Logistic回归 56 57 自变量分为以下情况 定量资料时 直接计算 二值时 化为 与 或 与 有序多分类 有线性规律时连续赋值 无线性规律按无序多分类无序多分类 需要先转换成n 1个哑变量 以哑变量进行分析 58 59 60 61 62 二分类Logistic回归 多重比较的方法 Indicator 第一类或最后一类为参照类 每一类与参照类比较Simple 除参照类外 每一类与参照类比较Difference 除第一类外 每一类与其前各类的平均效应比较 有称反HelmertHelmert 除最后一类外 每一类与其后各类的平均Repeated 相邻两类比较 除第一类外 每类与其前一比较Polynominal 正交多名义分类比较 该法假设每一分类都有相等的空间 仅适于数值变量Deviation 除参照类外 每一类与总效应比较 63 64 65 多分类无序反应变量Logistic回归 66 67 多分类有序反应变量Logistic回归 68 69 练习 据报道目前全世界每年的自杀率为10 10万 我国自杀率为23 10万 我国高校自杀率则为2 10万 为了了解当代大学生综合素质现状 为了进行提高大学生综合素质的对策研究 利用中国现场统计研究会教育统计与管理专业学会设计的 中国大学生综合素质调查问卷 采用分层整群抽样 选择了不同年级 不同性别 不同专业以及不同生源的医学大学生554名的调查问卷 其中129人有过自杀的意念 应用Logistic回归分析 探讨大学生有自杀意念的影响因素 70 部队3所院校 1121份有效问卷 地方3所院校1874份有效问卷 表8各校有效问卷情况单位有效问卷份数军队 北京军医学院554海军工程大学450解放军信息工程大学117地方 同济医学院778中国科技大学628广西工学院468 71 1 各项目的名称及量化方法在 中国大学生综合素质调查问卷 中又增加的2个小题记为A01 A02 基本情况A共有21项 分别记为A1 A2 A21 当有的项目中又分为2项时再分别赋予不同的名称 如A10父母亲文化程度分为 父亲文化程度A10 1 母亲文化程度A10 2 其它项目的名称以此类推 72 利用EXCEL将调查问卷各项进行量化 有序的项目按照顺序赋值0 1 2 两分类无序项目赋值0和1 多项无序和多选项目 根据例数多少进行合并成两项或引进哑变量 去掉了几项人数少或不容易量化的个别多选题 A9 1父亲职业 A9 2母亲职业 B16加入WTO后大学生最应具备的素质 B17在当代大学生中你认为普遍欠缺的东西 C10 1对学习吃力的再回答 C19 1决定考研者进一步需回答 C21 1 C21 3参与过科研或社会实践者进一步需回答的问题 最终确定的变量个数是 A类有22个 B类有17个 C类有38个 D类有32个 E类有20个 总计129个变量 73 大学生产生自杀念头的影响因素和程度按入选顺序依次是 抚养人对其关爱是不关爱方向的0 326倍 考试作弊严重的是不作弊方向的1 405倍 当认定一个目标能够尽力去做并持之以恒的是时做时不做方向的0 734倍 认为同学中考试作弊人数多的是少方向的1 295倍 对自己心理素质的评价高的是低方向的0 553倍 74 对自己各方面的综合评价高的是低方向的2 008倍 做事常半途而废是能坚持方向的1 732倍 家庭幸福度自我评定高的是低方向的0 699倍 认为自己在学习上接受与理解能力强的是不强方向的1 451倍 身体健康状况较好是较差方向的0 688倍 75 对自己心理素质评价低 身体健康状况差 做事常半途而废 认为同学中考试作弊人数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 八月十五超市活动方案
- 公交公司三八节活动方案
- 公交安全年活动方案
- 零售商业贸易行业试题
- 公众号签到活动方案
- 公会各项活动方案
- 基于遥感技术的农业生产监控合作协议
- 公关公司品牌策划方案
- 公关酒店活动方案
- 公司diy七夕活动策划方案
- 日光性角化病的健康宣教
- 2025年八省联考物理试卷答案解析版(云南)
- 个人发展与学习动力的秘密
- 供配电课程设计报告
- 【MOOC】当代社会中的科学与技术-南京大学 中国大学慕课MOOC答案
- 【MOOC】中级财务会计-江西财经大学 中国大学慕课MOOC答案
- 2024年海南省中考物理试卷(附真题答案)
- 3D打印技术与应用知到智慧树期末考试答案题库2024年秋西北工业大学
- 机房动力环境监控系统调试自检报告
- 诗人海子课件
- 美术基础理论知识单选题100道及答案解析
评论
0/150
提交评论