




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第十六章 logistic回归分析暨南大学医学院医学统计教研室林汉生内容logistic 回归的概念应用举例预备知识:OR值与RR值logistic回归对资料的要求模型的建立与变量筛选logistic回归分析的结果表达logistic回归应用的本卷须知logistic回归的应用logistic回归的种类logistic回归分析资料主要来源一、logistic 回归的概念在医学研究中经常遇到应变量为二项分类的资料,如治愈与未愈、生存与死亡、发病与未发病等,可以概括为阳性与阴性两种互斥的结果,同时可能存在对分类结果发生概率产生影响的因素即自变量。研究1个二分类观察结果与多个影响因素之间关系的多变量
2、分析方法。二、应用举例 探讨疾病发生的危险因素、筛选与疾病预后有关的因素、综合多个指标进行诊断试验,等。如:非胰岛素依赖型糖尿病的危险因素分析301例急性心肌梗死病人急性期预后因素的logistic模型分析运动试验logistic回归分析对冠心病的诊断价值三、预备知识:OR值与RR值预备知识:OR值OR值odds ratio:比值比或优势比比值 odds 是指某事物发生的概率与不发生的概率之比。病例组和对照组有暴露史与无暴露史的概率分别为: a / (a+b), b/(a+b) a / b c / (c+d), d / (c+d) c / d OR= a / b/ c / d =ad/bc =
3、 76 44/ 10 40出生时有窒息缺氧史儿童,发生低智的危险是对照儿童的倍要经过假设检验。OR值与RR值RRrelative risk:暴露人群发病率P(1)与非暴露人群发病率P(0)之比。当P(1)和 P(0)都很小时,OR值接近RR值。RR1:说明暴露越多,发病越多,可能是致病因素;RR1:说明暴露越少,发病越少,可能是抑制发病因素。四、 logistic回归对资料的要求Y 取值:0,1X1,X2,X3,Xm的取值:计数、计量和等级资料。五、模型的建立与变量筛选将回归效果显著的自变量选入模型,不显著的自变量那么排除在模型外,使建立的模型比较稳定和便于解释。?实习指导?例题例 某研究人员
4、在探讨肾细胞癌转移的有关临床病理因素研究中,收集了一批行根治性肾切除患者的肾癌标本资料,现从中抽取26例资料作为例如进行logistic回归分析。有关符号意义说明如下i:标本序号x1 :确诊时患者年龄x2 :肾细胞血管内皮生长因子,分3个等级x3 :肾细胞癌组织内微血管数x4 :肾癌细胞核组织学分级,分4级x5 :肾细胞癌分期,分4期y :肾细胞癌转移情况1转移;0无转移1. SPSS的数据工作表2. SPSS的操作步骤Analyze Regression Binary LogisticLogistic regression 对话框将Y选入Dependent栏,X1 X5选入Covariate
5、栏,选择Forward:LR法。单击Options按钮。Options对话框单击Continue按钮单击OK按钮3. SPSS的结果与分析1数据根本情况数据根本情况为26例纳入分析,没有缺失值 20步时的分析结果变量筛选第0步的Score检验结果,可作为单变量logistic回归分析的结果。如进行单变量logistic回归分析,在水准,变量X2、X4和X5有统计学意义。 3拟合优度用决定系数R2描述4分类表:只有1个分错类,即观察值为0类,而预测值为1类Y的观察值和预测值的符合情况:观测值为0时肾癌未转移,预测的准确率为94.1%;观测值为1时肾癌转移,预测的准确率为100.0%;总的预测准确
6、率为96.2%。该指标可以评价logistic模型的拟合优度。 5模型中的变量B:回归系数。当其他变量保持不变时,Xj每增加或减少1个单位时,OR值自然对数的平均变化量。Exp (B):OR值经校正的,或调整的OR值,adjusted odds ratioSE:回归系数的标准误Wald值:对回归系数进行假设检验的统计量最重要的结果选入模型的变量:X2和X4的OR值都大于1,故等级越高,肾癌转移的风险越大。总体OR值的95%可信区间太宽,提例如数太少 。可以将X2和X4的取值代入下式,计算肾癌转移的可能性。判断的截断点默认为,大于,那么预测为肾癌转移分类表中的结果。6未引入模型的变量没有引入模型
7、的变量,最小的P值为。即使将引入变量的检验水准放宽到,也不能引入新变量。多因素logistic回归分析结果影响因素回归系数回归系数标准误Wald统计量P值OR值OR95%CIX22.4131.1964.0720.04411.171.07116.44X42.0961.0883.7130.0548.140.9768.62该表可以改进吗?表1 肾细胞癌转移的多因素logistic回归分析影响因素OR值P 值OR 95% CI肾细胞血管内皮生长因子11.170.0441.07116.44肾癌细胞核组织学分级8.140.0540.97 68.62影响因素OR值(95CI)P 值肾细胞血管内皮生长因子11
8、.17 (1.07116.44)0.044肾癌细胞核组织学分级 8.14 ( 0.97 68.62 )0.054表1 肾细胞癌转移的多因素logistic回归分析小结用多因素logistic回归分析的似然比前进法筛选变量,引入变量的检验水准为。在所研究的5个有关临床病理因素中,入选模型的因素有2个:肾细胞血管内皮生长因子表达等级是肾细胞癌转移的危险因素经校正的OR值为,95% CI为 ,P;肾癌细胞核组织学分级也是肾细胞癌转移的危险因素经校正的OR值为,95% CI为 ,P=0.054 。六、logistic回归分析的结果表达赋值表单因素分析多因素分析例:16-2P339为了探讨冠心病发生的有
9、关危险因素,对26例冠心病病人和28例对照者进行病例对照研究,各因素的说明及资料见表。试用logistic回归分析方法筛选危险因素。冠心病危险因素的病例对照调查资料表1 冠心病的相关因素与赋值相关因素变量名赋值说明年龄(岁)X140=1,4554=2,5564=3,65=4高血压史X2无0,有1高血压史家族史X3无0,有1吸烟X4不吸0,吸1高血脂史X5无0,有1动物脂肪摄入X6低0,高1体重指数X724=1, 24=2, 26=3A型性格X8否0 ,是1冠心病Y对照0,病例1一相关因素与赋值二单因素分析单独分析每个自变量X与应变量Y是否有关联。检验水准可以放宽到。对单因素有统计学意义的变量,
10、进行多因素logistic回归分析。当某个自变量有缺失值时,不影响对其它自变量进行分析。可以分析每个自变量与应变量的关联对自变量进行初步筛选,为多因素分析做准备。当例数较少,而自变量较多,缺失值较多时,初步筛选更有必要。单因素分析方法无序分类资料:卡方检验有序分类资料:卡方检验中的线性趋势检验计量资料:t检验每次引入1个自变量进行logistic回归分析任意类型资料当缺失值没有或很少时,逐步多因素logistic回归0步时的分析结果任意类型资料1. 卡方检验Y Column (s)Chi-square卡方检验Risk 求OR值或RR值列联表及行百分数8个变量,例数54,无缺失值年龄:等级资料;
11、病例组与对照组的年龄构成线性趋势检验:年龄与冠心病的发病呈线性关系2,P等级资料,不能计算OR值A型性格 与 冠心病 2,P0.009OR=4.85 (1.42, 16.51)表中的因素都是2分类变量如果是计量资料,那么百分率改为 ,2 改为t2. 每次引入1个自变量进行logistic回归分析OR为4.85, 95% CI为Score统计量的结果与卡方检验一致Wald统计量的结果与卡方检验很接近3. 当缺失值没有或很少时,逐步多因素logistic回归0步时的分析结果结果没有缺失值Score统计量的结果与卡方检验一致无缺失值的情况下三多因素分析筛选独立的自变量进入模型例如,动物脂肪摄入和体重
12、指数在单因素分析都有统计学意义,但多因素分析时,只有动物脂肪摄入这个因素被引入模型。说明动物脂肪摄入与体重指数可能有联系,动物脂肪摄入提供的信息取代了体重指数。多因素logistic回归分析结果结果简洁清楚七、logistic回归应用的本卷须知危险因素分析 时,将计量指标转变为等级或二分类指标如年龄,肿瘤转移的淋巴结个数,使OR值的实际意义明确。无序分类变量的赋值方法:哑变量样本含量:经验上,病例和对照的人数应至少各有3050例。SPSS中哑变量的设置Categorical按钮的使用例P 352 1352名少年儿童肥胖症危险因素调查资料肥胖症:无;有根据体重指数BMI划分性别:男;女年龄组:7
13、-9岁;10-12岁;13-15岁;16岁及以上胆固醇:低;高甘油三脂:低;高数据文件多因素logistic回归分析年龄的OR值为,什么含义?Crosstab:肥胖发生风险并非随年龄增加而减少。可以79岁年龄组为参照79岁年龄组为参照:单击Categorical选择:First (1: 79岁年龄组)单击Change,单击Continue单击OK哑变量自动生成Frequency是分层的数目,总共有64层,其中有7层的例数为0结果解释年龄的参照组为79岁年龄组(1)的OR值为,P。即在校正了其它因素后, 1012岁儿童患肥胖症的风险是79岁儿童的倍。1315岁和16岁及以上儿童患肥胖症的风险与7
14、9岁儿童比较,差异无统计学意义。性别的OR值为?1:男性;2:女性甘油三酯的OR值为? 1:低;2:高是每个年龄组都是男性肥胖率高于女性吗?八、logistic回归的应用筛选疾病预后或发生的有关因素诊断模型的建立校正混杂因素 如临床试验数据分析:当评价指标为二值变量有效,无效,非处理因素在试验组和对照组中分布可能不均衡时。可以利用logistic回归分析得到调整后的药物评价结果。 Y group 年龄 病情0无效;1有效 (1常规疗法;2新疗法 不均衡九、logistic回归的种类非条件logistic回归分析:简称logistic回归分析,即前面介绍的内容,应用最广泛。条件logistic回归分析:为消除混杂因素对研究结果的影响,对每1例病人选择1至数例在混杂因素的暴露水平上相一致的,符合研究条件的,未患病的人作为对照,共同组成一个匹配组。统计分析按匹配组进行。多项分类Logistic回归分析有序多分类Logistic回归分析十、Logistic回归分析资料主要来源回忆性资料研究开始前病历等
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025全员安全培训考试试题完美
- 2024-2025管理人员岗前安全培训考试试题及参考答案
- 2025年土地流转相关合同范本
- 2025年订单合同范文
- 2025防水涂料采购合同范本
- 2025年度摩托车租赁合同
- 2025年长春市房屋租赁合同范本
- 2025年车用交流发电机合作协议书
- 2025流动资产外汇借款合同
- 2025竹林买卖合同模板
- 2025陕西汉中汉源电力(集团)限公司招聘56人易考易错模拟试题(共500题)试卷后附参考答案
- 南京师范大学自主招生个人陈述范文与撰写要点
- 铁粉运输合同协议
- 计算机网络安全知识试题及答案2025年计算机二级考试
- 浙江省A9协作体2024-2025学年高二下学期4月期中联考语文试卷(含答案 )
- (四调)武汉市2025届高中毕业生四月调研考试 语文试卷(含答案详解)
- 广州广州市天河区华阳小学-毕业在即家校共话未来-六下期中家长会【课件】
- 第4单元 亮火虫(教学设计)-2024-2025学年粤教花城版(2024)音乐一年级下册
- 车间生产材料管理制度
- 西师大版小学五年级数学(下)期中测试题(含答案)
- 广东省深圳市龙华区2023-2024学年七年级下学期期中数学试题(含答案)
评论
0/150
提交评论