版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2020/7/5,1,逻辑回归分析及其应用,温泽怀DME中心,2020/7/5,2,概述,Truelt J,Connifield J和Kannel W于1967年在慢性病杂志上发表了一篇关于冠心病危险因素的研究,并在医学研究中较早地使用了逻辑回归。一般概念:一元线性回归和多元线性回归,2020/7/5,3,一元线性回归模型y=a b x e多元线性回归模型y=ab 1x1b2x2bkxk e,2020/7/5,4,-4.00,-2.00,0.00,2,0.00,0.25,0.50,0.75,1.00,F(y):因变量的logit值。如果需要线性回归,可以得到结果,但此时效果不好。当自变量取某一
2、值时,因变量的预测值可能为负。2020/7/5,5,医学研究中难以用一般线性回归解决的问题、医学数据的复杂性、连续和离散数据以及疾病的复杂性。一种疾病可能有多种致病因素或与多种危险因素相关的影响因素,也可能有多种综合临床治疗结果。2020/7/5,6,简单的解决方案,固定其他因素,并研究一个或两个影响因素。分层分析:在由12个因素组成的层中进行分析和综合。统计模型,2020年7月5日,寻找合适的模型,进行对数变换,其中p是概率对数(p)=ln (0.1/0.9),p,1 p,0.1,10.1,对应于y=1,公式失败,p=r/n代替对数(p)=ln (r 0.5)/(n r 0.5),这称为经验
3、逻辑变换。它被称为逻辑回归模型,用Z代替logit(p),Z=a b1x1 b2x2 bkxk,P,1 p,2020/7/5,9,P=ez/(1ez)eab 1x 1 b2x 2 bkxk 1 eab 1x 1 b2bkxk这是一个无条件的逻辑回归模型,应用于组数据的分析,P=,2020/7/5,10。当自变量取一些值时,因变量取0和1的概率就是条件概率。条件概率的逻辑回归称为条件逻辑回归,其表达式为eb1x1b2x2bkxk1-eb1x2b2xbkxk,常用于分析匹配数据,p=,2020/7/5/11,总结,逻辑回归建立了因变量比值的对数(logit value)模型。因变量logit值的变
4、化与多个自变量的加权和成线性关系。因变量是二项分布。2020年7月5日,分析的一般步骤,变量的编码:虚拟变量的设置和引入每个自变量的单因素分析;介绍筛选变量的相互作用;建立多种模式;better模型应用条件的评价输出结果解释;2020/7/5,13,1。变量的编码应该易于识别;注意编码的层次关系;改变分类变量的编码;它的分析意义没有改变。请记住,编码使用可变值标签来记录编码内容,2020/7/5/14,可变编码,可变名称可变标签可变值标签性别1男2女EDU教育水平0文盲1小学2初中及以上,2020/7/5/15,可变标签qnum问卷序列号条目序列号pnum患者编号hnum住院号/门诊号chna
5、me患者中文姓名药物组名称患者姓名性别患者性别年龄患者年龄, 价值标签性别1男2女/hisc 1是0 9号无法判断/nsex 1正常0异常9未检测/demdx 1有0否/addx 0 1危险2可能3非常可能/edu 0文盲1小学2级初中及以上,2020年7月5日,16,2。 虚拟变量的设置和引入,也称为指标变量或设计矩阵。检查等级变量的等级之间的变化是否相同是有益的。k分类的分类变量可以用k-1虚拟变量来表示。2020/7/5/17,虚拟变量设置,教育水平:文盲,小学,初中,高中或以上,2020/7/5/18,以高中为参照,2020/7/5/19,SPSS提供的方法,默认为指标:将第一个或最后
6、一个类作为控件,并与控件进行比较;Sample:将第一个或最后一个类作为控件,其他类与控件进行比较,但反映的是平均效果。差异:将除第一个类别之外的所有类别的平均效果与前一个类别的平均效果进行比较;除赫尔默特:的最后一个分类及其以前的分类之外,每个分类的平均效果的比较;Repeated:将除第一个分类之外的每个分类与其前一个分类进行比较;多项式:假设类间距相等,用于数值变量。偏差:以第一个或最后一个类别作为控制,其他类别与总效果进行比较。2020/7/5,20,3。自变量的单变量分析,了解自变量和因变量的分布检验是否满足建模和偏离应用条件的应用条件,进行数据转换,比较两组自变量之间的计数数据,分
7、析两个变量的测量数据,筛选变量和变量筛选原则。专业地考虑测量中的共线性:计算相关矩阵,并计算相关矩阵。在双变量分析中,对于较少缺失数据和低测量误差的优先选择根据经验考虑重要的独立变量(第15页)。选择那些改变主要效果的独立变量,2020/7/5/22,变量筛选,以及变量筛选的可用方法。逐步逻辑回归:自动选择显著的自变量,不仅用于选择自变量,还用于判断交互项目是否显著。正向法:在模型外逐一引入变量;输入所有变量并逐一筛选。从理论上讲,正向法选择变量的经验公式缺乏整体概念,用于因子分析时,建议采用反向法。当变量之间存在完全相关性时,不能使用向后方法,但可以使用向前方法。2020/7/5,23,5。
8、相互作用的介绍和相互作用的定义当自变量和因变量之间的关系随着第三个变量的变化而变化时,就有了相互作用。交互作用术语的引入被认为对基于临床实践的结果有重要影响。在分析模型应用条件的基础上,引入了两个自变量的产品项交互的测试交互解释。2020/7/5,24,6。建立多个模型,并为自定义模型从饱和模型中选择独立变量。在2020年7月5日和2020年7月7日,选择更好的型号。模型拟合优度检验AIC(阿卡克信息准则):值越小,模型越合适。SC(施瓦茨标准):与上述分数统计相同:与上述相同,但不包括截距项。-2logL(似然比检验、综合检验):检查是否所有自变量都有显著影响。更可靠。它适用于连续变量的情况
9、。模型拟合良好,x2值大,p值小。Hosmer-Lemeshow检验:评估估计概率与观察概率接近的程度。它适用于连续变量的情况。模型好,x2值小,p值大。2020/7/5,26,8。评估模型的应用条件时,残差是观测值和估计值之间的差值。具有合理值的逻辑回归模型也可能得到不令人满意的残差,当自变量是二分变量时,残差更容易出现。添加交互项可能会提高模型的效率,2020/7/5,27/9。输出结果的解释,模型中各系数的显著性检验,沃尔德检验:与线性回归系数沃尔德x2检验相似的T检验:与上述似然比检验相同:不在模型中的自变量与模型中似然值的比较。评分测试,2020/7/5/28,输出结果解释,回归系数
10、解释系数的正负值:正(负)系数表示因变量的logit值随着自变量的增加而增加(减少)。第二类自变量的系数是比值的对数值,因此比值=eb的多类自变量以I类为参考,比较两个相邻或分离的类。连续自变量当自变量变化一个单位时,比值eb,2020/7/5,29,解释输出结果,自变量与结果变量(因变量)之间是否有关系,确认临床意义,2020/7/5/31,无条件逻辑回归,受试者之间是否存在事件是独立的。适用于:团体病例对照研究、分层队列研究或横断面调查诊断试验,2020/7/5/32,条件逻辑回归,研究中有n个匹配组,每组有n个病例与m个对照组匹配。此时,每个研究对象中事件的概率是条件概率。匹配病例对照研
11、究的精细分级设计的队列研究,2020/7/5/33,逻辑回归的应用,通过校正疾病预后的混杂因素来估计疾病诊断,2020/7/5/34,疾病影响因素的研究,病因学的病例对照研究,影响因素的横断面调查,临床试验,2020年5月35日,当Mantel-Haenszel分层分析通常用于校正混杂因素时,当分层精细或有网格零点时,不能使用M-H方法逻辑回归分析可以全面校正多种混杂因素的影响。2020/7/5/36,疾病预后的估计,逻辑回归模型,作为概率模型,可以用来预测事件的概率。逻辑回归不需要在正态因变量假设下进行预测。2020/7/5/37,疾病诊断,疾病诊断的鉴别诊断实验研究,敏感性和特异性的估计逻辑回归模型可以充分利用数据提供的信息来估计95%的置信区间,2020/7/5/38,逻辑回归的其他问题,多分类逻辑回归模型因变量是两分类变量,因变量是多分类变量,2020/7/5/39。其他问题,研究对象数量的确定,研究设计中样本量的估计经验方法:模型中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教育福利视角下瑞典儿童早期教育立法的历史演进及价值负载
- 砌体结构工程施工-学习情境4
- 国有企业混合所有制改革员工持股分类办法
- 2026警察教育工作面试题及答案
- 2026年国有企业管理人员处分条例考试题库及完整答案详解
- 《智慧物流概论》课件 项目10 智慧物流园区
- LH17-生命科学试剂-MCE
- 2025年上海宝山社区工作者招聘真题
- 昌江黎族自治县医疗集团招聘乡村医生笔试真题2025
- 2026年人教版四年级下册数学期末三角形专项复习卷含答案
- 2026年普通高等学校招生全国统一考试(北京高考卷)数学试卷
- 2026年河口区卫生类事业单位公开招聘工作人员(24人)笔试参考题库及答案详解
- 2026年福建厦漳泉城际铁路有限责任公司社会招聘34人笔试备考题库及答案详解
- 北师大版三年级下册数学总复习《数与代数》教学课件(新教材)
- 山东省烟台市2025-2026学年高一下学期期中学业水平诊断物理试卷(含答案)
- 铸造车间安全生产守则培训课件
- 2025年福建省厦门市广播电视台(融媒体中心)人员招聘考试试题及答案解析
- 2026 年安全生产月(医院版)人人讲安全、个个会应急 - 排查整治风险隐患课件
- 2026年高考全国I卷英语考试试题及答案
- 2026年广东高中学业水平合格性考试生物试卷试题(含答案详解)
- 2026年幼儿园游戏评价的方法
评论
0/150
提交评论