医学统计学第十六章 logistic.ppt_第1页
医学统计学第十六章 logistic.ppt_第2页
医学统计学第十六章 logistic.ppt_第3页
医学统计学第十六章 logistic.ppt_第4页
医学统计学第十六章 logistic.ppt_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第16章逻辑回归分析,逻辑回归是用概率型非线性回归模型研究分类观测结果(Y)和某些影响因素(X)之间关系的多元分析方法。问题毽子:医学研究中哪些因素存在的条件下会产生什么结果?那这种关系呢?因素(x)疾病结果(Y) x1,x2,x3XK发生Y=1发生渡边杏Y=0例:暴露因素冠心病结果高血压历史(x1):高脂血症无或无血脂历史(x2):有无或无吸烟(x1)在多线性回归方法中,Y的值必须是测量的连续性随机变量。2.多元线性回归方程的Y和X之间的关系必须是线性关系。3.多元线性回归结果不能用“是否发生”logistic回归方法研究多元线性回归不足、Logistic回归方法、Y取特定值(例如y=1)时

2、发生的概率(P)和暴露因素(X)的关系。p(概率)值可变01范围。基本原则:使用观测数据集拟合逻辑模型,表示多个X和一个收购值之间的关系,反映Y对X从属关系。第一节逻辑回归1,基本概念,1。变量值logistic回归要求变量(Y)将分类变量(两个茄子分类或多个分类)收购(Xi)称为风险因素或暴露因素,它可以是连续变量、等级变量或分类变量。m个收购X1、X2、Xm、2。可以有两个值相关变量的逻辑回归模型方程,一个参数和y关系的回归模型(例如y:发生=1,发生渡边杏=0 x:存在=1,无=0),或者,模型是p和x的关系,p概率,多个logistic回归模型方程式,logistic回归模型方程式的线

3、性表现法,logistic回归模型中概率(p)的logit转换,截断(常数),回归系数,Y(-结束)模型的参数语义,0(常量项):曝光因素Xi=0时个体发病概率与非发病概率的自然对数比率。的含义:某危险因素,曝光水平发生变化时,即与Xi=1和Xi=0相比,某结果(例如发病)优势比的对比发生的数值。P1(y=1/x=1)概率,P0(y=1/x=0)概率,危险系数Y x=1 x=0发病=1 P1 P0 (a回归系数和,多元回归模型的概念,第二,逻辑回归模型的参数估计,1。模型的参数(I)估计通常估计为最大相似函数(maximum likelihood estimate,MLE)。(讲义第259页)

4、,2。优势比(OR)和可信间隔估计(例如X=1,0分类),OR的1-可信间隔估计公式,回归系数的标准误差,(公式16-10)变量的分配,logistic说明引数对y的影响是否有统计意义。检查方法(讲义260-261页)1)检查相似率(likelihood ratio test) 2)Wald检查3)检查分数(score test),),公式16-13,=1的2,表16-1数据,每个X的检验(wald检验)参数估计标准误差Chi-Squa Pr常数-0.9099 0.1358 44.8699 .0001吸烟0 . 8856 0 . 15001例如,X1表示吸烟,X2表示饮酒,饮酒和食管癌关系检查

5、,H0: 2=0,H0,4,变量筛选,目的;在模型中选取回归系数重要的引数,排除效果不大的引数。变量过滤算法:前进、后退、前进。例如:讲义示例16-2,逐步选择变量的重要性级别为0.10,变量在方程级别为0.15例:16-2讲义261-263页,表16-4进入方程的收购和参数估计值。变量Sb Wald2 P标准OR常数-4.705 1.54 9.30 0 0.0023年龄0.924 0.477 3.76 0.0525 0.401 2.52 X5 1.496 0.744 0.0443 0.406 4.406 x 6 3.136 1.249 6 . 30 . 0121 0。703 23.06 x

6、8 1.947 0.847 0.847 5.29 0.0215 0.523 7.01标准回归系数(b)比较每个变量对y的相对贡献,双子句条件逻辑回归,概念:通过配对设计获得病例比较研究数据,计算出的Logistic回归组示例:请参阅265页差异:条件逻辑回归的参数估计常数(0)主要用于风险因素分析。3节逻辑回归的应用和注意事项,1,逻辑回归的应用1。疾病(结果)的危险因素分析和筛选用回归模型的回归系数(I)和OR说明了危险因素与疾病的关系。示例:讲义案例16-1、16-2、16-3适用资料:字典研究设计、案例比较研究设计、横断面研究设计资料。在三种茄子类型的研究中计算的逻辑回归模型的意义是一致

7、的。只有常数不同。(证明),逻辑回归的应用,2 .纠正杂物,对疗效的临床研究及疗效进行评价,组间部分因素构成不一致的干扰效果分析,通过牙齿方法,可以控制非处理因素,准确评价治疗效果。3.预测及判别预测个人在某些因素存在的条件下,预测某事件(发病)牙齿发生的概率,提供进一步治疗的依据。,表5-4甲与两种茄子疗法某病治愈率%比较,丙型甲疗法乙疗法患者治疗患者治疗产率一般型300 180 60.0 100 65.0中型100 35.0 300 35.0 300 125 41.7总计400 215 53.8 400 190 47.5,如例1 b=1)X2瓶(轻量级=1,重量=0)Y疗效(Y=1有效,Y

8、=0无效),逻辑回归计算标准wald parameter estimate error chi- 标准wald parame estimate error chi-square pr常数-1.9037 0.5982 10.127 0.0015性别1.4685 0.575 6.508 0.0107药物1.7816 0.518 11.794 0.0006 odd使用逻辑模型方程预测个体疗效。例如,女性患者,x1=1,新药x2=1,有效概率p=0.79,男性患者x1=0,新药x2=1,有效概率p=0.4695,测量数据经常重新分类为有序分组段,OR的实际意义更大。例如,年龄(3,x1),数据的多个分

9、配格式,1)两个茄子分类变量,分配:例如,1,无=0 2)顺序变量,分配;无=0,较少=1,中间=2,较多=3件;年龄45=1 45-54=2 55-64=3 65=4 3。)多分类无序变量:分配:虚拟变量格式示例:注:变量值不同时方程的系数和符号,表16-2冠心病8可茄子危险因素和分配(讲义262页),表16-9年龄(x 发病lnOR方程2:哑巴变量方程(哑巴变量数=分类数1)方程系数的说明:40- 40对对数优势比率50- 40对对数优势比率60- 40对对数优势比率、哑巴变量分配方法(例如2),270页分析问题2 哑巴变量的分配主X4-1X4-2 100 110 2101,2。样品含量:1)病例和对照组的实例数可以相同,也可以不同。2)样品数的估算原则:收购数越多,实例数就越多。每个组的样本数(对照组和病例组)是收购数的5-20倍以上。3 .模型评价(讲义269页),对设定的回归方程进行适用性测试。验证模型估计是否与实际数据一致。检验统计信息:1。剩馀差异(deviance,D) (16-25) 2。Pearson 2 (16-26)统计数据的概率值P0.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论