人民卫生统计学第8版第十三章-多重回归分析简介.ppt_第1页
人民卫生统计学第8版第十三章-多重回归分析简介.ppt_第2页
人民卫生统计学第8版第十三章-多重回归分析简介.ppt_第3页
人民卫生统计学第8版第十三章-多重回归分析简介.ppt_第4页
人民卫生统计学第8版第十三章-多重回归分析简介.ppt_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卫生统计学,刘美娜哈尔滨医科大学王雪梅内蒙古医科大学,第十三章多重回归分析简介,目录,第一节:多重线性回归,第二节:logistic回归,第三节:Cox回归,01,02,03,04,重点难点,理解多重线性回归模型的基本思想,掌握多重线性回归模型的参数估计、假设检验及用途。理解logistic回归的基本思想,logistic回归系数的意义及其与优势比的关系,掌握logistic回归模型的参数估计、假设检验及用途。理解Cox回归模型的基本结构、比例风险假定和用途,掌握Cox回归中RR的意义。,第一节多重线性回归,1.模型(1)表示模型中解释变量取值固定时反应变量的总体均数。(2)为解释变量个数。(3)为常数项,为解释变量的偏回归系数。,(一)多重线性回归模型,第一节多重线性回归,2.方程(1)为反应变量总体均数的估计值。(2)分别为的估计值。,第一节多重线性回归,3.解释变量及偏回归系数的标准化(1)解释变量的标准化:(2)偏回归系数的标准化:,第一节多重线性回归,1.参数估计多重线性回归采用最小二乘法估计未知参数,即使得反应变量的观测值和估计值之间的残差平方和取最小值时的作为相应的估计值,需要利用统计软件来完成。2.假设检验(1)回归模型的方差分析:确定回归方程是否有统计学意义。(2)偏回归系数的t检验:在回归方程具有统计学意义的情况下,检验某个总体偏回归系数是否等于零,判断某个解释变量在数据中是否有作用。,(二)多重线性回归模型参数估计及假设检验,第一节多重线性回归,例1通过收集某学校20名一年级女大学生体重(kg)、胸围(cm)、肩宽(cm)及肺活量(L),分析影响女大学生肺活量的相关因素,实测数据见下表。,某学校20名一年级女大学生肺活量及有关变量测量值,第一节多重线性回归,例1的数据,利用统计软件计算可获得回归方程:,第一节多重线性回归,例1回归模型的方差分析结果见表:,回归方程的方差分析表,上表显示,P0.001,可按0.05水准拒绝;说明整体而言,用这三个解释变量构成的回归方程解释一年级女大学生的肺活量具有统计学意义。,第一节多重线性回归,偏回归系数的t检验统计量为:,例1的3个偏回归系数进行t检验,并计算标准化偏回归系数,结果见下表:,偏回归系数的t检验与标准化偏回归系数,第一节多重线性回归,上表显示:以0.05为检验水准,三个变量中,变量x1和x2的偏回归系数具有统计学意义,x3的偏回归系数无统计学意义,即在考虑肩宽的前提下,体重和胸围对肺活量有作用。标准化偏回归系数提示每个解释变量对反应变量作用的大小,两个有统计学意义的变量中对肺活量作用较大的是体重,其次是胸围。,第一节多重线性回归,决定系数为回归平方和在总平方和中所占百分比:,决定系数为0.7251,说明体重、胸围和肩宽三个解释变量的作用可以解释一年级女大学生肺活量变异的72.51%。,例1的决定系数为:,第一节多重线性回归,1.“最优回归方程”(1)对反应变量有统计学意义的解释变量,全部入选回归方程。(2)对反应变量无统计学意义的解释变量,都未入选回归方程。2.选择“最优回归方程”的方法(1)最优子集回归法。(2)向后剔除法(backwardselection)。(3)向前引入法(forwardselection)。(4)逐步筛选法(stepwiseselection)。,(三)解释变量的筛选,第一节多重线性回归,利用统计软件,采用逐步回归法获得例1的筛选过程和最终结果如表所示:,逐步回归的变量筛选过程,第一节多重线性回归,变量筛选结果,得到的回归方程为:,上述结果,可以认为体重和胸围是影响该校一年级女大学生肺活量的主要因素,体重增加1kg,估计肺活量平均增加0.081L;胸围增大1cm,估计肺活量平均增加0.046L;体重对肺活量的影响大于胸围对肺活量的影响。,第一节多重线性回归,1.多重线性回归的用途(1)影响因素分析。(2)估计与预测。2.多重线性回归模型的注意事项(1)多重共线性问题。(2)解释变量间的交互作用。(3)通径分析。,(四)多重线性回归用途及注意事项,第一节多重线性回归,第二节logistic回归,1.logistic回归模型的基本形式,(一)logistic回归模型,第二节logistic回归,y=1发生的概率记为,y=0的概率为1-;为常数项,为logistic回归系数。,2.logistic回归系数的流行病学意义,第二节logistic回归,logistic回归模型的回归系数具有特殊含义,其解释可与流行病学中的优势比(oddsratio,OR)联系起来:,第二节logistic回归,两个优势之比为OR:,当解释变量仅有两个取值0和1,通常定义某影响因素的暴露为1,非暴露为0,为OR:,logistic回归系数可解释为:其他解释变量不变时,暴露于某影响因素相对于非暴露于该影响因素的值的自然对数;或者调整(控制)其他解释变量的影响后,解释变量每增加一个单位,得到的优势比的自然对数。,(1)当时,暴露与结局间不存在关联。(2)当时,暴露与结局间存在关联。(3)当解释变量的回归系数时,提示为危险因素。(4)当解释变量的回归系数时,提示为保护因素。,第二节logistic回归,1.参数估计,(二)logistic回归模型参数估计及假设检验,第二节logistic回归,采用极大似然估计(maximumlikelihoodestimate,MLE),样本似然函数为:,对似然函数取对数后,用Newton-Raphson迭代方法获得参数的估计值及其标准误。,2.OR值的置信区间,第二节logistic回归,当样本含量较大时,的抽样分布近似服从正态分布,优势比的100()%置信区间为:,3.假设检验,第二节logistic回归,(1)logistic回归模型的假设检验,似然比检验统计量G为:,(2)logistic回归系数的假设检验,检验统计量Wald服从自由度为1的分布,计算公式为:,例2为获得两周患病居民就诊的可能影响因素,采用多阶段分层整群随机抽样进行卫生服务利用的入户调查,收集两周患病的15岁以上居民1493人,就诊者495人。调查的相关因素包括:性别、年龄、文化程度、社会医疗保障、自感疾病严重程度、最近医疗点距离、年人均收入、城乡类型和是否就诊。调查所涉及因素的变量名及赋值说明见表,收集数据的基本形式见下表。,第二节logistic回归,两周患病居民就诊的影响因素与赋值说明,第二节logistic回归,两周患病居民就诊影响因素分析的部分原始数据,第二节logistic回归,假设例2影响因素仅有社会医疗保障x4和最近医疗点距离x6,利用软件建立两周患病是否就诊的logistic回归模型为:,或,(1)有社会医疗保障,最近医疗点距离小于3公里,两周患病就诊的概率为0.34。(2)无社会医疗保障,最近医疗点距离小于3公里,两周患病就诊的概率仅为0.16。,第二节logistic回归,当固定时x6,设有社会医疗保障就诊的优势为odds1,没有社会医疗保障就诊的优势为odds0,则有社会医疗保障相对于没有社会医疗保障的优势比为:,有社会医疗保障增加了两周就诊的可能性,有社会医疗保障是没有社会医疗保障两周就诊的2.678倍。,第二节logistic回归,例2分析性别、年龄、文化程度、社会医疗保障、自感疾病严重程度、最近医疗点距离、年人均收入、城乡类型对是否就诊的影响,统计软件分析结果如表所示。,两周内患病就诊的影响因素分析,第二节logistic回归,(1)根据P值以及OR的95%置信区间可知,x4x8对应的OR值均有统计学意义;x4,x5,x8为两周内患病就诊的危险因素,x6,x7为两周内患病就诊的保护因素。(2)针对OR值的解释如下:有社会医疗保障的患者就诊的可能性为无社会医疗保障者(x4)的4.684倍;自感疾病严重的患者就诊可能性是自感疾病一般患者(x5)的1.625倍;城市患者的就诊可能性为农村患者(x8)的3.393倍;最近医疗点距离为3公里以上的患者的就诊可能性是3公里以下的患者(x6)的0.328倍,年收入(x7)每增加一个等级,就诊可能性就降为原来的0.832倍。,上表分析结果解释为:,第二节logistic回归,1.logistic回归模型的用途(1)影响因素分析。(2)利用logistic回归模型进行预测。2.logistic回归模型应用的注意事项(1)logistic回归分析的应用条件。(2)模型的拟合效果评价。,(三)logistic回归用途及注意事项,第二节logistic回归,第三节Cox回归,(一)Cox回归模型,第三节Cox回归,1.Cox回归模型的基本形式为,(1)表示具有协变量的个体在时刻t的风险率,又称为瞬时死亡率。(2)为基准风险率,即协变量均为0时的风险率。(3)为解释变量的偏回归系数。,x1,x2,L,xp,1,2,L,p,2.Cox回归模型的假设条件(1)比例风险假定:各危险因素的作用不随时间变化而变化。(2)对数线性假定:模型中的协变量应与对数风险比呈线性关系。,第三节Cox回归,3.Cox回归模型的风险比RR,第三节Cox回归,(1)当0时,1,说明xj增加时,风险函数增加,即xj为危险因素。(2)当0时,1,说明xj增加时,风险函数下降,即xj为保护因素。(3)当0时,1,说明xj增加时,风险函数不变,即xj为无关因素。,或,4.Cox回归模型的预后指数PI,第三节Cox回归,预后指数(prognosticindex,PI):Cox回归模型的风险函数中为解释变量的变化量与相应回归系数的线性组合,线性组合的取值称为预后指数;变量的线性组合取值越大,则风险函数越大,预后越差。,5.Cox回归模型的生存率估计,第三节Cox回归,具有解释变量的个体在t时刻的生存率估计为:,为基准生存率的计算为:,(二)Cox回归模型参数估计及假设检验,第三节Cox回归,1.Cox回归模型中的参数估计需借助部分似然(partiallikelihood)理论,用极大似然估计方法获得。,2.可利用似然比检验、Wald检验和score检验对总模型的检验;单个回归系数的检验常采用Wald检验。,例330例膀胱肿瘤患者的随访记录,现对膀胱肿瘤患者生存情况的影响因素进行分析。变量赋值见表。,30例膀胱肿瘤患者生存数据原始记录,第三节Cox回归,膀胱肿瘤患者生存数据变量赋值,第三节Cox回归,利用统计软件取=0.05,=0.10,经逐步引入-剔除法筛选变量获得Cox回归分析,风险函数的表达式为:,结果显示:肿瘤分级(grade)、肿瘤大小(size)和是否复发(relapse)为膀胱肿瘤患者生存的影响因素。,第三节Cox回归,表中数据分析得到的风险比的自然对数为:,如果病人肿瘤尺寸小于3cm,肿瘤分级每增加I级的死亡风险为:,第三节Cox回归,例3中预后指数为:,PI1.680grade+1.078size0.979relapse,表中的1号患者:grade=1,size=0,relapse=0预后指数PI1.6801+1.0780+0.97901.680,其中30例患者所对应生存时间的生存率为:1号患者,肿瘤分级I级,肿瘤3.0cm,未复发,59个月生存率为25.6。,第三节Cox回归,下表为例3数据分析结果,可见肿瘤分级(grade)、肿瘤大小(size)和是否复发(relapse)三个变量的回归系数有统计学意义,RR的95置信区间的下限均大于1。,30例膀胱肿瘤患者多变量Cox回归分析结果,第三节Cox回归,(三)Cox回归模型的用途和注意事项,第三节Cox回归,1.Cox回归模型的用途(1)影响因素分析。(2)通过建立的Cox回归模型计算生存曲线,预测个体疾病发生风险。2.Cox回归模型应用的注意事项Cox模型的基本假定是比例风险假定:只有满足该假定前提下,基于此模型的分析预测才是可靠有效的。,小结,1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论