LOGISTIC回归分析.ppt_第1页
LOGISTIC回归分析.ppt_第2页
LOGISTIC回归分析.ppt_第3页
LOGISTIC回归分析.ppt_第4页
LOGISTIC回归分析.ppt_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第15章第2节Logistic回归分析,陕西医学院大学卫生统计刘继芬,1,前言,疗效评价,发病因素研究中的分类指标,有效治疗良性y无效死亡,没有进行女性线性回归分析。正规随机变量、多线性回归难以解决的问题、医疗数据的复杂性、多样性连续型和离散数据医学研究中疾病的复杂性茄子疾病可能会影响多种茄子发病因素或与多种危险因素相关的疾病的结果,多种林爽治疗结果的综合性、解决方法、简单的:固定其他因素,以及影响研究的一两个茄子因素。由12个元素组成的分层分析(层内和综合分析)。多元:寻找合适的统计模型,2,Logistic回归模型,Logistic回归2分类多分类条件Logistic回归无条件Logist

2、ic回归,概述,1967年Truelt J,Connifield J,Kannel W如何知道这些因素中的哪些因素影响结果?曝光组的发生率P1/未发生率(1-p1)对照组的发生率P0/未发生率(1-p0) p表示曝光因素X时个人的发生率。发病概率和未发病概率1- p的比率称为优势(odds)。曝光组Logistic回归分析,logit变换也称为日志单位变换。logit P=病例组和对照组的优势比(odds retio,OR)、逻辑回归分析模型、逻辑转换、逻辑回归模型是疾病的概率模型。特别适用于具有两个变量、多个分类的数据。多用于临床医学中鉴别诊断,治疗措施的好坏评价,以及与疾病预后相关的因素分

3、析等。logistic回归分析模型(无条件称为Logistic回归模型)经常应用于组数据分析,通过数学转换使:Exp/e指数函数。3,参数估计,最大似然估计方法(Maximum likehood estimate)似然函数:L=Pi对数似然函数:lnL=(ln P)=ln P1 ln P2 ln Pn非线性迭代方法Newton-,ln(OR)=log ITP(1)-log ITP(0)=(0 11)-(0 10)=1,例如,作为吸烟与肺癌关系的研究,1吸烟1肺癌x=,OR=?=-1,OR=1/e表示不吸烟的人患肺癌的危险为吸烟的36.79%。Logistic回归的常量项(B0)表示在与潜在危险

4、因素条件不接触的情况下,不发生效果指标的概率的对比度值。Logistic回归系数(bi)表示一个元素更改一个单位时不发生效果指标的概率的代数变化值,即OR的代数变化值。实例分析,实例分析,4,检查参数,1。“相似比例检查”(likehood ratio test)通过比较两个模型(包含要检查的一个或多个元素)的日志相似函数变化来完成。统计量g g=-2 (ln LP)“分数测试”(score test)用不包含一个或多个变量的模型计算模型的参数估计值,假定新参数为0,计算1-偏微分和信息矩阵(如函数)。将两个牙齿值相乘,得出分数测试的统计S。如果n牙齿较大,S大致遵循要检查的元素数的分布(根据

5、自由度)。Wald测试是广义的T测试,统计量是u u服从正态分布,即标准正态偏差。以上三种茄子方法中,也许比检查最可靠,分数检查一般与之一致,但两者的计算量都很大。Wald检查不考虑每个元素之间的复合作用,当元素之间存在共线性时,结果像其他两种一样不可靠。如果分析元素Xi是等级变量(例如,最小或最大等级作为参考组,按等级顺序为0、1、2、牙齿时,e(bi)表示Xi提高一个等级时的优势比例,e(k* bi)表示Xi提高K等级时的优势比例。如果分析元素Xi是连续性变量,则e(bi)表示Xi添加度量的优势百分比。6,Logistic回归分析方法,分析思想与多线性回归分析相同的过滤变量分析方法3360

6、前进法后退法步骤法统计量不再是线性回归分析的F统计量,而是上述三种茄子统计量之一。为了方便计算,通常选择变量前向进行似然比或分数检查,反求变量通常使用Wald检查。(大卫亚设,美国电视电视剧,计算),7,使用条件逻辑回归,比例调查资料,很多条件逻辑回归分析。逻辑回归方程式假设引数在每个比率群组中对结果变数的作用相同。也就是说,自变量的回归系数与比率组无关。比例设计的逻辑回归模型不包含常数。无条件逻辑回归模型与回归模型非常相似,但是参数估计基于条件概率,因此称为条件逻辑回归模型。条件Logistic回归模型的回归系数检查和分析无条件与Logistic回归相同。8,逻辑回归应用节目,1 .因素分析

7、可用于风险/健康因素筛选,其作用大小决定2。预测预测预测预测如果知道X1,X2XM数值大小,就可以通过模型预测某个病例发病和死亡的概率。10,应用需要注意的问题,(1)应用条件1。每个观察对象徐璐独立。Logit p和参数是线性关系。3.异常值4。变量之间的共线性问题,(2)变量的量化,变量的编码应容易识别编码的顺序关系,改变分类变量的编码,其分析的意义不应改变。变量的编码,变量名变量识别变量值识别SEX性别1男2女EDU教育水平0文盲1小学2初中以上,(3)哑巴变量的设置和引入,哑巴变量,又名显示变量有助于确保等级变量的等级之间的变化相同。在逻辑回归分析之前,必须转换为k-1显示变量或虚拟变量的k分类变量。这表示变量都是二分变量,每个显示变量都有回归系数,其解释与以前相同。哑巴变量的设置,教育水平:文盲、小学、初中、高级中学异常,见高级中学,(4)其他问题,研究对象案例数的确定观察单位数和分析变量数logistic回归的局限性理论不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论