




已阅读5页,还剩47页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Logistic回归 Logistic回归分析的分类 按数据的类型 非条件logistic回归分析 成组数据 条件logistic回归分析 配对病例 对照数据 按因变量取值个数 二分类logistic回归分析多分类logistic回归分析按自变量个数 一元logistic回归分析多元logistic回归分析 线性回归模型和广义线性回归模型均要求因变量是连续的正态分布变量 且自变量和因变量之间呈线性关系 若因变量是二分类变量时 能不能建立多重线性回归呢 建立p Y 1 X 与X的多重线性回归模型 Logit P P 考虑使用概率的logit变换函数 非条件logistic回归的数学模型 因此 我们使用P与 1 P 的比值的对数 来建立logit P 与X的多重线性回归模型 优势 即一个事件发生的概率比上对立事件发生的概率 各种Logistic回归模型的形式 logistic回归的自变量 自变量可以是连续型变量 分类变量或有序变量 如果是多分类变量 则需转化成哑变量来处理 参数估计 采用极大似然法 maximumlikelihood ML 进行回归系数的估计 极大似然法的基本思想是先建立似然函数或对数似然函数 求似然函数或对数似然函数达到极大时参数的取值 即为参数的极大似然估计值 似然函数 现已出现的所有结局事件的概率乘积 Logistic回归中的常数项 b0 表示 在不接触任何潜在危险 保护因素条件下 效应指标发生与不发生事件的概率之比的对数值 Logistic回归中的回归系数 bi 表示 某一因素改变一个单位时 效应指标发生与不发生事件的概率之比的对数变化值 即OR的对数值 系数的解释 Wald检验 单个回归系数的假设检验 Wald检验 用于检验单个回归系数有无统计学意义 计算简便 但结果较保守 大样本时 统计量服从卡方分布 拟合优度检验 检验模型是否拟合的好 L 似然函数LnL 对数似然函数 为负值 2LnL 正值 其值越小越好 如对应的P值不拒绝H0 则说明该模型拟合资料较好 似然比检验 比较两个模型哪个更优 比较两个模型的 2LnL值之差 G 2 lnL1 lnL2 G服从X2分布 自由度 两模型自变量个数差 判断在增加了自变量后 G的变化量是否有统计学意义 即此改善是否有意义 因此似然比检验也可用于对模型中的回归参数进行假设检验 似然比检验的结果比较稳健 因此使用更普遍 先做单因素分析 对连续变量先做两组频数分布 必要时转化成分类变量 考虑参数实际意义 对有序变量先做两组频数分布表 必要时转化为无序分类变量 哑变量 或二分类变量 对可能相关的自变量进行部分多因素分析 考察自变量间的相关关系 建模策略 建模策略 在单变量分析和相关自变量分析的基础上 进行多因素逐步筛选 纳入模型的因素 单变量分析有统计学意义专业上有意义需要调整的混杂因素 始终放在模型中 在多因素筛选模型的基础上 考虑有无必要纳入变量的交互作用项 SAS中的LOGISTIC过程 Proclogisticdescending Model因变量 自变量表 selection sle sls stb Freq频数变量 Run Proclogistic语句默认计算应变量值最小 阴性结果 一般赋值为0 的概率 但是通常我们想要得到的是阳性结果的概率 即赋值最大的数值的概率 二分类变量时一般赋值为1 于是使用选项 descending 解决这一问题 Selection用于选择筛选自变量的方法 有backward 向后法 forward 向前法 stepwise 逐步法 score 最优子集法 none 完全法 五个选项 默认为none SLE 概率值 入选标准 规定变量入选模型的显著性水平 前进法的默认是0 5 逐步法是0 15SLS 概率值 剔除标准 指定变量保留在模型的显著水平 后退法默认为0 10 逐步法是0 15标准化偏回归系数STB可用来比较各个自变量作用的大小 实例1 假设我们有一个数据 45个观测值 四个变量 包括 age 年龄 数值型 vision 视力状况 二分类 1表示差 0表示好 drive 驾车教育 二分类 1表示参加过驾车教育 0表示没有 Accident 去年是否发生事故 二分类 1表示出过事故 0表示没有 考察前三个变量与发生事故的关系 程序 datalogistic inputaccidentagevisiondrive cards 117111440014810155001751103501 131011161016110 run proclogisticdata logisticdescending modelaccident agevisiondrive selection stepwisesle 0 15sls 0 15stb run 结果1 本模型的基本信息 需要注意的是ResponseProfile中 accident 1排在首位 前面我们说过 SAS的Logistic回归方程log odds 默认的形式是处理那个变量值比较小的 加上descending选项后 accident 1就排在首位了 结果2 自变量进入模型的次序 三种检验方法结果均提示变量vision有统计学意义 AIC SC 2logL三个信息量标准均用来比较不同的模型 它们数值越小 模型拟合就越好 结果2 自变量进入模型的次序 Step2变量drive进入后 模型的表现变好了 因为这时AIC SC 2logL的值变小了 2LogL和Score对应的p值也更小 结果3 参数检验结果及回归模型 log p 1 p 0 1110 1 7137 vision 1 5000 drive视力的OR 5 550 表示了控制了驾车教育后 视力差与视力好的驾驶员相比 发生事故的风险为5 550倍 驾车教育的OR 0 223 表示了控制了视力后 有驾车教育的驾驶员发生事故的风险为无驾车教育者的0 223倍 实例2 研究性别 疾病的严重程度对某一疾病疗效的影响 得数据如下 程序 datap2 inputsexdegreeeffectcount cards 00121000601190109101810010111411011 proclogisticdescending freqcount modeleffect sexdegree scale noneaggregate 模型的拟合优度检验 run 结果1 拟合优度检验结果 两种拟合优度检验的结果均显示 P值 0 64 0 05 因此可以认为当前模型与拟合最好的模型比较 差别无统计意义 因此没有必要对模型作进一步改进 结果2 模型检验 似然比的卡方 无协变量的 2LOGL值 有两个协变量的 2LOGL值 107 669 95 9 11 769 自由度df 2 模型中的协变量个数 相应的P值 0 0028 因此可以认为两个协变量的回归系数至少有一个不为0 即 认为模型有统计学意义 结果3 参数估计 从结果来看 女性和疾病不严重均为保护因素 性别的OR 0 279 表示了控制了疾病程度后 男性与女性相比 治疗有效的概率大约为0 279倍 疾病程度的OR 0 348 表示了控制了性别后 疾病程度严重的治疗有效的概率为不严重者的0 348倍 实例3 课本例16 4 哑变量定义方法1 Dataa Inputydrinkagef age1 age 2 age2 age 3 age3 age 4 age4 age 5 age5 age 6 Cards 11111010112410251132510321114421043411519105361165106801190011060122600216401329003138014270041380151800588016000631 proclogisticdescending freqf modely drinkage1 age5 run proclogisticdescending freqf classage modely drinkage SAS软件中使用CLASS语句的过程多数把最大的编码值 按升序排列 作为参照类 其他类别的参数估计值都是与它相比而得到的 在logistic回归中使用class语句 则年龄以哑变量形式进入模型 以高水平作为参照组 run 哑变量的定义方法2 哑变量的设置和引入 哑变量 又称指示变量有利于检验等级变量各个等级间的变化是否相同 一个k分类的分类变量 进行Logistic回归分析前需将该变量转换成k 1个指示变量或哑变量 dummyvariable 来表示 这样指示变量都是二分变量 每一个指示变量均有一个回归系数 其解释同前 教育程度 文盲 小学 初中 高中以上 以高中作为参照 参照水平最好要有实际意义 不推荐使用 其他 作为参照 参照水平组要有一定的频数作保证 应不少于30或50例 对有序自变量的分析 从专业出发确定 分别以哑变量和连续性变量的方式引入模型进行比较后确定 同一变量的所有亚变量需同时进入模型 不能有些在模型外 有些纳入模型 否则将导致模型的错误解释 哑变量设置应该注意的问题 logistic回归模型系数 的意义解释 从e OR RR 说明当发病率很低时 e 近似地表示了相对危险度 即暴露下的发病率与非暴露下的发病率之比 例如 在例16 1中得到 1 1 110 因此 RR OR e 3 034 表明心梗发生后抢救前有休克的死亡危险是没有休克的3 034倍 logistic回归模型系数的意义 2 如果X是连续变量 则OR近似表示在X相邻两个单位上的相对危险度 1 如果X 1 0 则OR近似表示在X 1条件下的发病率与X 0条件下发病率之比 3 如果X是分类变量 则要将X的哑变量放入模型 则OR表示两个类之间的相对危险度 条件logistic回归 医学中经常需要作配对病例 对照研究 所谓的配对病例 对照研究指的是在病例 对照研究中 对每一个病例配以性别 年龄或其它条件相似的一个 1 1 或几个 1 M 对照 然后分析比较病例组与对照组以往暴露于致病因素的经历 分析配对病例 对照研究资料的统计分析方法一般采用条件logistic回归分析 条件logistic回归分析的数学模型以及分析原理方法均和非条件logistic回归分析类似 因为参数的估计公式涉及到条件概率理论 所以称为条件logistic回归分析 1 m配比设计的资料格式 条件logistic回归 一对中有一人患病的概率一对中有一人患病的条件下 恰好是A患病的概率 条件logistic回归 条件logistic回归模型 建立条件logistic回归模型的思想是 比较病例组与对照组内每个对子的各个因素之间的差别 从而找出其中的危险因素 特点 没有常数项 因为在计算过程中约掉了回归系数解释同非条件logistic回归模型不能做预测 只能做因素分析 条件logistic回归中的参数是通过条件似然函数估计得到 其假设检验与非条件logistic回归基本相同 可以选用似然比检验 计分检验和Wald检验 对条件logistic回归模型进行参数估计时 采用的是条件似然函数 由于条件似然函数与生存分析中cox比例风险模型的似然函数相同 因此 在计算时可以采用cox比例风险模型中参数估计的方法对条件logistic回归模型的参数进行估计 所以 在SAS软件中可以通过应用phreg过程来实现条件logistic回归分析 在SAS软件中logistic和phreg过程均可以进行条件logistic回归分析 当1 1配对时 可调用logistic过程 也可调用phreg过程 当应用logistic过程时 需引入新变量 使其等于配对组内2个研究对象中各变量的差值 然后将新变量代入回归模型即可 当应用phreg过程时 则可以直接使用原始数据 若进行非1 1配对时 应用logistic过程处理资料较为困难 此时可调用phreg过程实现条件logistic回归分析 PHREG过程 借用生存数据风险回归分析的phreg过程 procphreg model因变量 自变量 ties discrete 当实施1 m配对时 ties选项不可省略 strata分层变量 run 某医院为了研究孕期照过X射线对儿童患白血病的影响 收集了配对病例 对照资料如下表所示 其中D和D 分别表示儿童患和未患白血病 E和E 分别表示母亲孕期照和未照过X线照射 配对病例 对照实例 dataeg7 7 inputidyxwt cards 111310132101420114311530054106240062procphreg modely x freqwt strataid 指明用于配对的序号变量 run 结果解释 OR x 2 8 RR p y 1 x 1 p y 1 x 0 结果说明母亲孕期有过X线照射的儿童患白
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 物业酬金制服务合同范本
- 高档消费品买卖合同范本
- 高龄员工家属免责协议书
- 煤矿托管合同协议书范本
- 自动生鲜车购买合同范本
- 烘焙店加盟合同协议范本
- 深圳市拆迁协议合同模板
- 银行解除合同协议书范本
- 网店服装合伙人合同协议
- 煤矿股权出让协议书范本
- 妊娠高血压综合征眼底病变演示课件
- “青蓝工程”结对活动记录表
- 注射用头孢比罗酯钠-临床药品应用解读
- YY 0503-2023 正式版 环氧乙烷灭菌器
- 星火英语3500(整理)
- 《色彩构成》核心课程标准
- 企业人力资源管理中的成本控制与法律风险防控
- 江苏国强产品质量证明书-
- 2023年英语高考试卷(全国卷1)试题及答案
- 上海交通大学学生生存手册
- 2023年六盘水市六枝特区小升初英语考试题库及答案解析
评论
0/150
提交评论