




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 第一节第一节. .非条件非条件logisticlogistic回归回归 第二节第二节. .条件条件logisticlogistic回归回归 第三节第三节. . 应用及其注意事项应用及其注意事项 第一节 逻辑回归模型 Logistic regression model 逻辑回归模型是一非线性模型,可预测某現象发 生的概率,当研究中常碰到响响的可能取 值仅有两个(即)或为少数几个项 項目时時,无無法使用线性模型,可考虑使用 逻辑回归模型 范例:范例: 研究有心血管疾病的因素因素,研究的对象分为有有或沒有沒有 预测下雨概率,研究的对象是会下雨分為有或沒有下雨分為有或沒有 研究已婚妇联女选择就业的因
2、素,研究的对为象分就 业或不就业 金融机构研究影响个人信用壮況的因素 逻辑回归逻辑回归(Logistic Regression) 如果应变量Yi只能取两个值0和1,则Yi服从二点 分布(Bernoulli distribution). ii pXY)1Pr(设 )1 ()()( iiiii ppXYVarpXYE则 ii pXY1)0Pr( 逻辑函数(S型曲线): e xf 1 1 )(:逻辑函数 x y -6-4-20246 0.00.20.40.60.81.0 x 10 :为设事件发生的可能性记 )0()1(1 10 iiii xPxyPY则事件发生即 )()( )()1( 1010 10
3、 iii iiii xFxP xPxyP 服从正态分布若 i e xFxPxy iiiii 1 1 )()()1( 1010 则 逻辑回归模型 i i i x x x i e e e p 10 10 10 11 1 : )( 逻辑回归模型 )( 10 1 1 1 1 )1( ii x ii ee xyP 改写 ii i xx x i ee e p 1010 10 1 1 1 11 而事件不发生的概率 i x i i e p p 10 1 事件不发生的概率之比则事件不发生的概率与 x p p 10 ) 1 ln( 回归模型isticlog. 2 ppx xx p p .) 1 ln( 22110
4、 x e p p 10 1 x x e e p 10 10 1 pp pp xx xx e e p . . 110 110 1 逻辑回归模型 设 这里g定义为连系函数(link function),连系函数将 线性组合Xi与数学期望pi连在一起. 则 即 p是关于的逻辑函数,且有 0pi ChiSq Likelihood Ratio 22.3768 1 .0001 Score 21.7087 1 .0001(四格表的卡方) Wald 20.2762 1 ChiSq Intercept 1 -2.8904 0.6390 20.4594 .0001 treat 1 1.7918 0.3979 20
5、.2762 ChiSq Likelihood Ratio 12.7026 3 0.0053 Score 10.4135 3 0.0154 Wald 6.5331 3 0.0884 Analysis of Maximum Likelihood Estimates Standard Parameter DF Estimate Error Chi-Square Pr ChiSq Intercept 1 3.6547 2.0911 3.0545 0.0805 x1 1 -0.0822 0.0521 2.4853 0.1149 x2 1 -0.00152 0.00187 0.6613 0.416 x3
6、1 2.5016 1.1578 4.6689 0.0307 Logistic回归模型 先引入Logistic分布函数,表达式为: F(x) = ex / ( 1+ex ) X的取值在正负无穷大之间;F(x)则在01之间 取值,并呈单调上升S型曲线。人们正是利用 Logistic分布函数这一特征,描述事件发生的概率。 以因变量Y1表示发生,Y0表示不发生生存,以 P(Y1X)表示在X下因变量发生的概率,设 P(Y1X)e Bo+BX /(1+e Bo+BX ) 记Logit(P)=lnp/(1-p),则上式可表示为: Logit(P) Bo+BX 这里X的取值仍是任意的, Logit(P)的值亦
7、在 正负无穷大之间,概率P的数值则必然在0 1之间。 p/(1-p)为事件的优势(胜数), Logit(P)为对数优势,故logistic回归又称对 数优势线性回归 一般地,设某事件D发生(Y1)的概 率P依赖于多个自变量(x1,x2, ,xp),且 P(Y1)e Bo+B1X1+BpXp /(1+e Bo+B1X1+BpXp ) 或 Logit(P) Bo+B1X1+Bp X p 则称该事件发生的概率与变量间关系符合多元 Logistic回归或对数优势线性回归。 logistic回归模型参数的医学意义 优势比(odds ratio, OR):暴露人群发病优势与非暴 露人群发病优势之比。 P(
8、1) / 1-p(1) OR= P(0) / 1-p(0) Ln(oR)=logitp(1)-logitp(0)=(B0+B1) (B0+B0)=B 可见B是暴露剂量增加一个单位所引起的对数优势的增 量,或单位暴露剂量与零剂量死亡优势比的对数。eB就 是两剂量死亡优势比。常数项B0是所有变量X等于零时 事件发生优势的对数。 流行病学中的一些基本概念:流行病学中的一些基本概念: 相对危险度相对危险度(relative risk): RR=P1/P2 比数比数Odds=P/(1-P) 比数比比数比OR=P /(1-P)/P/(1-P) 在患病率较小情况下,在患病率较小情况下,ORRR Logist
9、ic回归中的常数项(回归中的常数项(b0)表示,在不)表示,在不 接触任何潜在危险保护因素条件下,效接触任何潜在危险保护因素条件下,效 应指标发生与不发生事件的概率之比的对应指标发生与不发生事件的概率之比的对 数值。数值。 Logistic回归中的回归系数(回归中的回归系数( bi )表示,)表示, 某一因素改变一个单位时,效应指标发生某一因素改变一个单位时,效应指标发生 与不发生事件的概率之比的对数变化值,与不发生事件的概率之比的对数变化值, 即即OR或或RR的对数值。的对数值。 Logistic回归系数的意义回归系数的意义 分析因素分析因素xi为二分类变量时,存在(暴为二分类变量时,存在(
10、暴 露)露)xi ,不存在(未暴露),不存在(未暴露)xi ,则,则Logistic回归中回归中xi的系数的系数bi就是就是 暴露与非暴露优势比之对数值即暴露与非暴露优势比之对数值即 OR=exp(bi)=e(bi) 分析因素分析因素xi为多分类变量时,为方便起见,为多分类变量时,为方便起见, 常用常用1,2,k分别表示分别表示k个不同的类别。个不同的类别。 进行进行Logistic回归分析前需将该变量转换成回归分析前需将该变量转换成 k-1个指示变量或哑变量(个指示变量或哑变量(design/dummy variable),这样指示变量都是一个二分变),这样指示变量都是一个二分变 量,每一个
11、指示变量均有一个估计系数,量,每一个指示变量均有一个估计系数, 即回归系数,其解释同前。即回归系数,其解释同前。 多因素多因素Logistic回归分析时,对回回归分析时,对回 归系数的解释都是指在其它所有自归系数的解释都是指在其它所有自 变量固定的情况下的优势比。存在变量固定的情况下的优势比。存在 因素间交互作用时,因素间交互作用时, Logistic回回 归系数的解释变得更为复杂,应特归系数的解释变得更为复杂,应特 别小心。别小心。 根据根据Wald检验可知,检验可知,Logistic回归系回归系 数数bi服从服从u u分布。因此其可信区间为分布。因此其可信区间为 进而,优势比进而,优势比e
12、(bi)的可信区间为的可信区间为 i ib bu s () ibi bus e 4 、回归系数i的意义 设只有一个自变量X,Logistic方程为 ln P/(1-P)= 0 + 1x X= 0表示非暴露,1 表示暴露。 X=1时的发病概率为 P1; X=0时的发病概率为 P0。 P1/(1-P1) 则, OR= P0/(1-P0) ln(OR)=logitP(1)-logitP(0) =(0+11)-(0+10) = 1 logistic 回归系数的回归系数的意义 表示自变量每增加一个单位,其 优势比的对数值的改变量, OR=e lnOR= 亦即自变量每增加一个单位,其相 对危险度为e 。
13、例如,吸烟与肺癌的关系的研究 令 1 吸烟 1 肺癌 X = y= 0 不吸 0 非肺癌 若求得: = 1, OR=e 意思是: 吸烟的人得肺癌症的危险 性是不吸烟的2.71828倍。 注意 变量X的赋值与OR的关系 令 0 吸 X = 1 不吸 则求得 = ? OR=? 则求得: = -1, OR=1/e 意思是: 不吸烟的人得肺癌症的危险 性是吸烟的36.79%。 二、二、logistic回归的作用回归的作用 (1)建立logistic回归模型: logit(p)=0+1X1+2X2+pXp ; (2) 预测预报 若已知x1, x2 xm数值大小时, 通过 模型可以预测发病、死亡等的概率;
14、 (3) 因素分析 寻找发病、死亡等影响有显著性的因素。 设研究问题中含有p个指标变量x1, x2,xp及Y. n个观察 对象. 其数据结构为: 编号 X1 X2 . XP y 1 x11 x21 x1p y1 2 x21 x22 x2p y2 n xn1 xn2 xnp yp Y 的值要求数值化。Y=1 为发病。 三、数据结构 四、四、Logistic分析的具体任务分析的具体任务: 1) 采用极大似然估计或加权最小二乘估 计确定方程中系数 i=0,1,2,3; 2) 采用(剩余)卡方检验对回归方程进 行检验; 3) 采用U检验对方程中的每个系数bi进行 显著性检验。 六、实例讲解 例例11-
15、1 某研究者调查了15名正常病人 和15名肺癌患者,记录了同肺癌发病 有关的危险因素情况, 数据如下表。试 分析各因素与肺癌间的关系。 七、Logistic回归方程的应用 -预测与估计 求出求出logistic回归方程后,可求出每个观回归方程后,可求出每个观 测点发病概率。测点发病概率。 分析的一般步骤分析的一般步骤 变量的编码变量的编码 哑变量的设置和引入哑变量的设置和引入 各个自变量的单因素分析各个自变量的单因素分析 变量的筛选变量的筛选 交互作用的引入交互作用的引入 建立多个模型建立多个模型 选择较优的模型选择较优的模型 模型应用条件的评价模型应用条件的评价 输出结果的解释输出结果的解释
16、 1.变量的编码变量的编码 变量的编码要易于识别变量的编码要易于识别 注意编码的等级关系注意编码的等级关系 改变分类变量的编码,其分析的意义改变分类变量的编码,其分析的意义 并不改变。并不改变。 牢记编码牢记编码 使用变量数值标识(使用变量数值标识(value labels) 记录编码内容记录编码内容 变量的编码变量的编码 变量名 变量标识 变量值 值标识 SEX 性别 1 男 2 女 EDU 教育程度 0 文盲 1 小学 2 初中及以上 variable labels qnum 问卷序号 rnum 录入序号 pnum 病人编号 hnum 住院号/门诊号 chname 患者中文姓名 drugr
17、oup 组别 name 患者姓名 sex 患者性别 age 患者年龄 value labels sex 1 男 2 女 /hisc 1 是 0 否 9 无法判断 /nsex 1 正常 0 异常 9 未检 /demdx 1 有 0 无 /addx 0 无 1 危险性 2 可能 3 很可能 /edu 0 文盲 1 小学程度 2 初中及 以上 2.哑变量的设置和引入哑变量的设置和引入 哑变量,又称哑变量,又称指示变量指示变量或或设计矩阵设计矩阵。 有利于检验等级变量各个等级间的有利于检验等级变量各个等级间的 变化是否相同。变化是否相同。 一个一个k分类的分类变量,可以用分类的分类变量,可以用k-1
18、个哑变量来表示。个哑变量来表示。 哑变量的设置 教育程度 X1X2X3 文盲:0000 小学:1100 初中:2010 高中:3001 教育程度教育程度:文盲,小学,初中,高中以上文盲,小学,初中,高中以上 3.自变量的单因素分析自变量的单因素分析 了解自变量与因变量的分布了解自变量与因变量的分布 检验是否符合建立模型的应用条件检验是否符合建立模型的应用条件 偏离应用条件时,进行数据变换偏离应用条件时,进行数据变换 各个自变量两组间的比较各个自变量两组间的比较 计数资料计数资料 计量资料计量资料 双变量分析双变量分析 4.变量的筛选变量的筛选 变量筛选的原则变量筛选的原则 专业上考虑专业上考虑
19、 测量上考虑测量上考虑 共线性问题:计算相关矩阵,相关系数共线性问题:计算相关矩阵,相关系数0.8- 0.9,则选其一。,则选其一。 缺失数据少、测量误差低的优先选择缺失数据少、测量误差低的优先选择 经验上考虑经验上考虑 双变量分析中有显著性的自变量(双变量分析中有显著性的自变量(P .15) 选择那些改变主效应的自变量选择那些改变主效应的自变量 变量的筛选变量的筛选 变量筛选的可用方法变量筛选的可用方法 逐步逐步logistic回归:回归:自动选择有显著性的自变自动选择有显著性的自变 量,不仅用于自变量的剔选,也用于交互作量,不仅用于自变量的剔选,也用于交互作 用项是否显著的判断。用项是否显
20、著的判断。 前进法:前进法:逐个引入模型外的变量逐个引入模型外的变量 后退法:后退法:放入所有变量,再逐个筛选放入所有变量,再逐个筛选 理论上看,前进法选择变量的经验公式缺乏总体概念,理论上看,前进法选择变量的经验公式缺乏总体概念, 当用于因素分析时,建议用后退法。当变量间有完全相当用于因素分析时,建议用后退法。当变量间有完全相 关性时,后退法无法使用,可用前进法。关性时,后退法无法使用,可用前进法。 5.交互作用的引入交互作用的引入 交互作用的定义交互作用的定义 当自变量和因变量的关系随第三个变量当自变量和因变量的关系随第三个变量 的变化而改变时,则存在交互作用的变化而改变时,则存在交互作用
21、 交互作用项的引入交互作用项的引入 基于临床实际认为对结果有重要影响基于临床实际认为对结果有重要影响 基于模型应用条件的分析基于模型应用条件的分析 引入两个自变量的乘积项引入两个自变量的乘积项 交互作用的检验交互作用的检验 交互作用的解释交互作用的解释 6.建立多个模型建立多个模型 饱和模型饱和模型 自定义的模型自定义的模型 从饱和模型中选择自变量从饱和模型中选择自变量 再建立模型再建立模型 7.选择较优的模型选择较优的模型 模型拟合优度检验模型拟合优度检验 AIC(Akaike information criterion):): 同一资料的多个模型的比较,此值越小,模型越合适。同一资料的多个
22、模型的比较,此值越小,模型越合适。 SC(Schwartz criterion):同上):同上 Score统计量统计量:同上,但不包括截距项。:同上,但不包括截距项。 -2logL(似然比检验,(似然比检验,Omnibus Test):检验全部自:检验全部自 变量的作用是否显著。较为可靠。适用于含连续性变变量的作用是否显著。较为可靠。适用于含连续性变 量的情况。模型拟合好,量的情况。模型拟合好, x2值大,值大,P值小。值小。 Hosmer-Lemeshow检验:检验:评价估计概率和观察概率评价估计概率和观察概率 接近的程度。适用于含连续性变量的情况。模型好,接近的程度。适用于含连续性变量的情
23、况。模型好, x2值小,值小,P值大。值大。 8.模型应用条件的评价模型应用条件的评价 残差分析残差分析 残差是观察值与估计值之差残差是观察值与估计值之差 合理的合理的logistic回归模型也可能得到不回归模型也可能得到不 理想的残差,这在自变量是二分类变量理想的残差,这在自变量是二分类变量 时更易出现。时更易出现。 增加交互作用项可能增加模型的效能增加交互作用项可能增加模型的效能 9.输出结果的解释输出结果的解释 模型中各个系数的显著性检验模型中各个系数的显著性检验 Wald检验:检验:类似于直线回归系数的类似于直线回归系数的 t检验检验 Wald x2检验:检验:同上同上 似然比检验:似
24、然比检验:自变量不在模型中与自变量不在模型中与 在模型中的似然值比较。在模型中的似然值比较。 Score检验检验 输出结果的解释输出结果的解释 回归系数的解释回归系数的解释 系数的正负值:系数的正负值:正(负)系数表示随自变量的正(负)系数表示随自变量的 增加因变量增加因变量logit值的增加(减少)。值的增加(减少)。 二分类自变量二分类自变量 系数为比数比的对数值,由此比数比系数为比数比的对数值,由此比数比=eb 多分类自变量多分类自变量 以第以第i类作参照,比较相邻或相隔的两个类别。类作参照,比较相邻或相隔的两个类别。 连续型自变量连续型自变量 当自变量改变一个单位时,比数比为当自变量改
25、变一个单位时,比数比为eb 输出结果的解释输出结果的解释 模型拟合的优劣模型拟合的优劣 自变量与结果变量(因变量)有无关系自变量与结果变量(因变量)有无关系 确认因变量与自变量的编码确认因变量与自变量的编码 模型包含的各个自变量的临床意义模型包含的各个自变量的临床意义 由模型回归系数计算得到的各个自变量由模型回归系数计算得到的各个自变量 的比数比的临床意义的比数比的临床意义 输出结果的解释输出结果的解释 模型的预测结果的评价模型的预测结果的评价 敏感度、特异度和阳性预测值敏感度、特异度和阳性预测值 正确选择预测概率界值,简单地以正确选择预测概率界值,简单地以 0.5为界值,但并不是最好的。为界
26、值,但并不是最好的。 C指数指数 预测结果与观察结果的一致性的度预测结果与观察结果的一致性的度 量。量。C值越大(最大为值越大(最大为1),模型预),模型预 测结果的能力越强。测结果的能力越强。 反应变量为两分类,自变量为一个(或多个)两类变量资料的 Logistic回归模型的回归模型的SAS过程过程 proc logistic 选项1; ferq 频数变量; model 因变量=自变量/选择项2; 注注选项1 order=data 表明输入数据集中的顺序一样 DESCENDING 表明反应变量以高水平1为事件发生在先,0为不发生在后 选择项2 NOINT 为取消截距 SELECTION=ST
27、EPWISE 选择逐步法 SLE=逐步法引入的显著性水平 SLS=剔除变量的显著性水平 SCALE=NONE 以残差统计量来衡量模型的拟合优度检验 简易模型简易模型 以某一变因(X) 預估事件发生的概率 资料的响应变量(Y)只有二种可能的結果, 通常以 Y=1 及 Y=0 代表。 定义:胜算 odds = 勝負概率之比 基本原理:假设 ln(胜算) 對 X 有线性关系 註:ln 是自然对数 XZ) odds ( 10 ln 由项目经历(经验)预估完成工作的概率模型 由逻辑回归模型估计得到 z = -3.0597 + 0.1615t )0.1615-exp(3.05971 1 t P 估计概率
28、原始資料与估计概图 有一年工作经验者,估计 24.6 % 概率完成,胜算 0.326 有二年工作经验者,估計 69.4 % 概率完成,胜算 2.262 (2) 由系数估计胜算比, 胜算比 = exp(0.1615) = 1.175. 工作经验增加一个月,完成之胜算是原来的 1.175倍。 6935.0,24 ,2457.0 p ,12 (1) )120.1615-exp(3.05971 1 px x 由经历估计成功率 科学研究中常碰到的可能取值 仅有两个(即),如发病与未 发病、阳性与阴性、死亡与生存、治愈与 未治愈、暴露与未暴露等,显然这类资料 不满足多元(重)回归的条件 什么情况下采用什么
29、情况下采用LogisticLogistic回归回归 Brown(1980)在术前检查了53例前列腺 癌患者,拟用年龄(AGE)、酸性磷酸酯酶 (ACID)两个连续型的变量,X射线(X_RAY)、 术前探针活检病理分级(GRADE)、直肠指检 肿瘤的大小与位置(STAGE)三个分类变量与 手术探查结果变量NODES(1、0分别表示癌 症淋巴结转移与未转移 )建立淋巴结转移 的预报模型。 实例 (一)53例接受手术的前列腺癌患者情况 (二)26例冠心病病人和28例对照进行 病例对照研究 26例冠心病病人和28例对照者进行 病例对照研究 一、logistic回归模型 概率预报模型概率预报模型 )(
30、110 110 110 110 1 1 )(exp1 1 )exp(1 )exp( pp XX pp pp pp e XX XX XX 三、回归三、回归 优势比及其可信区间优势比及其可信区间 标准化回归标准化回归 用于评价各自变量对模型的贡献大小用于评价各自变量对模型的贡献大小 SAS程序程序 The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates 预报模型预报模型 )9169. 16443. 08896. 5( 81 81 81 81 1 1 )9169. 16443. 08896. 5(exp1 1 )9169. 16
31、443. 08896. 5exp(1 )9169. 16443. 08896. 5exp( XX e XX XX XX The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates 预报模型预报模型 12345 12345 12345 exp(0.06182.04530.76141.56410.06930.0243) 1exp(0.06182.04530.76141.56410.06930.024 3) 1 1exp (0.06182.04530.76141.56410.06930.02 43) i XXXXX XXXXX XX
32、XXX 四、回归四、回归 X 当只有一个自变量时,以相应的预报 概率 为纵轴,自变量 为横轴,可绘 制出一条S形曲线。回归参数的正负符号与 绝对值大小,分别决定了S形曲线的方向与 形状 倍。的 比较,是事件不发生那么,事件发生 ,那么如果 优势 优势 33. 23 . 0/7 . 0 )0Pr() 1Pr( 3 . 0)0Pr(7 . 0) 1Pr( )exp( )0Pr( ) 1Pr( )(itlog )oddsln(ln )0Pr( ) 1Pr( ln 1 ln 110 110 YY YY XX Y Y XX Y Y pp pp 优势比改变优势比改变exp(exp( j j) )个单位个单
33、位 倍概率增加了 ),患冠心病的,分别为岁(岁提高到如年龄从 岁),个单位(改变保持不变,年龄令 优势 29047. 1)23(6443. 0(exp 326050 101 )9169. 16443. 08896. 5exp( )0(Pr ) 1(Pr 1 )odds( 1 182 81 X XXX XX Y Y 五、整个回归模型五、整个回归模型 似然比检验(似然比检验(likelihood ratio test) ROC曲线模型评价曲线模型评价 ROC曲线模型评价曲线模型评价 图图16-2 Logistic16-2 Logistic回归预报能力的回归预报能力的ROCROC曲线曲线 六、六、l
34、ogistic逐步回归(变量筛选)逐步回归(变量筛选) MODEL语句加入选项“ SELECTION=STEPWISE SLE=0.100.10 SLS=0.100.10;” 常采用似然比检验: 决定自变量是否引入或剔除。 )ln2()ln2()ln(ln2 1010 2 LLLL LR 模型中有模型中有X5、X6、X8,看是否引入,看是否引入X1 模型含X5、X6、X8的模型的负二倍 对数似然为: 50.402 模型含X1、X5、X6、X8的模型的负二倍 对数似然为: 46.224 )ln2( 0 L )ln2( 1 L X1,10. 00410. 0, 1 ,178. 4224.40402
35、.50 2 引入变量 P LR 1 11010 1 1 1exp()() n m i ijipijpi p j L XXXX 第三节第三节 应用及其注意事项应用及其注意事项 应变量应变量为(二项)分类的资料为(二项)分类的资料 (预测、判别、危险因素分析等等)(预测、判别、危险因素分析等等) 注意事项注意事项 分类自变量的哑变量编码 为了便于解释,对二项分类变量 一般按0、1编码,一般以0表示阴性或 较轻情况,而1表示阳性或较严重情况 。如果对二项分类变量按+1与-1编码, 那么所得的 ,容易造成错误 的解释。 )2exp(OR 西、中西、中三种疗法哑变量化 其它 中西 其它 西 0 1 2
36、0 1 1XX 原资料原资料 姓名姓名性别性别年龄年龄疗法疗法 张山张山150中西中西 李四李四120西西 王五王五018中中 刘六刘六070中中 赵七赵七135中西中西 孙八孙八029西西 哑变量化哑变量化 姓名姓名性别性别 年龄年龄 X1X2 张山张山15001 李四李四12010 王五王五01800 刘六刘六07000 赵七赵七13501 孙八孙八02910 00 10 01 21 中 中西 西 疗法XX 注意事项注意事项 2.自变量的筛选 不同的筛选方法有时会产生不同的模 型。实际工作中可同时采用这些方法,然 后根据专业的可解释性、模型的节约性和 资料采集的方便性等,决定采用何种方法
37、的计算结果。 注意事项注意事项 3.交互作用 交互作用的分析十分复杂,应 根据临床意义与实际情况酌情使用。 注意事项注意事项 4. 多分类logistic回归 心理疾病分为精神分裂症、抑郁症、神 经官能症等(名义变量名义变量nominal variables) ;疗效评价分为无效、好转、显效、痊愈( 有序变量有序变量ordinal variables)。 参见第17章 应变量 SPSS软件计算 Analyze Regression Binary Logistic Dependent: y Covariates: x1 x8 Method: Forward Ward Save Predicted
38、 Values Probabilities Group membership Option CI for exp 95% Probability for Stepwise Entry: 0.1 Removal 0.15 DATA samp16_1; INPUT x_ray grade stage age acid nodes; CARDS; . ; PROC LOGISTIC DESCENDING; MODEL nodes=x_ray grade stage age acid/RISKLIMITS; OUTPUT OUT=pred PROB=pred; PROC PRINT DATA=pred
39、; RUN; The SAS System 22:07 Monday, November 29, 2005 1 The LOGISTIC Procedure Model Information Data Set WORK.SAMP16_1 Response Variable nodes Number of Response Levels 2 Number of Observations 53 Model binary logit Optimization Technique Fishers scoring Response Profile Ordered Total Value nodes F
40、requency 1 1 20 2 0 33 Probability modeled is nodes=1. Model Convergence Status Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics Intercept Intercept and Criterion Only Covariates AIC 72.252 60.126 SC 74.222 71.948 -2 Log L 70.252 48.126 Testing Global Null Hypothesis: BETA=0 Test C
41、hi-Square DF Pr ChiSq Likelihood Ratio 22.1264 5 0.0005 Score 19.4514 5 0.0016 Wald 13.1406 5 0.0221 The SAS System 22:07 Monday, November 29, 2005 2 The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr ChiSq Intercept 1 0.0618 3.4599 0.0003 0.9857 x_ray 1 2.0453 0.8072 6.4208 0.0113 grade 1 0.7614 0.7708 0.9
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年党务公开年终工作总结模版
- 酒水业务员年终总结
- 检索指南国际水协会IWA出版社全文电子期刊
- 向管理要效益
- 7《妈妈睡了》课件
- 2025届江苏省淮安市淮阴区淮阴师院附属中学七下数学期末统考试题含解析
- 病房管理精细化
- 腹股沟滑动疝的临床护理
- 员工法律测试题及答案
- 在师带徒仪式上的发言稿模版
- 2025-2030中国药品连续生产行业市场发展趋势与前景展望战略研究报告
- 2025年中考数学总复习《投影与视图》专项测试卷(附答案)
- 2025年“六一”少先队新队员入队仪式主持词
- 胃镜室试题及答案
- 死鱼赔偿协议书范本
- 2025年贵州水投水库运营管理西秀有限公司招聘笔试参考题库附带答案详解
- 2008年高考语文试卷(山东)(解析卷)
- 2024年中国成人心肌炎临床诊断与治疗指南解读
- 仓库三级安全教育培训
- 焊接实训车间建设方案
- 英国默许开发权的发展历程、体系构建与成效分析
评论
0/150
提交评论