




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1 温州医学院环境与公共卫生学院温州医学院环境与公共卫生学院 叶晓蕾叶晓蕾 2 3 4 Y,X直线回归直线回归 Y,X1,X2,Xm多元回归(多重回归)多元回归(多重回归) 例:例:欲研究血压受年龄、性别、体重、性格、欲研究血压受年龄、性别、体重、性格、 职业(体力劳动或脑力劳动)、饮食、吸烟、职业(体力劳动或脑力劳动)、饮食、吸烟、 血脂水平等因素的影响。血脂水平等因素的影响。 5 eXXXY mm 22110 6 mm22110 XbXbXbbY Y 7 8 9 10 11 表表15-2 27名糖尿病人的血糖及有关变量的测量结果名糖尿病人的血糖及有关变量的测量结果 序号序号i 总胆固醇总胆
2、固醇甘油三脂甘油三脂胰岛素胰岛素糖化血糖化血血血 糖糖 (mmol/L)(mmol/L)(U/ml)红蛋白红蛋白(%)(mmol/L) X1X2X3X4Y 15.681.904.538.211.2 23.791.647.326.98.8 36.023.566.9510.812.3 265.840.928.616.413.3 273.841.206.459.610.4 12 Coefficientsa 5.9432.8292.101.047 .142.366.078.390.701 .351.204.3091.721.099 -.271.121-.339-2.229.036 .638.243.3
3、982.623.016 (Constant) 总胆固醇x1 甘油三脂x2 胰岛素x3 糖化血红蛋白x4 Model 1 BStd. Error Unstandardized Coefficients Beta Standardized Coefficients tSig. Dependent Variable: 血 糖 y a. 由上表得到如下多元线性回归方程:由上表得到如下多元线性回归方程: 4321 638. 0271. 0351. 0142. 0943. 5 XXXXY 13 14 ANOVAb 133.711433.4288.278.000a 88.841224.038 222.552
4、26 Regression Residual Total Model 1 Sum of SquaresdfMean SquareFSig. Predictors: (Constant), 总胆固醇x1, 胰岛素x3, 糖化血红蛋白x4, 甘油三脂x2 a. Dependent Variable: 血糖y b. 15 Coefficientsa 5.9432.8292.101.047 .142.366.078.390.701 .351.204.3091.721.099 -.271.121-.339-2.229.036 .638.243.3982.623.016 (Constant) 总胆固醇x1
5、 甘油三脂x2 胰岛素x3 糖化血红蛋白x4 Model 1 BStd. Error Unstandardized Coefficients Beta Standardized Coefficients tSig. Dependent Variable: 血 糖 y a. 16 432 663. 0287. 0402. 0500. 6 XXXY Coefficientsa 6.5002.3962.713.012 .402.154.3542.612.016 -.287.112-.360-2.570.017 .663.230.4132.880.008 (Constant) 甘油三脂x2 胰岛素x3
6、 糖化血红蛋白x4 Model 1 BStd. Error Unstandardized Coefficients Beta Standardized Coefficients tSig. Dependent Variable: 血 糖 y a. 17 ANOVAb 133.098344.36611.407.000a 89.454233.889 222.55226 Regression Residual Total Model 1 Sum of SquaresdfMean SquareFSig. Predictors: (Constant), 胰岛素x3, 甘油三脂x2, 糖化血红蛋白x4 a
7、. Dependent Variable: 血糖y b. 18 Coefficientsa 6.5002.3962.713.012 .402.154.3542.612.016 .663.230.4132.880.008 -.287.112-.360-2.570.017 (Constant) 甘油三脂x2 糖化血红蛋白x4 胰岛素x3 Model 1 BStd. Error Unstandardized Coefficients Beta Standardized Coefficients tSig. Dependent Variable: 血糖y a. n对新方程的偏回归系数进行检验对新方程的
8、偏回归系数进行检验 检验结果均有意义,因此回归方程保留检验结果均有意义,因此回归方程保留甘油三酯甘油三酯(X2)、胰岛、胰岛 素素(X3)和糖化血红蛋白和糖化血红蛋白(X4)三个三个因素。因素。 最后获得回归方程为:最后获得回归方程为: 432 663. 0287. 0402. 0500. 6 XXXY 19 总总 回归回归 SS SS R 2 Y 20 总总 残残 MS MS 1 1pn 1n )R1(1R 22 a 21 Model Summary .775a.601.5282.0095 .773b.598.5461.9721 Model 1 2 RR SquareAdjusted R S
9、quare Std. Error of the Estimate Predictors: (Constant), 糖化血红蛋白x4, 甘油三脂x2, 胰岛素x3, 总胆固醇x1 a. Predictors: (Constant), 糖化血红蛋白x4, 甘油三脂x2, 胰岛素x3 b. 22 23 24 25 bj X的偏回归系数的偏回归系数 Sj为自变量的标准差为自变量的标准差 SY 为应变量的标准差为应变量的标准差 Yjjj SSbb i i i i S XX u n若将各变量先经标准状态化处理后,再进行多元回归,若将各变量先经标准状态化处理后,再进行多元回归, 则所得到的偏回归系数即为标准
10、偏回归系数。则所得到的偏回归系数即为标准偏回归系数。 n计算:计算: 26 Coefficientsa 6.5002.3962.713.012 .402.154.3542.612.016 -.287.112-.360-2.570.017 .663.230.4132.880.008 (Constant) 甘油三脂x2 胰岛素x3 糖化血红蛋白x4 Model 1 BStd. Error Unstandardized Coefficients Beta Standardized Coefficients tSig. Dependent Variable: 血糖y a. 对血糖影响大小的顺序依次为:
11、糖化血红蛋白对血糖影响大小的顺序依次为:糖化血红蛋白(X4)、胰岛、胰岛 素素(X3) 、甘油三酯、甘油三酯(X2)。 比较糖化血红蛋白和甘油三酯的标准偏回归系数:比较糖化血红蛋白和甘油三酯的标准偏回归系数: 0.413 / 0.354 =1.17(倍)(倍) 糖化血红蛋白对血糖的影响强度约为甘油三酯的糖化血红蛋白对血糖的影响强度约为甘油三酯的 1.17倍。倍。 27 28 29 30 31 32 33 2 1 0 重型病人重型病人 中度型病人中度型病人 轻型病人轻型病人 X 3 2 1 重型病人重型病人 中度型病人中度型病人 轻型病人轻型病人 X 34 0 1 0 1 0 1 321 其它其
12、它 干部干部 其它其它 农民农民 其它其它 工人工人 XXX 35 36 说明说明X3、X4对应变量既有单独作用,又有交互作用。即说对应变量既有单独作用,又有交互作用。即说 明糖尿病人体内胰岛素对血糖的影响依赖于糖化血红蛋白明糖尿病人体内胰岛素对血糖的影响依赖于糖化血红蛋白 的含量。的含量。 Coefficientsa -.7903.172-.249.806 .365.133.3212.744.012 1.227.5101.5392.405.025 1.510.343.9414.401.000 -.179.059-1.828-3.022.006 (Constant) 甘油三脂x2 胰岛素x3
13、糖化血红蛋白x4 X3*X4 Model 1 BStd. Error Unstandardized Coefficients Beta Standardized Coefficients tSig. Dependent Variable: 血糖y a. 37 38 39 (9)残差分析)残差分析模型诊断模型诊断 iii YYe 通常以标准化残差(通常以标准化残差(standardized residual)为纵为纵 坐标,以坐标,以 为横坐标,作残差图。为横坐标,作残差图。 i Y 40 41 42 mm XXX P P Q P 22110 1 lnln 43 mm mm XXX XXX e
14、e P 22110 22110 1 mm XbXbXbb P P 22110 1 ln mm mm XbXbXbb XbXbXbb e e P 22110 22110 1 44 immii i i XbXbXbb Q P 22110 ln lmmll l l XbXbXbb Q P 22110 ln lmimmlili ll ii xxbxxbxxbOR QP QP 222111 )ln(ln 45 暴露暴露 非暴露非暴露 j X 1 0 )bexp(OR jj lmimmlili ll ii xxbxxbxxbOR QP QP 222111 )ln(ln ljij xx j b e 46 R
15、R P P P1P P1P OR 0 1 00 11 )bexp(OR jj 47 48 二、二、 Logistic 回归的参数估计及假设检验回归的参数估计及假设检验 例:例:在研究医院抢救急性心肌梗塞在研究医院抢救急性心肌梗塞(AMI)患者能否成患者能否成 功的危险因素调查中,某医院收集了功的危险因素调查中,某医院收集了5年中该院所有年中该院所有 的的AMI患者的抢救病史,共患者的抢救病史,共200例。其中例。其中P表示抢救表示抢救 是否成功(是否成功(0表示成功,表示成功,1表示死亡),表示死亡),X1表示抢救表示抢救 前是否已休克(前是否已休克( 0表示未休克,表示未休克,1表示已休克)
16、,表示已休克), X2 表示抢救前是否已心衰(表示抢救前是否已心衰( 0表示未心衰,表示未心衰,1表示已心表示已心 衰),衰),X3表示患者从开始有表示患者从开始有AMI症状到抢救时是否症状到抢救时是否 已超过已超过12小时(小时( 0表示未超过表示未超过12小时,小时,1表示已超过表示已超过 12小时)。试分析影响抢救成功率的因素。小时)。试分析影响抢救成功率的因素。 49 P=0(P=0(抢救成功抢救成功) )P=1(P=1(抢救不成功而死亡抢救不成功而死亡) ) X X1 1X X2 2X X3 3N NX X1 1X X2 2X X3 3N N 0 00 00 035350 00 00
17、 04 4 0 00 01 134340 00 01 11010 0 01 10 017170 01 10 04 4 0 01 11 119190 01 11 11515 1 10 00 017171 10 00 06 6 1 10 01 16 61 10 01 19 9 1 11 10 06 61 11 10 06 6 1 11 11 16 61 11 11 16 6 AMI患者的抢救危险因素资料患者的抢救危险因素资料 50 参数估计方法:参数估计方法:(maximum likelihood)。)。 最大似然法的基本思想:最大似然法的基本思想: 先建立似然函数或对数似然函数,求似然函数或对数
18、先建立似然函数或对数似然函数,求似然函数或对数 似然函数达到极大时参数的取值,即称为参数的最大似然似然函数达到极大时参数的取值,即称为参数的最大似然 估计值。估计值。 n i Y i Y i ii PPL 1 1 )1( n i iiii PYPYL 1 )1ln()1(lnln 51 Variables in the Equation 1.110.34810.1401.0013.033 .703.3294.5571.0332.019 .975.3448.0341.0052.651 -2.086.35135.2571.000.124 X1 X2 X3 Constant Step 1a BS.E
19、.WalddfSig.Exp(B) Variable(s) entered on step 1: X1, X2, X3. a. 参数估计方法:参数估计方法:(maximum likelihood) 321 975. 0703. 0110. 1086. 2 1 lnXXX P P b0=-2.086,表示在其它自变量均为,表示在其它自变量均为0时死亡优势的对数值;时死亡优势的对数值; exp(b0)=0.124是无休克、无心衰和抢救及时组死亡的优势,是无休克、无心衰和抢救及时组死亡的优势, 当死亡概率很低时,近似等于自然死亡率。当死亡概率很低时,近似等于自然死亡率。 52 Variables i
20、n the Equation 1.110.34810.1401.0013.033 .703.3294.5571.0332.019 .975.3448.0341.0052.651 -2.086.35135.2571.000.124 X1 X2 X3 Constant Step 1a BS.E.WalddfSig.Exp(B) Variable(s) entered on step 1: X1, X2, X3. a. b1=1.110X1的的logistic回归系数;回归系数; exp(1.110)=3.033,表示在其它自变量取值固定时,表示在其它自变量取值固定时, 休克与没有休克相比死亡的优势
21、比(休克与没有休克相比死亡的优势比(OR),反映),反映 死亡与休克的关联程度。死亡与休克的关联程度。 53 1. 似然比检验似然比检验比较两个模型的拟合效果。比较两个模型的拟合效果。 模型模型1含较少自变量,模型含较少自变量,模型2含较多自变量。含较多自变量。 H0:模型模型1与模型与模型2拟合效果无区别拟合效果无区别 H1:模型模型1与模型与模型2拟合效果不同拟合效果不同 检验统计量:检验统计量: )ln2(ln2 21 LLG 54 2. Wald检验检验用于回归系数的假设检验。用于回归系数的假设检验。 H0:=0 H1:0 检验统计量:检验统计量: 1 ) ( 2 2 SE 55 3.
22、 优势比的估计优势比的估计 j b j Sue :OR 2/j bxp 1 可信区间可信区间的的 56 Logistic Regression Dependent Variable Encoding 0 1 Original Value .00 1.00 Internal Value 显示的是应变量的赋值情况。显示的是应变量的赋值情况。 Binary Logistic过程默认以应变量过程默认以应变量 Y=1所对应的概率为所对应的概率为P,即以,即以P (Y=1)建立模型。)建立模型。 57 58 Omnibus Tests of Model Coefficients 21.7303.000 2
23、1.7303.000 21.7303.000 Step Block Model Step 1 Chi-squaredfSig. 59 Model Summary 222.616.103.146 Step 1 -2 Log likelihood Cox & Snell R Square Nagelkerke R Square 60 Classification Tablea 134695.7 54610.0 70.0 Observed .00 1.00 Y Overall Percentage Step 1 .001.00 Y Percentage Correct Predicted The c
24、ut value is .500 a. 61 Variables in the Equation 1.110.34810.1401.0013.033 .703.3294.5571.0332.019 .975.3448.0341.0052.651 -2.086.35135.2571.000.124 X1 X2 X3 Constant Step 1 a BS.E.WalddfSig.Exp(B) Variable(s) entered on step 1: X1, X2, X3. a. 3 jjj Sbb 62 Model if Term Removed -116.49110.3651.001 -
25、113.6004.5831.032 -115.5588.4991.004 Variable X1 X2 X3 Step 1 Model Log Likelihood Change in -2 Log Likelihooddf Sig. of the Change 63 疾病疾病暴露暴露非暴露非暴露 发生发生10 2 不发生不发生4080 例:例:在某项病因调查研究工作中,通过病例在某项病因调查研究工作中,通过病例对对 照研究,得下表资料:照研究,得下表资料: n疾病为疾病为Y ,发生为,发生为1,不发生为,不发生为0; n暴露情况为暴露情况为X,暴露为,暴露为1,非暴露为,非暴露为0。 n频数
26、需加权。频数需加权。 64 Variables in the Equation 2.303.7988.3171.00410.0002.09147.822 -3.689.71626.5521.000.025 expose Constant Step 1 a BS.E.WalddfSig.Exp(B) LowerUpper 95.0% C.I.for EXP(B) Variable(s) entered on step 1: expose.a. 65 条件条件logistic回归回归 n用于配对资料。用于配对资料。 66 配对组号配对组号 应变量应变量危险因素危险因素 i iY YX1X1X2X2
27、X3X3X4X4X5X5X6X6 1 11 13 35 51 11 11 10 0 0 01 11 11 13 33 30 0 0 01 11 11 13 33 30 0 2 21 11 13 31 11 13 30 0 0 01 11 11 13 32 20 0 0 01 12 21 13 32 20 0 25251 11 14 41 11 11 11 1 0 01 11 11 13 32 20 0 0 01 11 11 13 33 30 0 表表16-7 喉癌喉癌1 2配对病例对照调查资料整理表配对病例对照调查资料整理表 67 条件条件logistic回归的回归的SPSSSPSS实施实施利
28、用利用Cox回归模型回归模型 虚拟的生虚拟的生 存时间。存时间。 病例取值病例取值 为为1,对,对 照取值为照取值为 2。对照。对照 比病例数比病例数 值大的其值大的其 他数。他数。 虚拟的生虚拟的生 存时间。存时间。 病例取值病例取值 为为1,对,对 照取值为照取值为 2。对照。对照 比病例数比病例数 值大的其值大的其 他数。他数。 68 69 70 Variables in the Equation .933.2979.8901.0022.5431.4214.551 1.351.4299.9031.0023.8591.6648.950 2.147.8067.0871.0088.5591.76241.582 1.428.4838.7511.0034.1691.61910.735 2.084.8206.4541.0118.0371.61040.125 2.1801.1223.7731.0528.842.98179.727 1.487.5517.2921.0074.4231.50313.016 1.917.9444.1191.0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025贵州兴黔人才资源有限责任公司模拟试卷及完整答案详解一套
- 2025初级经济师金融专业常考知识点:企业合同的分类及其特点
- 2025年宣城宣州区水阳镇选拔村级后备干部18人模拟试卷及答案详解1套
- 2025年齐齐哈尔工程学院博士人才招聘50人模拟试卷及参考答案详解一套
- 2025湖北黄冈市武穴市事业单位第二批考核招聘三支一扶服务期满人员1人考前自测高频考点模拟试题及完整答案详解1套
- 2025北京大兴区庞各庄镇中心卫生院招聘临时辅助用工模拟试卷附答案详解(突破训练)
- 2025广西玉林市福绵区石和镇人民政府招聘代理服务记账中心编外人员2人考前自测高频考点模拟试题及一套参考答案详解
- 2025涟水县事业单位招聘人员40人考前自测高频考点模拟试题及1套完整答案详解
- 2025广西钦州市钦南区林业局招聘1人模拟试卷带答案详解
- 2025航空工业集团通飞华南校园招聘考前自测高频考点模拟试题含答案详解
- 教师晋升答辩常见问题汇编
- 新加坡安全培训题库及答案解析
- (人教A版)选择性必修一数学高二上册 第一章 空间向量与立体几何(A卷·知识通关练+B卷提升练习)(原卷版)
- 2025煤矿安全规程解读
- 2025-2026学年北师大版数学小学三年级上册(全册)教案设计及教学计划
- 2025年党纪法规知识测试题(含答案)
- 护理伦理与法律
- 网赌网贷专题教育
- (2025年)【辅警协警】笔试模拟考试试题含答案
- 急性阑尾炎护理诊断及措施
- 教育是唤醒的
评论
0/150
提交评论