




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第十七章 多因素回归分析的SAS实现例17-4 某研究者为了研究某种避孕药对人体血糖的影响,分别在正在使用这种避孕药的人群、6个月前曾经使用过这种避孕药的人群、从未使用过避孕药的人群中各随机抽取6人。考虑到血糖可能与年龄有关,所以该研究者不仅测定了这18位对象的血糖,而且也记录了这18位对象的年龄,具体资料见表174。请根据研究问题作统计分析。表17-4 三种避孕药使用情况下的年龄(,岁)与血糖水平(,mg)现服药者曾服药者从未服药者201202412628135211222613032137231242713234138231262913135137241252913435139241273
2、013637144SAS分析程序data ch17_4; 定义数据集名input x g1 g2 y; 定义数据集的变量名cards;200112021011222301124230112624011252401127241012626101302710132291013129101343010136280013532001373400138350013735001393700144;proc reg; 利用reg作线性回归分析model y=x g1 g2 /r; 指定模型并输出个体预测值、残差及其标准误run;SAS软件输出结果The REG Procedure Model: MODEL1
3、 Dependent Variable: y Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr F Model 3 717.68456 239.22819 83.88 |t| Intercept 1 102.56215 6.05307 16.94 .0001 x 1 1.06780 0.17951 5.95 F变异来源自由度平方和均方和F值P值Model(回归)3717.68456239.22819 83.88|t|变量自由度参数估计标准误F值P值Intercept (截距)1102.562156.0530
4、716.94.0001x(年龄)11.06780 0.179515.95.0001g11-0.426551.45283-0.290.7734g21-2.587572.20223-1.170.2596SAS软件输出结果解释该输出结果包含三个部分:第一部分是关于线性回归方差分析结果,第二部分是关于回归直线的参数估计结果,最后一部分是给出一些回归直线预测结果。具体来说,由第一部分的结果,由于P值0.0001,按水准,拒绝H0 认为模型有统计学意义;由第二部分结果,关于截距(Intercept)和年龄(x)假设的P值0.25,按水准,只有截距(Intercept)和年龄(x)不为0,同时建立回归方程;
5、由第三部分结果,我们可以得到每一个观察值y的期望值(Predicted value)及其标准误(Std Error Mean Predict),以及残差(Residual)等结果。教材中的说明表17-10 校正年龄后的回归分析主要结果回归系数b标准误setP值95%可信区间g1 -0.4271.453-0.290.773-3.543 2.689g2 -2.5882.202-1.170.260-7.311 2.136年龄X 1.0680.180 5.950.000 0.683 1.453常数项102.5626.05316.940.00089.580115.545由表17-10所显示的回归分析结果
6、表明,g1和g2的回归系数统计检验的P值均大于0.05,基于a=0.05检验水准,没有足够的证据可以推断三组总体均数不同,并且注意到年龄的回归系数检验的P值 F Model 1 98.80909 98.80909 63.79 F Intercept -0.74184 1.14239 0.65317 0.42 0.5214 x1 0.17955 0.02248 98.80909 63.79 F Model 2 106.78494 53.39247 40.73 F Intercept -13.02042 5.08766 8.58602 6.55 0.0164 x1 0.14411 0.02518
7、42.91972 32.74 F Model 3 114.19548 38.06516 35.37 F Intercept -14.67888 4.65313 10.71125 9.95 0.0040 x1 0.13489 0.02309 36.73343 34.13 F 1 x1 1 0.6950 0.6950 12.8131 63.79 F Model 3 114.19548 38.06516 35.37 |t| Estimate Intercept 1 -14.67888 4.65313 -3.15 0.0040 0 x1 1 0.13489 0.02309 5.84 .0001 0.6
8、2626 x2 1 0.54458 0.17952 3.03 0.0054 0.32404 x4 1 1.04474 0.39816 2.62 0.0144 0.23126 SAS软件输出结果解释该输出结果包含三个部分:第一部分(PART I)输出了逐步回归的过程,每一步筛选都对回归作了方差分析,同时对每一个入选变量也作假设检验,以决定该变量是否留在方程中。本例共进行了5步,最终留在方程中的变量为x1,x2和x4;第二部分(PART II)是逐步回归结果的总结,首先说明了入选和剔除模型的标准分别为0.15 和0.10。Variable Entered和Variable Removed分别表示入
9、选和剔除变量的名称,Partial R-Square和 Model R-Square分别表示偏相关系数和复相关系数,Cp值越小说明模型越理想。最后一部分(PART III)对回归模型进行检验,结果为F=35.37,p值0.05,故可以认为步骤 3的模型是最好的模型P0.048 0.009 0.499 0.013 最后的回归方程为由表1712的结果,可以认为年龄X1,体重指数X2和患糖尿病X4是影响瘦素的主要因素,年龄X1增大1岁,估计瘦素平均升高0.135 ng/ml;体重指数增大1个单位,估计瘦素平均升高0.545 ng/ml;患糖尿病患者的瘦素比非糖尿病患者平均升高1.045 ng/ml,
10、这些自变量均有统计学意义。例17-6 为了研究荨麻疹史(1为有,0为无)及性别(1为男,0为女)是否对慢性气管炎(1为病例,0为对照)有影响,某病例对照研究的研究结果见表17-13所示,试用logistic回归进行统计分析。表17-13 慢性气管炎的影响因素荨麻疹史性别慢性气管炎频数000 99001 90010153011138100 11101 20110 15111 30SAS分析程序data ch17_6; 定义数据集名input x1 x2 y count; 定义数据集的变量名cards;000 99001 90010153011138100 11101 20110 15111 30
11、;proc logistic descending; 利用logistic过程进行分析,descending表示反应变量的水平按从大到小排序freq count; 指定频数变量model y=x1 x2; 指定模型run;SAS软件输出结果Model Information Data Set WORK.CH17_6 Response Variable y Number of Response Levels 2 Number of Observations 8 Frequency Variable count Sum of Frequencies 556 Model binary logit O
12、ptimization Technique Fishers scoring Response Profile Ordered Total Value y Frequency 1 1 278 2 0 278 Probability modeled is y=1. Model Convergence Status Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics Intercept Intercept and Criterion Only Covariates AIC 772.780 767.868 SC 777.
13、100 780.830 -2 Log L 770.780 761.868 Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr ChiSq Likelihood Ratio 8.9116 2 0.0116 Score 8.7798 2 0.0124 Wald 8.5082 2 0.0142Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr ChiSq Intercept 1 -0.103
14、2 0.1400 0.5438 0.4608 x1 1 0.7540 0.2585 8.5082 0.0035 x2 1 0.00519 0.1749 0.0009 0.9763 Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits x1 2.126 1.281 3.528 x2 1.005 0.714 1.416 Association of Predicted Probabilities and Observed Responses Percent Concordant 16.7 Somers D 0.0
15、87 Percent Discordant 8.1 Gamma 0.350 Percent Tied 75.2 Tau-a 0.043 Pairs 77284 c 0.543SAS软件输出结果解释 Testing Global Null Hypothesis: BETA=0给出了模型是否成立的检验,各种检验方法的p值均0.05,可以认为模型是成立的。Analysis of Maximum Likelihood Estimates 给出了模型参数用最大似然估计方法得到的结果,可以发现关于变量x1的检验的p值0.05,而关于变量x2的检验的p值= 0.9763,因此该变量可以考虑从模型中剔除。可以
16、类似于例17-5考虑逐步回归方法。只要在语句model y=x1 x2;后加上/selection=stepwise sls=0.10 stb。Odds Ratio Estimates 给出了模型中各效应的优势比以及95%可信区间。本例变量x1的总体优势比为2.126,总体优势比95%可信区间为(1.281,3.528);变量x2的总体优势比为1.005,总体优势比95%可信区间为(0.714,1.416)。教材中的说明采用统计学软件对例17-6数据进行Logistic回归分析,可以得到表17-14结果。结果表明荨麻疹史与慢性气管炎正相关关系,其2.126,总体优势比95%可信区间为(1.28
17、1,3.528),即估计有荨麻疹史者发生慢性气管炎的优势约是无荨麻疹史者的2倍。性别对慢性气管炎影响不大(),该变量可以考虑从模型中剔除。表17-14 例17-6数据的logistic回归分析结果自由度回归系数WaldPORj的95CI估计值标准误下限上限常数项1-0.1030.1400.5440.4610.902荨麻疹史10.7540.2598.5100.0042.1261.2813.528性别10.0050.1750.0010.9761.0050.7141.416例17-7 某研究者对经某医院手术治疗的30例癌症患者进行了为期5年的临床随访观察,收集了每一患者的性别(X1=1为男性,X1=0为女性)、年龄(X2,岁)、从癌症确诊日期到手术日期的等候时间(X3,月)、从癌症确诊到研究结束的时间(即生存时间t,月),采用变量Y指示研究结束时每一手术患者的生存情况(Y=1为死亡,Y=0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2023年度山西老区职业技术学院单招《物理》能力提升B卷题库附答案详解【预热题】
- 一年级数学(上)计算题专项练习集锦
- 【优化方案】2025-2026学年高二物理(RJ.选修3-1):第二章第一节知能演练轻松闯关
- 建设单位管理行为检查表
- 浙江省2025年房地产经纪人《制度与政策》基础:不动产登记簿模拟试题
- 特殊教育读书感
- 管理人员安全教育培训
- 百草枯中毒患者的护理
- 现代物流管理专业教学标准(高等职业教育专科)2025修订
- 肿瘤介入术前健康指导
- 中国航天(航天科普知识)PPT
- GB/T 27806-2011环氧沥青防腐涂料
- GB/T 17949.1-2000接地系统的土壤电阻率、接地阻抗和地面电位测量导则第1部分:常规测量
- 梦幻西游古龙服务端安装教程
- 《出生医学证明》单亲母亲情况声明
- 4配电柜安全风险点告知牌
- 旋挖机操作手知识试卷含参考答案
- GB∕T 22590-2021 轧钢加热炉用耐火浇注料
- 大件运输管理制度
- Q∕GDW 11445-2015 国家电网公司管理信息系统安全基线要求
- 材料科学基础 第2章 晶体结构
评论
0/150
提交评论