版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
直线相关与回归分析
LinearCorrelationandRegression相关分析和回归分析是研究变量与变量间相互关系的重要方法。为此,SAS系统提供了强大的相关分析与回归分析手段。相关分析可用CORR过程来处理,而回归分析则可用REG过程来完成。当然,特殊的回归分析SAS提供了专用的过程。这里,仅仅讨论CORR过程和REG过程的常规用法。
PROCCORR<option(s)>;
VARvariables;
WITHvariables;
PARTIALvariables;
一、直线相关分析
SAS提供的相关分析过程是CORR过程,它位于BASE模块中,可以计算的相关系数有:Pearson积差相关系数、Spearman等级相关系数、Kendall‘stau-b统计量、Hoeffding’s独立性分析统计量D。此外,还可以计算偏相关系数等。CORR过程只有第一条语句(下划线部份)是必需的,其它语句都是可选的。常用语句及格式:语句说明1、PROCCORR[options];
这里的选项有20多项。我们现在只介绍最简单的两个选项:缺省值:即第一条语句只有两个单词加上分号,即
Proccorr;
这时,SAS系统计算Pearson积差相关系数(普通相关系数)和进行显著性检验,以及简单统计量。Spearman:即Proccorr
spearman;
此时,SAS系统计算Spearman等级相关系数。2、VARvariables;
指明要计算相关系数的变量。3、WITHvariables;
与VAR语句配合使用。计算VAR语句指定的变量与WITH语句指定的变量间的相关系数。输出的相关矩阵用VAR语句指定的变量作为列变量放在相关阵的上方,而用WITH语句指定的变量作为行变量放在相关阵的左边。假如有以下两句,
varxy;withab;
则,输出的相关阵形式为:
xya
-0.08297-0.61185
0.8319
0.0799b
0.26553-0.14309
0.4899
0.7134例7-1为了了解年龄与总胆固醇之间的关系,随机抽查了20高血脂病人治疗前的总胆固醇水平(mmol/L)与年龄,资料见下表。试问年龄与胆固醇之间是否存在相关关系?首先建立SAS数据集dataex71;inputagechol;cards;24 5.4360 10.2728 7.49……….51 9.7234 5.7237 7.1231 7.54;run;由于数据太长,此处以省略号代之调用CORR过程PROC
CORRdata=ex71;RUN;程序中只有两条语句,第一条语句调用CORR过程,并指明分析数据集;第二条词句就是程序结束语句RUN。程序中没有VAR语句,则SAS系统对数据集中所有数值型变量进行相关分析。分析结果TheCORRProcedure2Variables:agechol
SimpleStatisticsVariableNMeanStdDevSumMinimumMaximumage2039.4500013.01204789.0000020.0000060.00000chol208.205502.17555164.110004.7100011.73000
PearsonCorrelationCoefficients,N=20
Prob>|r|underH0:Rho=0
agecholage1.00000
0.84993
<.0001chol0.84993
<.00011.00000
CORR过程的默认输出结果主要包括各个变量的简单统计描述和一个相关系数矩阵。简单统计描述:包括变量名、例数、均数、标准差等,这些都是前面的统计过程经常出现的。相关系数矩阵:
在相关系数矩阵的上方指明了相关系数的类型,如本例是”PearsonCorrelationCoefficients”,接下来就是对相关系数矩阵的说明,矩阵中每一个格子有两个数据,上方的数据是对应变量的相关系数,其下方的数据是该相关系数的显著性检验。本例中,age与chol的相关系数r=0.84993,p<.0001,因此可以认为年龄与胆固醇之间存在着较强的正相关。等级相关系数PROC
CORRSpearmandata=ex71;RUN;计算等级相关系数只需在调用CORR过程的语句中加入选项“Spearman”即可。SpearmanCorrelationCoefficients,N=20
Prob>|r|underH0:Rho=0
agecholage1.00000
0.84456
<.0001chol0.84456
<.00011.00000
本例计算的age与chol的等级相关系数rs=0.84456,p<.0001SAS提供的回归分析的过程中,REG过程是一个最常用的过程。它采用最小二乘法拟合线性回归模型,同时还提供多种“最优”回归子集的方法,是一个应用广泛的回归过程。我们这里只介绍一元回归的情形。二、直线回归分析语句格式PROCREG[options];
MODELdependent=regressors;PRINTstb;PLOT[Y*X][/options];此过程中,下划线的部份是必需的。语句说明1、PROCREG[options];
这里的选项有两类共十项,我们只介绍两项,其余的选项请查阅SAS帮助。CORR:对model语句中列出的变量输出相关阵。SIMPLE:对用REG过程进行分析的每个变量输出简单统计量。2、MODELdependent=regressors;
指定因变量(dependent)和自变量(regressors),即指定回归方程模型,如,y=x等。3、PRINTstb;
要求输出标准化回归系数。对于高版本的SAS系统,REG过程不会自动输出标准化回归系数,因此,需用该语句强制输出标准化回归系数。对于SAS6.12版,可以自动输出标准化回归系数。4、PLOT[Y*X];
以Y变量为纵轴、X变量为横轴作散点图,并自动绘制拟合的回归直线。实例分析仍然采用例7-1的数据资料,试以胆固醇为应变量,年龄为自变量建立直线回归方程。数据集的建立完全同相关分析。PROCREG
data=ex71;MODEL
chol=age;RUN;调用REG过程进行回归分析Model语句中,chol是应变量,放在等号的左边,age是自变量,放在等号的右边。分析结果TheREGProcedureModel:MODEL1DependentVariable:cholAnalysisofVarianceSourceDFSumof
SquaresMean
SquareFValuePr
>
FModel164.9613664.9613646.84<.0001Error1824.965941.38700
CorrectedTotal1989.92730
RootMSE1.17771R-Square0.7224DependentMean8.20550AdjR-Sq0.7070Coeff
Var14.35267
ParameterEstimatesVariableDFParameter
EstimateStandard
Errort
ValuePr
>
|t|Intercept12.599510.860443.020.0073age10.142100.020766.84<.0001模型的显著性检验一些统计量参数估计及检验结果的解释结果主要分为三部份:回归模型的显著性检验、一些统计量、回归参数的估计及检验。对回归模型的显著性检验:F=46.84,p<.0001,可以认为回归模型是成立的。一些统计量包括:RootMSE(均方根),即误差均方的平方根;R-Square(R2),即决定系数;AdjR-Sq(校正R平方);Coeff
Var(应变量的变异系数)。参数估计及检验:回归方程的截距intercept=2.59951,自变量age的回归系数为0.14210,因此回归方程为:
chol=2.59951+0.14210age
对回归系数的假设检验得t=6.84,p<0.0001,因此可以认为回归系数具有统计学意义,即总体回归系数β≠0。以上结果均表明血中胆固醇水平与年龄之间具有直线关系。PROCREGdata=ex71;MODELchol=age;PRINTstb;PLOTchol*age;RUN;输出标准化回归系数及绘制回归直线在程序中添加两条语句(红色部份)。PRINTstb;语句表示输出标准化回归系数;PLOTc
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年班组操作员安全培训内容重点
- 库房档案安全培训内容2026年实操流程
- 大同市矿区2025-2026学年第二学期五年级语文期中考试卷(部编版含答案)
- 郴州市桂阳县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 福州市连江县2025-2026学年第二学期五年级语文第六单元测试卷(部编版含答案)
- 2026年保险投资管理合同协议
- 阜阳市颍州区2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 张家口市阳原县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 电梯工安全操作培训内容2026年全套攻略
- 伊犁哈萨克自治州尼勒克县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 护理血管解剖知识课件
- 2025年高考作文备考之60组高分论证结构:标题、开头、分论点、结尾
- 2025年中考语文二轮文言文复习:人物传记 练习题(含答案解析)
- 虚拟现实交互设计(基于Unity引擎)(微课版)全套完整教学课件
- 护士三基培训内容
- 六年级少先队活动课《我们的集体日记》课件
- 2023年高考真题-英语(天津卷) 含答案
- 杵针疗法技术操作规范标准
- 中医培训课件:《经穴推拿术》
- 校园小记者培训课件
- DBJ∕T 15-19-2020 建筑防水工程技术规程
评论
0/150
提交评论