Ch8 相关与回归分析.ppt_第1页
Ch8 相关与回归分析.ppt_第2页
Ch8 相关与回归分析.ppt_第3页
Ch8 相关与回归分析.ppt_第4页
Ch8 相关与回归分析.ppt_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、线性相关和回归预测线性相关和注册,相关性分析和回归预测是研究变量和变量之间相互关系的重要方法。 因此,SAS系统提供了强大的相关性分析和回归预测手段。 相关性分析可以在CORR进程中处理,而回归预测可以在REG进程中执行。 当然,特殊的回归预测SAS提供了专用的过程。 这里仅讨论CORR过程和REG过程的一般用法。 proc核心; 虚拟可变性; 部分可变性; 另一方面,线性相关性分析、SAS所提供的相关性分析进程是CORR进程,位于BASE模块中,能够进行校正计算的相关系数是Pearson积差相关系数、Spearman等级相关系数、Kendalls tau-b统校正量、Hoeffdings,此

2、外还计算偏相关系数等的双曲馀弦值。 CORR过程仅需要第一个语句(下划线部分),而其他语句是可选的。 常用句子和格式:句子说明1,proc corr选项; 这里的选项有20个以上。 下面是最简单的两个选项。 在差动奥尔特中,第一句中有两个单词带有分号(Proc corr )时,SAS系统对Pearson乘积相关系数(一般相关系数)进行修正,进行显着检查,进行简单的统一修正量。 人员: proccorrspearman; 此时,SAS系统校正Spearman类相关系数。 2、可变性; 指定修正相关系数的变量。 为了解例7-1年龄与血清总胆固醇的关系,随机抽取20高脂血症患者治疗前的血清总胆固醇水

3、平(mmol/L )和年龄,资料如下表所示。 年龄和胆固醇之间的相关关系是有木有查问题,首先是SAS数据定径套,data ex71; 输入牙周; 卡多斯; 245.436010.27287.49.519.72345.72377.12317.54。 run;由于数据过长,调用CORR过程而不是省略号,PROC CORR data=ex71; RUN; 普计程仪拉姆只有两个句子。 第一个语句调用CORR过程,表示解析数据定径套,第二个语句是plum计程仪结束语句RUN。 如果计程仪程序中没有VAR语句,则SAS系统对数据定径套中的所有数值类型变量进行相关解析。 解析结果、CORR进程的差动奥尔特输

4、出结果主要包含每个变量的简单统一描述和相关系数矩阵。 简单的统一描述:包括变量名称、斯坦共和国数、平均数、标准离差等。 在以前的修订过程中,这些个很常见。 相关系数矩阵:在相关系数矩阵上表示相关系数的类型。 例如,在本例中为“人员合作协议”。 接下来,对相关系数矩阵进行说明。 矩阵的各格子有两个数据,上面的数据是对应变量的相关系数,下面的数据是该相关系数的显着性。在本例中,由于age和chol的相关系数r=0.84993,p.0001,所以可以认为年龄和胆固醇之间有强的正相关等级相关系数,proc corr spearman数据=ex71; RUN; 要修正类相关系数,只需在调用CORR过程的

5、语句中加入选项“Spearman”。 另外,在本例中修正的age和chol的等级相关系数rs=0.84456,p.0001, SAS提供的回归预测的过程中,REG过程是最常用的过程。 使用最小二乘法拟合线性回归模型的同时提供多个“最优”回归子定径套的方法是应用广泛的回归过程。 下面介绍一元回归的情况。 二、直线回归预测、句子格式proc reg选项; 模型从属关系=注册; 打印STB; 出图y * x /选项; 的双曲馀弦值。 此步骤需要下划线部分。 语句说明1、proc reg选项; 此处的选项有两个类别的修订10项。 我们只介绍两个。 其雄辩的选项请参照SAS帮助。 corr :输出与mo

6、del语句中列出的变量关联的数组。 simple :输出reg进程中分析的每个变量的简单统一修正量。 2、模型从属=注册; 指定“因变量”和“参数”。 也就是说,指定回归公式模型,如y=x。 3、打印STB; 要求输出标准化的回归系数。 在较高版本的SAS系统中,REG进程不会自动输出标准化回归系数,因此必须使用此语句强制输出标准化回归系数。sas版本6.12可以自动输出标准化的回归系数。 4、PLOT Y*X/选项:以y变量为纵轴,以x变量为横轴创建散布图,自动绘制拟合的回归直线。 常用的选择是描绘整体回归线的信赖带和个体值的允许区间。 对应的选项分别是conf :整体回归线的信赖带。 pr

7、ed :个体值的允许区间。 事例分析使用例7-1的数据资料,以胆固醇为应变量,以年龄为自变量,试图作成直线回归方程。 数据定径套的编制完全相关性分析。 proc reg数据=ex71; 模型选择=age; RUN; 调用REG过程进行回归预测。 在Model语句中,chol在应变量中位于等号的左侧,age在参数中位于等号的右侧。 分析结果、模型的显性检验、几个整合量、参数估计和检验、结果的解释、结果主要分为回归模型的显性检验、几个整合量、回归残奥计的估计和检验三个部分。 回归模型显性检查: F=46.84,p.0001,认为回归模型成立。 一些统一修正量包含Root MSE (平方平均数),即误差平均值的平方根,R-Square(R2 ),即系数行列式; Adj R-Sq (修正r平方) Coeff Var (应变量的离散系数定)。 由于残奥仪表的推定和检验:回归式的截尾intercept=2.59951,自变量age的回归系数为0.14210,因此回归式对chol=2.59951 0.14210age的回归系数的假定检验为t=6.84,p0.0001以上的结果都是血proc reg数据=ex71; 模型选择=age; 打印STB; 出图彩色; R

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论