统计软件SAS讲义 相关分析_第1页
统计软件SAS讲义 相关分析_第2页
统计软件SAS讲义 相关分析_第3页
统计软件SAS讲义 相关分析_第4页
统计软件SAS讲义 相关分析_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、简单相关(Pearson相关) 又称直线相关、线性相关二、净相关三、复相关第五章 相关分析一、相关分析的功用 研究随机变量间的关系密切程度二、相关分析的应用 广泛应用于各行各业 如:身高与体重的关系; 病虫害的发生和流行原因的分析; 农作物增产和减产原因的分析等。第一节 简单相关表9.1 为说明两变量之间的线性关系而假设的三组(x,y)观察值组别 变量观 察 值 平均数 平方之和 第一组 x17 7 1 6 5 3 8 9 3 1y15 9 6 1 3 1 9 4 6 8 第二组 x29 8 7 7 6 5 3 3 1 1y29 9 8 6 6 5 4 3 1 1第三组 x31 1 3 3

2、 5 6 7 7 8 9y39 9 8 6 6 5 4 3 1 1三、简单相关的散点图表示第一节 简单相关第一节 两随机变量之间的线性关系表9.1 为说明两变量之间的线性关系而假设的三组(x,y)观察值组别 变量观 察 值 平均数 平方之和 第一组 x17 7 1 6 5 3 8 9 3 1y15 9 6 1 3 1 9 4 6 8 第二组 x29 8 7 7 6 5 3 3 1 1y29 9 8 6 6 5 4 3 1 1第三组 x31 1 3 3 5 6 7 7 8 9y39 9 8 6 6 5 4 3 1 1 第一组数据 第二组数据 第三组数据 a b c 图9.1 三组假设数据的散点图

3、第一节 两随机变量之间的线性关系 第一组数据 第二组数据 第三组数据 a b c 图9.1 三组假设数据的散点图 在第三组数据中,随着x3数值的增大, y3值有减少的趋势。 在第二组数据中,随着x2数值的增大, y2值有增加的趋势。 在第一组数据的散点图中,各点的位置很分散, x1和y1之间没有明显的关系。 第一组数据 第二组数据 第三组数据 a b c 图9.1 三组假设数据的散点图 在上面的三个散点图中,分别过各自的重心,即坐 标( , )作纵轴线和横轴线,将各图分为、 、和等四个象限。相关系数公式推导 第一组数据 第二组数据 第三组数据 a b c 图9.1 三组假设数据的散点图 在第一

4、组数据中四个象限的点的数目相差不多。 在第二组数据中,大部分的点分布在的和象限。 在第三组数据中,大部分的点分布在和象限。相关系数公式推导 第一组数据 第二组数据 第三组数据 a b c 图9.1 三组假设数据的散点图 不论在哪一幅图中,有四条规律是共同的: 第象限的点 0, 0, 0; 第象限的点 0, 0, 0; 第象限的点 0, 0, 0; 第象限的点 0, 0, 0; 相关系数公式推导 第一组数据 第二组数据 第三组数据 a b c 图9.1 三组假设数据的散点图其中 是两变量的离均差的乘积。如果将各组数据中所有观察值的离均差的乘积都加起来,可以发现离均差乘积和很接近于0离均差乘积和大

5、于0离均差乘积和小于0可见,离均差乘积和能很好地衡量两个变量之间的线性关系。记:相关系数公式推导表9.1 为说明两变量之间的线性关系而假设的三组(x,y)观察值组别 变量观 察 值 平均数 平方之和 第一组 x17 7 1 6 5 3 8 9 3 1y15 9 6 1 3 1 9 4 6 8 第二组 x29 8 7 7 6 5 3 3 1 1y29 9 8 6 6 5 4 3 1 1第三组 x31 1 3 3 5 6 7 7 8 9y39 9 8 6 6 5 4 3 1 1利用定义,可将上面三组数据的离均差乘积和算出为: SP1 (75)(55.2)(15)(85.2) 2 SP2 (95)(

6、95.2)(15)(15.2) 75SP3 (15)(95.2)(95)(15.2) -74相关系数公式推导协方差:去除资料的观测值数量的影响1、总体资料:2、样本资料:相关系数公式推导上述三组样本的协方差Sxy1=Cov1=Cov(x1,y1)=2/(10-1)=0.2222相关系数公式推导Sxy2=Cov2=Cov(x2,y2)=75/(10-1)=8.333Sxy3=Cov3=Cov(x3,y3)=74/(10-1)=8.222相关系数:去除资料的自身变异程度的影响1、总体相关系数:2、样本相关系数:相关系数公式推导第一节 两随机变量之间的线性关系四、简单相关系数性质相关系数的定义域:1

7、,1相关系数是相关性大小的度量,是没有单位的量相关系数 为低度相关相关系数 为中度相关相关系数 为高度相关第一节 两随机变量之间的线性关系四、简单相关系数性质正相关:0 r =1完全正相关: r = 1负相关:-1= r 0完全负相关: r = -1不相关:r = 0表9.1 为说明两变量之间的线性关系而假设的三组(x,y)观察值组别 变量观 察 值 平均数 平方之和 第一组 x17 7 1 6 5 3 8 9 3 1y15 9 6 1 3 1 9 4 6 8 第二组 x29 8 7 7 6 5 3 3 1 1y29 9 8 6 6 5 4 3 1 1第三组 x31 1 3 3 5 6 7 7

8、 8 9y39 9 8 6 6 5 4 3 1 1如果上例中的是样本数据,则它们的相关系数分别为: ; ; 练习:求三组数的相关系数 如第2组数据的相关系数 r2 =0.97721;所以 x2 与 y2之间有正的高度相关关系; 如第3组数据的相关系数 r3 = 0.96418;所以 x3与y3 之间有负的高度相关关系; 如第1组数据的相关系数 r1 =0.0261;所以 x1 与 y1之间就几乎没有线性相关关系。练习:求三组数的相关系数第一节 两随机变量之间的线性关系五、相关系数显著性测验第一步: 统计假设:H0:0,HA: 01、用统计量t检验当要使用一个样本的相关系数r对相应的总体相关系数

9、进行估计,可以由两种统计量t和r来实现总体相关系数是否为零的假设。相关系数显著性测验第二步:计算统计量tdf = n2相关系数显著性测验第三步:统计推断 1、|t|t0.05 推断相关不显著 2、t0.05|t| t0.01 3.356推断x2和y2相关达极显著2、统计量r显著性测验第一步:作统计假设第二步:计算统计量r,根据df=n-2,查相关系数显著性测验表,从而获得r0.05和r0.01 。第三步:作统计推断 1、|r|r0.05 推断相关不显著; 2、r0.05=|r|= r0.01 推断相关达极显著。第一节 两随机变量之间的线性关系实例:相关系数显著性测验根据自由度df=8,查相关系

10、数显著性测验表,从而获得 r0.05 = 0.632 r0.01 = 0.765作统计推断 今|r|=0.97721r0.01 推断x2和y2相关达极显著计算得:相关系数显著性测验t和r检验是等价的,在水平下相关系数显著性测验多个变量间的简单相关设有n个变量x1xn,其相关系数矩阵:第二节 净相关 偏相关一级净相关二级净相关 最高级净相关净相关:用数学方法固定其余的变量,消除其余变量的影响,只研究指定两个变量间的纯相关关系。 弥补了简单相关不能真实地反映两个变量间的相关关系。一级净相关Df=n-3第二节 净相关第二节 净相关二级净相关Df=n-4第二节 净相关最高级净相关df = n-m将m个变量中的m-2个变量固定,只研究另外两个变量的相关相关矩阵净相关系数的显著性检验第二步:计算统计量第一步:统计假设 H0:ij.0,HA:ij.0n为观测数据组数,m为相关变量总个数净相关系数的显著性检验第三步:统计推断 1、|tr|t0.05 推断相关不显著 2、t0.05|tr|t0.01 推断相关达显著 3、|tr|t0.01 推断相关达极显著 第三节 复相关复相关:是指一个变量和其余的变量间的复杂的关系复相关系数定义计算式第三节 复相关复相关系数回归计算式复相关系数R取值: 0R1复相关系数的显著性检验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论