统计学9.普通相关分析.ppt_第1页
统计学9.普通相关分析.ppt_第2页
统计学9.普通相关分析.ppt_第3页
统计学9.普通相关分析.ppt_第4页
统计学9.普通相关分析.ppt_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,第九章 普通相关分析,变量之间的相关关系有两种: 确定性的关系 不确定性的关系,相关分析是研究变量之间不确定关系的统计方法。最为常见的是两个或多个随机变量之间的线性相关关系。 也是本章研究的主要内容。,定义: X , Y 是随机变量, 已知二维( X, Y ) 分布, 总体相关系数,1. 两个随机变量的总体 (简单) 相关系数,一.两个随机变量的总体相关与样本相关,相关系数 XY-1, 1, 若XY = 0, 则称 X 与 Y 不相关. 若 X 与Y 相互独立, 则必然不相关, 即 XY = 0 . 反之, 不相关, 不一定独立. 但对两个正态分布, 不相关 独立.,2. 样本相关,定义: ( X1, Y1 ) , ( Xn, Yn )是 ( X, Y ) 的 一组样本( 样本 X, Y 是配对的, 不可独自交换顺序 ), 则样本相关系数:,注意: 小写的 xi 是大写 Xi 的中心化结果, 即 xi = Xi X . 对yi 同理.,这种相关关系, 又称 Pearson积矩相关.,相关系数计算,【例】在研究我国人均消费水平的问题中,把全国人均消费额记为y,把人均国民收入记为x。我们收集到19811993年的样本数据(xi ,yi),i =1,2,,13,数据见表10-1,计算相关系数。,计算结果,解:根据样本相关系数的计算公式有 人均国民收入与人均消费金额之间的相关系 数为 0.9987,3 样本相关系数的几何解释,x,y,|y| = y12 + yn2 , 表示向量 y =(y1, yn) T的模长.,4 . 直观散点图,设有配对样本观测值: x1, xn与 y1, yn , 则其直观散点图如图:,该散点图, 反映出x, y 之间的正相关关系.,1. 两组配对的顺序数据的 Spearman 等级相关系数(又称秩相关 或 名次相关),对两组配对顺序样本而言, 无法求出上述样本相关系数, 而应当采用Spearman 等级相关系数.,设有配对样本观测值x1, xn与 y1, yn .,二. Spearman 等级相关,等级相关系数公式如下:,式中, 而,表示 xi 的名次,表示yi 的名次.,注: 两个相同的名次 , 要加起来除以 2.,一个等价的公式是:,2. 刻度级(Scale) 配对样本的等级相关系数,刻度级的配对样本, 也可以排名次(秩), 因此可以求Spearman 等级相关系数. 计算公式同上. 等级相关, 也称非参数相关.,Spearmanman相关,我国30个省市区1997年的出生率X(单位:千分之一)和文盲率Y(单位:百分之一)为,13 16 10 22 20 26 19 29 27 30 14 23 28 24 25 14 16 9 10 8 18 20 27 26 30 22 28 29 25 11 -1 0 1 12 12 8 -1 2 1 0 -8 -5 -1 -1 14,2 3 12 18 17 7 9 8 1 6 5 15 11 21 4 1 6 12 5 15 2 4 7 3 19 17 21 23 13 24 1 -3 0 13 2 5 5 1 -2 -13 -12 -6 -12 8 -20,三 . 偏相关,偏相关就是, 在诸多相关的变量中, 剔除了其中的一个或若干个变量的影响后, 两个变量之间的相关关系.,1. 剔除了一个变量 Z 的影响后, 两个变量 X , Y 之间的偏相关系数。,偏相关系数是:,式中, r是普通样本相关系数.,2 . 剔除了两个变量 Z1, Z2 的影响后, 两个变量 X , Y 之间的偏相关系数,偏相关系数是:,式中, r,.是偏相关系数.,四. 相关系数异于零的显著性检验,由于我们是通过抽样的方法来研究变量之间的关系, 所以, 当求出各类样本相关系数不为零时, 并不能真正一定表明变量之间是相关的, 要通过假设检验判别是否显著异于 0.,1. 简单样本相关系数(Pearson)显著异于 0 的 T 检验,在二维总体(X,Y)服从正态分布条件下, Fisher 给出了检验简单相关系数(Pearson)显著异于0的t 统计量为:,服从 t (n-1)分布,式中, n 是样本容量, r 是简单相关系数.,设定假设: H0: r =0 H1: r 0 这是一个双尾检验问题.,2. 等级相关系数(Spearman)显著异于 0 的 T 检验,检验等级相关系数(Spearman)显著异于0的t 统计量为:,服从 t (n-1)分布,式中, n 是样本容量, r 是等级相关系数.,3. 偏相关系数显著异于 0 的 T 检验,检验偏相关系数显著异于0的t 统计量为:,服从 t (n-1)分布,式中, n 是样本容量, r 是偏相关系数,k是剔除了的变量数. 注意: 如果要作正负相关的双向检验,就要做双尾的T检验。如果只作正相关或负相关的检验,就只作单尾的T检验。 选择双尾还是单尾的T检验,所计算出来的 t 值是相同的,但是t的显著性概率p(统计值t的外侧概率)是不同的。在双尾情况下,t的外侧的概率是 21-P(Tt).在单尾的情况下, t的外侧的概率是1-P(Tt).,散点图 (例题分析),【例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据,散点图 (例题分析),散点图 (例题分析),相关系数 (例题分析),用Excel计算相关系数,相关系数的显著性检验, 对不良贷款与贷款余额之间的相关系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论