版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3章相关分析
相关分析的任务,是揭示地理要素之间相互关系的密切程度。而地理要素之间相互关系密切程度的测定,主要是通过对相关系数的计算与检验来完成的。本节主要内容:两要素之间相关程度的测定多要素间相关程度的测定简单相关分析是对两个变量之间的相关程度进行分析。简单相关分析所用的指标称为简单相关系数,又称为Pearson(皮尔森)相关系数。通常以ρ表示总体的相关系数,以r表示样本的相关系数(一)相关系数的计算与检验总体相关系数的定义式是:
其中,Cov(X,Y)是随机变量X和Y的协方差;Var(X)和Var(Y)分别为变量X和Y的方差。总体相关系数是反映两变量之间线性相关程度的一种特征值,表现为一个常数。
样本相关系数的计算
(3.1.1)两个要素标准化后的积的平均数
和为两要素的平均值。
公式(3.1.1)可简化为(3.1.2)(1)说明:-1<=<=1
大于0时正相关,小于0时负相关。的绝对值越接近于1,两要素的关系越密切;越接近于0,两要素的关系越不密切。(2)x与y是对称的,说明x与y的相关系数等同于y与x的相关系数。(3)由于相关系数是x和y标准化后的结果,因此简单相关系数是无量纲的。(4)对x和y做线性变换后可能会改变他们之间相关系数的符号(相关的方向),但不会改变相关系数的值。(5)相关系数能够度量两变量之间的线性关系,但并不是度量非线性关系的有效工具。(6)样本相关系数是根据样本观测值计算的,抽取的样本不同,其具体的数值也会有所差异。样本相关系数是总体相关系数的一致估计量。表3.1.1伦敦的月平均气温与降水量
资料来源:.tw/V4/climate/wta_station/wta20.htm
相关分析实例
(1)根据表3.1.1中的数据,我们可以利用公式(3.1.1),计算伦敦市月平均气温(t)与降水量(p)之间的相关系数
(2)计算结果表明,伦敦市的月平均气温(t)与降水量(p)之间呈负相关,即异向相关。又如:根据甘肃省53个气象台站的多年平均数据(见教材表3.1.2),可以利用公式(3.1.1)对降水量(p)和纬度(y)之间的相关系数以及蒸发量(v)和纬度(y)之间的相关系数进行计算,结果如下
==计算结果表明,降水量(p)和纬度(y)之间异向相关,而蒸发量(v)与纬度(y)之间同向相关。
相关系数的检验
相关系数是根据要素之间的样本值计算出来,它随着样本数的多少或取样方式的不同而不同,因此它只是要素之间的样本相关系数,只有通过检验,才能知道它的可信度。检验是通过在给定的置信水平下,查相关系数检验的临界值表来实现的。在X与Y都服从于正态分布,并且又有ρ=0的条件下,可以采用t检验来确定r的显著性。其步骤如下:首先,计算相关系数r的t值:其次,根据给定的显著性水平和自由度(n-2),查找t分布表中相应的临界值tα/2(或p值)。若|t|>tα/2(或p<α)表明r在统计上是显著的。若|t|≤tα/2(或p≥α),表明r在统计上是不显著的。
SPSS将自动计算Pearson简单相关系数、t统计量的观测值和对应的概率p值。秩相关系数又称Spearman等级相关系数,或顺序相关系数,是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。
(二)秩相关系数的计算与检验其中,di
=(xi−yi
),x
i和iy
分别是两个变量按大小(或优劣等)排位的等级(称为秩),n是样本的容量。(3.1.4)
与简单相关系数类似,Spearman等级相关系数的取值区间为:−1≤r
s≤1。
r
s为正值时,存在正的等级相关,r
s取负值时,存在负的等级相关。
r
s=1,表明两个变量的等级完全相同,存在完全正相关。r
s=-1,表明两个变量的等级完全相反,存在完全的负相关。
教材中表3.1.4给出了2003年中国大陆各省(直辖市、自治区)的GDP(x)和总人口(y)数据及其位次,将数据代入公式(3.1.4),就可以计算它们之间的秩相关系数即:GDP(x)与总人口(y)之间的等级相关系数为0.7847。
示例:Spearman等级相关系数检验
Spearman等级相关系数是根据一定的样本计算的。两个变量的总体是否存在显著的等级相关也需要进行检验。当样本容量n大于20时,可利用以下t统计量,进行等级相关系数的显著性检验。总体等级相关系服从自由度为(n-2)的t分布。在给定的显著水平α下,如按上式计算的t值(或者p值)大于临界值tα/2(n−2)(或p<α),则可以认为ρs
与0显著差别,即两种现象(两个变量)的总体是否存在显著的等级相关。
SPSS将自动计算Spearman相关系数、t统计量的观测值和对应的概率p值。(三)Kendall(肯德尔)的tau(τ)相关系数及其检验(了解)
Kendall(肯德尔)的tau相关系数由统计学家Kendall提出,适用于度量两个定序变量X与Y之间的相关。共有三种形式:tau-a、tau-b和tau-c,公式分别为:其中,Ns为X和Y的同序对的数目;N
d
为X和Y的异序对的数目;T
x
为X中同分对的数目;T
y
为Y中同分对的数目;n为样本容量;m为X与Y等级数较小者。所谓同序对是指变量大小顺序相同的两个样本观测值,即其X的等级高低顺序与Y的等级顺序相同,否则称为异序对;所谓同分对是指等级相同的一对样本观测值,如果样本容量为n,则样本观测值两两组对的话一共可以有n(n-1)/2对。一般情况下,tau-a是在没有同分对时采用,它表示同序对的数目与异序对的数目的差在全部可能对数中所占的比例。如果有同分对时常用tau-b和tau-c;如果X和Y的等级数相同,则可用tau-b,否则用tau-c。在SPSS中采用tau-b。特别注意,对不同类型的变量应采用不同的相关系数来度量。两个连续变量间呈线性相关时,使用Pearson积差相关系数,不满足积差相关分析的适用条件时,使用Spearman秩相关系数来描述.
Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。对于服从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要低一些。Spearman相关系数的计算公式可以完全套用Spearman相关系数计算公式,但公式中的x和y用相应的秩次代替即可。
Kendall‘stau-b等级相关系数:用于反映分类变量相关性的指标,适用于两个分类变量均为有序分类的情况。对相关的有序变量进行非参数相关检验;取值范围在-1-1之间,此检验适合于正方形表格;二、多要素间相关程度的测定偏相关系数的计算与检验复相关系数的计算与检验(一)偏相关系数的计算与检验①
定义:在多要素所构成的地理系统中,先不考虑其他要素的影响,而单独研究两个要素之间的相互关系的密切程度,这称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。偏相关系数的计算
在计算简单相关系数时,只需要掌握两个变量的观测数据,并不考虑其他变量对这两个变量可能产生的影响。而在计算偏相关系数时,需要掌握多个变量的数据,一方面考虑多个变量相互之间可能产生的影响,一方面又采用一定的方法控制其他变量,专门考察两个特定变量的净相关关系。
在多变量相关的场合,由于变量之间存在错综复杂的关系,因此偏相关系数与简单相关系数在数值上可能相差很大,有时甚至符号都可能相反。简单相关系数受其他因素的影响,反映的往往是表面的非本质的联系,而偏相关系数则较能说明现象之间真实的联系。
例如,一种商品的需求既受收入水平的影响又受其价格的影响。按照经济学理论,在一定的收入水平下,该商品的价格越高,商品的需求量就越小。也就是说,需求与价格之间应当是负相关。可是,在现实经济生活中,由于收入和价格常常都有不断提高的趋势,如果不考虑收入对需求的影响,仅仅利用需求和价格的时间序列数据去计算简单相关系数,就有可能得出价格越高需求越大的错误结论。②计算:3个要素的偏相关系数(3.1.5)
(3.1.6)
(3.1.7)
4个要素的偏相关系数(3.1.8)
(3.1.9)
(3.1.10)
(3.1.11)
例如:对于某4个地理要素x1,x2,x3,x4的23个样本数据,经过计算得到了如下的单相关系数矩阵:
利用公式计算一级偏向关系数,如表3.1.6所示:r12·3r13·2r14·2r14·3r23·1r24·1r24·3r24·1r34·20.8210.8080.6470.895-0.8630.9560.945-0.8750.371表3.1.6一级偏相关系数
利用公式计算二级偏相关系数,如表3.1.7所示:表3.1.7二级偏相关系数
r12·34r13·24r14·23r23·14r24·13r34·12-0.1700.8020.635-0.1870.821-0.337
4个要素的一级偏相关系数有12个,这里给出了9个;二级偏相关系数有6个,这里全部给出来了。偏相关系数的性质
①
偏相关系数分布的范围在-1到1之间;②
偏相关系数的绝对值越大,表示其偏相关程度越大;③
偏相关系数的绝对值必小于或最多等于由同一系列资料所求得的复相关系数,即R1·23≥|r12·3|。偏相关系数的显著性检验
偏相关系数的显著性检验,一般采用t检验法。其统计量计算公式为式中:为偏相关系数;n为样本数;m为自变量个数。
(3.1.14)
查t分布表,在自由度为23-3-1=19时,t0.001=3.883,显然,这表明在置信度水平=0.001上,偏相关系数r24·13是显著的。譬如,对于上例计算得到的偏相关系数
,由于n=23,m=3,故选择[Analyze]=>[Correlate]=>[Partial]
(二)复相关系数的计算与检验复相关系数:反映几个要素与某一个要素之间的复相关程度。复相关系数的计算当有两个自变量时当有三个自变量时(3.1.15)
(3.1.16)当有k个自变量时(3.1.17)
复相关系数的性质
①复相关系数介于0到1之间,即②
复相关系数越大,则表明要素(变量)之间的相关程度越密切。复相关系数为1,表示完全相关;复相关系数为0,表示完全无关。③
复相关系数必大于或至少等于单相关系数的绝对值。复相关系数的显著性检验
F检验法。其统计量计算公式为(3.1.18)例题:在上例中,若以x4为因变量,x1,x2,x3为自变量,试计算x4与x1,x2,x3之间的复相关系数。解:按照公式(3.1.16)计算检验:,故复相关达到了极显著水平。相关分析中应注意的问题相关系数不解释两个变量间的因果关系,它只是表明了两个变量间互相影响的程度和方向。有时两变量之间不存在相关关系,但却可能出现较高的相关系数,要警惕虚假相关导致的错误结论。如何运用SPSS进行相关分析数据准备:来自历年河南统计年鉴年份化肥施用量折纯量d万吨粮食产量d万吨1986148.732545.71987135.582948.41988150.5726631989184.253149.41990213.183303.71991239.73010.31992251.13109.6199328836391994292.473253.81995322.23466.51996345.33839.91997355.33894.71998382.84009.61999399.94253.32000419.54101.52001441.74119.92002468.842102003467.93569.52004493.2426020055
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医学26年:消化科危急值管理要点 查房课件
- 2026 减脂期坚果搭配策略课件
- 肝内胆汁淤积的护理措施
- 输液常见不良反应的预防措施
- 胎儿窘迫的护理心理支持
- 门急诊健康宣教服务
- 2026 塑型维持期肌酸维持课件
- 老年友好:动画讲解护理员沟通艺术
- 肠息肉护理中的安全管理
- 青光眼护理要点与实践
- 买房个人协议
- 援外成套项目(中方代建项目)检查验收标准
- DB12T 1341-2024 消防产品使用和维护管理规范
- 幼儿园班级幼儿图书目录清单(大中小班)
- 中国超重肥胖营养专家共识
- 村委会会议签到表
- MSOP(测量标准作业规范)测量SOP
- 第12章 群体遗传和进化
- 解除党纪处分影响期申请书
- GA 1807-2022核技术利用单位反恐怖防范要求
- GB/T 5330.1-2012工业用金属丝筛网和金属丝编织网网孔尺寸与金属丝直径组合选择指南第1部分:通则
评论
0/150
提交评论