SPSS的相关性分析_第1页
SPSS的相关性分析_第2页
SPSS的相关性分析_第3页
SPSS的相关性分析_第4页
SPSS的相关性分析_第5页
已阅读5页,还剩5页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第 分析 分析概 相关的基本概念1. 函数关系和相关关系函数关系是指事物或现象之间存着严格的依存关系它的确定性 一个变量的每一个值个变都具有惟一确定的值与之相对应间的函数关系通 常可以用函数式 Y=f(x)切地表示出来。例如,圆的周C 径 r 的存关系就是函数 关系:。相关关系反映出变量之间虽然相影响系能一一对应的。 例如生成绩与其智力因素成绩之间的关系投资额与经济发展水平的关 系、社会环境与人民健康的关系等,都反映出客观现象中存在的相关关系。 分析概关关系的类型(1据相关度的不同,相关关系可分为完全相关、不完全相关和无相关。(2据变量变动方向的趋势,相关关系可分为正相关和负相关。(3据变量系

2、的形态,相关关系可分为直线相关和曲线相关。(4据研究量的多少,可分为单相关、复相关。 相关分析关分析的作用(1断变量间有无联系(2定选择关关系的表现形式及相关分析方法(3握相关系的方向与密切程度(4关分析但可以描述变量之间的关系状况,而且用来进行预测。(5)析还可以用来评价测量量具的信度、效度以及项的区分度等。 相关分析相关系数是在直线相关条件下间相关程度以及相关方向的统计分 析指标。相关系数一般可以通过算得到。作为样本相关系数,常用字 示;作为总体 相关系数,常用字母 。相关系数的数值范围是介于 之(即 r 形式表示, 一般要取小数点后两位数字来表,以便比较精确地描述其相关程度。两个变量之间

3、的相关程度用相关数 r 的对值表示,其绝对值越接近 1表明两 个变量的相关程度越高;其绝对越接近 0,明两个变量相关程度越低。如果其绝对值 等于零 1,则表示两个变完全直线相关。如果其绝对值为零,则表示两个变量完全不相 (不是直线相关 相关分析变量相关的方向通过相关系数 所有的符号来表示示正相关1 “”示负相关,即 r 。在使用相系数时应该注意下面的几个问题。(1关系数是一个比率值,并不具备与相关变量相同的测量单位。(2关系数 r 量值区间大小及样本数目多少的影响比较大。(3自于不群体且不同质的事物的相关系数不能进行比较。(4于不同型的数据,计算相关系数的方法也不相同。 在简单相关分析中的应用

4、简单相关分析是研究两个变量之关联程度的统计方法过计算简单相关 系数来反映变量之间关系的强弱一般它有图形和数值两种表示方式。、相关图在统计中制作相关图,可以直观判断事物现象之间大致上呈现何种关系的形式。 相关图是相关分析的重要方法坐标系第一象限个变量置于横轴上二 个变量置于纵轴上两个变量对应的变量值用坐标点形式描绘出来相关点分 布状况的图形,这就是相关图 在简单相关分析中的应用2、关系数虽然相关图能够展现变量之间的量关系也只是种直观判断方法以计 算变量之间的相关系数型的变量应当采取不同的相关系数来度量系 数主要有:皮尔逊)关系数常称为积差相关系数,适用于研连续变量之间的相关程度。例如,收入和储蓄

5、存款、 身高和体重等变量间的线性相关系 Pearson 相关系数适用于线性相关的情形 曲线相关等更为复杂的情形,系的大小并不能代表其相关性的强弱。它的计算公式为:利用相关系数 r 的小可以判断变量间相关关系的密切程度,具体见表所示。 在简单相关分析中的应用 在简单相关分析中的应用对 单相关系数的统计检验是计算 t 计量服从 自由度的 t 分。 SPSS 会动计算 r 统量和 ,并据 t 给出其对应的相伴概率值。Spearman 级相关系数用来度量顺序水准变量间的线性相关关系。它是利用两变量的秩次 大小作线性相关分析,适用条件: 量的变量值是以等级次序表示的资料; 量的变量值是等级数据,另一个变

6、量的变量值是距或比率数据,且其两总体不 要求是正态分布,样本容量 一定大于 30。 在简单相关分析中的应用从斯皮尔曼等级相关适用条件中以看出关的应用范围要比积差相关广泛 的突出优点是对数据的总体分布大小都不做要求缺点是计算精度不高皮尔曼 等级相关系数常用符号 来表示。其基本公式为:式中D 是个变量每对数据等级之差 两列变量值的对数。Spearman 关系数计算公式可以完全套用 关系数的计算公式,但公式中的 x 和 的秩次代替即可。 在简单相关分析中的应用Kendalls 关系数它是用于反映分类变量相关性的标,适用于两个变量均为有序分类的情况。这种 指标采用非参数检验方法测度变间的相关关系的秩计

7、算一致对数目和非一致 对数目。显然,如果两变量具有强的正相关,则一致对数 较大;但若两变量相关 性较弱,则一致对数目 非一致对数目 致相等。故按照此思想,可得其定义:SPSS 将动计算它的相关系数、检验统计量和对应的概 P 。 在简单相关分析中的应用 简单相关分析的 详Step01主菜单选择菜单栏中的分)】关)】命令, 弹出 双变量相】话框,如图 这是简单相关检验的主 操作窗口。 在简单相关分析中的应用 在简单相关分析中的应用:择检验变量在【 量相)框左侧的候选变量列表框中选择个个 或两个以上变量将其添加至变)列表框中,表示需要行简单相关分析的变 量。:择相关系数类型图中的 Coefficie

8、nts()】选项组中可以选择计简单相关系数的 类型。 :系统默认项,即积差相关系数,计算连续变量或是等间距测度的变量间的相关分析。 级相关,计算分类变量间的秩相关。 等级相关,斯皮尔曼相关系数对于非等间距测度的连续变量,为分布不明可以使用等级相关分析,也可以使用 关分析完全等级的离散变量必须使用等级相关分析相关性不服从 双变量正态分布或总体分布型未等级表示时 Spearman 或 Kendall 相关。 在简单相关分析中的应用Step04检验类型选择在图中【Test 显性检中可选择输出的假设检验类型, 对应有两个单选项。 Two tailed系统默认项。双尾检验,当事先不知道关方向(正相关还是

9、负相关)时 选择此项。 One 单尾检验如果事先知道相关方向可以选择此项。同时,可以勾选 significant Correlations(性相】选框。它表示选择此项 后,输出结果中对在显著性水平 0.05 显著相关的相关系数用一个星号“*以标记;对在 显著性水平 0.01 相关的相关系数用两个星号“*”记。 在简单相关分析中的应用Step05选项选择单击 选)】按钮,弹出对话框用于指定输出内容和关于缺失值的处理方 法,主要包括以下选项。 Statistics择输出统计量 Means and standard 将输出选中的各变量的观测值数目、均值和标准差。 Cross-product devi

10、ations and 出反映选中的每一对变量之间的叉积离差 矩阵和协方差矩阵。 MissingValues用于设置缺失值的处理方式。它有两种处理方式: cases :统默认项。剔除当前分析两个变量值是缺失的个案。 cases listwise剔除所有含缺失值的个案后再进行分析。 在简单相关分析中的应用 在简单相关分析中的应用Step06统计量的 Bootstrap 单击,在弹出的对话框中可以进行如下统计量的 Bootstrap 估。 描述统计表支持均值和标准差的 计。 相关性表支持相关性的 Bootstrap 在简单相关分析中的应用 在简单相关分析中的应用 实例分析:股票指数之间的联系1. 实

11、例内容道琼斯工业平均指数DJIA标准普尔指数 500 500)都被用做股市全面动态 的测度DJIA 是于 种股票的价格动态 由 500 组成的指数。有人说 票市场功能的一种更好的测度,因为它于更多的股票。 和 1997 10 内的收盘价。请计算它们之间的样本相关系数。不仅如此样 本相关系数告诉我们 和 S&P 的关系是怎样的? 在简单相关分析中的应用2. 实例操作表给出了道琼斯工业平均指数和准普尔指数在同一时间点的数值是 连续型变量时根据两个股票指数的散点图它们呈显著的线性相关以采用 关系数来测度它们之间的相关性。但为了比较我们也计算了这两组变量的 Kendall Spearman 相关系数。

12、 在简单相关分析中的应用 在简单相关分析中的应用3. 实例结果及分析(1述性统分析表执行完上面的操作后,首先给出是当前样本进行描述性统计的结果,如 7-3 所。可 以看到样本容量都等于 工业平均指数和标准普尔指数的平均均值分别 7743.60 和 两者差距显著。同时,两者的方差差距也很明显。 在简单相关分析中的应用(2 相系数表接着 SPSS 道琼斯工业平均指数和标准普尔数的 关系数表 7-4 以看到,两种指数的 高达 ,非常接近 1相伴概率 P 显小于 显著性水平 ,这也进一步说明两者高度正线性相关。 在简单相关分析中的应用(3参数相系数表表 列了两种股票指数的 和 相系数 和 0.985

13、同时它们的概率 远小于显著性水平。但本案例中Spearman 相系数和 相 关系数都小于 Pearson 关系数由于在秩变换或数据按有序分类处理时损失信息 所导致的。所以,通过以上分析看到,道琼工业平均指数和标准普尔指数具有高度正相关性, 一个指数的上涨或上跌时,另一指数也会伴随着上涨或下跌。 在简单相关分析中的应用 在偏相关分析中的应用 偏相关分析的基本原理法概述简单相关分析计算两个变量之间相互关系,分析两个变量间线性关系的程度。 但是现实中之间的联系可存在于多个主体之间为第三个变量的作用使 得相关系数不能真实地反映两个量间的线性相关程度与肺活量之间的关 系,如果使用 Pearson 计算相

14、关系数,可以得出肺活量、身高和体重均存在较强的 线性相关性质上呢,对重相同的人而言,身高值越大其肺活量也不一定越大。因 为身高与体重有着线性关系量与体重有着线性关系得出了身高与肺活量之间存 在较强的线性关系的错误结论就是在研究两个变量之间的线性相关关系时控制 可能对其产生影响的变量。 在偏相关分析中的应用本原理偏相关分析是在相关分析的基础考虑了两个因素以外的各种作用了其他因素的作用大小以后度这两个因素间的关联程度方法的目的就在于消除 其他变量关联性的传递效应。偏相关系数在计算时可以首先分计算三个因素之间的相关系数三个简单 相关系数来计算偏相关系数,公如下:上式就是在控制了第三个因素的响所计算的

15、第一之间的偏相关系数 考虑一个以上的控制因素时的公类推。 在偏相关分析中的应用 偏相关分析的 操详解Step01主菜单选择菜单栏中的Analyze(分)】偏)】命令, 弹【Partial 偏相图 是偏相关检验的主操作窗口。 在偏相关分析中的应用Step02检验变量在 偏相)对话框侧的候选变量列表框中选择两个或两个 以上变量,将其添加至变表框中,表示需要进行偏相关分析的变量。 Step03控制变量在 偏相)对话框侧的候选变量列表框中至少选择一个变 量,将其添加至Controlling for()列表框中,表示在进行偏相关分析时需要控制的变 量。注意如果不选入控制变量,进行的是简单相关分析。Ste

16、p04检验类型选择在 Significance(著性检)】选项组中可以选择输出的假设检验类型,对应有 以下两个选项。 Two tailed系统默认项。双尾检验,当事先不知道关方向(正相关还是负相关)时选 择此项。 One 单尾检验如果事先知道相关方向可以选择此项。同时,可以勾选Flag significant 复选。它表示选择此项后,输出结果 中对在显著性水平 下著相关的相关系数用一个星号“”以标记;对在显著性水平 下显著相关的相关系数用两个星号“*”记。 在偏相关分析中的应用Step05选项选择单击】按钮弹出的对话框用于指定输出内容和关于缺失值的处理方法,主 要包括以下选项。 Statist

17、ics择输出统计量 Means deviations将输出中的各变量的观测值数目、均值和标准差。 示零阶相关矩阵,即 Pearson 矩阵。 MissingValues用于设置缺失值的处理方式。它有两种处理方式: cases :统默认项。剔除当前分析两个变量值是缺失的个案。 cases listwise剔除所有含缺失值的个案后再进行分析。 在偏相关分析中的应用 在偏相关分析中的应用Step06统计量的 Bootstrap 单击,在弹出的对话框中可以进行如下统计量的 Bootstrap 估。 描述统计表支持均值和标准差的 计。 相关性表支持相关性的 Bootstrap Step07OK按钮,结束

18、操作SPSS 软自动输出结果。 在偏相关分析中的应用 实例分析:股票市场和债券市场1. 实例内容在我国的金融市场中市场和债券市场都是其中的重要组成部分们之间的 关系有利于我们弄清楚金融市场间的关联特征券市场主要由银行间债券市场 和证券交易所债券市场组成处于相对分割状态主体易方式等方面存 在显著差异。数据文件 近几年我国股票市场、交易所国债市和银行间国债 市场的综合指数,请利用相关分研究这三个市场的关联特征 在偏相关分析中的应用 例操作由于这里要研究三个金融市场之的关系先可以利用 7.2 节单相关分析 来初步探讨它们之间的联系 算了这三个市场之间的 Pearson 关系数中数 据看到,三个市场间

19、的价格相关数较高,其中交易所和银行间国债市场相关系数高达 0.922它们和股市的相关系数相对较低,别是 ,从数值大小看到这两个 子市场和股市的关联性差异不明。但是关系数本身而言未必是两事物间线性关系强弱的真实体现有夸大 的趋势时都没有虑第三方的影响导致对事物的解释出现偏差。 这里市行间国债市场和交易所国债市场之间肯定是相互关联的场间的关系 强弱肯定要受到第三方的影响制,市场间的关系强弱可能存在传递效应。基于这种考虑, 这里要引入偏相关系数测度市场的关系。 在偏相关分析中的应用3. 实例结果及分析(1述性统分析表执行完上述操作后先给出的当前样本进行描述性统计的结果表 看到样 本容量都等于 ,三个

20、市场综合指数的样本均值和样本方差都一定的差距。 在偏相关分析中的应用(2相关系表表 7-8 了三个市场之间的偏相关系。在控制了股市指数后,银行间和 交易所市场间的相关系数没有发太大变化,仍然高 0.906了这两个市场的关系密 切且股市对两市波动影响较小行间国债市场所国债市场与股市的偏相关系数却 发生了显著变化:银行间市场和市的 系数为 0.419,而在控制了交易所指数 后的偏相关系数下降 0.114市的相关系数也 0.411 下降到 。这说明了第三方市场对剩余两个市场确实在显著影响,通过简单相关系数 还无法深入刻画市场之间的关系这里引入偏相关系数是比较适合的。 在偏相关分析中的应用 在偏相关分

21、析中的应用 在偏相关分析中的应用 在距离分析中的应用 距离分析的基本原理简单相关分析和偏相关分析有一共同点,那就是对所分析的数据背景应当有一定程 度的了解实际中有时会遇到一种情况对数据所代表的专业背景知识尚不充 分身就属于探索性的研究要先对各个指标或者案例的差异性程度进行 考察,以先对数据有一个初步了,然后再根据结果考虑如何进行深入分析。 在距离分析中的应用距离分析是对观测量之间或变量间相似或不相似的程度的一种测度,是计算一对变 量之间或一对观测量之间的广义距离量的不同类型以有许多距离似程度 测量指标供用户选择于本块只是一个预分析过程距离分析并不会给出常用的 P 而只能给出各变记录间的距离大小

22、,以供用户自行判断相似性调用距离分析过程可对变量内部观察单位间的数值进行距离相关分析 的接近程度可对变量间进行距离相关分析于考察预测值对实际值的拟合程度 可用于考察变量的相似程度。在离分析中,主要利用变量间的相似性测度) 和不相似性测度Dissimilarities究对象之间的关系。 在距离分析中的应用 距离分析的 SPSS 操解Step01对话框选择菜单栏中的分)】)令,弹出 【Distances()框,这是距离分析的主操作窗口 在距离分析中的应用Step02检验变量在距】话框左侧的候选变量列表框中选择两个或两个以上变量, 将其添加至变】表框中,表示需要进行距离分析的变量。同时可以选择一 个

23、字符型标示变量移入 个)】列表框中,在输出中将用这个标示变量值 对各个观测量加以标记。缺省时输出中用观测量的序号来标记。Step03分析类型在 算距)选项组中可以选择计算何种类型的距离。 cases系统默认项。表示作变量内部观察值之间的距相关分析。 variables作变量之间的距离相关分析。 在距离分析中的应用Step04类型选择在量标)项组中可以选择分析时采用的距离类型。 默认项性测距默认采用欧式距离测度观测值或变量之 间的不相似性。 :相似性测距。统默认使用 关系数测度观测值变量之间的 相似性。Step05操作单击】按钮,结束操作 自动输出结果。上述第四步中除了采用系统默认距离测度类型外

24、的需要自己选择测 度类型,由于这里专业性很强,且实际中使用很少,下面只做些简单的介绍。距)中相似)后 按钮,弹出下图所示的对话框。 在距离分析中的应用 在距离分析中的应用选择【Similarities(似)时各种数据类型用的测距方法有以下几种。 量资料 。 以 Pearson 数为距离。量矢量的余弦值为距离,界 +1 之间。 类变量 and Rao以二分点乘积为对系数。 :配对数与总对数的比例为配对系数。Jaccard相似比例,分子与分母中的配对数与非配对数给予相同的权重。:Dice 数,分子与分母中的对数给予加倍的权重。 Tanimoto Tanimoto 对系数为配对数配对数, 非配对数给

25、予加倍的权重。 1 型配对系数,分母为配对数,分子为非配对数, 配对数给予加倍的权重。 Sneath 2 型配对系数,分子与分母均为非配对数,但分子 给予加倍的权重。 在距离分析中的应用 Sneath 3 型配对系数,分母为配对数,分子为非配对数, 分子与分母的权重相同。Kulczynski 1:Kulczynski 型配对系数,分母为总数与配对数之差,子为非配对数,分 子与分母的权重相同。Kulczynski 2 平均条件概率。 Sneath 4 Sneath 。 Lambda:Goodman-Kruskai 相测量的 值 D:一个变量状态预测另一个变量状态。s Y 综合系数,属于 22 格表的列联比例函数。 属于 22 格表的列联比例函数。Ochiai:Ochiai 二余弦测量。 Sneath 5 型相似测量。 4 point correlation:Pearson 相系数的平方值。Dispersion:Dispersion 似测量。 在距离分析中的应用进行标准化的方法在标准】面的下拉列表中。单击矩形框右面的箭头按钮 展开下拉列表,可选择的标准化法如下。:不作数据转换,系统默认项。作标准 Z 转换,此时均值等于 准差等 。 -1 to 1-1 之间的标准化转。 to :作

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论