第五章相关分析_第1页
第五章相关分析_第2页
第五章相关分析_第3页
第五章相关分析_第4页
第五章相关分析_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2022-3-27安徽工业大学安徽工业大学 管理学院管理学院1相关分析相关分析(Correlation Analysis)2022-3-27安徽工业大学安徽工业大学 管理学院管理学院2相关分析的意义相关分析的意义v寻找变量间的关系是科学研究的首要目的。变量间的关系最简单的划分即:有关与无关。v在统计学上,我们通常这样判断变量之间是否有关:如果一个变量的取值发生变化,另外一个变量的取值也相应发生变化,则这两个变量有关。如果一个变量的变化不引起另一个变量的变化则二者无关。2022-3-27安徽工业大学安徽工业大学 管理学院管理学院3二、相关分析的概念二、相关分析的概念n 变量之间的关系分为确定性关

2、系和非确定性关系。确定性关系:当一个变量值(自变量)确定后,另一个变量值(因变量)也就完全确定了,确定性关系往往可以表示成一个函数的形式,比如圆的面积和半径的关系: S=r 非确定性关系:给定了一个变量值后,另一个变量值可以在一定范围内变化,例如家庭的消费支出和家庭收入的关系。 研究者把非确定性关系称为相关关系。2022-3-27安徽工业大学安徽工业大学 管理学院管理学院4 1 通通过过考考试试 2 未未通通过过考考试试 1男男性性 40% 60% 2女女性性 40% 60% 总总计计 40% 60% 性别与四级英语考试通过率的相关统计性别与四级英语考试通过率的相关统计表述:统计结果显示,当性

3、别取值不同时,通过率变量表述:统计结果显示,当性别取值不同时,通过率变量的取值并未发生变化,因此性别与考试通过率无关。的取值并未发生变化,因此性别与考试通过率无关。自变量的不同取值在因变量上无差异,两变量无关。自变量的不同取值在因变量上无差异,两变量无关。自变量的不同取值在因变量上有差异,两变量有关。自变量的不同取值在因变量上有差异,两变量有关。2022-3-27安徽工业大学安徽工业大学 管理学院管理学院5 每月工资平均数 N 1 男性 752.40 452 2 女性 601.97 409 总计 680.95 861 表述:统计结果显示,当性别取值不同时,收入变表述:统计结果显示,当性别取值不

4、同时,收入变量的取值发生了变化,因此性别与月收入有关。量的取值发生了变化,因此性别与月收入有关。自变量因变量2022-3-27安徽工业大学安徽工业大学 管理学院管理学院6三、相关系数三、相关系数n相关分析的主要目的是研究变量之间关系的密切程度,相关分析的主要目的是研究变量之间关系的密切程度,以及根据样本的资料推断总体是否样关。反映变量之以及根据样本的资料推断总体是否样关。反映变量之间关系紧密程度的指标主要是相关系数间关系紧密程度的指标主要是相关系数rnPearson相关系数应用广泛,其计算公式及其性质如相关系数应用广泛,其计算公式及其性质如下:下:22)()()(yyxxyyxxr不相关与时,

5、表示当为负相关与时,表示当为正相关与时,表示当高度相关显著相关、低度相关微弱相关、yxryxryxrrrrr00018 . 08 . 05 . 05 . 03 . 03 . 02022-3-27安徽工业大学安徽工业大学 管理学院管理学院7双变量关系的统计类型双变量关系的统计类型 定类 定序 定距 定类 列联 cross-tabulate 列联 cross-tabulate 方差分析(分组平均数) compare means 定序 列联 cross-tabulate 积差相关 spearman correlation 积差相关 spearman correlation 积矩相关 pearson

6、correlation 定距 积矩相关 pearson correlation 回归 regression 2022-3-27安徽工业大学安徽工业大学 管理学院管理学院8 定类 定序 定距 定类 卡方类测量 卡方类测量 Eta 系数 定序 Spearman相关系数 同 序 - 异 序对测量 Spearman 相关系数 定距 Pearson 相关系数 2022-3-27安徽工业大学安徽工业大学 管理学院管理学院9四、四、SPSS中相关分析中相关分析n在在Analyze的下拉菜单的下拉菜单Correlate命令项中有三命令项中有三个相关分析功能子命令个相关分析功能子命令:n Bivariate(两

7、两相关分析过程)(两两相关分析过程)n Partial (偏相关分析过程)(偏相关分析过程)n Distances(距离分析过程)(距离分析过程)2022-3-27安徽工业大学安徽工业大学 管理学院管理学院10Bivariate过过程程2022-3-27安徽工业大学安徽工业大学 管理学院管理学院11nBivariate过程用于进行两个或多个变量间的相关分析,如为多个变量,给出两两相关的分析结果。nPartial过程,当进行相关分析的两个变量的取值都受到其他变量的影响时,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数。nDistances过程用于对同一变量各观察单位间的

8、数值或各个不同变量间进行相似性或不相似性分析一般不单独使用,而作为因子分析等的预分析。2022-3-27安徽工业大学安徽工业大学 管理学院管理学院12n在进行相关分析时,散点图是重要的工具,分析前应先做散点图,以初步确定两个变量间是否存在相关趋势,该趋势是否为直线趋势,以及数据中是否存在异常点。否则可能的出错误结论。nBivariate相关分析的步骤:相关分析的步骤:输入数据后,依次单击AnalyzeCorrelateBivariate,打开Bivariate Correlations对话框如图512022-3-27安徽工业大学安徽工业大学 管理学院管理学院13图图51 Bivariate C

9、orrelations 对话框对话框不清楚变量之间是正相关还是不清楚变量之间是正相关还是负相关时选择此项。负相关时选择此项。清楚变量之间是正相关还是负清楚变量之间是正相关还是负相关时可选择此项。相关时可选择此项。计算积距相关系数,连续计算积距相关系数,连续性变量才可采用。性变量才可采用。计算计算Kendall秩相关系数,秩相关系数,适合于定序变量或不满足适合于定序变量或不满足正态分布假设的等间隔数正态分布假设的等间隔数据。据。计算计算Spearman秩相关系秩相关系数,适合于定序变量或不数,适合于定序变量或不满足正态分布假设的等间满足正态分布假设的等间隔数据。隔数据。在输出结果中,相关系数的在

10、输出结果中,相关系数的右上角上有右上角上有“”则表示显则表示显著性水平为著性水平为0.05;右上角上;右上角上有有“”则表示显著性水则表示显著性水平为平为0.01。见图见图522022-3-27安徽工业大学安徽工业大学 管理学院管理学院14图图52 Optins 对话框对话框对每一个变量输出对每一个变量输出均值、标准差和无均值、标准差和无缺省值的观测数。缺省值的观测数。对每一个变量输出对每一个变量输出交叉距阵和协方差交叉距阵和协方差距阵。距阵。计算某个统计量时,在这一计算某个统计量时,在这一对变量中排除有缺省值的观测对变量中排除有缺省值的观测值。值。对于任何分析,有缺省值的对于任何分析,有缺省

11、值的观测值都会被排除。观测值都会被排除。2022-3-27安徽工业大学安徽工业大学 管理学院管理学院15观测观测 号号12345678910体重体重(克)(克)83726990909590917570鸡冠重鸡冠重(毫克)(毫克)564218845610790683148连续变量相关分析实例数据表连续变量相关分析实例数据表相关分析实例相关分析实例1、连续变量的相关分析实例、连续变量的相关分析实例 十只小鸡的体重与鸡冠的数据如表所示(数据文件:小鸡(相关)小鸡(相关).sav):2022-3-27安徽工业大学安徽工业大学 管理学院管理学院16分析步骤1 1)输入数据,依次单击)输入数据,依次单击A

12、nalyzeCorrelateAnalyzeCorrelateBivariateBivariate,打开,打开Bivariate CorrelationsBivariate Correlations对话框对话框2 2)选择)选择weight weight 和和coronarycoronary变量进入变量进入 VariablesVariables框中。框中。3 3)在)在Correlation CoefficientsCorrelation Coefficients栏内选择栏内选择PearsonPearson。4 4)在)在Test of SignificanceTest of Signific

13、ance栏选择栏选择Two-tailedTwo-tailed。5 5)选择)选择Flag significant correlationFlag significant correlation。6 6)单击)单击OptionsOptions按钮,选择按钮,选择Mean and standard Mean and standard deviationsdeviations、Cross-product deviations and Cross-product deviations and covariancescovariances、Exclude cases pairiseExclude cas

14、es pairise选项。选项。7 7)单击)单击OKOK完成。完成。2022-3-27安徽工业大学安徽工业大学 管理学院管理学院17描述性统计量表,如下:描述性统计量表,如下:D De es sc cr ri ip pt ti iv ve e S St ta at ti is st ti ic cs s82.5010.011060.0027.6010体重鸡冠重MeanStd.DeviationN 从表中可看出,变量weight的均值为82.50,标准差为10.01,观测数为10;变量coronaryt的均值为60.00,标准差为27.60,观测数为10;结果分析结果分析2022-3-27安徽

15、工业大学安徽工业大学 管理学院管理学院18从表中可看出, Pearson相关系数为0.865,即小鸡的体重与鸡冠的相关系数为0.865,这两者之间不相关的双尾检验值为0.001。体重观测值的协方差为100.278,而鸡冠重观测值的协方差为761.556,体重和鸡冠重的协方差为239.111。从统计结果可得到,小鸡的体重与鸡冠重之间存在正相关关系,当小鸡的体重越大时,则小鸡的鸡冠越重。并且,否定了小鸡的体重与鸡冠重之间不相关的假设。Pearson相关系数距阵相关系数距阵C Co or rr re el la at ti io on ns s1.000.865*.001902.5002152.00

16、0100.278239.1111010.865*1.000.001.2152.0006854.000239.111761.5561010Pearson CorrelationSig. (2-tailed)Sum of Squares andCross-productsCovarianceNPearson CorrelationSig. (2-tailed)Sum of Squares andCross-productsCovarianceN体重鸡冠重体重鸡冠重Correlation is significant at the 0.01level (2-tailed).*. 2022-3-27安

17、徽工业大学安徽工业大学 管理学院管理学院192、定序变量的、定序变量的Spearman分析实例分析实例 为研究集团迫使个人顺从的效应,一些研究者用F量表和为测量地位欲而设计的一种量表对12名大学生进行调查。欲知道对权威主义的评分之间相关的信息。学生ABCDEFGHIJKL权威主义265110983412711地位欲342181110671259权威主义和地位欲评秩权威主义和地位欲评秩2022-3-27安徽工业大学安徽工业大学 管理学院管理学院201)输入数据,依次单击AnalyzeCorrelateBivariate,打开Bivariate Correlations对话框2)选择power和p

18、osition 变量进入 Variables框中。3)在Correlation Coefficients栏内选择Spearman选项。4)在Test of Significance栏选择Two-tailed。5)选择Flag significant correlation。6)单击Options按钮,选择Mean and standard deviations、Cross-product deviations and covariances、Exclude cases pairise选项。7)单击OK。分析步骤分析步骤2022-3-27安徽工业大学安徽工业大学 管理学院管理学院21 从表中可看

19、出,权威主义和地位欲的相关系数为0.818,这表明权威主义越高的人地位欲也越高。权威主义与地位欲不相关的假设检验值为0.001,否定假设,即权威主义与地位欲是相关的。C Co or rr re el la at ti io on ns s1.000.818*.0011212.818* 1.000.001.1212Correlation CoefficientSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)N权威主义地位欲Spearmans rho权威主义 地位欲Correlation is significant at the .01

20、 level (2-tailed).*. 结果分析2022-3-27安徽工业大学安徽工业大学 管理学院管理学院22C Co or rr re el la at ti io on ns s1.000.667*.0031212.667*1.000.003.1212Correlation CoefficientSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)N权威主义地位欲Kendalls tau_b权威主义地位欲Correlation is significant at the .01 level (2-tailed).*. 3、定序变量

21、的、定序变量的Kendall分析实例分析实例 仍用前例中的数据(数据文件:权威(权威(Spearman相相关)关).sav) 。操作过程相同,只是在第3)步在Correlation Coefficients栏内选择Kendalls选项。结果如下: 从表中可看出,权威主义和地位欲的相关系数为0.667,这表明权威主义越高的人地位欲也越高。权威主义与地位欲不相关的假设检验值为0.003,否定假设,即权威主义与地位欲是相关的。Kendall相关分析所得到的结果类似于Spearman分析。2022-3-27安徽工业大学安徽工业大学 管理学院管理学院23Partial 过程过程2022-3-27安徽工业

22、大学安徽工业大学 管理学院管理学院24偏相关分析也称净相关分析,它在控制其他变量的线性影响偏相关分析也称净相关分析,它在控制其他变量的线性影响下分析两变量间的线性相关,所采用的是工具是下分析两变量间的线性相关,所采用的是工具是偏相关系数偏相关系数(净相关系数)。运用偏相关分析可以有效地揭示变量间的(净相关系数)。运用偏相关分析可以有效地揭示变量间的真实关系,识别干扰变量并寻找隐含的相关性。真实关系,识别干扰变量并寻找隐含的相关性。如控制年龄如控制年龄和工作经验的影响,估计工资收入与受教育水平之间的相关和工作经验的影响,估计工资收入与受教育水平之间的相关关系。关系。PartialPartial过

23、程,当进行相关分析的两个变量的取值都受到其过程,当进行相关分析的两个变量的取值都受到其他变量的影响时,就可以利用偏相关分析对其他变量进行控他变量的影响时,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数。制,输出控制其他变量影响后的相关系数。2022-3-27安徽工业大学安徽工业大学 管理学院管理学院25举例:举例:分析身高与肺活量之间的相关性,要控制体重在分析身高与肺活量之间的相关性,要控制体重在相关分析过程中的影响。相关分析过程中的影响。1. 1.设置偏相关分析的参数。设置偏相关分析的参数。 依次单击依次单击“Analyze-Correlate-Patial”Ana

24、lyze-Correlate-Patial”执行偏相执行偏相关分析。其主设置面板如图所示:关分析。其主设置面板如图所示:2022-3-27安徽工业大学安徽工业大学 管理学院管理学院260 0阶偏相关阶偏相关(Pearson)Pearson)1 1阶偏相关阶偏相关显著相关显著相关相关不显著相关不显著2022-3-27安徽工业大学安徽工业大学 管理学院管理学院27(1 1)描述性输出,)描述性输出,“描述性统计量描述性统计量”表格给出了三个表格给出了三个变量的基本统计信息,包括均值、标准差和频率。变量的基本统计信息,包括均值、标准差和频率。(2 2)相关性输出,)相关性输出,“相关性相关性”表格给

25、出了所有变量的表格给出了所有变量的0 0阶偏相关(阶偏相关(PearsonPearson简单相关)系数和简单相关)系数和1 1阶偏相关系数的阶偏相关系数的计算结果果、以及它们各自的显著性检验计算结果果、以及它们各自的显著性检验P P值。分析结值。分析结果显示:在体重果显示:在体重 不变的条件下,身高与肺活量之间不不变的条件下,身高与肺活量之间不存在显著存在显著 线性相关关系。线性相关关系。2022-3-27安徽工业大学安徽工业大学 管理学院管理学院28Distances过程过程2022-3-27安徽工业大学安徽工业大学 管理学院管理学院29距离分析:此过程可以在观测记录之间或者距离分析:此过程

26、可以在观测记录之间或者 不同变量之间进不同变量之间进行行相似性和不相似性相似性和不相似性分析。相似性分析可以用于检测观测值分析。相似性分析可以用于检测观测值的接近程度,不相似性分析可用于考察各变量的内在联系和的接近程度,不相似性分析可用于考察各变量的内在联系和结构。该过程一般不单独使用,而是作为因子分析、聚类分结构。该过程一般不单独使用,而是作为因子分析、聚类分析和多维尺度分析等的预分析过程,以帮助了解复杂数据集析和多维尺度分析等的预分析过程,以帮助了解复杂数据集的内部结构,为进一步的分析做准备。的内部结构,为进一步的分析做准备。与距离分析有关的统计量分为相似性测度和不相似性测试两与距离分析有关的统计量分为相似性测度和不相似性测试两大类。大类。2022-3-27安徽工业大学安徽工业大学 管理学院管理学院30不相似性测度不相似性测度a a、对定距变量的测度可以使用的统计量有、对定距变量的测度可以使用的统计量有EuclidEuclid欧氏距离、欧氏距离、平方欧氏距离、契比雪夫距离等。平方欧氏距离、契比雪夫距离等。 b b、对定序变量,使用卡方不相似测度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论