第八章 相关分析_第1页
第八章 相关分析_第2页
第八章 相关分析_第3页
第八章 相关分析_第4页
第八章 相关分析_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章第八章 相关分析相关分析相关分析相关分析 相关分析研究变量之间联系的紧密程度。例如身高相关分析研究变量之间联系的紧密程度。例如身高和体重之间的关系、年龄与阅读能力的关系、广告支和体重之间的关系、年龄与阅读能力的关系、广告支出与产品的销售量之间的关系等。出与产品的销售量之间的关系等。8.1 8.1 基本数学原理基本数学原理 相关分析通过相关系数来衡量变量之间的紧密程度。相关相关分析通过相关系数来衡量变量之间的紧密程度。相关系数介于系数介于-1-1-1-1之间之间, ,当大于当大于0 0时称为正相关时称为正相关, ,表示表示A A变量随变量随B B变变量的增大而增大量的增大而增大, ,相关系

2、数小于相关系数小于0 0时称为负相关时称为负相关, ,表示表示A A变量随变量随B B变量的增大而减小。变量的增大而减小。 常用的相关系数为常用的相关系数为PearsonPearson相关系数相关系数, ,另外还有另外还有KendallKendall偏秩相关系数和偏秩相关系数和SpearmanSpearman秩相关系数。分别介绍如下(主要秩相关系数。分别介绍如下(主要介绍如何计算相关系数)。介绍如何计算相关系数)。v(1)Pearson (1)Pearson 相关系数度量两个变量之间的线性相关程度。相关系数度量两个变量之间的线性相关程度。相关系数前面的符号表征相关关系的方向相关系数前面的符号表

3、征相关关系的方向, ,其绝对值的大其绝对值的大小表示相关程度小表示相关程度, ,相关系数越大相关系数越大, ,则相关性越强。则相关性越强。 v(2)Kendall (2)Kendall 偏秩相关系数是适用于度量等级变量或秩变偏秩相关系数是适用于度量等级变量或秩变量相关性的一种非参数度量。量相关性的一种非参数度量。v(3)Spearman (3)Spearman 秩相关系数是秩相关系数是PearsonPearson相关系数的非参数版相关系数的非参数版本本, ,主要基于数据的秩而不是数据的值本身主要基于数据的秩而不是数据的值本身, ,它适用于等级它适用于等级数据和不满足正态假定的等问隔数据。数据和

4、不满足正态假定的等问隔数据。PearsonPearson简单相关系数计算公式为简单相关系数计算公式为 对对PearsonPearson简单相关系数的统计检验是计简单相关系数的统计检验是计算算t t统计量,公式为统计量,公式为 t t统计量服从统计量服从n n2 2个自由度的个自由度的t t分布。分布。 SpearmanSpearman等级相关系数为等级相关系数为8.2 SPSS8.2 SPSS实现实现 8.2.1 8.2.1 对话框介绍对话框介绍 在在AnalyzeAnalyze主菜单中用鼠标指向主菜单中用鼠标指向CorrelateCorrelate选项选项, ,然后然后在打开的子菜单中单击在

5、打开的子菜单中单击BivariateBivariate- 选项选项, ,打开对话框打开对话框, ,在在该对话框中设置选项该对话框中设置选项, ,进行变量两两之间的相关分析。该对进行变量两两之间的相关分析。该对话框中各选项的意义分别为话框中各选项的意义分别为: : (1)Variables (1)Variables列表框列表框: :用箭头按钮从左边列表框中将需用箭头按钮从左边列表框中将需要分析的变量对应的变量名转移到该列表框中要分析的变量对应的变量名转移到该列表框中。 (2)Correlation Coefficients(2)Correlation Coefficients方框方框: :在该方

6、框内确定计算哪在该方框内确定计算哪( (几几) )种相关系数种相关系数, ,有有3 3个选项。个选项。 PearsonPearson核选框为默认选项。选择此项核选框为默认选项。选择此项, ,生成生成PearsonPearson相关系数。相关系数。 KendallsKendalls核选框核选框 选择此项选择此项, ,生成生成KendallKendall偏秩相关系数。偏秩相关系数。 SpearmanSpearman核选框核选框 选择此项选择此项, ,生成生成SpearmanSpearman秩相关系数。秩相关系数。 (3)Test of Significance(3)Test of Signific

7、ance方框方框: :确定进行双侧显著性检验还确定进行双侧显著性检验还是单侧显著性检验。检验的零假设为相关系数为零是单侧显著性检验。检验的零假设为相关系数为零, ,即分析的变即分析的变量之间不具相关性。量之间不具相关性。 Two-tailedTwo-tailed单选钮单选钮 为默认选项。选择此项为默认选项。选择此项, ,进行双侧显著性进行双侧显著性检验检验 One-tailedOne-tailed单选钮单选钮 选择此项选择此项, ,进行单侧显著性检验进行单侧显著性检验 (4)Flag significant correlations(4)Flag significant correlation

8、s核选框核选框: : 默认时选择此项默认时选择此项, ,表示在成果表中标注经检验显著的变量对表示在成果表中标注经检验显著的变量对, ,并在表的下方添加脚并在表的下方添加脚注注, ,注明显著性水平。对于单侧检验注明显著性水平。对于单侧检验, ,显著性水平为显著性水平为0.05,0.05,对于双对于双侧检验侧检验, ,显著性水平为显著性水平为0.010.01。 (5)Options(5)Options按钮按钮: :单击该按钮单击该按钮, ,打开打开Bivariate Bivariate Correlation:OptionsCorrelation:Options 对话框。在该对话框中可以设置更多的

9、选对话框。在该对话框中可以设置更多的选项。项。 -Statistics-Statistics方框方框 设置统计量的生成。设置统计量的生成。 Means and standard deviationsMeans and standard deviations核选框选择此项核选框选择此项, ,计算计算均值和标准离差。均值和标准离差。 Cross-product deviations and covarianceCross-product deviations and covariance核选框选核选框选择此项择此项, ,计算叉积离差和协方差。计算叉积离差和协方差。 -Missing Values-

10、Missing Values方框方框 设置缺失值的处理方式。设置缺失值的处理方式。 Exclude cases pairwiseExclude cases pairwise单选钮单选钮 为默认选项。选择此为默认选项。选择此项项, ,剔除正在进行相关分析的配对变量中含有缺失值的个案。剔除正在进行相关分析的配对变量中含有缺失值的个案。 Exclude cases listwiseExclude cases listwise单选钮单选钮 选择此项选择此项, ,剔除所有剔除所有含有缺失值的个案的全部数据。含有缺失值的个案的全部数据。12.2.2 12.2.2 应用实例应用实例 实例实例1:H.H.Sm

11、ith1:H.H.Smith在烟草杂交繁殖的花上搜集了以下的数据在烟草杂交繁殖的花上搜集了以下的数据文件为文件为“Flower.savFlower.sav”。 要求对以上要求对以上3 3组数据两两之间进行相组数据两两之间进行相关分析。关分析。 在数据编辑器中打开该数据文件在数据编辑器中打开该数据文件, ,变量分别定名为变量分别定名为“花花瓣瓣”、“花枝花枝”和和“花萼花萼 。打开。打开BivariateBivariate Correlations Correlations对话对话框框, , 进行设置进行设置, ,运行过程运行过程, ,生成以下表格。生成以下表格。 表表1 1为相关表。表中列出了

12、为相关表。表中列出了3 3个变量两两之间的个变量两两之间的PearsonPearson相关系数相关系数(Pearson Correlation)(Pearson Correlation)、双侧显著性检验概率、双侧显著性检验概率(Sig.2-tailed)(Sig.2-tailed)和数据组数和数据组数(N)(N)。脚注内容显示相关分析结果在。脚注内容显示相关分析结果在0.010.01的水平上显的水平上显著。另外著。另外, ,从表中可以看出从表中可以看出, ,花瓣长和花枝长的数据具有很强的花瓣长和花枝长的数据具有很强的相关性。而双侧检验的显著性概率均小于相关性。而双侧检验的显著性概率均小于0.0

13、1,0.01,因此否定零假设因此否定零假设, ,认为相关系数不为零认为相关系数不为零, ,变量之间具有相关性。变量之间具有相关性。C Co or rr re el la at ti io on ns s1.955*.797*.000.000181818.955*1.678*.000.002181818.797*.678*1.000.002.181818Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N花瓣长花枝长花萼长花瓣长花枝长花萼长

14、Correlation is significant at the 0.01 level (2-tailed).*. 在以上设置的基础上在以上设置的基础上, ,单击单击OptionsOptions按钮按钮, ,打开打开Bivariate Bivariate Correlations:OptionsCorrelations:Options 对话框对话框, ,选择选择StatisticsStatistics方框内的两个方框内的两个核选框核选框, ,单击单击“ContinueContinue按钮按钮, ,运行过程运行过程, ,生成表生成表2 2和表和表3 3。 表表2 2为描述统计量表。表中列出的统

15、计量包括各变量的均值为描述统计量表。表中列出的统计量包括各变量的均值(Mean)(Mean)、标准离差、标准离差(Std.Deviation(Std.Deviation) )和数据个数和数据个数(N)(N)。 Descriptive StatisticsDescriptive Statistics40.445.9731819.675.0291816.173.29418花瓣长花枝长花萼长MeanStd. DeviationNCorrelationsCorrelations1.955*.797*.000.000606.444487.667266.66735.67328.68615.68618181

16、8.955*1.678*.000.002487.667430.000191.00028.68625.29411.235181818.797*.678*1.000.002.266.667191.000184.50015.68611.23510.853181818Pearson CorrelationSig. (2-tailed)Sum of Squares andCross-productsCovarianceNPearson CorrelationSig. (2-tailed)Sum of Squares andCross-productsCovarianceNPearson Correlat

17、ionSig. (2-tailed)Sum of Squares andCross-productsCovarianceN花瓣长花枝长花萼长花瓣长花枝长花萼长Correlation is significant at the 0.01 level (2-tailed).*. 表表3为添加了叉积平方和为添加了叉积平方和(Sum of Squares and Cross-products)和协方差和协方差(Covariance)的相关分析成果表。的相关分析成果表。实例实例2:2:对对1212个受试者的地位欲、权威主义和顺从性进行评秩个受试者的地位欲、权威主义和顺从性进行评秩, ,得到得到的数据文件

18、为的数据文件为Testee.savTestee.sav, ,试分析试分析3 3者之间的相关性。者之间的相关性。 由于以上数据为评秩变量数据由于以上数据为评秩变量数据, ,用用KendallKendall偏秩相关系数和偏秩相关系数和SpearmanSpearman秩相关系数进行分析。秩相关系数进行分析。 在数据编辑器中打开该数据文件在数据编辑器中打开该数据文件, ,变量分别定名为变量分别定名为 地位地位 、 权权威威 和和 顺从顺从 。打开。打开BivariateBivariate Correlations Correlations 对话框对话框, ,在在VariablesVariables列表

19、框中输入以上变量列表框中输入以上变量, ,在在Correlation Correlation CoefficientCoefficient方框中选择方框中选择“Kendalls”Kendalls”核选框和核选框和SpearmanSpearman核选核选框框, ,运行过程运行过程, ,生成表生成表4 4。 利用表利用表4 4中中KendallKendall法得到的系数法得到的系数, ,将将0.6670.667、0.3880.388和和0.3570.357代入代入计算计算KendallKendall偏秩相关系数的公式偏秩相关系数的公式, ,得结果得结果0.62,0.62,该值与该值与0.6670.

20、667相相比差别较小比差别较小, ,故可以认为地位欲与权威主义的相关性与顺从性故可以认为地位欲与权威主义的相关性与顺从性无关。从表无关。从表4 4中得到的中得到的SpearmanSpearman秩相关系数可以看出秩相关系数可以看出, ,地位欲与地位欲与权威主义在权威主义在0.010.01的显著性水平上有较好的相关性的显著性水平上有较好的相关性, ,地位欲与顺地位欲与顺从性在从性在0.050.05的显著性水平上有较好的相关性。的显著性水平上有较好的相关性。CorrelationsCorrelations1.000.667*.388.003.084121212.667*1.000.357.003.

21、112121212.388.3571.000.084.112.1212121.000.818*.615*.001.033121212.818*1.000.545.001.067121212.615*.5451.000.033.067.121212Correlation CoefficientSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)NCorrelation Coefficie

22、ntSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)N地位欲权威主义顺从性地位欲权威主义顺从性Kendalls tau_bSpearmans rho地位欲权威主义顺从性Correlation is significant at the 0.01 level (2-tailed).*. Correlation is significant at the 0.05 level (2-tailed).*. 8.3 8.3 偏相关系数偏相关系数v基本与相关系数计算方法相同。基本与相关系数计算方法相同。v选取选取Analyse-Correlat

23、e-ParitalAnalyse-Correlate-Parital菜单,可以得到菜单,可以得到偏相关分析结果。偏相关分析结果。偏相关的有关公式:偏相关的有关公式:控制了控制了z的条件下,的条件下,x、y之间的偏相关系数之间的偏相关系数 :)1)(1 (22,yzxzyzxzxyzxyrrrrrr)1)(1 (212212121. 2121.,zyzzxzzyzzxzzxyzzxyrrrrrr控制了两个变量控制了两个变量z z1 1、z z2 2,变量,变量x x、y y之间的偏相关系数:之间的偏相关系数: Pearson偏相关系数假设检验的偏相关系数假设检验的t统计量:统计量: 其中,其中,

24、r是相应的偏相关系数,是相应的偏相关系数,n是观测量数,是观测量数,k是控制变量的数目,是控制变量的数目,n-k-2是自由度。当是自由度。当tt0.05(n-k-2)时,时,p0.05拒绝原假设拒绝原假设 212rrknt偏相关分析的主对话框偏相关分析的主对话框偏相关的选择项对话框偏相关的选择项对话框偏相关应用实例输出偏相关应用实例输出1 四川绵阳地区3年生中山柏的数据,分析月生长量与月平均气温、月降雨量、月平均日照时数、月平均湿度这四个气候因素哪个因素有关。数据来源于袁佳祖编著灰色系统理论,数据编号data8-03。 各变量的描述统计量各变量的描述统计量生长量与各变量间生长量与各变量间Pea

25、rsonPearson相关分析结果相关分析结果D De es sc cr ri ip pt ti iv ve e S St ta at ti is st ti ic cs s9.45927.177871298.891734.662621280.25003.360871285.216797.488341215.98337.4991912生长量(cm)月平均日照时数月平均湿度月降雨量(mm)月平均气温(c)MeanStd. DeviationNC Co or rr re el la at ti io on ns s1.983*.709*.704*.374.000.010.011.232121212

26、1212Pearson CorrelationSig. (2-tailed)NVariables生长量(cm)生长量(cm)月平均气温(c)月降雨量(mm)月平均日照时数月平均湿度Correlation is significant at the 0.01 level (2-tailed).*. Correlation is significant at the 0.05 level (2-tailed).*. 偏相关分析输出偏相关分析输出2:CorrelationsCorrelations1.000.632.06807.6321.000.068.70CorrelationSignifican

27、ce (2-tailed)dfCorrelationSignificance (2-tailed)dfVariables生长量(cm)月平均日照时数Control Variables月平均湿度 & 月降雨量(mm) & 月平均气温(c)生长量(cm)月平均日照时数CorrelationsCorrelations1.000.731.02507.7311.000.025.70CorrelationSignificance (2-tailed)dfCorrelationSignificance (2-tailed)df生长量(cm)月平均湿度Control Variables月平均日照时数& 月平均

28、气温(c)& 月降雨量(mm)生长量(cm)月平均湿度CorrelationsCorrelations1.000.977.00007.9771.000.000.70CorrelationSignificance (2-tailed)dfCorrelationSignificance (2-tailed)df生长量(cm)月平均气温(c)Control Variables月平均日照时数 & 月平均湿度 & 月降雨量(mm)生长量(cm)月平均气温(c)偏相关分析结论偏相关分析结论中山柏生长量与四个气候因素的偏相关综合结果中山柏生长量与四个气候因素的偏相关综合结果 TEMPHUMIHSUNRAIN

29、HGROW.9774.7310.6318-0.4906( 7)( 7)( 7)( 7)p=0.000p=0.025p=.068p=0.1808.4 距离分析Distance 8.4.1 统计学上的定义和计算公式统计学上的定义和计算公式 距离相关分析是对观测量之间或变量之间距离相关分析是对观测量之间或变量之间相似或不相似的程度的一种测量。距离相关分相似或不相似的程度的一种测量。距离相关分析可用于同一变量内部各个取值间,以考察其析可用于同一变量内部各个取值间,以考察其相互接近程度;也可用于变量间,以考察预测相互接近程度;也可用于变量间,以考察预测值对实际值的拟合优度。值对实际值的拟合优度。 距离相

30、关分析的结果可以用于其他分析过距离相关分析的结果可以用于其他分析过程。例如,因子分析、聚类分析等,有助于分程。例如,因子分析、聚类分析等,有助于分析复杂的数据集合。析复杂的数据集合。 距离相关分析根据统计量不同,分为以下距离相关分析根据统计量不同,分为以下两种。两种。 不相似性测量:通过计算样本之间或不相似性测量:通过计算样本之间或变量之间的距离来表示。变量之间的距离来表示。 相似性测量:通过计算相似性测量:通过计算PearsonPearson相关系相关系数或数或CosineCosine相关来表示。相关来表示。 距离相关分析根据分析对象不同,分为以距离相关分析根据分析对象不同,分为以下两种。下

31、两种。 样本间分析:样本和样本之间的距离样本间分析:样本和样本之间的距离相关分析。相关分析。 变量间分析:变量和变量之间的距离变量间分析:变量和变量之间的距离相关分析。相关分析。 在不相似性测量的距离分析中,根据不同在不相似性测量的距离分析中,根据不同类型的变量,采用不同的统计量进行计算。类型的变量,采用不同的统计量进行计算。 (1 1)对连续变量的样本)对连续变量的样本 (x,y(x,y) ) 进行距进行距离相关分析时,常用的统计量有以下几种。离相关分析时,常用的统计量有以下几种。 8.4.2 SPSS中实现过程中实现过程 距离相关分析分为相似性测量和不相似性距离相关分析分为相似性测量和不相似性测量,也可分为样本间分析和变量间分析。下测量,也可分为样本间分析和变量间分析。下面分别对这面分别对这4 4种情况进行讲解。种情况进行讲解。 研究问题研究问题1 1变量之间的相似性测量分析变量之间的相似性测量分析 对对6 6个标准电子元件的电阻(欧姆)进行个标准电子元件的电阻(欧姆)进行3 3次平行测试,测得结果如表次平行测试,测得结果如表8-48-4所示。问测试所示。问测试结果是否一致。结果是否一致。123456第一次0.1400.1380.1430.1410.1440.137

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论