第八章-SPSS的相关分析.ppt_第1页
第八章-SPSS的相关分析.ppt_第2页
第八章-SPSS的相关分析.ppt_第3页
第八章-SPSS的相关分析.ppt_第4页
第八章-SPSS的相关分析.ppt_第5页
免费预览已结束,剩余31页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本章内容,8.1相关分析概述8.2绘制散点图8.3计算相关系数8.4偏相关分析,8.1相关分析概述,客观事物之间的关系大致可归纳为两大类:(1)函数关系:指两事物之间的一种一一对应的关系,如商品的销售额和销售量之间的关系。(2)相关关系(统计关系):指两事物之间的一种非一一对应的关系,例如家庭收入和支出、子女身高和父母身高之间的关系等。相关关系又分为线性相关和非线性相关。(3)相关分析和回归分析都是分析客观事物之间相关关系的数量分析方法。,双变量关系强度测量的主要指标,8.2绘制散点图,(1)相关分析通过图形(散点图)和数值(相关系数)两种方式,有效地揭示事物之间相关关系的强弱程度和方向。(2)散点图它将数据以点的形式画在直角坐标系上,通过观察散点图能够直观地发现变量间的相关关系及它们的强弱程度和方向。,2.操作步骤,(1)绘制散点图前,先将数据按一定的方式组织:每个变量设置为相应的SPSS变量。(2)Graphs-LegacyDialogs-Scatter/Dot:提供四种类型的散点图simpleScatter-简单散点图overlayScatter-重叠散点图matrixScatter-矩阵散点图3-DScatter-三维散点图,(3)简单散点图(simpleScatter)表示一对变量间统计关系的散点图将纵轴变量选入YAxis,将横轴变量选入XAxis,将分组变量选入Setmarkersby:用该变量将样本数据分组,并在一张图上用不同颜色绘制若干个散点图。将标记变量选入LableCasesby,将标记变量的各变量值标记在散点图相应点的旁边。指定一个分类变量到panelby,分别绘制该变量不同取值下的多张散点图。,(4)重叠散点图(overlayScatter)表示多对变量间统计关系的散点图两个变量为一对,前一个为纵轴变量,后一个为横轴变量,并可通过按钮进行横轴变量的调换。将标记变量选入LableCasesby,将标记变量的各变量值标记在散点图相应点的旁边。指定一个分类变量到panelby,分别绘制该变量不同取值下的多张散点图。,以方形矩阵的形式分别显示多对变量间统计关系的散点图需弄清各矩阵单元中的横纵变量。括号中,前一个变量为纵轴变量,后一个变量为横轴变量对角线格子,显示参与绘图的变量。在第三行第三列,则第三行的所有图形都以为纵轴,第三列的所有图形都以为横轴。,(5)矩阵散点图(matrixScatter),指定参与绘图的若干变量到matrixVariables,选择变量的先后顺序决定了其在矩阵对角线的排列顺序。将分组变量选入Setmarkersby:用该变量分组,并在一张图上用不同颜色绘制若干个散点图。将标记变量选入LableCasesby,将标记变量的各变量值标记在散点图相应点的旁边。,(6)三维散点图(3-DScatter)以立体图的形式表示三对变量间统计关系的散点图,指定三个变量,分别选入XAxis、YAxis、ZAxis将分组变量选入Setmarkersby:用该变量分组,并在一张图上用不同颜色绘制若干个散点图。将标记变量选入LableCasesby,将标记变量的各变量值标记在散点图相应点的旁边。,3其他功能,(1)图形的交互绘制Graphs-ChartBuilder在Gallery选项卡中选择Scatter/Dot,拖动SampleScatte图标到绘制区域,用鼠标拖动相关变量到X轴和Y轴。,(2)散点图的调整,在需调整的散点图上双击鼠标,进入图形编辑窗口。Option-BinElement:数据点的合并,“棒状”的绘制,Elements-FitLineatTotal:选择”棒状”的样式:(a)Linear-线性回归(b)Quadratic-二项式回归(c)Cubic-三项式回归,应用案例,利用“住房状况调查”数据,分析家庭收入与计划面积之间的关系。分析:(1)可通过散点图大致了解两者关系。(2)只有一对变量,用简单散点图。,1.利用相关系数进行变量间线性关系的分析通常需要完成以下两个步骤:(1)计算样本相关系数r;相关系数r的取值在-1+1之间。r0表示两变量存在正的线性相关关系;r0.8表示两变量有较强的线性关系;|r|0.3表示两变量之间的线性关系较弱。(2)对样本来自的两总体是否存在显著的线性关系进行推断。抽样随机性样本容量小,8.3计算相关系数,2.对不同类型的变量应采用不同的相关系数来度量,常用的相关系数主要有Pearson简单相关系数、Spearman等级相关系数和Kendall相关系数等。(1)Pearson简单相关系数(适用于两个变量都是定距型变量)Pearson简单相关系数的检验统计量为:,(2)Spearman等级相关系数,Spearman等级相关系数用来度量定序变量间的线性相关关系。设计思想与Pearson简单相关系数相同,只是数据为非定距的,故计算时并不直接采用原始数据,而是利用数据的秩,用两变量的秩代替代入Pearson简单相关系数计算公式。于是其中的和的取值范围被限制在1和n之间,且可被简化为:,如果两变量的正相关性较强,它们秩的变化具有同步性,于是的值较小,r趋向于1;如果两变量的正相关性较弱,它们秩的变化不具有同步性,于是的值较大,r趋向于0;小样本下,在零假设成立时,Spearman等级相关系数服从Spearman分布;在大样本下,Spearman等级相关系数的检验统计量为Z统计量,定义为Z统计量近似服从标准正态分布。,3.Kendall相关系数,(1)用非参数检验方法度量定序变量间的线性相关关系(2)利用变量秩计算一致对数目U和非一致对数目V。当两个变量具有较强的正相关关系,则一致对数目较大,非一致对数目较小;当两个变量具有较强的负相关关系,则一致对数目较小,非一致对数目较大;当两个变量相关性较弱,则一致对数目和非一致对数目大致相等。,Kendall相关系数在小样本下,Kendall相关系数服从Kendall分布;在大样本下,Kendall相关系数的检验统计量为Z统计量为:Z统计量近似服从标准正态分布。,4.计算相关系数的基本操作,(1)相关分析用于描述两个变量间关系的密切程度,其特点是变量不分主次,被置于同等的地位。(2)AnalyzeCorrelate命令项中有三个相关分析子命令:Bivariate相关分析,用于进行两个或多个变量间的相关分析,如为多个变量,给出两两相关的分析结果。Partial偏相关分析,当进行相关分析的两个变量的取值都受到其他变量的影响时,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的偏相关系数Distances相似性测度(距离),用于对各样本点之间或各个变量之间进行相似性分析,一般不单独使用,而作为聚类分析和因子分析等的预分析。,Bivariate相关分析步骤,(1)选择菜单AnalyzeCorrelateBivariate,出现窗口:,(2)把参加计算相关系数的变量选到Variables框。(3)在CorrelationCoefficents框中选择计算哪种相关系数(4)在TestofSignificance框中选择输出相关系数检验的双边(Two-Tailed)概率p值或单边(One-Tailed)概率p值。(5)选中Flagsignificancecorrelation选项表示分析结果中除显示统计检验的概率p值外,还输出星号标记,以标明变量间的相关性是否显著;不选中则不输出星号标记。(6)在Option按钮中的Statistics选项中,选中Cross-productdeviationsandcovariances表示输出两变量的离差平方和、样本方差和协方差。,5.相关分析应用举例利用“住房状况”数据,计算家庭收入与计划面积之间的相关系数。分析:(1)家庭收入与计划面积均属定距变量,(2)计算Pearson简单相关系数。,8.4偏相关分析,8.4.1偏相关分析和偏相关系数(1)简单相关系数研究两变量间线性相关性,若还存在其他因素影响,其往往夸大变量间的相关性,不是两变量间线性相关强弱的真实体现。(2)例如,研究商品的需求量、价格和消费者收入之间的线性关系时,需求量和价格的相关关系实际还包含了消费者收入对价格和商品需求量的影响。此时,单纯利用简单相关系数来评价变量间的相关性是不准确的,需要在剔除其他相关因素影响的条件下计算变量间的相关。偏相关的意义就在于此。,(3)偏相关分析也称净相关分析,它在控制其他变量线性影响的条件下分析两变量间的线性关系,所采用的工具是偏相关系数。(4)控制变量个数为1时,偏相关系数称一阶偏相关;当控制两个变量时,偏相关系数称为二阶偏相关;当控制变量的个数为0时,偏相关系数称为零阶偏相关,也就是简单相关系数。,偏相关系数的分析步骤,(1)计算样本的偏相关系数假设有三个变量y、x1和x2,在分析x1和y之间的净相关时,需控制x2的线性作用,则x1和y之间的一阶偏相关定义为:偏相关系数的取值范围及大小含义与相关系数相同。,(2)对样本来自的两总体是否存在显著的净相关进行推断,检验统计量为:其中,r为偏相关系数,n为样本数,q为阶数。t统计量服从n-q-2个自由度的t分布。,8.4.2偏相关分析的基本操作,(1)选择菜单AnalyzeCorrelatePartial,(2)把参与分析的变量选择到Variables框中。(3)选择一个或多个控制变量到Controllingfor框中。(4)在TestofSignificance框中选择输出偏相关

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论