SPSS统计分析 第七章 相关分析.ppt_第1页
SPSS统计分析 第七章 相关分析.ppt_第2页
SPSS统计分析 第七章 相关分析.ppt_第3页
SPSS统计分析 第七章 相关分析.ppt_第4页
SPSS统计分析 第七章 相关分析.ppt_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章相关分析 一 相关分析的概念 相关分析是研究变量间密切程度的一种常用统计方法 线性相关分析研究两个变量间线性关系的程度 相关系数是描述这种线性关系程度和方向的统计量 通常用r表示 相关系数r没有单位 其值在 l 1之间 当数值愈接近 l或 1之间时 关系愈紧密 接近于0时 关系愈不紧密 对其数值可以从小到大排列的数据才能计算其相关系数 例如不能计算宗教信仰与颜色喜好之间的关系 二 相关系数 积矩相关系数 Pearson相关系数 Spearman和Kendall秩相关系数偏相关系数 1 积矩相关系数 Pearson相关系数 积矩相关系数 又称积差相关系数 适用于等间隔测度 相关系数采用Pearson积矩相关 2 Spearman和Kendall秩相关系数 Spearman和Kendall秩相关系数是一种非参测度 是根据秩而不是根据实际值计算的秩相关适用于下列资料不服从双变量正态分布 总体分布型未知 用等级表示的资料 Spearman相关系数是Pearson相关系数的非参形式 是根据数据的秩而不是根据实际值计算的 也就是说 先对原始变量的数据排秩 根据各秩使用相关系数公式进行计算 它适合有序数据或不满足正态分布假设的等间隔数据 相关系数的值范围也是在 l 1之间 绝对值越大表明相关越强 相关系数的符号也表示相关的方向 这两种相关系数的计算必须对连续变量值排秩 对离散变量排序 例如 我们可以将一组学生按入学考试成绩和第一学年结业成绩的顺序排队 如果将入学考试成绩的评秩记为X1 X2 Xn 而学年结业成绩的评秩记为Y1 Y2 Yn 我们就可以用秩相关度量来决定X和Y之间的相关性 Ri为第i个X值的秩 Si为第i个Y值的秩 Kendall stau b也是一种对两个有序变量或两个秩变量间的关系程度的测度 因此也属于一种非参测度 以一个例子来进行Kendall秩相关系数的计算 如果两位鉴定家各自以吸引力的大小将7幅抽象派画评定了秩 那么可能知道这些秩评定之间的相符的程度 依次取观测2 鉴别家2 给出的秩 数出每一个右面在秩次上比自己小的个数 并将这些个数加起来 例如抽象画2的秩为2 其个数是1 因为其右边的只有抽象画5的秩比它小 6个数依次为1 1 0 0 1和0 所以总和为Q 3 Kendall秩相关系数则为 R 1 4Q n n 1 1 12 42 0 714 3 偏相关系数 偏相关系数描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性 例如 可以控制年龄和工作经验两个变量的影响 估计工资收入与受教育程度之间的相关关系 控制了变量Z 变量X与Y之间的偏相关 和控制了两个变量Z1 Z2 变量X与Y之间的偏相关系数计算公式不同 两个或若干变量之间或两组观测量之间的关系有时也可以用相似性或不相似性来描述 相似性测度用大数值表示很相似 较小的数值表明相似性小 不相似性使用距离或不相似性来描述 大值表示相差甚远 三 相关系数统计意义的检验 由于我们通常是通过抽样方法 利用样本研究总体的特性 由于抽样误差的存在 样本中两个变量间相关系数不为0 不能说明总体中这两个变量间的相关系数不是0 因此必须经过检验 检验的零假设是 总体中两个变量间的相关系数为0 SPSS的相关分析过程给出这假设成立的概率 四 相关分析的SPSS过程 Bivarate 相关分析 命令项调用Correlations过程和NonparCorr过程 按指定项显示变量的描述统计量 计算指定的两个变量间的相关系数 可以选择Pearson相关 Spearman和Kendall stau b相关 同时对相关系数进行检验 检验的零假设是 相关系数为0 可以对检验进行单尾或双尾的选择 给出相关系数为0的概率 Partial 偏相关分析 命令项调用PartialCorr过程 计算两个变量间在控制了其他变量的影响下的相关系数 可以选择单尾或双尾显著性检验 检验的零假设是 偏相关系数为零 还可以要求计算其他描述统计量 Distance 距离分析 命令项调用Proximities过程 对变量或观测量进行相似性或不相似性测度 因此分析的变量可以是连续变量 表示频数分布的变量 某些测度还可以适用于二值变量 可以对原始数据和计算出的距离数据进行标准化 如果需要确定两个变量或若干自变量与因变量具体的函数关系 使用相关分析不能达到目的 必须使用回归分析 如果要将观测量或变量归到确定的类中 必须使用聚类分析中的观测量聚类或变量聚类的相应过程 一 两个变量间的相关分析 本节介绍两变量间的相关 包括两个连续变量间的相关和两个等级变量间的秩相关 这两种相关使用同一个命令项Bivarate调用 通过选择不同的分析方法调用不同的分析过程 选择哪一种分析方法要看具体的数据类型 对于连续变量和等级变量选择不同的分析方法 Pearson调用correlation过程计算连续变量或等间隔测量的变量间的相关系数 Kendall stau b调用Nonparcorr过程计算分类变量间的秩相关 Spearman调用Nonparcorr过程计算斯皮尔曼秩相关 如果参与分析的变量是连续变量 选择Kendall stau b或Spearman相关 则系统自动对连续变量的值先求秩 再计算其秩分数间的相关系数 使用系统默认值进行相关分析 l962 1988年安徽省国民收入与城乡居民储蓄存款余额两个变量间的相关分析为例 说明使用系统默认值进行连续变量相关分析的方法 数据编号data10 01 变量包括 income国民收入 亿元 deposit城乡居民储蓄存款余额 number序号 year年份 例一 Data09 03是银行雇员数据 要求分析起始工资 当前工资 与雇员年龄 受教育水平 工作经验职务等之间是否存在线性关系 生成新变量 age 1999 Xdate year bdate 例二 10名运动员长拳和长兵器两项得分 分析两项得分是否存在相关关系 Data10 02 例三 10名学生两科课程的名次排列 要求求出其等级相关系数 检验其显著性 Data10 03 练习题 某妇幼保健医院对33名产妇进行产前检查并得到婴儿体重的原始观测值包括髂前上棘间径 x1 髂脊间径 x2 耻骶外径 x3 坐骨间径 x4 血红蛋白 x5 婴儿体重 X6 等6个指标 试分析各指标的相关系数 Hong1 sav 二 偏相关分析 相关分析计算两个变量间的相关系数 分析两个变量间线形关系的程度 往往因为第三个变量的作用 使相关系数不能真正反映两个变量间线形程度 例如身高 体重与肺活量之间的关系 使用Pearson相关计算其相关系数 可以得出肺活量与身高和体重均存在较强的线形关系 但实际上 如果对体重相同的人 分析身高和肺活量 是否身高值越大 肺活量越大呢 结论是否定的 正是因为身高与体重有着线形关系 体重与肺活量才存在线形关系 因此 得出身高与肺活量之间存在较强的线形关系的错误结论 偏相关分析的任务就是在研究两个变量之间的线形相关关系时控制可能对其产生影响的变量 例一 分析身高 体重 肺活量间的关系数据编号data10 04分别调用bivariate和partial过程 比较其结 例二 四川绵阳地区3年生中山柏的数据 分析月生长量与月平均气温 月降雨量 月平均日照时数 月平均湿度四个气候因素哪个因素有关 Month 月份 hgrow 生长量 temp 月平均气温 rain 月降雨量 hsun 月平均日照时数 humi 月平均湿度 数据编号data10 05分析变量 hgrow 生长量 与hsun 月平均日照时数 控制变量 humi 月平均湿度 rain 月降雨量 temp 月平均气温 综合分析结果 中山柏生长量与气温关系最密切 其次湿度 日照时间 相关系数0 6318 不相关概率p 068 没有显著意义 与降雨量没有线形关系 降雨量过大 还会影响其生长 练习题 从下表所给资料分析血小板和出血症的关系 试分析上述资料有无相关关系 Spearman sav 三 距离分析 距离分析是对观测量之间或变量之间相似性或不相似程度的一种测度 是计算一对变量之间或一对观测量之间的广义距离 这些相似性或距离测度可用于因子分析和聚类分析等 有关统计量 不相似性测度等

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论