第五章SPSS相关分析PPT课件.ppt_第1页
第五章SPSS相关分析PPT课件.ppt_第2页
第五章SPSS相关分析PPT课件.ppt_第3页
第五章SPSS相关分析PPT课件.ppt_第4页
第五章SPSS相关分析PPT课件.ppt_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章相关分析 主要内容 1 相关分析2 绘制散点图3 计算相关系数4 偏相关分析5 距离分析 一 相关分析 1 相关关系和函数关系社会经济现象中 一些现象与另一些现象之间往往存在着依存关系 当我们用变量来反映这些现象的的特征时 便表现为变量之间的依存关系 现象之间的相互关系 可以概括为两种不同的类型 函数关系相关关系 统计关系 函数关系 是一一对应的确定关系 设有两个变量x和y 变量y随变量x一起变化 并完全依赖于x 当变量x取某个数值时 y依确定的关系取相应的值 则称y是x的函数 记为y f x 如 销售额与销售量 圆面积和圆半径 相关 统计 关系 两事物之间的非一一对应关系 即一个变量的取值不能由另一个变量唯一确定 当变量x取某个值时 变量y的取值可能有几个 各观测点分布在直线或曲线周围 现象之间客观存在的不严格 不确定的数量依存关系 变量间关系不能用函数关系精确表达 相关 统计 关系的例子商品的消费量 y 与居民收入 x 之间的关系商品销售额 y 与广告费支出 x 之间的关系粮食亩产量 y 与施肥量 x1 降雨量 x2 温度 x3 之间的关系收入水平 y 与受教育程度 x 之间的关系父亲身高 y 与子女身高 x 之间的关系 相关关系的常见类型 线性相关 正线性相关 负线性相关非线性相关 二次曲线相关 指数曲线相关等相关关系不象函数关系那样直接 但却普遍存在 且有强有弱 如何测度 2 相关分析 目的 通过样本数据 研究两变量间线性相关方向和相关程度的强弱 例如 投资与收入之间的关系 商品销售额与广告费支出之间的数量关系 基本方法 绘制散点图 计算相关系数 二 绘制散点图 一 散点图在平面直角坐标系上将两个变量间相对应的变量值用坐标点的形式描绘出来 用来反映两变量之间相关关系的图形 又称相关图 用途 在进行定量分析之前 可以先利用它对现象之间相关的方向 形式和密切程度作大致的判断 完全相关 2020 2 9 10 X Y X Y 不相关 2020 2 9 11 X Y 线性正相关 2020 2 9 12 X Y 非线性相关 2020 2 9 13 X Y 散点图矩阵 2020 2 9 14 三维散点图 2020 2 9 15 二 SPSS操作 1 菜单选项 图形 散点 2 选择散点图类型 简单 simple 重叠 overlay 矩阵 matrix 三维 3 D 散点图 3 选择x轴和y轴的变量 4 选择分组变量 setmarkersby 分别以不同颜色表示 5 选择标记变量 labelcaseby 散点图上可带有标记变量的值 如 省份名称 三 相关系数 一 概述作用 相关系数 r 以数值的方式精确地体现两个变量间的线性关系程度 分析步骤 1 计算样本相关系数r 2 相关系数检验 即对样本来自的两总体是否存在显著的线性关系进行推断 如果变量Y与X间是函数关系 则r 1或r 1 如果变量Y与X间是统计关系 则 10 如果x y变化的方向相反 如吸烟与肺功能的关系 则称为负相关 r0 8存在高度相关 0 5 r 0 8显著相关 0 3 r 0 5低度相关 r 0 3关系极弱 认为微相关 r 2020 2 9 19 使用相关系数时应注意的问题 相关关系不等于因果关系 相关系数只度量变量间的线性关系 因此 微弱相关不一定表明变量间没有关系 极端值可能影响相关系数 例如 1 1 2 2 3 3 4 4 5 5 6 1 r 0 33 但总体上表现出 x y 警惕伪相关 只是数据上计算有相关关系 其实没有实际意义 2020 2 9 20 说明 相关系数只是有效地度量两变量间的线性相关程度 但它并不是度量非线性关系的有效工具 数据中存在极端值时 用相关系数度量不好如 1 1 2 2 3 3 4 4 5 5 6 1 r 0 33但总体上表现出 x y因此 相关系数应结合散点图分析 二 相关系数的种类 Pearson简单 积差 相关系数Spearman等级相关系数Kendall和谐相关系数 三 Pearson简单相关系数度量定距变量间的相关关系 例如 收入和储蓄 身高和体重等 x与y的相关系数等同于y与x的相关系数 简单相关系数是无量纲的 度量两变量之间的线性关系 样本相关系数接近零并不意味着两个变量间一定无相关性 一个变量的值人为选定时莫作相关分析出现异常值时慎作相关分析相关未必真有内在联系相关分析时 小样本资料经检验只能推断两变量间有无直线关系 而不能推断其相关的密切程度 要推断两变量间相关的程度 样本含量必须足够大 尤应注意 若两变量间相关系数具有统计学意义 但较小时 下结论要慎重 四 Spearman等级相关 变量间的秩相关 1 秩次和秩和 秩 即按数据大小排定的次序号 又称秩次号 编秩就是将观察值按顺序由小到大排列 并用序号代替原始变量值本身 用秩次号代替原始数据后 所得某些秩次号之和 即按某种顺序排列的序号之和 称为秩和 设有以下两组数据 A组4 76 42 63 25 2B组1 72 63 62 33 7 两组各有5个变量值 现在依从小到大的顺序将它们排列起来 并标明秩次 结果如下 A组2 63 24 75 26 4B组1 72 32 63 63 7秩次12345678910 原始值中有两个 2 6 分属A B组 它们的秩次应是3和4 然而它们的数值本来是同样大小的 哪组取 3 哪组取 4 呢 我们计算它们的平均数 3 4 2 3 5 作为 2 6 的秩次 称为 平均秩次 这样才公平合理 这样两组所得的秩次及秩和如下 A组3 558910 35 5B组123 567 19 5 上面A组和B组中各有五个原始值 按顺序排列 最小值设为1 再按绝对值大小对余下的变量逐个排序 最大值为两组变量个数之和10 依次可得1 2 3 5 3 5 5 6 7 8 9 10 这10个序号即是秩次 A组秩和就是等于3 5 5 8 9 10 39 5 B组秩和就是等于1 2 3 5 6 7 19 5 从两组的原始变量值也可以初步看出 A组偏大 B组偏小 现在得出的秩和也是A组大于B组 与由变量值所观察到的一致 2 怎样编秩 编秩就是将观察值按顺序由小到大排列 并用序号代替原始变量值本身 不同的实验设计类型 有不同的编秩规则 3 Spearman秩相关 概念及适用条件 1 概念两变量是等级测量数据 且总体不一定呈正态分布 样本容量也不一定大于30 这样两变量的相关 称为等级相关 斯皮尔曼相关 2 适用条件 两变量的资料为等级测量数据 且具有线性关系 连续变量的测量数据 按其大小排成等级 亦可用等级相关计算 不要求总体呈正态分布 2 计算方法 式中 D为两变量每对数据的等级之差 N表示样本容量 2020 2 9 33 计算步骤 1 计算两变量等级之差D 2 计算D2 3 计算 D2 4 代入公式 求得rR例求10名学生的语文成绩与阅读能力成绩之间的等级相关系数 10名学生的语文成绩与阅读能力成绩相关计算表 解 将有关数据代入公式得 如果求相关的是连续变量 计算时先把两组数据分别按大小排成等级 最大值取为1等 其它类推 若出现相同的等级分数时 可用它们所占等级位置的平均数作为它们的等级 五 Kendall 肯德尔 和谐系数1 概念及适用条件 1 概念当多个变量值以等级顺序表示时 这几个变量之间的一致性程度 称为肯德尔和谐系数或肯德尔W系数 2 适用条件适用于两列以上等级变量 如了解几个评定者对同一组学生成绩等级评定的一致性程度等 2 计算方法它以符号W表示 公式为 计算步骤 略例某评价小组7人依据已确定的4项内容对某教师打分 将分数转换为等级后的结果见表 求这7人对该教师评价意见的一致性程度 个人评价某教师意见资料表 解 将上述数据代入公式得 实际上 当出现相同等级时 应校正W系数 其校正公式为 六 相关系数检验 一般情况下 总体相关系数是未知的 通常用r作为的近似值 但由于r是根据样本计算出来的 它受抽样误差的影响 由于抽取的样本不同 r的取值也不同 能否用r说明总体的相关程度呢 这就需要考查r的可靠性也就是进行显著检验 1 H0 两总体不存在线性相关 2 构造统计量 简单相关系数 Spearman系数 大样本下 近似正态分布 kendall系数 大样本下 近似正态分布 Pearson系数 服从自由度为n 2的t分布 七 案例分析 见识字量与阅读能力 sav程序调用 1 散点图 图形 旧对话框 散点2 分析 相关 双变量 从散点图上看 两个变量成直线相关关系 从分析结果上看 识字量与阅读能力在显著性水平r 0 01情况下相关系数为r 0 82 属于显著相关 且通过了假设检验 四 偏相关系数 1 概念线性相关分析计算两个变量间的相关关系 分析两个变量间线性关系的程度 往往因为第三个变量的作用 使相关系数不能真正反映两个变量间的线性程度 如身高 体重与肺活量之间的关系 如果使用Pearson相关计算其相关系数 可以得出肺活量与身高和体重均存在较强的线性关系 但实际上 如果对体重相同的人 分析身高和肺活量 是否身高越高 肺活量就越大呢 不是的 原因是身高与体重有线性关系 体重与肺活量存在线性关系 因此得出身高和肺活量之间存在着较强的线性关系的错误结论 偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量 分析身高与肺活量之间的相关性 就要控制体重在相关分析中的影响 实际生活中有许多这样的关系 如可以控制年龄和工作经验两个变量的影响 估计工资收入与受教育程度之间的相关关系 可以在控制了销售能力与各种其他经济指标的情况下 研究销售量与广告费用之间的关系等 在多元回归分析中 在消除其他变量影响的条件下 所计算的某两变量之间的相关系数称为偏相关系数 2 偏相关分析的步骤 第一 计算样本偏相关系数 第二 对样本来自的总体是否存在显著的净相关进行推断 基本步骤如下 1 H0 两总体的偏相关系数与零无显著差异 3 偏相关系数SPSS操作 菜单 分析 相关 偏相关Variables 分析变量Controllingfor 控制变量调用此过程可对变量进行偏相关分析 在偏相关分析中 系统可按用户的要求对两相关变量之外的某一或某些影响相关的其他变量进行控制 输出控制其他变量影响后的相关系数 4 分析案例 见身高与体重 sav先进行积差相关分析 再把性别作为控制变量进行偏相关分析 看看结果有什么不同 很显然 这里用偏相关分析是正确的 四 距离分析 是对观测量之间或变量之间相似或不相似程度的一种测度 是一种广义的距离 有关的统计量 不相似性测度 a 对等间隔 定距 数据的不相似性 距离 测度可以使用的统计量有Euclid欧氏距离 欧氏距离平方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论