SPSS聚类分析--用于筛选聚类变量的一套方法_第1页
SPSS聚类分析--用于筛选聚类变量的一套方法_第2页
SPSS聚类分析--用于筛选聚类变量的一套方法_第3页
SPSS聚类分析--用于筛选聚类变量的一套方法_第4页
SPSS聚类分析--用于筛选聚类变量的一套方法_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSS 聚类分析 用于筛选聚类变量的一套方法 来源 数据小兵 聚类分析是常见的数据分析方法之一 主要用于市场细分 用户细分等领域 利用 SPSS 进行聚类分析时 用于参与聚类的变量决定了聚类的结果 无关变量有时会引起严重的错 分 因此 筛选有效的聚类变量至关重要 案例数据源 在 SPSS 自带数据文件 plastic sav 中记录了 20 中塑料的三个特征 分别是 tear res 抗 拉力 gloss 光滑度 opacity 透明度 相关经验表面这 20 中塑料可以分为 3 个种类 如果用这三个变量进行聚类 请判断和筛选有效聚类变量 一套筛选聚类变量的方法 一 盲选 将根据经验得到的 现有的备选聚类变量全部纳入模型 暂时不考虑某些变量是否不合适 本案例采用 SPSS 系统聚类方法 对话框如下 统计量选项卡 聚类成员选择单一方案 聚类数输入数字 3 绘制选项卡 勾选树状图 方法选项卡 默认选项 不进行标准化 保存选项卡 聚类成员选择单一方案 聚类数输入数字 3 二 初步聚类 这是盲选得到的初步聚类结果 并且在数据视图我们可以看到已经自动生成了一个聚类结 果变量 这个变量非常有用 三 方差分析 是不是每一个纳入模型的聚类变量都对聚类过程有贡献 利用已经生成的初步聚类结果 我们可以用一个单因素方差分析来判断分类结果在三个变量上的差异是否显著 进而判断 哪些变量对聚类是没有贡献的 分析 比较均值 单因素方差分析 选项选项卡 勾选均值图 由方差分析我们很明确的得知 纳入模型的三个聚类变量 其中只有 透明度 指标在各 个分类上有显著的差异 也就是说分类有效果 让每个分类的差异很大 而两外两个变量 则在三个分类上没有显著差异 没有很好的类别区分度 所以 我们可以认为 这两个变 量对聚类无作用或者无贡献 可考虑踢出模型 我们还想从可视化的角度来查看和判断 单因素方差分析为我们提供了均值图 可惜 这 三个图却最容易误导我们的判断 因为 spss 在自动生产均值图时为每一个变量单独制图 而且分配不同的纵轴坐标 导致每个图看起来都有非常大的差异 从视觉上迷惑我们做出 错误的判断 这里需要改进 四 均值描述 为改进以上 SPSS 默认选项的不足之处 我们需要自己生成三个变量在不同类别上的均值 means 过程可以帮助到我们 从数字上来看 抗拉力 6 8 6 7 7 1 光滑度 9 3 9 4 9 2 两个指标在三个类别 上并没有多大的差异 而对聚类有贡献的透明度指标在不同类别上区分度非常明显 五 多线均值图 克服纵轴刻度的方法是将这三个指标放在同一个坐标轴上进行对比 也就是制作一个多线 均值图 此时 结果已经一目了然了 综上 我们可以将抗拉力 光滑度两个指标从模型中剔除 只留下透明度一个指标再进行 聚类 我们发现 前后两次聚类的结果一模一样 用一个指标可以代替以前三个指标的进行聚类 我们这样做的意义

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论