教育信息处理(实验九因子分析与主成分分析)实验报告-示例_第1页
教育信息处理(实验九因子分析与主成分分析)实验报告-示例_第2页
教育信息处理(实验九因子分析与主成分分析)实验报告-示例_第3页
教育信息处理(实验九因子分析与主成分分析)实验报告-示例_第4页
教育信息处理(实验九因子分析与主成分分析)实验报告-示例_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 1 对北京 对北京 1818 个区县中等职业教育发展水平进行聚类 个区县中等职业教育发展水平进行聚类 X1X1 每 每 万人中职在校生数 万人中职在校生数 X2X2 每万人中职招生数 每万人中职招生数 X3X3 每万人中职毕业 每万人中职毕业 生数 生数 X4X4 每万人中职专任教师数 每万人中职专任教师数 X5X5 本科以上学校教师占专任 本科以上学校教师占专任 教师的比例 教师的比例 X6X6 高级教师占专任教师的比例 高级教师占专任教师的比例 X7X7 学校平均在校 学校平均在校 生人数 生人数 X8X8 国家财政预算中职经费占国内生产总值的比例 国家财政预算中职经费占国内生产总值的比例 X9X9 生均教育经费 数据表如下 生均教育经费 数据表如下 区县 x1x2x3x4x5x6x7x8x9 东城 1565345150 5070 2457010 01095356 西城 1194231130 5020 3315520 00636449 崇文 2027257160 5660 1936330 01685357 宣武 1765731170 630 2345840 01556432 朝阳 2217745170 4990 2545530 02286625 海淀 1696442130 5730 1835730 00485840 丰台 1666648150 4440 1424650 01125532 石景山 1926152190 5240 0855350 01585695 门头沟 1275333300 1430 0263760 00573904 房山 1153825100 5710 1276180 00617020 昌平 2328066190 5310 1064910 00725089 顺义 67351750 3410 0794030 00063056 通县 98402570 5330 1074740 00315559 大兴 2057667160 5970 1296160 01074990 平谷 81392170 1920 035330 00072518 怀柔 1215227120 2230 0766370 00234149 密云 84412260 5580 0916180 00434376 延庆 78312350 3660 074240 00394677 具体步骤如下 1 导入数据 建立数据文件 data sav 2 选择聚类分析 分析 分类 系统聚类分析 选择变量 分群选择个 案方式 3 聚类分析描述描述统计 统计量 合并进程表 聚类成员 单一方案 聚类 数 3 4 聚类分析绘制绘制 树状图 冰柱 所有聚类 方向 垂直 5 聚类分析方法方法 聚类方法 组间联接 度量标准 区间 平方 Euclidean 距离 6 聚类分析保存保存 聚类成员 单一方案 聚类数 3 7 保存实验结果 并分析结果 结果与分析 结果与分析 1 输出结果文件中的第一部分如下图 1 所示 图 1 中可以看出 18 个样本都进入了聚类分析 但有效样本为 14 个 缺失 14 个 2 输出结果文件中的第二部分为系统聚类分析的凝聚状态表 如图 2 所示 第一列表示聚类分析的步骤 可以看出本例中共进行了 17 个步 骤的分析 第二列和第三列表示某步聚类分析中 哪两个样本或类聚成了 一类 第四列表示两个样本或类间的距离 从表格中可以看出 距离 小的样本之间先聚类 第五列和第六列表示某步聚类分析中 参与聚类的是样本还是 类 0 表示样本 数字 n 非零 表示第 n 步聚类产生的类参与了本 步聚类 第七列表示本步聚类结果在下面聚类的第几步中用到 图 2 给中第一行表示 第二个样本和第四个样本最先进行了聚 类 样本间的距离为 4803 026 这个聚类的结果将在后面的第六步 聚类中用到 第二行表示聚类的第二步中第七个样本和第十三个样 本进行了聚类 样本间的距离为 6703 009 这个聚类的结果将在后 面的第八步骤中用到 其他行的含义和上面的类似 可见 在本例 中 经过了 17 个步骤 18 个样本聚成了一个大类 3 输出结果文件中第三部分如图 3 所示 图 3 是样本系统聚类分析 3 个类时 样本的类归属情况表 从 结果可以看出 样本 1 3 6 7 8 9 11 13 14 16 17 18 属于第一类 样本 2 4 5 10 属于第二类 样本 12 15 属于第三 类 这 3 个类恰好反映了北京市 18 区县的 3 个不同层次 4 输出结果文件中第四部分如图 4 所示 图 4 是系统聚类分析的冰柱图 该图的第一类表示类数 冰柱 图一般从其最后一行开始观察 最后一行中 类的数目为 17 即样 本聚积成 17 类 其中样本 2 和样本 4 用 X 连接在一起 表示两个样 本聚成一类 其余每个样本构成一类 倒数第二行中 类的数目为 16 即样本聚积成 16 类 其中样本 7 和样本 13 又聚成一类 其余 每个样本构成一类 因此 从冰柱图中可以非常清楚地看到 聚成 n 类时 各个样本的类归属情况 如聚成 3 个类时 样本 12 15 属 于第一类 样本 2 4 5 10 属于第二类 其余属于第三类 将 18 个区县聚成 3 类 各个样本的类归属情况保存为一个变量 因此在 SPSS 数据编辑窗口中就新增了一个变量的值 如图 5 所示 2 2 同上例对北京地区 同上例对北京地区 1818 区县各中职教育发展指标进行聚类 区县各中职教育发展指标进行聚类 分析哪些指标是属于一类的 分析哪些指标是属于一类的 具体步骤如下 1 导入数据 建立数据文件 data sav 2 选择聚类分析 分析 分类 系统聚类分析 选择变量 分群选择变 量方式 3 聚类分析描述描述统计 统计量 合并进程表 相似性矩阵 聚类成员 单 一方案 聚类数 3 4 聚类分析绘制绘制 树状图 冰柱 所有聚类 方向 垂直 5 聚类分析方法方法 聚类方法 组间联接 度量标准 区间 Pearson 相关 性 6 保存实验结果 并分析结果 结果与分析 结果与分析 1 输出结果文件中的第一部分如下图 6 所示 图 6 中可以看出 18 个样本都进入了聚类分析 但有效样本为 14 个 缺失 14 个 2 输出结果文件中的第二部分如下图 7 所示 图 7 所示的是系统聚类分析各变量的距离矩阵 从中可以看出 各个变量之间的距离 有正负 因为在设置样本间距离计算公式时 选择了 Pearson 相关分析 相关分析有正负之分 3 输出结果文件中的第三部分如下图 8 所示 图 8 是系统聚类分析的凝聚状态表 第一行表示第一个变量和 第二个变量首先进行了聚类 变量间的相关系数为 0 959 这个聚 类的结果将在后面的第二步聚类中用到 第二行表示第二步聚类中 第一个变量和第三个变量进行了聚类 变量间的相关系数为 0 910 这个聚类的结果将在后面的第四步聚类中用到 等等 4 输出结果文件中的第四部分如下图 9 所示 图 9 是变量系统聚类分析聚成 3 个类时 变量的类归属情况表 从该图中可以看出 x1 每万人中职生在校生数 x2 每万人中职 招生数 x3 每万人中职毕业生数 x4 每万人中职专任教师数 x8 国家财政预算中职经费占国内生产总值的比例 属于第一类 x5 本科以上学校教师占专任教师的比例 x6 高级教师占专任教 师的比例 x9 生均教育经费 属于第二类 x7 学校平均在校生 人数 属于第三类 5 输出结果文件中的第五部分如下图 10 所示 图 10 是系统聚类分析的冰柱图 图的第一类表示类数 冰柱图 一般从其最后一行开始观察 最后一行中 类的数目为 8 即变量 聚积成 8 类 其中变量 x1 和变量 x2 用 X 连接在一起 表示两个变 量首先聚成一类 其余每个变量构成一类 倒数第二行中 类的数 目为 2 即变量聚积成两

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论