多元统计分析实验报告-聚类分析_第1页
多元统计分析实验报告-聚类分析_第2页
多元统计分析实验报告-聚类分析_第3页
多元统计分析实验报告-聚类分析_第4页
多元统计分析实验报告-聚类分析_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

武汉理工大学 实实 验 实训 报验 实训 报 告告 项项 目目 名名 称称 实验 2 聚类分析 所属课程名称所属课程名称 多元统计分析 项项 目目 类类 型型 设计性实验 实验实验 实训实训 日期日期 年 月 日 班班 级级 学学 号号 姓姓 名名 指导教师指导教师 武汉理工大学统计学系制 一 实验 实训 概述 一 实验 实训 概述 目的及要求目的及要求 聚类分析的目的是将分类对象按一定规则分为若干类 这些类不是事先给 定的 而是根据数据的特征确定的 在同一类里的这些对象在某种意义上倾向 于彼此相似 而在不同的类里的对象倾向于不相似 按具体的题目要求完成实验报告 并及时上传到给定的 FTP 和课程网站 基本原理基本原理 系统聚类法是聚类分析中用的最多的一种 其基本思想是 开始将 n 个对 象各自作为一类 并规定对象之间的距离和类与类之间的距离 然后将距离最 近的两类合并成一个新类 计算新类与其它类之间的距离 重复进行两个最近 类的合并 每次减少一类 直至所有的对象合并为一类 实施环境实施环境 使用的材料 设备 软件 使用的材料 设备 软件 SPSS 等软件 二 实验 实训 内容 二 实验 实训 内容 项目内容项目内容 聚类分析 方案设计方案设计 共含两道题目 第一题为基于距离矩阵的聚类分析 第二题为基于原始数据的聚类分析 三 指导教师评语及成绩 三 指导教师评语及成绩 评语 评语 成绩 成绩 指导教师签名 指导教师签名 批阅日期 批阅日期 实验报告 2 聚类分析 设计性实验 设计性实验 实验原理 实验原理 聚类分析的目的是将分类对象按一定规则分为若干类 这些类不是 事先给定的 而是根据数据的特征确定的 在同一类里的这些对象在某种意义 上倾向于彼此相似 而在不同的类里的对象倾向于不相似 系统聚类法是聚类 分析中用的最多的一种 其基本思想是 开始将 n 个对象各自作为一类 并规 定对象之间的距离和类与类之间的距离 然后将距离最近的两类合并成一个新 类 计算新类与其它类之间的距离 重复进行两个最近类的合并 每次减少一 类 直至所有的对象合并为一类 实验题目一 实验题目一 为了对 11 种语言 英语 挪威语 丹麦语 荷兰语 德语 法语 西班 牙语 意大利语 波兰语 匈牙利语及芬兰语进行比较研究 研究人员选取每 种语言的 1 至 10 十个数字相应的单词列表分析 对于同一数字 某两种语言的 第一个字母若相同 则称这两者在该数字上一致 否则非一致 将这 11 种语言 两两比较后 计算每一对在十个数字上非一致的数目 得到下列距离矩阵 E N Da Du G Fr Sp I P H Fi E 0 N 2 0 Da 2 1 0 Du 7 5 6 0 G 6 4 5 5 0 Fr 6 6 6 9 7 0 Sp 6 6 5 9 7 2 0 I 6 6 5 9 7 1 1 0 P 7 7 6 10 8 5 3 4 0 H 9 8 8 8 9 10 10 10 10 0 Fi 9 9 9 9 9 9 9 9 9 8 0 1 对这 11 种语言分别用最小距离法 single linkage 最大距离法 complete linkage 平均距离法 average linkage 进行聚类分析 2 画出以上三种方法聚类分析结果的树状图 3 结合三种方法的树状图 你认为将 11 种语言分为哪几类比较合适 4 用最大距离法将 11 种语言聚为 3 类 并将聚类结果存储在一个 SPSS 数 据文件中 实验题目二 实验题目二 下表给出了 2010 年湖北省省各地区的人均各项消费支出情况 表表 1 2010 年湖北省各地区人均各项消费支出 市 县 代码 食品类 元 衣着类 元 家庭设备 元 医疗保健 元 交通和通 元 娱乐教育 元 居住 元 服务项目 元 42013303645626 5444 1547 51079701442 9 42022985608845 1537590 51028706 7334 1 42032744554380607496827582350 42042843623529453424662414405 42053033527851 1317 5403 21347612 9338 420628853947484164511063746261 42073251632542440675937854369 42082864500841588709921314382 42093561566953 1463 1887 4967722 3434 3 421026496671798372 3650 2844768 4541 7 421124374101399671457634860223 42122372497793493407774436389 42132200567708 6500 4781790 8606 5262 7 实验要求 实验要求 1 分别应用最小距离法 single linkage 最大距离法 complete linkage 平均距离法 average linkage 对湖北省的 13 个城市进行聚类分析 2 画出以上三种方法聚类分析结果的树状图 比较异同 3 用最小距离法将 13 个城市聚为 3 类 并将聚类结果存储在一个 SPSS 数 据文件中 4 对表 1 中的人均各项消费支出进行聚类分析 实验题目一分析报告 实验题目一分析报告 1 实验 实训 过程 步骤 记录 数据 程序等 实验 实训

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论