主成分分析报告和聚类分析报告_第1页
主成分分析报告和聚类分析报告_第2页
主成分分析报告和聚类分析报告_第3页
主成分分析报告和聚类分析报告_第4页
主成分分析报告和聚类分析报告_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

wordword/word建筑工程学院理学院信息与计算科学专业实验报告课程名称《数据分析》实验名称《主成分分析和聚类分析》实验地点:根底楼C-423日期_____某某X丽芝班级信131学号201307010108___指导教师王恒友成绩【实验目的】〔1〕熟悉利用主成分分析进展数据分析,能够使用SPSS软件完成数据的主成分分析;〔2〕熟悉利用聚类分析进展数据分析,能够运用主成分分析的结果,做进一步分析,如聚类分析、回归分析等,能够使用SPSS软件完成该任务。【实验要求】根据各个题目的具体要求,分别运用SPSS软件完成实验任务。【实验内容】1、〔数据见〕给出了1991年我国30个省市、城镇居民的月平均消费数据,所考察的八个指标如下:〔单位均为元/人〕X1:人均粮食支出;X2:人均副食支出;X3:人均烟酒茶支出;X4:人均其他副食支出;X5:人均衣着商品支出;X6:人均日用品支出;X7:人均燃料支出;X8:人均非商品支出。〔1〕求样本相关系数矩阵R。〔2〕从R出发做主成分分析,求出各主成分的贡献率与前两个主成分的累积贡献率;2、〔1〕对题1中的数据,按照原有的八个指标,对30个省份进展聚类,给出分为3类的聚类结果。〔2〕利用题1得到的前2个主成分指标,分别按最短距离法〔最近邻居距离〕、最长距离法〔最远邻居距离〕、类平均距离法〔组间平均距离〕、重心距离法;其中距离均采用欧式平方距离,对样本进展谱系聚类分析,并画出谱系聚类图;给出分为3类的聚类结果。并与〔1〕的结果进展比拟【实验步骤】〔此局部主要包括实验过程、方法、结果、对结果的分析、结论等〕11〕相关矩阵V2V3V4V5V6V7V8V9相关V2.334.199.349.319V3.334.399.711.414.835V4.533.497.033V5.399.533.698.468.313V6.497.698.280V7.199.711.033.468.280.417.702V8.349.414.417.399V9.319.835.313.702.3992〕表:方差贡献率和累计贡献率解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的%累积%合计方差的%累积%合计方差的%累积%123.9204.7065.4986.2307.1318.051.643提取方法:主成份分析。由上图可知,只有前两个成分的特征值大于1,所以只选择前两个主成分。第一个主成分的方差贡献率是38.704%,第二个主成分的方差贡献率是29.590%,前两个主成分的方差占所有主成分方差的64.294%。前两个主成分的累计贡献率为68.294%,选择前两个主成分即可代表绝大多数原来的变量。最终聚类中心聚类123V2V3V4V5V6V7V8V92每个聚类中的案例数聚类123有效缺失.000由上图可知,聚类2包含样本数最多,聚类3包含样本数最少。通过K中心聚类分析,可以对我国各地区生活中的人均支出类别情况有一个根本的了解。我们可以将不同地区的人均消费情况分为3类;其中第二类包含的省市最多,有18个,其他两类包含城市较少。通过分析结果也可知每个地区所属类别。〔2〕按最短距离法〔最近邻居距离〕对样本进展谱系聚类分析聚类表阶群集组合系数首次出现阶群集下一阶群集1群集2群集1群集2112001525600335720648900651213001065834775106098340014951170141012145012111516001312121810013131215121116143589151513114181612171301917242500191811915020191224161720201121819232121220022222123210252312020024241262302525121242226261272502727128260282812927029291302800由聚类表可知聚类的具体过程。以第一步为例,样品1和2合并为一类,距离系数为3.299,在“首次出现阶段集群〞里显示为0,因此合并两项都是第一次出现,合并结果取15,即归为第15类。群集成员案例3群集1:某某12:某某13:某某14:某某15:某某16:某某17:某某18:某某19:某某110:某某111:某某112:某某113:某某114:某某115:某某116:某某117:某某118:某某119:某某120:某某121:某某122:某某123:某某124:某某125:某某126:某某127:128:某某129:某某230:某某3集群成员表如图,当划分为3个类别时,各个地区所属类别。与上一问所得结论有较大出入。上图直观的反响了样品逐步合并的过程。最长距离法〔最远邻居距离〕聚类表阶群集组合系数首次出现阶群集下一阶群集1群集2群集1群集211200152560053890074121300855720166340010781030158121440129151600121031160171117180018121215891813242500221421220021151817161615155171713161023181217121120192627002420121918022212123140272212242013262312017028242628190262529300027261226222428272129212529281122326292912128270群集成员案例3群集1:某某12:某某13:某某14:某某15:某某16:某某17:某某18:某某19:某某110:某某111:某某112:某某213:某某214:某某215:某某216:某某217:某某218:某某219:某某220:某某121:某某322:某某323:某某324:某某225:某某226:某某227:228:某某229:某某330:某某3类平均距离法〔组间平均距离〕聚类表阶群集组合系数首次出现阶群集下一阶群集1群集2群集1群集21120017256004389007457201451213008634001378103010812145011915160011108117013111215891812171800181338610141435134171524250020162122002117131142418121711121919121918022202426150232121231602522122019024232427200252411217222725212421232726293000292712124252828128270292912928260群集成员案例3群集1:某某12:某某13:某某14:某某15:某某16:某某17:某某18:某某19:某某110:某某111:某某112:某某113:某某114:某某115:某某116:某某117:某某118:某某119:某某120:某某121:某某122:某某123:某某124:某某125:某某126:某某127:128:某某229:某某330:某某3重心距离法聚类表阶群集组合系数首次出现阶群集下一阶群集1群集2群集1群集2112001425600438900645720135121300868103097340012812145011981160121015160011111215810161238791313351241414131132315171800161612171115191724250021182122002019121916022202123180252124261702422122019023231121422262424272102525212420242626121232527271282602928293000292912927280群集成员

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论