主成分分析实验报告_第1页
主成分分析实验报告_第2页
主成分分析实验报告_第3页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、项目名称实验4主成分分析所属课程名称多元统计分析(英)项目类型综合性实验实验(实训)日期 2012年4 月15日一、实验(实训)概述:【目的及要求】主成分分析利用指标之间的相关性,将多个指标转化为少数几个综合指标, 从而达到降维和数据结构简化的目的。这些综合指标反映了原始指标的绝大部分 信息,通常表示为原始指标的某种线性组合, 且综合指标间不相关。利用矩阵代 数的知识可求解主成分。按具体的题目要求完成实验报告,并及时上传到给定的FTP和课程网站! 【基本原理】利用指标之间的相关性,将多个指标转化为少数几个综合指标。【实施环境】(使用的材料、设备、软件)SAS SPSS EXCELS件、实验(实

2、训)内容:【项目内容】 主成分分析。【方案设计】 题目: 由原始数据求主成分。【实验(实训)过程 】(步骤、记录、数据、程序等)附后【结论】(结果、分析)附后三、指导教师评语及成绩: 评语:成绩:指导教师签名:批阅日期:实验报告4主成分分析(综合性实验)(Pri ncipal comp onent an alysis)实验原理:主成分分析利用指标之间的相关性, 将多个指标转化为少数几个综合 指标,从而达到降维和数据结构简化的目的。 这些综合指标反映了原始指标的绝 大部分信息,通常表示为原始指标的某种线性组合, 且综合指标间不相关。利用 矩阵代数的知识可求解主成分。实验题目: 下表中给出了不同国

3、家及地区的男子径赛记录: (t8a6)Country100m200m400m800m1500m5000m10,000mMarathon(s)(s)(s)(min)(min)(min)(min)(mins)ArgentinaAustraliaAustriaBelgiumBermudaBrazilBurmaCanadaChileChinaColumbiaCook IslandsCosta Rica CzechoslovakiaDenmarkDominican RepublicFinlandFranceGerman .)German .)Great Brit.& N.IrelandGreec

4、eGuatemalaHungaryIndiaIndonesiaIrelandIsrael 21ItalyJapanKenyaKoreaKoreaLuxembourgMalaysiaMauritiusMexicoNetherlandsNew ZealandNorwayPapua New GuineaPhilippinesPolandPortugalRumaniaSingaporeSpainSwedenSwitzerlandTaipeiThailandTurkeyUSA49Western Samoa(数据来源:1984年洛杉机奥运会IAAF/AFT径赛与田赛统计手册)实验要求:( 1 )试用 Pr

5、incomp 过程求主成分;并对结果进行解释;( 2)试用方差累积贡献率和 Scree 图确定主成分的个数;( 3)计算各国第一主成分的得分并排名;( 4)试对结果进行解。实验题目分析报告:( 1 )试用 Princomp 过程求主成分;并对结果进行解释;如上就是主成分分析截图,利用 sas 处理数据后我们可以知道:有 8 个主成分( 2)试用方差累积贡献率和 Scree 图确定主成分的个数;从上面的主成分累计贡献率截图和碎石图我们可以分析: 选取两个主成分的贡献 率就已经达到 . 所以我们选取 2 个主成分个数。( 3)计算各国第一主成分的得分并排名;得分排名国家得分得分排名 国家得分得分排

6、名 国家得分1Cook Islands10.5556320 Argentina0.26189639 Brazil-1.558262 Western Sam7.o23121621 Luxembourg0.22050940 New Zealand -1.599713Mauritius4.25865822 Korea0.20754541 Sweden-1.603234 Papua New 3G.90919323 India-0.1652442 Switzerland-1.638975 Singapore3.12211124 Greece-0.3795943 Finland-1.692026 Thai

7、land2.76181725 Chile-0.3810844 Canada-1.746357Indonesia2.74779926 Columbia-0.3900745 Poland-2.000618 Guatemala2.67243527 Mexico-0.6785346 Belgium-2.041269 Costa Rica2.29664728 Austria-0.8076447 Kenya-2.1683210Philippines2.07042229 Norway-0.8114948 France-2.171911Burma1.9718730 Ireland-0.884249 Austr

8、alia-2.4463712Dominican R1e.71488631 Portugal-0.9163750 German (F.R.-)2.5527413Malaysia1.70828332 Denmark-1.1132451 German (D.R.-)2.5900914D.P.R Korea1.68368733 Rumania-1.1964952 USSR-2.6268515Taipei0.95050234 Hungary-1.2051953 Italy-2.7269516Bermuda0.73925735 Japan-1.2378754 Great Brit.& N- 3.0

9、242317Israel0.43458636 Czechoslova-k1.3725655 USA-3.4305618China0.4089737 Spain-1.4805919Turkey0.2660838 Netherlands-1.55543(4)试对结果进行解。 对上述的各个国家的第一主成分得分排名,排在第一的是 Coook Island, 排名中 也有出现第一主成分得分负数的, 这主要是因为求出来的数据与对应的数据相乘 的结果。相关程序:( 1) 导入数据程序PROC IMPORT OUT= DATAFILE= "f:sas" DBMS=EXCEL REPLACE

10、;RANGE="Sheet1$"GETNAMES=YES;MIXED=NO;SCANTEXT=YES;USEDATE=YES;SCANTIME=YES;RUN;( 2) 得到主成分并且画图分析程序:title;footnote;* Principal Components Analysis * ;options pageno=1;ods output Eigenvalues = ;proc princomp data= out= outstat=;var A B C D E F G H;run; quit;goptions reset=all device=WIN;* Sc

11、ree Plot *;data ; set ;if eigenvalue > 0;rename number=Component;drop difference proportion cumulative;run;title;footnote;goptions ftext=SWISS ctext=BLACK htext=1 cells;axis1 minor=none major=(number=5) label=('Eigenvalue');pattern1 value=SOLID color=BLUE;proc gchart data= ;format eigenvalue best8.;vbar component / type=sum sumvar=eigenvalue discrete raxis=axis1 framecf

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论