吴伟主成分分析PPT课件_第1页
吴伟主成分分析PPT课件_第2页
吴伟主成分分析PPT课件_第3页
吴伟主成分分析PPT课件_第4页
吴伟主成分分析PPT课件_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主成分分析法 MATLAB应用 第一组 吴伟 李璇 朱璇 2020 4 5 1 应用matlab进行主成分分析 2020 4 5 2 主成分分析简介 主成分分析 principalcomponentanalysis 简称PCA 是在处理数据时 在保留绝大多数信息的条件下将多个变量综合为几个主要变量 进而在新的综合变量基础上 对数据进一步的分析解释及推断的一种方法 2020 4 5 3 pca步骤 第一步 对原始数据进行标准化处理 第二步 计算标准化后数据数组协方差矩阵或相关矩阵 第三步 求协方差矩阵的特征值和相应的特征向量 第四步 计算主成份贡献率及累计贡献率 第五步 依据方差贡献率选取主成份 第六步 计算主成份得分 第七步 结论解释与推断 2020 4 5 4 相关函数简介 std x 求矩阵x的标准差 zscore x 对矩阵x进行标准化 cov x 求矩阵x的协方差矩阵 corrcoef x 求矩阵x的相关系数矩阵 coeff latent explained pcacov x 对x进行主成分分析 sum x 对向量x求和 cumsum x 表示x向量不同维数的累加和 x向量中第m行的元素是A中第1行到第m行的所有元素累加和 2020 4 5 5 相关函数介绍 pcacov函数介绍 格式 coeff latent explained pcacov x coeff表示各个主成分的系数 latent表示矩阵特征值 explained 每个特征向量表征在观测量总方差中所占的百分数也就是各个主成分的贡献率 2020 4 5 6 7 一 标准化数据 stddata zscore x 二 求协方差矩阵或相关系数矩阵 covtrix cov stddata 或cortrix corrcoef stddata 三 求矩阵特征值和相应的特征向量 coeff latent explained pcacov covtrix 或 coeff latent explained pcacov cortrix matlab主成分分析步骤 2020 4 5 四 计算主成份贡献率及累计贡献率步骤三中pcacov函数中返回的explained即主成分贡献率 累积贡献率 per 100 cumsum latent sum latent 五 选取主成分六 计算各主成份得分 score stddata coeff七 结论解释与推断 2020 4 5 8 案例分析 我们对江苏省十个城市的生态环境状况进行了调查 得到生态环境指标的指数值 见表1 现对生态环境水平分析和评价 2020 4 5 9 案例分析 在matlab中输入观察数据 x 0 78830 76330 47450 82460 87910 95380 87850 63050 89280 73910 72870 51260 76030 87360 92570 85420 61870 78310 81110 76290 88100 68880 81830 92850 85370 63130 56080 65870 85520 89030 89770 94460 94340 90270 74150 84190 65430 75640 82880 79260 92020 91540 87290 63980 84640 82590 74550 78500 78560 92630 88710 84850 61420 76160 84860 78000 80320 65090 91850 93570 84730 57340 82340 68340 94900 88620 89020 95050 87600 90440 89800 63840 84950 89180 39870 67990 86200 95790 88660 61860 96040 78460 89540 39700 98770 88730 97410 90350 73820 8514 2020 4 5 10 案例分析 一 标准化数据 stddata zscore x 标准化后数据 2020 4 5 11 案例分析 二 求协方差矩阵或相关系数矩阵 covtrix cov stddata 协方差矩阵 2020 4 5 12 案例分析 三 求矩阵特征值和相应的特征向量 coeff latent explained pcacov covtrix 各特征向量即各主成分荷载系数 2020 4 5 13 案例分析 四 计算主成份累计贡献率 per 100 cumsum latent sum latent 五 选取主成分六 计算各主成份得分 score stddata coeff 累计贡献率 个主成分得分 2020 4 5 14 数据分析 七 结论解释与推断第一主成分贡献率为43 12 第二主成分贡献率为29 34 第三主成分贡献率为11 97 前三个主成分累计贡献率达84 24 如果按80 以上的信息量选取新因子 则可以选取前三个新因子 第一新因子z1包含的信息量最大为43 12 它的主要代表变量为X8 0 4815城市文明 X7 0 4236生产效率 X4 0 4048城市绿化 这三个变量与生态环境水平密切相关 第一主成分是人为因素的影响 2020 4 5 15 数据分析 第二新因子Z2包含的信息量次之为29 34 它的主要代表变量为X3 0 5299地理结构 X6 0 5273资源配置 X9 0 4589可持续性 第二主成分是自然因素的影响 第三新因子Z3包含的信息量为11 97 代表变量为X9 0 5933可持续性 X5 0 5664物质还原 其他的变量荷载值都很小

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论