版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
(优选)主成分分析法当前1页,总共48页。一、主成分分析法概述二、主成分分析法的基本原理三、主成分分析法的应用四、主成分分析法的步骤和方法五、主成分分析法的操作流程六、主成分分析法的结果分析七、应用主成分分析法的注意事项八、与因子分析法的区别当前2页,总共48页。一、主成分分析法概述每个人都会遇到有很多变量的数据。这些数据的共同特点是变量很多,在如此多的变量之中,有很多是相关的。人们希望能够找出它们的少数“代表”来对它们进行描述。介绍两种把变量维数降低以便于描述、理解和分析的方法:主成分分析(principalcomponentanalysis)和因子分析(factoranalysis)。实际上主成分分析可以说是因子分析的一个特例。当前3页,总共48页。定义:主成分分析(PrincipalComponentsAnalysis,PCA)也称为主分量分析,是一种通过降维来简化数据结构的方法,即如何把多个变量(变量)转化为少数几个综合变量(综合变量),而这几个综合变量可以反映原来多个变量的大部分信息。主成分:把相关的变量变为无关的主成分。注意:进行主成分的变量之间必须要有相关性,经过分析后变量之间独立。当前4页,总共48页。二、主成分分析法基本原理主成分分析就是设法将原来众多具有一定相关性的变量(如p个变量),重新组合成一组新的相互无关的综合变量来代替原来变量。怎么处理?通常数学上的处理就是将原来p个变量作线性组合作为新的综合变量。如何选择?如果将选取的第一个线性组合即第一个综合变量记为F1,自然希望F1尽可能多的反映原来变量的信息。怎样反映?当前5页,总共48页。最经典的方法就是用方差来表达,即var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中所选取的F1应该是方差最大的,故称之为第一主成分(principalcomponentI)。如果第一主成分不足以代表原来p个变量的信息,再考虑选取F2即第二个线性组合。F2称为第二主成分(principalcomponentII)。F1和F2的关系?当前6页,总共48页。1、基于类型的古村落旅游竞争力分析
本文以社区参与型古村落为主要研究对象,采用主成分分析法、层次熵法等确定主要的旅游评价指标并获得其贡献指数。三、主成分分析法的应用
当前7页,总共48页。2、基于主成分分析的新疆与全国旅游产业竞争力评价
本文采用主成分分析(PCA)方法,对新疆旅游业的竞争能力与全国其他省、区、直辖市进行比较。对全国31个省、区、直辖市的310个原始数据,根据PCA方法的原理和步骤进行计算机处理,可以得到主成分因子的特征值、贡献率与累积贡献率及因子提取结果。前3个主成分因子的累积贡献率达87.154%,根据累积贡献率大于85%的主成分因子选取原则,选择前3个主成分因子,而且选择的3个主成分因子相互之间不存在相关性。当前8页,总共48页。四、主成分分析法的步骤1)数据归一化处理:数据标准化(Z)2)计算相关系数矩阵R:3)计算特征值;特征值越大说明重要程度越大。4)计算主成分贡献率及方差的累计贡献率;5)计算主成分载荷与特征向量:
主成分的负荷值大小反映了主成分因子对可测变量的影响程度;载荷值越大说明此变量对主成分的解释越多,及贡献越大。6)写出主成分模型当前9页,总共48页。主成分选取的条件:
(1)特征值(特征值>1);
(2)方差的累计贡献率。(前K个主成分的方差累计贡献率达到了80%或85%,也可以说累计贡献率≥80%或≥85%)(较多)。
两个条件满足其一就可以了,究竟以哪个为主依个人情况而定或根据实际情况两个结合使用。如果前K个主成分的累计贡献率达到了85%,则表明取前K个主成分基本包含了全部测量指标所具有的信息,从而达到了变量降维的目的。当前10页,总共48页。五、主成分分析法的操作流程当前11页,总共48页。当前12页,总共48页。当前13页,总共48页。当前14页,总共48页。当前15页,总共48页。当前16页,总共48页。当前17页,总共48页。KMO检验是在主成份分析前对数据的分析:
KMO越接近于1越好,等于相关系数,≥0.5就可以。1、相关系数R:KMO检验六、主成分分析法的结果分析当前18页,总共48页。当前19页,总共48页。2、确定主成分本操作是选择以特征根大于1为标准提取主成分,提取了4个主成分。按照累积方差的观点,应该提取≥80%或≥85%的值,本例题提取5个主成分,其累积方差贡献率为85.644%,应该提取前五个主成分。当前20页,总共48页。两个条件都满足当前21页,总共48页。3、写出主成分模型
当前22页,总共48页。2、写出主成分模型
主成分因子载荷矩阵:
载荷值越大,说明此变量对主成分的解释越多,及贡献越大;越大越好。当前23页,总共48页。前面的表给出的是因子载荷矩阵,主成分系数应该为特征向量,其换算方法为:用主成分载荷矩阵中的数据除以主成分相对应的特征值开平方根便得到两个主成分中每个指标所对应的系数。(1)主成分系数(特征向量)计算当前24页,总共48页。当前25页,总共48页。当前26页,总共48页。当前27页,总共48页。当前28页,总共48页。当前29页,总共48页。当前30页,总共48页。(2)写各主成分模型F1=0.50X1+0.40X2-0.02X3+0.07X4+0.36X5+0.14X6
F1主要表示X1、X2、X5的信息F2=1.28X1-0.18X2-0.07X3+0.38X4-0.08X5+0.50X6
F2主要表示X1、X4、X6F3=2.27X1+0.14X2-0.54X3-0.47X4-0.12X5+0.07X6
F3主要表示X1F4=3.69X1-0.01X2+0.38X3-0.13X4+0.52X5-0.03X6
F4主要表示X1、X3、X5当前31页,总共48页。主成分的综合模型:两个公式之意:F中X1的综合系数w1=(F1的x1的系数×x1在F1中的方差贡献率+F2的x1的系数×x1在F2中的方差贡献率…Fn)/方差累计贡献率注意:X1、X2在F1、F2中各自所对应的方差贡献率。
方差贡献率与方差累计贡献率的区别
当前32页,总共48页。主成分赋权法其中,aij描述了因子i在第j个主成分中的因子得分系数,即第i个因子对第j个主成分的贡献,它与该主成分对应方差的贡献率Ej的组合,便是需要确定的第i个环境因子的权重值。当前33页,总共48页。主成分赋权法:计算权重集进行归一化处理由此即得到权重集:和为1.当前34页,总共48页。4、旋转:
从下表的因子荷载看,第三个主成分因子在10个指标上的载荷值都不明显,因此很难对第三个主成分因子进行有效定义。旋转的条件:当某个主成分因子的各载荷值大小都不明显,很难对此主成分因子进行有效定义时,采用旋转进一步分析。当前35页,总共48页。旋转后的主成分因子载荷矩阵当前36页,总共48页。景区满意度旋转前后成分矩阵图对比当前37页,总共48页。选取主成分的个数,急转处是确定主成分的个数处。5、碎石图分析景区满意度碎石图当前38页,总共48页。八、与因子分析法的区别当前39页,总共48页。1、基本概念主成分分析就是将多项指标转化为少数几项综合指标,用综合指标来解释多变量的方差-协方差结构。综合指标即为主成分。所得出的少数几个主成分,要尽可能多地保留原始变量的信息,且彼此不相关。因子分析是研究如何以最少的信息丢失,将众多原始变量浓缩成少数几个因子变量,以及如何使因子变量具有较强的可解释性的一种多元统计分析方法。当前40页,总共48页。因子分析实例:当前41页,总共48页。当前42页,总共48页。当前43页,总共48页。2、基本思想的异同共同点主成分分析法和因子分析法都是用少数的几个变量(因子)来综合反映原始变量(因子)的主要信息,变量虽然较原始变量少,但所包含的信息量却占原始信息的85%以上,所以即使用少数的几个新变量,可信度也很高,也可以有效地解释问题。并且新的变量彼此间互不相关,消除了多重共线性。这两种分析法得出的新变量,并不是原始变量筛选后剩余的变量。主成分分析和因子分析都产生了新变量。当前44页,总共48页。不同之处主成分分析中,最终确定的新变量是原始变量的线性组合,每个主成分都是由原有p个变量线性组合得到。在诸多主成分Zi中,Zi在方差中占的比重最大,说明它综合原有变量的能力最强,越往后主成分在方差中的比重也小,综合原信息的能力越弱。因子分析是要利用少数几个公共因子去解释较多个要观测变量中存在的复杂关系,它不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子与特殊因子两部分。公共因子是由所有变量共同具有的少数几个因子;特殊因子是每个原始变量独自具有的因子。当前45页,总共48页。主成分分析是研究如何通过少数几个主成分来解释多变量的方差一协方差结构的分析方法,也就是求出少数几个主成分(变量),使它们尽可能多地保留原始变量的信息,且彼此不相关。因子分析是寻找潜在的起支配作用的因子模型的方法。因子分析是根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同的组的变量相关性较低,每组变量代表一个基本结构,这个基本结构称为公共因子。通过因子分析得来的新变量是对每个原始变量进行内部剖析。当前46页,总共48页。3、应用中的优缺点比较
主成分分析优点:首先它利用降维技术用少数几个综合变量来代替原始多个变量,这些综合变量集中了原始变量的大部分信息。其次它通过计算综合主成分函数得分,对客观经济现象进行科学评价。再次它
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人货梯基础施工方案
- 工程量确认复核现场组织方案
- 初中英语七年级下册 Unit 1 Silk Road Journey Lesson 3 Experiencing Xian 深度教学方案
- 施工投标答辩策略资料准备方案
- 施工道路分部分项临时围挡施工安全方案
- 成型线高处作业安全管理方案
- 临边洞口防护设施设置达标方案
- 综合楼施工招标商务澄清方案
- 机电安装综合施工方案
- 高校宣传基地建设方案范文
- (二模)石家庄市2026届普通高中高三毕业年级教学质量检测(二)数学试卷(含答案详解)
- 喷雾扬尘施工方案(3篇)
- 2026年西部计划志愿者招募考试题及答案
- 电厂扩建工程锅炉主钢架垂直度偏差控制QC成果
- 2022年上海市闵行区七宝镇社区工作者招聘考试真题及答案
- GB/T 17702-2021电力电子电容器
- 量子力学-81电子自旋态与自旋算符
- DV-PV培训课件:设计验证和生产确认
- 数模和模数转换器-课件
- 小学生血液知识讲座课件
- 部编人教版中考语文试卷分类汇编口语交际与综合性学习
评论
0/150
提交评论