版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
光学工程与精密仪器
——主成分分析自动化工程学院在日常的数据中,有很多是相关的。人们希望能够找出它们的少数“代表”来对它们进行描述。需要把这种有很多变量的数据进行高度概括,用少数几个指标简单明了地把情况说清楚。主成分变换将三维空间的样本显示在二维空间主成分分析(
PrincipalComponentsAnalysis)就是把变量维数降低以便于描述、理解和分析的方法。主成分分析也称为主分量分析,是一种通过降维来简化数据结构的方法:如何把多个变量化为少数几个综合变量(综合指标),而这几个综合变量可以反映原来多个变量的大部分信息,所含的信息又互不重叠,即它们之间要相互独立,互不相关。这些综合变量就叫主成分,它是不可观测的,即它不是具体的变量,只是几个指标的综合。什么是主成分分析法?成绩数据53个学生的数学、物理、化学、语文、历史、英语的成绩如下表(部分)。从本例可能提出的问题能不能把这个数据表中的6个变量用一两个综合变量来表示呢?这一两个综合变量包含有多少原来的信息呢?能不能利用找到的综合变量来对学生排序呢?(一)主成分分析的几何解释
例中数据点是六维的;即每个观测值是6维空间中的一个点。希望把6维空间用低维空间表示。先假定只有二维,即只有两个变量,语文成绩(x1)和数学成绩(x2),分别由横坐标和纵坐标所代表;每个学生都是二维坐标系中的一个点。空间的点如果这些数据形成一个椭圆形状的点阵(这在二维正态的假定下是可能的)该椭圆有一个长轴和一个短轴。在短轴方向上数据变化很少;•••••••••••••••••••••••••••••••••••••假定语文成绩(X1)和数学成绩(X2)的相关系数ρ=0.6。设X1
和X2
分别为标准化后的分数,右图为其散点图。那么随机向量的方差—协方差矩阵为可以看出,在变量标准化的情况下的方差—协方差矩阵与其相关矩阵相等。由求矩阵特征值和特征向量的方法:令可以求出:对应的特征向量分别为:显然,这两个特征向量是相互正交的单位向量。而且它们与原来的坐标轴X1
和X2
的夹角都分别等于45º。如果将坐标轴X1
和X2
旋转45º,那么点在新坐标系中的坐标(Y1,Y2)与原坐标(X1,X2)有如下的关系:Y1和Y2均是X1
和X2的线性组合系数代表什么?•••••••••••••••••••••••••••••••••••••在新坐标系中,可以发现:虽然散点图的形状没有改变,但新的随机变量Y1
和Y2
已经不再相关。而且大部分点沿Y1
轴散开,在Y1轴方向的变异较大(即Y1的方差较大),相对来说,在Y2轴方向的变异较小(即Y2
的方差较小)。事实上,随机变量Y1和Y2的方差分别为:可以看出,最大变动方向是由特征向量所决定的,而特征值则刻画了对应的方差。这只是我们举的一个例子,对于一般情况,数学上也能证明。在上面的例子中Y1
和Y2
就是原变量X1和X2的第一主成分和第二主成分。实际上第一主成分Y1就基本上反映了X1
和X2
的主要信息,因为图中的各点在新坐标系中的Y1
坐标基本上就代表了这些点的分布情况,因此可以选Y1
为一个新的综合变量。当然如果再选Y2也作为综合变量,那么Y1
和Y2
则反映了X1
和X2的全部信息。从几何上看,找主成分的问题就是找出p维空间中椭球体的主轴问题,就是要在x1~xp的相关矩阵中m个较大特征值所对应的特征向量。究竟提取几个主成分,一般有两种方法:特征值>1累计贡献率>0.8那么如何提取主成分呢?
(二)主成分分析的基本思想
假定有n个样本,每个样本共有p个变量,构成一个n×p阶的数据矩阵
综合指标如何选取呢?这些综合指标要想尽可能多地反映原指标的信息,综合指标的表达式中要含有原指标,那么我们通常是取原指标的线性组合,适当调整它们的系数,使综合指标间相互独立且代表性好。定义:记x1,x2,…,xP为原变量指标,z1,z2,…,zm(m≤p)为新变量指标
可以看出,新指标对原指标有多个线性组合,新指标对哪个原指标反映的多,哪个少,取决于它的系数。系数lij的确定原则:①
zi与zk(i≠k;i,k=1,2,…,m;j=1,2,…,p)相互无关;
②
z1是x1,x2,…,xP的一切线性组合中方差最大者(最能解释它们之间的变化),z2是与z1不相关的x1,x2,…,xP的所有线性组合中方差最大者;…;zm是与z1,z2,……,zm-1都不相关的x1,x2,…xP,的所有线性组合中方差最大者。
从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2,…,
p)在诸主成分zi(i=1,2,…,m)上的荷载
lij(
i=1,2,…,m;
j=1,2,…,p)。从数学上可以证明,它们分别是相关矩阵(也就是x1,x2,…,xP的相关系数矩阵)m个较大的特征值所对应的特征向量。
(一)计算相关系数矩阵
rij(i,j=1,2,…,p)为原变量xi与xj标准化后的相关系数,rij=rji,其计算公式为主成分分析的计算步骤
(二)计算特征值与特征向量1、解特征方程,求出特征值,并使其按大小顺序排列;
2、分别求出对应于特征值的特征向量,要求=1,即,其中表示向量的第j个分量,也就是说为单位向量。3、计算主成分贡献率及累计贡献率贡献率累计贡献率
一般取累计贡献率达85%~95%的特征值所对应的第1、第2、…、第m(m≤p)个主成分。
4、计算主成分载荷
在主成分之间不相关时,主成分载荷就是主成分zi与变量xj之间的相关系数(在数学上可以证明)
5、各主成分的得分
得到各主成分的载荷以后,可以按照计算各主成分的得分
每个地区的综合评价值为:对各个主成分进行加权求和。权重为每个主成分方差的贡献率。(一)下面,我们根据下表给出的数据,对某农业生态经济系统做主成分分析。
某农业生态经济系统各区域单元的有关数据
步骤如下:(1)将上表中的数据作标准差标准化处理,然后计算相关系数矩阵。相关系数矩阵
特征值及主成分贡献率
=4.661/8.9988
(2)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率。由表可知,第1,第2,第3主成分的累计贡献率已高达86.596%(大于85%),故只需要求出第1、第2、第3主成分z1,z2,z3即可。
(3)对于特征值分别=4.6610、=2.0890、=1.0430,分别求出其特征向量e1,e2,e3,再计算各变量x1,x2,…,x9在主成分z1,z2,z3上的载荷。
主成分载荷
(1)从上表可以看出,第1主成分z1与x1,x5,x6,x7呈现出较强的正相关,与x3呈现出较强的负相关,而这几个变量则综合反映了生态经济结构状况,因此可以认为第1主成分z1是生态经济结构的代表。
(2)第2主成分z2与x2,x4,x5呈现出较强的正相关,与x1呈现出较强的负相关,其中,除了x1为人口总数外,x2,x4,x5都反映了人均占有资源量的情况,因此可以认为第2主成分z2代表了人均资源量。
分析:主成分载荷是主成分与变量之间的相关系数。
显然,用3个主成分z1、z2、z3代替原来8个变量(x1,x2,…,x8)描述农业生态经济系统,可以使问题更进一步简化、明了。
(3)第3主成分z3与x8呈现出的正相关程度最高,其次是x6,而与x7呈负相关,因此可以认为第3主成分在一定程度上代表了农业经济结构。
(4)另外,表3中最后一列(占方差的百分数),在一定程度上反映了3个主成分z1、z2、z3包含原变量(x1,x2,…,x9)的信息量多少。接着还可以计算每个主成分的得分,组成一个新的数据集,作为进一步应用系统聚类分析方法进行区划、分类的新的出发点。也可以用来综合评价。进行区域差异分析35人脸识别就是将已检测到的待识别人脸与数据库中的已知人脸进行比较匹配,得出相关信
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 贾生名谊课件
- 2026年灾后重建中的结构设计挑战
- 货运司机安全培训5步课件
- 货车运输安全培训
- 货物打包培训课件
- 心脏重症护理理论与实践探讨
- 2026年成都职业技术学院单招职业技能笔试备考题库带答案解析
- 植入式心脏起搏器进展与应用
- 2026年河南质量工程职业学院单招综合素质笔试模拟试题带答案解析
- 2026年海南体育职业技术学院高职单招职业适应性考试备考题库有答案解析
- 达人分销合同范本
- 检修车间定置管理制度(3篇)
- 雨课堂学堂在线学堂云《工程伦理( 北林)》单元测试考核答案
- 2025年西藏自治区公务员面试结构化真题汇编试卷(含答案)
- 2025及未来5年轴功率监测器项目投资价值分析报告
- 基于深度图的三维重建算法优化:理论、实践与创新
- 吸烟有害健康课件教学
- 2025年公司押运年终总结样本(五篇)
- 2025届央国企校招笔试真题及答案
- 2025年新苏教版七上生物知识点归纳
- 2025教育机构全职教师劳动合同(示范文本)
评论
0/150
提交评论