主成分分析及其在综合评价系统中的应用_第1页
主成分分析及其在综合评价系统中的应用_第2页
主成分分析及其在综合评价系统中的应用_第3页
主成分分析及其在综合评价系统中的应用_第4页
主成分分析及其在综合评价系统中的应用_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 主成分分析及其在统计综合评价系统中的应用一. 文献综述主成分分析法是在对于复杂系统进行统计分析时十分有效的一种方法。本文主要是对主成分分析法进行详细介绍,并分析其在统计综合评价中的应用1。突出介绍主成分分析法在学生综合成绩分析2、企业业绩分析3及景区游客服务满意度测评4这三个综合评价系统中的应用。并在文末,对主成分分析法进行了一定的改进5,使得主成分分析法更加合理并贴近实际,且在一定程度上减小了统计分析过程中“线性化”产生的误差。二.相关知识在我们进行系统分析时,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。因

2、此,我们就会很自然地想到,能否在各个变量之间相关关系研究的基础上,用较少的新变量代替原来较多的变量,而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息?事实上,这种想法是可以实现的,本文介绍的主成分分析方法就是综合处理这种问题的一种强有力的方法。(一)主成分分析方法的原理主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假定有n个样本,每个样本共有p个变量描述,这样可构成一个n×p阶的数据矩阵。如何从这么多变量的数据中抓住事物的内在规律性呢?要解决这一问题,自然要在p维空间中加以考察,这是比较麻烦的。为了克服这一困难,

3、就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。那么,这些综合指标(即新变量)应如何选取呢?显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。如果记原来的变量指标为,它们的综合指标新变量指标为,(mp)。则在(1)式中,系数由下列原则来决定:(1)与相互无关;(2) 是的一切线性组合中方差最大者;是与不相关的的所有线性组合中方差最大者;是与都不相关的的所有线性组合中方差最大者。这样决定的新变量指标分别称为原变量指标的第一,第

4、二,第m主成分。其中,在总方差中占的比例最大,的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。从以上分析可以看出,找主成分就是确定原来变量在诸主成分上的载荷,从数学上容易知道,它们分别是的相关矩阵的m个较大的特征值所对应的特征向量。(二)主成分分析的解法通过上述主成分分析的基本原理的介绍,我们可以把主成分分析计算步骤归纳如下:(1)计算相关系数矩阵在公式(2)中,(i,j=1,2,p)为原来变量与的相关系数,其计算公式为因为R是实对称矩阵(即rij=rji),所以只需计算其上三角元素或下三角元素即可。(2)计算特征值

5、与特征向量首先解特征方程I-R=0求出特征值i(i=1,2,p),并使其按大小顺序排列,即12,p0;然后分别求出对应于特征值i的特征向量ei(i=1,2,p)。(3)计算主成分贡献率及累计贡献率。一般取累计贡献率达85-95的特征值,所对应的第一,第二,第m(mp)个主成分。(4)计算主成分载荷 (4)由此可以进一步计算主成分:Z= (5)三.主成分分析法的应用近年来, 随着统计分析活动的广泛开展, 评价对象也越来越复杂, 简单评价方法的局限性也越来越明显。因此, 通过对实践活动的总结, 逐步形成了一系列运用多个指标对多个单位进行评价的方法, 简称综合评价方法。在综合评价方法中应用极为广泛的

6、就是主成分分析法1。采用主成分分析法进行综合评价的原因是主成分分析的降维处理技术能较好地解决多指标评价的要求且主成分分析在进行多指标综合评价时,权数是从信息量和系统效应角度来确定的。用主成分分析法进行多指标综合评价的几个优点是:I. 消除了评价指标间的相关影响。另外, 主成分分析用于多指标综合评价是对彼此独立的分量进行合成, 正适于采用加权线性相合成方法, 不必在合成方法选择上多做工作。II. 减少了指标选择的工作量。在主成分分析中由于可以消除评价指标间的相关影响, 因而在指标选择上相对容易些。但主成分分析法确定评价指标的原则是宁多勿少, 尽可能地全面。主成分分析可以保留原始评价指标的大部分信

7、息。如果指标选择不够全面, 就会先天不足,再好的分析方法也会失去效用。III. 在主成分分析将原始变量变换为成分的过程中, 同时形成了反映成分和指标包含信息量的权数, 以计算综合评价值, 这比人为地确定权数, 工作量少些, 也有助于保证客观地反映样本间的现实关系。 主成分分析法在进行综合评价上应用得十分广泛,在很多系统的综合评价中都起到了很重要的作用。这里举出其在学生综合成绩分析2、企业业绩分析3及景区游客服务满意度测评4这三个综合评价系统中的应用。(一) 主成分分析法在学生综合成绩分析中的应用2随着经济全球化和知识经济的强力推动,人力资源已成为人类的第一宝贵资源。各行各业高素质人才培养主要基

8、地是高等院校,因此,如何科学地评价大学生的综合成绩成为当前各高校在全面推进素质教育过程中所面临的问题之一。目前高校普遍采用的方法是取学习成绩的加权平均,然而这种方法存在着许多不足,无法反映学生的整体素质,也不利于素质教育的推进。以某数学班2009-2010 学年的大学物理、大学英语、概率统计、数学分析、中国近现代史纲、常微分方程、程序设计基础、数学模型与数学实验作为变量,分别用X1, X2 X8表示。通过数据2,可计算得出各主成分的得分函数:F1 =0.843X1+0.311X2+0.727X3+0.835X4+0.216X5+0.712X6+0.528X7+0.293X8F2 =0.123X

9、1-0.128X2+0.239X3+0.159X4+0.077X5+0.375X6+0.612X7+0.702X8F4 =0.101X1-0.138X2 +0.087X3-0.003X4 +0.436X5-0.403X6-0.012X7 +0.283X8从上述统计分析中可以得到如下结论:影响学生综合得分的主要因素有四个方面:F1:大学物理,概率统计,数分,常微方程; F2:计算机;F3:英语;F4:史政。其中最主要的是F1, F1反映了学生专业基础课方面的能力水平。普物虽属于公共课,但它与数学有着非常密切的联系,普物与数学同属于理科,且普物中有许多内容都用到了数学中的微积分知识。综上所述, 基

10、于主成分分析的大学生综合成绩评估方法克服了传统方法中只能笼统的反映学生考试成绩的缺点,具有很好的实用性。可以帮助教学人员根据学生的具体情况制定不同的培养方案和教学手段,切实有效地提高学生的专业素质。该方法能够全面客观地评估大学生的综合成绩与专业素质,可以满足当前社会对人才选拔方式的基本要求。(二) 主成分分析法在企业业绩评价指标选择中的应用3业绩评价是评价主体利用其所掌握的信息对评价客体运用一定的方法、程序、指标等进行分析,进而对评价客体在一定时期内的行为表现做出某种判断的过程。业绩评价指标的选择完全可以依靠主成分分析法来进行。首先按着战略业绩评价体系的分类,将业绩评价指标分为财务指标和非财务

11、指标,然后分组做主成分分析。下面以财务指标为例,对主成分分析法在业绩评价指标选择中的运用进行阐述。选取n家企业(或者项目、事业部等需要做业绩评价的单位)作为样本,对每个样本观测p个财务指标指标(变量),分别用X1,X2,X3,XP,例如,假设X1为总资产周转率,X2为销售净利率,X3为资产负债率计算业绩评价单位的各个财务指标Xi,得到原始的数据资料矩阵,再通过主成分分析法的过程对数据矩阵进行计算和处理。对战略业绩评价指标进行主成分分析的目的之一是希望能用尽可能少的综合指标F1,F2,F3,代替原来的p个指标,从而将业绩评价指标简化。而到底选用多少个主成分,本文认为各个企业可以参照该企业的实际情

12、况恰当确定。在实践中比较通行的确定主成分个数方法的主要原则有以下几种1:(k)85%准则(k)即前k个主成分保留原观测变量信息的比重)。根据国内外用主成分分析进行多指标综合评价的实践来看, (k)>85%通常可以保证样本排序的稳定。g>准则。先计算特征根g, 的均值然后将之与g比较, 选取g>的前k个成分作为主成分。由标准化数据的相关矩阵R求得的=1, 因此只要取g>1的前k个主成分即可。选取第一主成分用于综合评价。主成分分析法作为数据降维方法, 其每一个主成分均有特定经济含义, 可以用于揭示原始样本中的基本性质。第一主成分说明了原始数据变动的总规模, 而其余各主成分则

13、说明样本内部的各方面的特征。(三) 主成分分析法在景区游客服务满意度测评中的应用4随着市场竞争的加剧和顾客消费观念的转变,顾客满意度被越来越多的学者和经营者所关注。景区作为一个企业化运营的经济体,游客满意度的高低直接影响了游客的重游率和向亲友推荐的意向。因而,游客的满意度越来越受到景区管理部门和学者的重视。可运用主成分分析法,对游客的满意度进行测评,在测评结果的基础上,通过对景区游客服务的研究,来提出提高景区游客服务满意度的对策,以供景区服务工作者参考。可根据景区游客服务满意度测评指标体系的各项指标,设计调查问卷。运用主成分分析法对所得的数据进行指标分析,可得到总方差解释表和旋转后的成分矩阵载

14、表,得出景区游客服务满意度测评指标层的权重和最终的评价得分。以广州白云山麓湖公园为例,得出的最终评价得分4为:目标层准则层指标层N权重评价值景区游客服务满意度景区游客交互服务态度3.340.133.52行为3.510.08专业技能4.100.11景区游客服务物质环境服务设施2.870.07环境3.560.05服务陈设3.770.15景区游客服务的结果等待时间2.560.11有形性3.210.09效价比3.430.12游客感知服务感知服务3.790.09得出这样的结果表明:在白云山麓湖公园游客看来,白云山麓湖公园游客服务基本上令游客满意,但是最终的满意度得分并不高,说明白云山麓湖公园游客服务满意度尚有待提高。且提出如下建议:旅游景区服务作为游客旅游体验的重要组成部分对于景区的发展有至关重要的意义。四.关于主成分分析做综合评价的改进5传统主成分分析法存在两个不足之处:一是综合评价的实际效果与评价指标间的相关程度高低成正比,评价指标间相关程度越高,主成分分析的结果越好,当指标间相关性小时,每一个主成分承载的信息量就越少,为满足累计方差贡献率达到一定水平,可能需选取较多的主成分,此时降维作用就不明显。二是主成分分析只是一种“线性”降维技术,只能处理线性问题。而研究实际问题时,不仅指标间有非线性关系有时主成分与原始数据之间也呈非线性关系,如果简单地进行线性处理,必然导致评价结果的偏差。可以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论