




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.主成分分析计算方法和步骤:在对某一事物或现象进行实证研究时,为了充分反映被研究对象个体之间的差异, 研究者往往要考虑 增加测量指标,这样就会增加研究问题的负载程度。但由于各指标都 是对同一问题的反映,会造成信息的重叠,引起变量之间的共线性,因此,在多指标的数 据分析中,如何压缩指标个数、压缩后的指标能否充分 反映个体之间的差异,成为研究 者关心的问题。而主成分分析法可以很好地解决这一问题。主成分分析的应用目 的可以简单地归结为: 数据的压缩、数据的解释。它常被用来寻 找和判断某种事物或现象的综合指标,并 且对综合指标所包含的信息给予适当的解释, 从而更加深刻地揭示事物的内在规律。主成分分析的
2、基本步骤分为: 对原始指标进行标准化,以消除变量在数量极或量 纲上的影响;根据标准化后的数据矩阵求出相关系数矩阵 R; 求出 R 矩阵的特征 根和特征向量; 确定主成分,结合专 业知识对各主成分所蕴含的信息给予适当的解 释;合成主成分,得到综合评价值。结合数据进行分析本题分析的是全国各个省市高校绩效评价,利用全国2014年的相关统计数据(见附录),从相关的指标数据我们无法直接评价我国各省市的高等教育绩效,而通过表5-6的相关系数矩阵,可以看到许多的变量之间的相关性很高。如:招生人数与教职工人数之间具有较强的相关性,教育投入经费和招生人数也具有较强的相关性,教工人数与本科院校数之间的相关系数最高
3、,到达了0.963,而各组成成分之间的相关性都很高,这也充分说明了主成分分析的必要性。表5-6 相关系数矩阵本科院校数招生人数教育经费投入相关性师生比0.2790.3290.252重点高校数0.3450.2040.310教工人数0.9630.9540.896本科院校数1.0000.9380.881招生人数0.9381.0000.893教育经费投入0.8810.8931.000师生比重点高校数教工人数相关性师生比1.000-0.2180.208重点高校数-0.2181.0000.433教工人数0.2080.4331.000本科院校数0.2790.3450.963招生人数0.3290.2040.9
4、54教育经费投入(元)0.2520.3100.896表5-7给出的是各主成分的方差贡献率和累计贡献率,我们选取主成分的标准有两个:第一,特征根大于1,因为,如果特征根小于1,说明该主成分的解释力度太弱,还比不上直接引入一个原始变量的平均解释力度大;第二,方差贡献率大于85%,如果这两个标准不能同时符合要求,则往往是因为选择的指标不合理或者样本容量太小,应继续调整。表5-7还显示,只有前2个特征根大于1,因此SPSS只提取了前两个主成分,而这两个主成分的方差贡献率达到了87.081%,因此选取前两个主成分已经能够很好地描述我国高等教育地区现状。表5-7 方差贡献率以及累计贡献率元件起始特征值提取
5、平方和载入合计方差的贡献率 %累加贡献率 %合计方差的贡献率 %累加贡献率 %13.98366.39066.3903.98366.39066.39021.24120.69187.0811.24120.69187.08130.5719.50896.589.5719.50896.58940.1402.33598.925.1402.33598.92550.0520.86999.794.0520.86999.79460.0120.206100.000.0120.206100.000表5-8为输出的主成分系数矩阵,可以说明各主成分在各变量上的载荷。由表5-8可以看出,标准化后的第一主成分( 简称) 对所
6、有变量都有载荷,且载荷绝对值几乎都在0.7以上, 因此可以说第一主成分是对人口结构的度量,代表了一个地区人口结构状况,可以称之为“综合因子”。在综合因子中,平均每户人口,农业与非农业人口比例, 人口的自然增长率比重即 人口自然增长各指标具有较强的作用,人与经济等其他指标所起的作用次之,男女比例也起一定作用。第二主成分( 简称 ) 对重点高校数和教工人数具有负载荷,其他变量具有正载荷,并且除 师生比和重点高校数载荷绝对值均小于0.2,有的甚至 接近于 0.1。因此,第二个主成分只是汇集了第一主成分遗漏的部分信息,我们称之为“辅助 因子”。表5-8主成分矩阵成分师生比0.3170.799重点高校数
7、0.396-0.759教工人数0.984-0.095本科院校数0.9730.005招生人数0.9640.131教育经费投入0.9390.011表5-9 主成分评分系数矩阵成分师生比.079.643重点高校数.099-.612教工人数.247-.077本科院校数.244.004招生人数.242.106教育经费投入.236.009根据表5-9可以得到各主成分的表达式把变量分别代入以上表达式,可以得出和两个主成分得分,但单独一个主成分不能很好地评价十个地区人口结构的情况,因此需要按照各主成分对应的方差贡献率为权数计算综合统计F,()主成分分析法的优点: 1、 可消除评价指标之间的相关影响 因为主成分
8、分析在对原指标变量进行变换后形成了彼此相互独立的主成分,而且实践证明指标之间相关程度越高,主成分分析效果越好。 2、 可减少指标选择的工作量 对于其它评价方法,由于难以消除评价指标间的相关影响,所以选择指标时要花费不少精力,而主成分分析由于可以消除这种相关影响,所以在指标选择上相对容易些。 3、 当评级指标较多时还可以在保留绝大部分信息的情况下用少数几个综合指标代替原指 标进行分析 主成分分析中各主成分是按方差大小依次排列顺序的,在分析问题时,可以舍弃一部分主成分,只取前后方差较大的几个主成分来代表原变量,从而减少了计算工作量。 4、 在综合评价函数中,各主成分的权数为其贡献率,它反映了该主成
9、分包含原始数据的信 息量占全部信息量的比重,这样确定权数是客观的、合理的,它克服了某些评价方法中认为确定权数的缺陷。 5、 这种方法的计算比较规范,便于在计算机上实现,还可以利用专门的软件主成分分析法的缺点:1、在主成分分析中,我们首先应保证所提取的前几个主成分的累计贡献率达到一个较高的水平(即变量降维后的信息量须保持在一个较高水平上),其次对这些被提取的主成分必须都能够给出符合实际背景和意义的解释(否则主成分将空有信息量而无实际含义)。2、主成分的解释其含义一般多少带有点模糊性,不像原始变量的含义那么清楚、确切,这是变量降维过程中不得不付出的代价。因此,提取的主成分个数m通常应明显小于原始变
10、量个数p(除非p本身较小),否则维数降低的“利”可能抵不过主成分含义不如原始变量清楚的“弊”。四、一辈子孤单并不可怕,如果我们可以从中提炼出自由,那我们就是幸福的。许多长久的关系都以为忘记了当初所坚持与拥有的,最后又开始羡慕起孤单的人。五、恋爱,在感情上,当你想征服对方的时候,实际上已经在一定程度上被对方征服了。首先是对方对你的吸引,然后才是你征服对方的欲望。六、没有心如刀割,不再依依不舍,只有,沉默相隔七、和你在一起只是我不想给任何人机会。八、一个人总要走陌生的路,看陌生的风景,听陌生的歌,然后在某个不经意的瞬间,你会发现,原本是费尽心机想要忘记的事情真的就那么忘记了。九、无论我们爱过还是就
11、这样错过,我都会感谢你。因为遇见你,我才知道思念一个人的滋味;因为遇见你,我才知道感情真的不能勉强;因为遇见你,我才知道我的心不是真的死了;因为遇见你,我才知道我也能拥有美丽的记忆。所以,无论你怎么对待我,我都会用心去宽恕你的狠,用心去铭记你的好。十、爱情需要的是彼此互相的照顾,当我们心爱的人累了,我们不是坐在一边不理,而是多陪对方谈谈心,对方需要什么的时候,自己尽量的满足对方的需求,至少可以让对方知道,在自己身边的感觉是如此的温暖。十一、自从你出现後,我才知道原来有人爱是那麽的美好十二、有的人与人之间的相遇就像是流星,瞬间迸发出令人羡慕的火花,却注定只是匆匆而过。十三、有一些人,这一辈子都不
12、会在一起,但是有一种感觉却可以藏在心里守一辈子。十四、不要轻易说爱,许下的承诺就是欠下的债!十五、不管你是多么的爱对方,但千万不可当第三者。细想,默然。因为知道,这样的故事一开始便注定了结局,一开始就注定在这个故事里,很多人会受伤。离开的总是要离开,挽留不住,就像彼岸花,穷其一生,花叶仍是生生相错。十六、什么叫快乐?就是掩饰自己的悲伤对每个人微笑。十七、爱情与视力无关,任你看得再怎么清楚,在爱里只有模糊。因为太聪明太理智就没有办法恋爱,爱情根本是盲目的。十八、恋爱就像剪头发,这种事情不到最后是不知道结果的,结果能否令每个人皆大欢喜,无人保障,但是一切都是自己的选择。十九、因为爱过,所以慈悲:因
13、为懂得,所以宽容。二十、那些随风散落的微笑眼神,仿似落寞诗人的爱情诗句,一段一段,错落成行。孤独的钟鸣彻夜悲鸣,那些如花容颜,终不敌过时间切割的颓败,我们忧伤的仰望阳光,看流年未亡,年华尽耗。二十一、一个人一生可以爱上很多的人,等你获得真正属于你的幸福之后,你就会明白一起的伤痛其实是一种财富,它让你学会更好地去把握和珍惜你爱的人。二十二、爱一个人,由天由人却由不得自己。不由自主只因刻骨铭心,不离不弃只因无法代替。总是心有期待,才有灯火阑珊处的望眼等待;总是情怀善待,才有心甘情愿地付出所有,习惯的依赖。也许你的世界一无所有,但在爱你人的心里,你就是全世界。珍惜一个深爱你的人,更要珍藏一颗为你融入生命的心。二十三、就在我以为一切都没有改变只要我高兴就可以重新扎入你的怀抱一辈子不出来的时候,其实一切都已经沧海桑田了,我像是一躲在壳里长眠的鹦鹉螺,等我探出头来打量这个世界的时候,我原先居住的大海已经成为高不可攀的山脉,而我,是一块僵死在山崖上的化石二十四、幸福,不是长生不老,不是大鱼大肉,不是权倾朝野。幸福是每一个微小的生活愿望达成。当你想吃的时候有得吃,想被爱的时候有人来爱你。二十五、有时,爱也是种伤害。残忍的人,选择伤害别人,善良的人,选择伤害自己。二十六、如果,不幸福,如果,不快乐,那就放手吧;如果,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初中国庆课件
- 中班健康不挑食
- 初中化学说课课件
- TYK2-activator-1-生命科学试剂-MCE
- 保护耳朵健康教案课件
- R-Alyssin-生命科学试剂-MCE
- 初中元旦主题班会课件
- 初中信息技术课件全套
- 俄罗斯课件英语作业
- 大班健康认识食品安全
- 基于核心素养的单元整体教学设计
- 《看病歌诀》全文背诵版
- 外协件检验流程
- 《浅析5G通信的军事应用》2300字
- 拖欠工程款上访信范文
- 2025四川成都市新都区事业单位招聘历年管理单位笔试遴选500模拟题附带答案详解
- 2024在用井口装置检验技术指南
- 2024年国家电网招聘之通信类题库及参考答案(考试直接用)
- 足下垂的原因及治疗方法
- 2024年印度饲料原料行业状况及未来发展趋势报告
- 2024-2030年墨西哥GPON家庭网关市场前景分析
评论
0/150
提交评论