




已阅读5页,还剩22页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于层次分析法的组合评价法,姓名:陈从叶指导教师:王俊杰,主成分分析法研究的背景及意义主成分分析法的基本原理主成分分析法的计算步骤主成分分析法的不足及改进主成分分析法改进的应用实例,内容纲要,主成分分析法研究的背景及意义,在实际问题中,为了全面系统地分析问题,必须考虑许多对实际过程有影响的因素,也称之为指标或变量。因为每个变量都在不同程度上反映了所研究问题的信息,而且指标之间或多或少都有一定的相关性,因此得到的统计数据所反映的信息在一定程度上会有所重叠;另一方面,在研究多变量问题时,变量太多会增大计算量,增加分析问题的复杂性,因此希望在定量分析的过程中涉及的变量少,而得到的信息量又多。主成分分析法就是解决这一问题的理想工具。,主成分分析法的基本原理,主成分分析法是一种对数据降维的常用统计方法,它的基本思想是将原有的众多具有一定相关性的指标重新整理出一组具有较少数目的互不相关的综合性指标来代替原始指标。其中,综合指标的选取应该具备两个特点:1.它能够最大程度反映原变量所包含的信息;2.它能够保持指标之间的相互无关;设F1表示原变量第一个线性组合所形成的主成分指标,即,其中每一个主成分所提取的信息量可用其方差来度量,其方差越大,表示所包含的信息越多。在实际应用中,人们希望第一主成分所包含的信息量最大,因此在所有的线性组合中选取的应该是的所有线性组合中方差最大的,故称为第一主成分。如果第一主成分不足以代替原有n项指标的信息,再考虑第二个主成分指标,为有效的反映原信息,中已有的信息就再出现在中了,即与要保持独立、不相关,用数学语言表达就是其协方差,所以是与不相关的的所有线性组合中方差最大的,故称为第二主成分。,依此类推构造出的为原变量指标的第一、第二、第m项主成分。,主成分分析法的计算步骤,主成分分析法的计算步骤如下:1.设某综合评价是用p项指标,先将指标同趋势化,即将逆向指标转化为正向指标,一般用指标值的倒数代替原指标;2.进行无量纲化。将p项指标的原始数据标准化;3.计算指标的相关矩阵R,求R的p项特征值记为,相应的正交化特征向量;,4.设方差贡献率,当累计方差贡献率G(q)达到一定的数值(一般取大于等于85%)时,取q项主成分,进而得到综合评价函数:5.将每一个样本的标准化指标值代入上式求得各样本的综合评价函数值,根据综合评价函数值对各样本进行排序。,主成分分析法的不足及改进,主成分分析法存在的不足主要表现在如下两点:1.数据标准化过程存在信息丢失在对指标进行标准化处理时存在信息丢失问题,使特征提取能力下降。传统主成分分析法采用变换方法为倒数法,这种方法改变了线性相关系数。从而特征值与特征向量也产生了变动。因此,对评价结果的准确性有影响。,2.综合评价指标权重系数分配的不完全合理在实际评价过程中我们常常发现,指标之间相关性高低程度影响着评价指标权重系数的分配,权重系数明显向相关性较高的变量倾斜,这些变量的权重系数明显高于其他变量的权重系数。不同研究者对问题偏重程度不同,使用的评价方法不同,就会造成不同的结果。所以在处理实际问题时,必须从多个角度综合考虑,才能做出正确的评价,因此需要均衡各个指标变量的系数。,主成分分析法的改进,1.原始数据的均值化在传统主成分分析法中,为了消除变量量纲或数量级的影响,需要对原始数据进行标准化处理,但是在实施标准化的过程中,却抹杀了各指标变异程度的差异信息。为了避免上述情况的发生,我们需要对原始数据进行均值化处理。,2.综合评价指标权重系数分配的改进设指标系统总体为I,按指标相关性强弱将总体I分成和两部分,将相关性较强的指标分入,相关性较弱的指标分入,。对比传统主成分分析法的函数表达式,将相关性较强的指标连同它们的系数组合得函数,为指标相关性较弱的一组函数,且满足(1)指标个数相近时,各指标系数大体均衡;(2)指标个数相差悬殊时,满足多指标系数之和大于小指标系数之和,得改进后综合评价函数,则得到的综合评价函数比较合理。,主成分分析法改进的应用实例,应用一:对我国各地区独立核算工业企业经济效益评价分别将传统主成分分析法、均值化改进模型应用于实例,数据结果如表1,表2所示。,1.运用传统主成分分析法求得的特征值、贡献率及累计贡献率如表1所示。表1传统主成分分析得到的数据,2.运用均值化改进模型求得的特征值、贡献率及累计贡献率如表2所示。表2均值化改进模型得到的数据,结果分析从计算结果可以看出,均值化改进模型得到的第一主成分包含的信息比传统主成分分析法得到的第一主成分承载的信息高十四个百分点。因此均值化改进模型可以用较少的主成分提取更多的信息。,应用二:施工企业的内部评优模型根据项目总目标制定施工企业内部评优指标,具体评比数据如表3所示。表3评比原始数据,模型求解用Matlab对数据进行标准化处理求出标准化矩阵Z,并求出相关系数矩阵R。标准化矩阵Z:,相关系数矩阵R:从相关系数矩阵R可以看出质量指标X2与进度指标X1相关性比较大,安全文明施工指标X3与质量指标X2相关性大,安全文明施工指标X3与进度指标X1相关性大。因此,X1,X2,X3相关性较大,S1=X1,X2,X3,X4,X5与前三者相关性较弱,两者之间的相关性也较弱,则S2=X4,X5。,然后求出R的特征值、贡献率及累计贡献率如表4所示。表4特征值、贡献率及累计贡献率,表5为主成分与指标之间的线性关系表5主成分与指标之间的线性关系,表6为评比原始数据按前两项主成分排序的结果。表6评比原始数据按前两项主成分排序结果,第一主成分分量的计算公式:第二主成分分量的计算公式:传统主成分分析的综合评价函数:改进后的综合评价函数:,最后分别用传统与改进后的主成分分析法算出结果,对比数据如表7所示。表7传统与改进后的主成分分析法的结果比较,结果分析在假设各指标在综合评价中的重要程度相同的情况下,对比综合评价函数表达式可知,传统主成分分析法分配给各指标系数明显偏向于相关性较强的集合,因此强化了的信息,相应的削弱了的信息,而用改进的主成分分析法使得相关性较强的集合和相关性较弱的集合的指标系数相对接近,改进后更为合理。,结论,主成分分析法是由原始数据进入到数据处理和分析的关键步骤,是多元统计分析的重要组成部分。它通过对离散数据集合的分析来探求嵌入在高维数据空间中数据的不同样式,其目的是快速、有效地对高维数据进行数据降维或特征提取,用维数较低且互不相关的新变量来反映原变量所提供的绝大部分信息,以寻求事物的本质规律,为其后的聚类分析、回归分析、分类识别等分析处理阶段提供依据。本文主要是对主成分分析
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 如何培养藏区中职校幼教专业学生的弹唱能力
- 2024年山西省特岗教师招聘考试真题
- 生物炭应用研究-洞察及研究
- 记账实操-照明行业的会计分录实例
- 微生物控制方法-洞察及研究
- 辽宁省抚顺市顺城区2025届七年级英语第二学期期中检测试题含答案
- 学校教育中的性别角色干预-洞察及研究
- 13.1 第2课时 命题与证明 教案
- 江苏省泰兴市济川中学2025届英语七下期中质量检测试题含答案
- 海外仓运营效率-洞察及研究
- 2023年镀层和化学覆盖层技术要求规范(铝合金化学导电氧化)
- 南宁市信息化大楼工程建设项目可行性研究报告
- 管 制 刀 具课件
- 生物多样性保护与建设项目可行性研究报告
- 健康减肥调脂降糖
- LaTeX科技排版课件
- 2023年河北交通投资集团有限公司招聘笔试题库及答案解析
- 反向传播算法课件
- 企业质量安全主体责任
- 南模自招试卷-2012年自主招生
- 数据仓库开发规范
评论
0/150
提交评论