已阅读5页,还剩22页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于层次分析法的组合评价法 姓 名:陈从叶 指导教师:王俊杰 主成分分析法研究的背景及意义 主成分分析法的基本原理 主成分分析法的计算步骤 主成分分析法的不足及改进 主成分分析法改进的应用实例 内容纲要 主成分分析法研究的背景及意义 在实际问题中,为了全面系统地分析问题,必须 考虑许多对实际过程有影响的因素,也称之为指 标或变量。因为每个变量都在不同程度上反映了 所研究问题的信息,而且指标之间或多或少都有 一定的相关性,因此得到的统计数据所反映的信 息在一定程度上会有所重叠;另一方面,在研究多 变量问题时,变量太多会增大计算量,增加分析 问题的复杂性,因此希望在定量分析的过程中涉 及的变量少,而得到的信息量又多。主成分分析 法就是解决这一问题的理想工具。 主成分分析法的基本原理 主成分分析法是一种对数据降维的常用统计方法 ,它的基本思想是将原有的众多具有一定相关性 的指标 重新整理出一组具有较少数目 的互不相关的综合性指标来代替原始指标。 其中,综合指标的选取应该具备两个特点: 1.它能够最大程度反映原变量 所包含的信息; 2.它能够保持指标之间的相互无关; 设F1表示原变量第一个线性组合所形成的主成分 指标, 即 其中每一个主成分所提取的信息量可用其方 差来度量,其方差 越大,表示 所包含 的信息越多。在实际应用中,人们希望第一主 成分 所包含的信息量最大,因此在所有的线 性组合中选取的 应该是 的所有线性 组合中方差最大的,故称 为第一主成分。如 果第一主成分不足以代替原有n项指标的信息, 再考虑第二个主成分指标 ,为有效的反映原 信息, 中已有的信息就再出现在 中了,即 与 要保持独立、不相关,用数学语言表达 就是其协方差 ,所以 是与 不相 关的 的所有线性组合中方差最大的 ,故称 为第二主成分。 依此类推构造出的 为原变量指标 的第一、第二、第m项主成分。 主成分分析法的计算步骤 主成分分析法的计算步骤如下: 1.设某综合评价是用p项指标,先将指标同趋势 化,即将逆向指标转化为正向指标,一般用指标 值的倒数代替原指标; 2.进行无量纲化。将p项指标的原始数据标准化 ; 3.计算指标的相关矩阵R,求R的p项特征值记为 ,相应的正交化特征向量 ; 4.设方差贡献率 ,当累计方差贡献率G(q) 达到一定的数值(一般取大于等于 85%)时,取 q项主成分 ,进而得到 综合评价函数: 5.将每一个样本的标准化指标值代入上式求得各样 本的综合评价函数值,根据综合评价函数值对各 样本进行排序。 主成分分析法的不足及改进 主成分分析法存在的不足主要表现在如下两点: 1.数据标准化过程存在信息丢失 在对指标进行标准化处理时存在信息丢失问题 ,使特征提取能力下降。传统主成分分析法采用 变换方法为倒数法,这种方法改变了线性相关系 数。从而特征值与特征向量也产生了变动。因此 ,对评价结果的准确性有影响。 2.综合评价指标权重系数分配的不完全合理 在实际评价过程中我们常常发现,指标之间相 关性高低程度影响着评价指标权重系数的分配, 权重系数明显向相关性较高的变量倾斜,这些变 量的权重系数明显高于其他变量的权重系数。不 同研究者对问题偏重程度不同,使用的评价方法 不同,就会造成不同的结果。所以在处理实际问 题时,必须从多个角度综合考虑,才能做出正确 的评价,因此需要均衡各个指标变量的系数。 主成分分析法的改进 1.原始数据的均值化 在传统主成分分析法中,为了消除变量量纲或 数量级的影响,需要对原始数据进行标准化处理 ,但是在实施标准化的过程中,却抹杀了各指标 变异程度的差异信息。为了避免上述情况的发生 ,我们需要对原始数据进行均值化处理。 2.综合评价指标权重系数分配的改进 设指标系统总体为I,按指标相关性强弱将总 体I分成 和 两部分,将相关性较强的指标 分入 ,相关性较弱的指标 分入 , 。 对比传统主成分分析法的函数表达式 ,将相关性较强的指标连同它们的系数组合得函 数 ,为指标相关性较弱的一组函数,且满足 (1)指标个数相近时,各指标系数大体均衡;(2) 指标个数相差悬殊时,满足多指标系数之和大于 小指标系数之和,得改进后综合评价函数 ,则得到的综合评价函数比较合理。 主成分分析法改进的应用实例 应用一:对我国各地区独立核算工业企业经济效 益评价 分别将传统主成分分析法、均值化改进模型应用 于实例,数据结果如表1,表2所示。 1.运用传统主成分分析法求得的特征值、贡献率及 累计贡献率如表1所示。 表1 传统主成分分析得到的数据 传统主成分分析法 特征值贡献率累计贡献率 13.79750.54250.5425 21.92030.27430.8168 31.07430.15350.9703 40.19020.02720.9975 50.01480.00210.9996 60.00240.00030.9999 70.00050.00011 2.运用均值化改进模型求得的特征值、贡献率及累 计贡献率如表2所示。 表2 均值化改进模型得到的数据 均值化改进模型 特征值贡献率累计贡献 率 11.27640.68630.6863 20.44340.23840.9247 30.12860.06910.9939 40.00850.0460.09985 50.00210.00110.9996 60.00050.00030.9999 70.00030.00011 结果分析 从计算结果可以看出,均值化改进模型得到的第 一主成分包含的信息比传统主成分分析法得到的 第一主成分承载的信息高十四个百分点。因此均 值化改进模型可以用较少的主成分提取更多的信 息。 应用二:施工企业的内部评优模型 根据项目总目标制定施工企业内部评优指标,具 体评比数据如表3所示。 表3 评比原始数据 序 号 单位进度 X1 质量 X2 安全文明 X3 内业资 料X4 产值加 分X5 1一队25.2224.2225.119.13.72 2二队25.8925.6726.449.52.54 3三队26.6726.3326.568.85.19 4四队26.8926.1126.009.25.04 5五队27.0025.3326.448.33.05 6六队26.6726.2225.789.313.48 模型求解 用Matlab对数据进行标准化处理求出标准化 矩阵Z,并求出相关系数矩阵R。 标准化矩阵Z: 相关系数矩阵R: 从相关系数矩阵R可以看出质量指标X2与进度指标 X1相关性比较大,安全文明施工指标X3与质量指 标X2相关性大,安全文明施工指标X3与进度指标 X1相关性大。因此,X1,X2,X3相关性较大, S1=X1,X2,X3,X4,X5与前三者相关性较弱,两者 之间的相关性也较弱,则S2=X4,X5。 然后求出R的特征值、贡献率及累计贡献率如表4 所示。 表4 特征值、贡献率及累计贡献率 特征值贡献率累计贡献 率 2.46880.493020.49302 1.56260.3120520.805072 0.8050.1607590.965831 0.13380.026720.992551 0.03730.0074491.0000 表5为主成分与指标之间的线性关系 表5 主成分与指标之间的线性关系 指标 主成分 工程进度0.5959-0.0286 工程质量0.55790.3230 安全文明0.5115-0.2884 内业资料-0.21170.5988 产值加分0.16500.6731 表6为评比原始数据按前两项主成分排序的结果。 表6 评比原始数据按前两项主成分排序结果 单位编号第一主成分第二主成分 综合指标 值 排序综合指标 值 排序 一队-3.01496-0.19344 二队-0.432150.03793 三队1.26901-0.32775 四队0.580330.40182 五队0.89892-1.74226 六队0.559042.11411 第一主成分分量的计算公式: 第二主成分分量的计算公式: 传统主成分分析的综合评价函数: 改进后的综合评价函数: 最后分别用传统与改进后的主成分分析法算出结 果,对比数据如表7所示。 表7 传统与改进后的主成分分析法的结果比较 单位编号 传统主成分分析法改进主成分分析法 综合评价值排序综合评价值排序 一队-1.54686-3.04866 二队-0.201150.14434 三队0.523420.85063 四队0.411530.9022 五队-0.10054-0.73635 六队0.935312.12971 结果分析 在假设各指标在综合评价中的重要程度相同的情况下 ,对比综合评价函数表达式可知,传统主成分分析法分配 给各指标系数明显偏向于相关性较强的集合 ,因此强化 了 的信息,相应的削弱了 的信息,而用改进的主成分 分析法使得相关性较强的集合 和相关性较弱的集合 的 指标系数相对接近,改进后更为合理。 结 论 主成分分析法是由原始数据进入到数据处理和分析的 关键步骤,是多元统计分析的重要组成部分。它通过对离 散数据集合的分析来探求嵌入在高维数据空间中数据的不 同样式,其目的是快速、有效地对高维数据进行数据降维 或特征提取,用维数较低且互不相关的新变量来反映原变 量所提供的绝大部分信息,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《2025年终止劳动合同书范本》
- 甲状腺功能亢进症常见症状及护理策略
- 2025版慢性喉炎常见症状解读及护理经验分享
- 卧床患者营养宣教
- 网络安全知识科普题目参考(附答案)
- 环形封闭的方法
- 2025年登高架设高处作业证理论考试模拟试题含答案
- 2025年11月监理工程师理论与法规题目及答案
- 学习贯彻中国工会十八大精神知识竞赛练习试卷附答案
- 构造柱砼浇筑施工方案
- 2025年安装维护试题及答案
- 2025年河南省商丘市【辅警协警】笔试预测试题(含答案)
- (高清版)DBJ∕T 13-278-2025 《福建省电动汽车充电基础设施建设技术标准》
- 神经源性肠道康复护理
- 中国民间故事交流会课件
- 兵团职工考试试题及答案
- 围术期肺康复全程管理策略-从评估到实践的多学科优化路径
- 电销员工职业规划课件
- 营业厅安全培训内容
- 母婴安全课件
- 销售费用培训课件
评论
0/150
提交评论