数学建模实用教程(主成分分析)_第1页
数学建模实用教程(主成分分析)_第2页
数学建模实用教程(主成分分析)_第3页
数学建模实用教程(主成分分析)_第4页
数学建模实用教程(主成分分析)_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

综合评价方法之二

基于数据分析几种方案

方案一

主成份分析法问题实际背景在现实生活中,人们往往会对样品收集尽可能多的指标,例如人口普查往往要调查每个人的姓名、年龄、性别、文化程度、住房、职业、收入、消费等几十项指标,从收集资料的角度来看,收集较多的数据有利于完整反映样品的特征,但是这些指标从统计角度来看相互之间具有一定的依赖关系,从而使所观测的数据在反映信息上有一定重叠。解决的问题之一:降维主成份分析正是针对这类问题而产生的,是解决这类题的理想工具。

主成分分析也称主分量分析(principalcomponentsanalysis,PCA)是由美国的科学家哈罗德·霍特林(HaroldHotelling)于1933年首先提出的。人们希望通过克服相关性、重叠性,用较少的变量来代替原来较多的变量,而这种代替可以反映原来多个变量的大部分信息,这实际上是一种“降维”的思想。多维数据的一种图形表示方法。

我们知道当维数大于3时便不能画出几何图形经过主成分分析后,我们可以选取前两个主成分或其中某两个主成分,这样既可以就这两个主成分性质加以分析,还可以根据主成分画出n个样品在二维平面上的分布况,由图形可直观地看出各样品在主成分中的地位,进而还可以对样本进行分类处理。解决的问题之二:几何分析选择评价指标体系后通过对各指标加权的办法来进行综合。但是,如何对指标加权是一项具有挑战性的工作。指标加权的依据是指标的重要性,指标在评价中的重要性判断难免带有一定的主观性,这影响了综合评价的客观性和准确性。主成分分析法是根据指标间的相对重要性进行客观加权,可以避免综合评价者的主观影响,所以在实际应用中越来越受到人们的重视。解决的问题之三:客观加权有关数学模型与常见实例2008年美国数学建模竞赛题:“评价国家公共卫生体系上的应用

”啤酒风味评价分析实例我国部分地区城镇居民家庭收支基本情况分析实例

主成分分析的基本思想明确信息量大数学意义我们知道,当一个变量只取一个数据时,这个变量(数据)提供的信息量是非常有限的,当这个变量取一系列不同数据时,我们可以从中读出最大值、最小值、平均数等信息。变量的变异性越大,说明它对各种场景的“遍历性”越强,提供的信息就更加充分,信息量就越大。主成分分析中的信息,就是指标的变异性,用标准差或方差表示它。为了便于理解以两个指标为例:主成分确定的准则:信息损失小,之间重叠少假设共有n个样品,每个样品都测量了两个指标(X1,X2),在坐标系x1-O-x2中,观察散点的分布,单独看这n个点的分量X1和X2,它们沿着x1方向和x2方向都具有较大的离散性,其离散的程度可以分别用的X1方差和X2的方差测定。如果仅考虑X1或X2中的任何一个分量,那么包含在另一分量中的信息将会损失,因此,直接舍弃某个分量不是“确定主成分”的有效办法。确定第一主成分方法事实上,散点的分布总有可能沿着某一个方向略显扩张,这个方向就把它看作椭圆的长轴方向。结论:为第一主成分,为第二主成分。主成分的数学模型:推广一般主成分确定的模型主成分分析的数学模型是,设p个变量构成的q维随机向量为X=(X1,…,Xp)′对X作正交变换,令Y=T′X,其中T为正交阵,要求Y的各分量是不相关的,并且Y的第一个分量的方差是最大的,第二个分量的方差次之,……,等等。为了保持信息不丢失,Y的各分量方差和与X的各分量方差和相等。Y是列向量T为正交阵有:T’T=I;T’=T^(-1)新旧变量关系的表达式新指标的方差及它们的协方差:其中表示方差,Cov表示协方差,表示X协方差阵主成分确定条件:第一主成分为,满足,并且使得达到最大的。第二主成分为,满足,使得达到最大的。一般情形,第主成分为,满足,且(),使得达到最大的。第一主成分求法第二主成分求法第主成分求法结论:主成分保持信息总量不少主成分个数确定的标准第个主成分的贡献率:主成分个数确定的标准

主成分分析的步骤构造样本阵样本阵,其中是样本容量即评价对象,是评价指标个数,是第个样本中采集的第项评价指标值。

指标正向化正向指标是随着该指标值的增长总系统评价结果越好,因而转化公式为转化后样本阵

指标规范化为克服单位差异对评价结果的影响,须将指标规范化其中,

协方差矩阵:也是样本阵的相关系数阵显然,的协方差矩阵也是的相关系数矩阵确定主成分构造综合评价函数1.求的权值公式:2.构造综合评价函数这里我们应该注意,从本质上说综合评价函数是对原始指标的线性综合,从计算主成分到对之加权,经过两次线性运算后得到综合评价函数。

啤酒风味评价实例分析题目:啤酒是个多指标风味食品,为了全面了解啤酒的风味,啤酒企业开发了大量的检测方法用于分析啤酒的指标,但是面对大量的指标数据,大多数企业又感到茫然,不知道如何利用这些大量的数据,来对各品牌的啤酒加以评价,由上面的介绍可知,在这种情况下,主成分分析法较为适合。构造样本阵(1)确定原始评价指标:即未经简化的指标m个本题选有:乙醛、乙酸乙酯、异丁酯、乙酸异戊酯、异戊醇及己酸乙酯(m=6)(2)确定评价对象:即定抽样,一般样本容量n个本题选有:百威啤酒、喜力啤酒和青岛啤酒,南方某种啤酒(n=4)(3)采集样本数据:采集4个样本的对应指标,得到4个6维的随机向量。(4)构造样本阵:

。本题样本阵乙醛乙酸乙酯异丁酯乙酸异戊酯异戊醇己酸乙酯百威啤酒1.22.33.10.72.14.5喜力啤酒2.13.25.16.47.61.3青岛啤酒1.10.62.13.11.93南方某品牌2.31.54.13.213构造标准化阵Z

指标规范化为克服单位差异对评价结果的响,须将样本阵元素规范化,得标准化矩阵Z其中本题标准化矩阵-1.000280.464991-0.5-1.46277-0.45111.5302351.2537311.6842111.4166671.9104482.4126980.440678-1.21086-1.51122-1.5-0.138-0.537020.0493621.316154-0.464990.5-0.0828-0.923670.049362相关系数矩阵:对角元为1的实对称

本题相关系数阵

乙醛乙酸乙酯异丁酯乙酸异戊酯异戊醇己酸乙酯乙醛1乙酸乙酯0.4210551异丁酯0.8633970.8137331乙酸异戊酯0.6056130.4222220.6844671异戊醇0.3193610.7840870.6873860.8058141己酸乙酯-0.59667-0.36954-0.65158-0.99835-0.775321相关系数阵的特征值及向量(1)解样本相关系数矩阵R的特征方程

得6个特征根,(2)确定主成分个数k:并由大到小排列:

使信息的利用率达85%以上,

(3)构造个主成份:

对每个λj,j=1,2,...,k,解得单位特征向量

则第j个主成份本题k=2,利用率d=45.1%+38.2%=83.3%构造综合评价价值函数:(1)首先构造权向量:其中

(2)构造价值函数:

本题结果:综合结论:由好到差排序喜力啤酒

百威啤酒

青岛啤酒南方某种啤酒随机向量X的方差协方差阵对角线上的元素主成分的方差协方差矩阵的对角线元素正交矩阵T中对应的第k行第i列元素主成分因子载荷量:主成分因子载荷量:以为坐标画图分析结果分析:从图可以看出,主成分1主要由乙酸乙酯、乙酸异戊酯和己酸乙酯决定,这些酯含量高,主成分1就越大,即主成分1代表了啤酒的酯香,酯香越浓,主成分1就越大。主成分2主要由乙醛、异丁醇和异戊醇决定,这些成分能够代表啤酒的“酒劲”的大小,这些成分含量越高,主成分2就越大,即啤酒的酒味就越重。

模型结果分析(2):各样本主成分各样本主成分分析图结论:关于个样本结论结合这种解释,就可以对图2中的分类做出分析,其中百威啤酒是酒味适中和酯香相对较浓的“浓香型”啤酒,喜力啤酒是酒味和酯香均较浓的“浓醇型”啤酒青岛啤酒是酒味较重,而酯香较弱的“醇型”啤酒某品牌的啤酒则是酒味和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论