基于AHP、PCA、HCA实例的数据标准化处理及软件实现_第1页
基于AHP、PCA、HCA实例的数据标准化处理及软件实现_第2页
基于AHP、PCA、HCA实例的数据标准化处理及软件实现_第3页
基于AHP、PCA、HCA实例的数据标准化处理及软件实现_第4页
基于AHP、PCA、HCA实例的数据标准化处理及软件实现_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于AHP、PCA、HCA实例的数据标准化处理及软件实现吴娇、董津津【摘要】本文对层次分析法、主成分分析法、模糊聚类分析法做了概绍,结合实例详述三种方法的应用,并用SPSSMATLAB实现。【关键字】AHPPCAHCA标准化软件标准化也就是统计数据的指数化。数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面。原始数据通过标准化处理后,它们之间的可比性增强、影响因素减少,从而更加便于分析的进行。但是,不同的分析方法标准化处过程不同,例如:层次分析法是在对样本分层后针对准则层各因素占全层的权重比例进行标准化处理。意义是为准则层因素直观赋权,取01之间的数能便捷的反应各指标的权重,同时为下一

2、步方案选择提供简单、可信的数据;在主成分分析法中需要在分析进行前对数据进行标准化,这是由于大量原始数据取自不同的评价指标,指标间可能存在较大的量纲差异。如果不进行标准化,各数据之间的关联无法衡量,有必要作进一步处理。原始数据经标准化处理后消除了量纲上的差异,能有效体现各指标的贡献率;与主成分分析法类似的是模糊聚类分析,它要求对研究对象归类。原始数据量纲和残值的差异导致归类无法进行,只有作标准化处理才利于分析的进行。因此,模糊聚类分析也是在分析前进行数据标准化。以下选取三种分析法的实例,并用SPSS和MATLAB软件对数据进行处理,同时对它们的标准化过程作进一步探讨:一、层次分析法层次分析法(A

3、nalyticHierarchyProcess,简称AHP)是对一些较为复杂、较为模糊的问题作出决策的简易方法,它特别适用于那些难于完全定量分析的问题。它是美国运筹学家T.L.Saaty教授于70年代初期提出的一种简便、灵活而又实用的多准则决策方法。人们在进行社会的、经济的以及科学管理领域问题的系统分析中,面临的常常是一个由相互关联、相互制约的众多因素构成的复杂而往往缺少定量数据的系统。层次分析法为这类问题的决策和排序提供了一种新的、简洁而实用的建模方法。在应用层次分析法研究问题时,遇到的主要困难有两个:(i)如何根据实际情况抽象出较为贴切的层次结构;(ii)如何将某些定性的量作比较接近实际定

4、量化处理。层次分析法对人们的思维过程进行了加工整理,提出了一套系统分析问题的方法,为科学管理和决策提供了较有说服力的依据。但层次分析法也有其局限性,主要表现在:(i)它在很大程度上依赖于人们的经验,主观因素的影响很大,它至多只能排除思维过程中的严重非一致性,却无法排除决策者个人可能存在的严重片面性。(ii)比较、判断过程较为粗糙,不能用于精度要求较高的决策问题。AHP至多只能算是一种半定量(或定性与定量结合)的方法。AHP方法经过几十年的发展,许多学者针对AHP的缺点进行了改进和完善,形成了一些新理论和新方法,像群组决策、模糊决策和反馈系统理论近几年成为该领域的一个新热点。目标忌承则忌方案息选

5、校干部例1,对三个干部候选人y1、y2、y3,按选拔干部的五个标准:品德、才能、资历、年龄和群众关系,构成如下层次分析模型:假设有三个干部候选人y1、y2、y3,按选拔干部的五个标准:品德,才能,资历,年龄和群众关系,构成如下层次分析模型求解的过程包括:构建成对比较矩阵成对比较矩阵中aij的取值可参考Satty的提议,按下述标度进行赋值。aij在1-9及其倒数中间取值。其中,aij=1元素i与元素j对上一层次因素的重要性相同;aij=3元素i比元素j略重要;aij=5元素i比元素j重要;aij=7元素i比元素j重要得多;aij=9元素i比元素j的极其重要;ai.=2n,n=1,2,3,4元素i

6、与j的重要性介于ai.=2n-1与aj=2n+1之间。对于此例,选拔干部考虑5个条件:品德x1,才能x2,资历x3,年龄x4,群众关系x5o某决策人用成对比较法,得到成对比较阵如下:53工31531-21174123211-41-31-311-21-71-51-51,例如,a14=5表示品德与年龄重要性之比为5,即决策人认为品德比年龄重要。计算衡量一个成对比矩阵A(n>1阶方阵)不一致程度的指标CI:其中,,n-1,入是矩阵A的最大特征值。用Matlab求得如下(图一)特征值:选取最大的入=5.072,故CI=0.018从有关资料查出检验成对比较矩阵A一致性的标准RI:CIRI。此例中R

7、I=1.12,故CR=0.018/1.12=0.016RI称为平均随机一致性指标,它只与矩阵阶数有关。对n=1,,9,Saaty给出了RI的值,如下表所示:n123456789RI000.580.901.121.241.321.411.45CR=按下面公式计算成对比较阵A的随机一致性比率CR:A,直到达到满意判断A矩阵是否满意:判断方法如下:当CR<0.1时,判定成对比较阵A具有满意的一致性,或其不一致程度是可以接受的;否则就调整成对比较矩阵的一致性为止。由于CR=0.016<0.1,所以成对比较矩阵A具有满意的一致性。更工1_0些aA牝工iawWalbWinac-wHelp.口?

8、CurrentDirectory:|C:MATLAB6pSVworkUm*nsTooltpO3<F-o.'thkCduha.T_3rqp。liLJLp-tooJLtoom_口,牝huduh.。foireairw>zk.f_To石a*tmtdir±aea-1ac"t""MA,TUkBHa工firom牝haHa工pma-xkUL.»A1二ClZTS5;1Z214匚:y=.aig:CA3;,i.£qrw"i&ZLuriadi(yJ;X-ajmdaa1a-xmvaJL-u.a("3kJLajm&

9、lt;1珏=*£:上:口33?:1/IT1Z<1Z21Z3;1Z51/3:之11;1Z51/33XAJTlda与OT21-O.O3OT+-O.O3OT-O.OOS3+-O.OOS3一O.吕OQ总£oeooeioos4:eio.os4ei68409一口一4iBSS一口.Q031O-1?3:3口一1020OlTTT3dTTT3-oesTS一口.8STSO.qqua+o.NT11o_qqiao.NT11.iO.36T之O.xil5£口.36712*O.之41与工一口.OiOUO-1SS7l-O_0200+0.15S71501SOO-ooe-ix口.0190+O.O

10、i.口之:已工+O.OTS3iO-0之仁工O-OiTS3iO.OT3T+0.之鼻&*o."FSTO.之1.43二一口.NHN口+O-:LNqT支O_Oi-L之4T3O.口TIS:O.11S51口.*O.1LESS!图一确定特征向量由图一,得最大特征值的特征向量为U=(-0.8409,-0.4658,-0.0951,-0.1733,-0.1920),这个向量就是问题所需的,它表明了准则层中的因素对目标层的影响。进行数据标准化处理,确定权向量对于上述U=(-0.8409,-0.4658,-0.0951,-0.1733,-0.1920),使得它的各分量都大于0,各分量之和等于1。于

11、是有,U=(0.4759,0.2636,0.0538,0.0981,0.1087)经过标准化后的这个特征向量称为权向量,它使准则层中各因素在本层中的权重得以量化。其中,分量之和为1说明准则层中诸因素加总对目标的绝对影响,而各分量的权重则表示单一因素对目标的影响程度。本例中,它反映了决策者选拔干部时,视品德条件最重要,其次是才能,再次是群众关系,年龄因素,最后是资历。根据权向量进行决策二、主成分分析法主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为

12、变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的。主成分分析法是一种数学变换的方法,它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,个变量就有

13、I个主成分。例2.随着武钢钢铁业务量的扩大,物流在武钢企业运作中的作用越显重要,物流配送中心的选择是整个物流系统规划中的重要环节,合理的选择物流配送中心,能够有效地降低物流成本,提高企业竞争力。目前,武钢周边配送中心的备选地址主要有3处:武东地区,龚家岭地区,北湖地区。配送中心选址的影响因素很多,我们可以根据物流学的原理,结合武钢实际情况,选择其中较重要的一些因素,作为武钢配送中心选址的指标。这些因素主要包括满足建库目标、地理和交通条件、运营成本、发展空间、投资成本等五个方面。我们通过相关调查数据,结合专家打分得出武钢三个候选地址的评价矩阵(如下表)。备选地址建库目标地理和交通条件运营成本发展

14、空间投资成本武东地区7085908071龚家岭地区7869768880北湖地区8276849084说明:建库目标以是否满足10万吨、30万吨、50万吨仓储来评价;地理和交通条件以备选地的铁路和公路与武钢工业港远近、土地条件、是否交通管制来评价;运营成本以铁路运费、加固费、仓储吊装费、停时费的总和来评价成本以各备选地投资成本占三者总投资成本的百分比来评价。原始评价指标标准化以下是用SPS劭现标准化的过程发展空间以发展用地空间、土地成本、是否符合城市规划来评价;投资得到标准化矩阵Ihtitled-SPSSHataEditorilt取由岫岫ii1咖庇面临,皿V-h卜1.091091.038960.9

15、4916-1.13389-1.10138X=0.21822-0.95585-1.044070.377960.87287一0.08312-0.094920.755930.250310.85106计算指标数据的相关系数矩阵pg|a&匈d|电m|41日口HrJ卬>|>3x4xEzx1zx22x32x4zx5908071-109109r10339694916-113339-110133FadoiAnalysisaceDescriptives.IVariables:scorepK111zx11scor&p<2zsc?Zscorep<3)lzx3Nu匚口re(XWJ

16、wxWJN»c:nrep<5nx5SdcictiDiniVariable:图三OptionsScorics.1.37796.25031J.75593.8510670B59USO10389694916711-t09l0S-113389j37796-1101302503122wd邸bh.851069101112131516172021222324以place*如年x2,各黑3舐44>x5EEDescriptives.Extraction.Variables:Zscore(X1)zxl)Z3Core(X2)2x2Zscore(X3)zx3Zscore(Xljzx4j;Zscor

17、ep(5)lzx5SelectionVariable:Rolalion.OKPa&te口cqtScores.图四CorrelationMatrixZscareXI)Zscore(X2JZscore(X3ZscoreX43Zs匚口e(X5CorretatkinZscorefXlJ1.000-.7D7-.590,9901.00G-7071.000.988-.801-.727Z5CoreCX3)-,590.9881.000-.700-.613ZscoreCX45.90-.801-.7001.000,993ZscoreCX51.000-.727-.613.9931.00D-1.000-0.70

18、7-0.5900.9901.0001故相关系数矩阵为Pj=-0.707一0.5901.0000.9880.9881.000-0.801一0.700-0.727一0.6130.9901.000-0.801一0.727-0.700一0.6131.0000.9930.9931.000TotalVarianceExplainedComponentInitialEigenvaluesExtractionSumsofSquaredLoadingsTotal%ofVarianceCumulative%Total%ofVarianceCumulative彩14.25485.08085.0804.2S485.0

19、8085.0802,74614,920100+00D36.995E-171.399E-15100.00041.608E-173.217E-16100.0005-5.56E-16-1.112E-14100,000ExtractionMethod:PrincipalComponentAnalysis.上表显示:第一主成分贡献率为85.08%,第二主成分贡献率为14.92%用Matlab求特征值及特征向量CvirrrrtDiredoryc:3八TL小日后&5!VworKH七JLp"£romth壮Helpemu_»a=i-o.tot-oseo=eig.CAJ.a&

20、#39;±g.anvX-ULA旦£a.君(yi;O.99101;-OTOT1O.SSO119881-O.601-O.71O.993:1-O.727-O.613O99311:1-ajndaaigaik-vr-aJ-TiaC')Xcjtia.-O.C.0007O.0005o.T463>1.2539o.T91O-O.O6G9-D.0016口.404.2O.4.544o.O5SOO.6129-O.4411O.016-O-44gl一口.14工口O.5T31OkZS5BCLB3T4-O-4口4丁-o.033-O.华百NT一Ok6711Cl之q3由O.473总-o.4146

21、O.529O.522总O.37S6O.459口X_3.afnda.图五由上,得相关矩阵的特征向量为0.7910一0.0669一0.00180.40420.45440.05800.6129-0.44110.4816-0.4409-0.1410-0.57310.28560.6374-0.4047-0.4233-0.2937-0.67110.24390.4739'-0.41460.45290.52290.37260.4590-0.0007,0.0001,0.0005,0.7463,4.2539进行指标综合评价后两个特征值对应的特征向量分别是e4=6.40420.48160.63740.243

22、90.3726Te5=10.4544-0.4409-0.40470.47390.4590T贝U:F4=0.4042x1-0.4816x20.6374x30.2439x40.3726x5F5=0.4544x1-0.4409x2-0.4047x3-0.4739x40.4590x5综合评测值:F=0.8508F50.1492F4计算得:备选配送中心F4F5F武东地区-0.0226-2.3809-2.0291龚家岭地区-0.85211.23750.5015北湖地区0.75381.22041.1508由上三地区总排序权值可知,物流配送中心应选择北湖地区。北湖由于具有丰富且低廉的土地资源,便利的交通优势。

23、与其它选址相比,北湖具有更为广阔的发展空间,能够以较低的资源成本和投资成本承担钢材仓储乃至钢材物流中心的综合功能。因此从长远看,武钢建设物流配送中心,选址北湖更为恰当。三、模糊聚类分析聚类分析是数理统计中的一种多元分析方法,它是用数学方法定量地确定样本的亲疏关系,从而客观地划分类型。事物之间的界限,有些是确切的,有些则是模糊的。例如人群中的面貌相像程度之间的界限是模糊的,天气阴、晴之间的界限也是模糊的。当聚类涉及事物之间的模糊界限时,需运用模糊聚类分析方法。例3.环境单元分类。abcde共5个环境单元,每个环境单元包括空气、水份、土壤、作物四个要素,环境单元的污染状况由污染物在四要素中含量的超

24、限度来描写。这五个单元的污染数据如下:NoX1X2X3X4A5532B2345C5523D1531E2451将原始数据输入SPSS图六由于指标测量值之间可能存在量纲差异,甚至相差悬殊,数据标准化处理后不仅消除了原始数据数量级上的差别及“残值”,而且使各指标间具有可比性。国队八一ed-SPSiiData£d±-t:ox:FileEditViewata.ArtalsrzeGraphs;Uti1itiesWiixdowHelpL色irLesurCltkS3.1£之Da.ta.R-dLuctionScAl*NoitpHTiieXficT*s%g-UjTiMullipl餐K

25、espons|昱irequexicies.13escirip"ti-wes.1E_Mploire-var|var|PvCiross1labs-I图七标准化处理后得到以下结果T:工“2no|>Clx2x3x4zrxlx2zzk3zx4«11a55321.06904670S2-3S002-2390S2b2345-.53452-1,S6S25526231553803c552310690467082-122780358574d1531-1.06904670S2-.35082-836665e2451-53452-4+721140329-83666g1图八其中ZX1、ZX2、ZX3、ZX4是对应的XI、X2、X3、X4标准化的结果本例中用系统聚类分析法把五个环境单元分为3类。-23905OK155380_.3585Z-.03666-S3G6Si£Vj*21Vairia13Ic|-s:Statistic;s:.图九wiga。w»包-3皿|马m|m|一|口m也|U3,«*nrmr*

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论