SPSS在主成分分析中的应用_第1页
SPSS在主成分分析中的应用_第2页
SPSS在主成分分析中的应用_第3页
SPSS在主成分分析中的应用_第4页
SPSS在主成分分析中的应用_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

#/17需要注意的是:主成分计算是利用迭代(Iterations)方法,系统默认的迭代次数是25次。但是,当数据量较大时,23次迭代是不够的,需要改为50次、100次乃至更多。对于本例而言,变量较少,25次迭代足够,故无需改动。设置完成以后,单击Continue按钮完成设置(图6)。3.设置Scores设置。选中Saveasvariables栏,则分析结果中给出标准化的主成分得分(在数据表的后面)。至于方法复选项,对主成分分析而言,三种方法没有分别,采用系统默认的"回归”(Regression)法即可。图7因子得分对话框选中Displayfactorscorecoefficientmatrix,则在分析结果中给出因子得分系数矩阵及其相关矩阵。设置完成以后,单击Continue按钮完成设置(图7)。4.其它。对于主成分分析而言,旋转项(Rotation)可以不必设置;对于数据没有缺失的情况下,Option项可以不必理会。全部设置完成以后,点击0K确定,SPSS很快给出计算结果(图8)o

FactorAnalysisDescriptiveStatistics;weenStd.DS'/dticn阳咖5M匡F兀住产1921.093H74.9C603EO居民消戏1745.929961.64193SO固浚产511.5083402.96548EO职工工资5457.633L31O.21805EO货物周转C6D.L4C0459.9£699EO117.23672.02531SO商品零侈114.«)671.8C608EO工Ik产怕862.的€05S4.58726EOCorrelationMatrix^国为生产固宦盜产职工工宙货物周传裔品零音工业产恒匚orrehtbn国內生产1.000.257・951・19L・617-.273・・264・874居民消菇.2671.000.42S.718-.151-.235-.593.363固定谥产.951.4261.003.431-.280-.35?.792聊TT恪・7:18.qoo1.000・・356-.135・・5旳.104剤调转・617•151・431-.3561.000•253.022.559消馥价搐-.273-.235-.283-.135-.2531.CD0.763商品孝査-.264-.593-.399-.539.022.7631.003・.:192工业产值.87433.792・104・659-.125・.伦LOCOa.Detefmhant=1133E-04图8主成分分析的结果第四步,结果解读。在因子分析结果(Output)中,首先给出的DescriptiveStatistics,第一列Mean对应的变量的算术平均值,计算公式为第二列Std.Deviation对应的是样本标准差,计算公式为笫三列Analysis'对应是样本数II。这一组数据在分析过程中可作参考。

DescriptiveStatisticsMeanStd.DeviationAnaly引sN国内生产1921.0931474.8060330居民消费1745.933861.6419330固走资产511.5083402.8854830职工工资5457.6331310.2180530货物周转666.1400459.9669930消费价格117.28672.0253130商品零售114.90671.8980830工业产值862.9980584.5872630接下来是CorrelationMatrix(相关系数矩阵),一般而言,相关系数高的变量,大多会进入同一个主成分,但不尽然,除了相关系数外,决定变量在主成分中分布地位的因素还有数据的结构。相关系数矩阵对主成分分析具有参考价值,毕竟主成分分析是从讣算相关系数矩阵的特征根开始的。相关系数阵下面的Determinant=1.133E-0.4是相关矩阵的行列式值,根据关系式det(〃-R)=0可知,det(XI)=det(R),从而Determinant=1.133E-0.4=X1*X2*X3*4*X5*入6*A7*X8o这一点在后面将会得到验证。CorrelationMatrix国内生产民费居消固定资产工资职工物转货周消费价格商品零售T'lV产值国内生产1.000.267.951.191.617-.273-.264.874居民消费・2671.000.426・718-.151-.235-.593.363固走资产・951・4261.000・400・431-.280-.359.792职工工资・191.718.4001.000-.356-.135-.539.104货物周转.617-.151・431-.3561.000-.253.022.659消费价格-.273-.235-.280-.135-.2531.000・763-.125商品零售-.264-.593-.359-.539.022.7631.000-.192T'lV产值.874.363.792.104.659-.125-.1921.000a.Determinant=1.133E-04在Communalities(公因子方差)中,给出了因子载荷阵的初始公因子方差

(Initial)和提取公因子方差(Extraction),后面将会看到它们的含义。

CommunalitiesInitialExtraction国内生产1.000.945居民消费1.000.800固定资产1.000.902职工工资1.000.875货物周转1.000.857消费价格1.000.957商品零售1.000.929T'll/产值1.000.903ExtractionMethod:PrincipalComponentAnalysis・在TotalVarianceExplained(全部解释方差)表的InitialEigenvalues(初始特征根)中,给出了按顺序排列的主成分得分的方差(Total),在数值上等于相关系数矩阵的各个特征根入,因此可以直接根据特征根计算每一个主成分的方差口分比(%ofVariance)。山于全部特征根的总和等于变量数目,即有m=EXi=8,故第一个特征根的方差白分比为Xl/m=3.755/8=46.939,第二个特征根的百分比为X2/m=2.197/8=27.459,……,其余依此类推。然后可以算出方差累计值(Cumulative%)。在ExtractionSumsofSquaredLoadings,给出了从左边栏訂中提取的三个主成分及有关参数,提取的原则是满足X>1,这一点我们在图6所示的对话框中进行了限定。TotalVarianceExplainedComponentInitialEigenvaluesExtractionSumsofSquaredLoadingsTotal%ofVarianceCumulative%Total%ofVarianceCumulative%13.75546.93946.9393.75546.93946.93922.19727.45974.3982.19727.45974.39831.21515.18689.5841.21515.18689.5844.4025.03194.6155.2132.66097.2756.1381.72498.99976.5E-02.81899.81781.5E-02.183100.000Extract!onMethod:PrincipalCorrporientAnalysis.ScreePlotComponentNumber图8特征根数值衰减折线图(山■图)主成分的数LI可以根据相关系数矩阵的特征根来判定,如前所说,相关系数矩阵的特征根刚好等于主成分的方差,而方差是变量数据蕴涵信息的重要判据之一。根据入值决定主成分数目的准则有三:i只取X>1的特征根对应的主成分从TotalVarianceExplained表中可见,第一、第:和第三个主成分对应的X值都大于1,这意味着这三个主成分得分的方差都大于1。本例正是根据这条准则提取主成分的。ii累计百分比达到80%~85%以上的入值对应的主成分在TotalVarianceExplained表可以看出,前三个主成分对应的入值累计白•分比达到89.584%,这暗示只要选取三个主成分,信息量就够了。iii根据特征根变化的突变点决定主成分的数量从特征根分布的折线图(ScreePlot)上可以看到,笫4个入值是一个明显的折点,这暗示选取的主成分数目应有pW4(图8)。那么,究竟是3个还是4个呢?根据前面两条准则,选3个大致合适(但小有问题)。在ComponentMatrix(成分矩阵)中,给出了主成分载荷矩阵,每一列载荷值都显示了各个变量与有关主成分的相关系数。以第一列为例,0.885实际上是国内生产总值(GDP)与第一个主成分的相关系数。将标准化的GDP数据与第一主成分得分进行回归,决定系数R2=0.783(图9),容易算出R=0.885,这正是GDP在第一个主成分上的载荷。ComponentMatrtfComponent123国内生产.885.384.121居民消费.607-.598.271固走资产.912・161.212职工工资.466-.722.368货物周转.486・738-.275消费价格-.509・252.797商品零售-.620.594.438工业产值.823.427.211ExtractionMethod:P「incipalComponentAnalysis・a・3componentsextracted・下面将主成分载荷矩阵拷贝到Excel上面作进一步的处理:计算公因子方差和方差贡献。首先求行平方和,例如,第一行的平方和为hl2=0.88492+0.38362+0.12092=0.9449这是公因子方差。然后求列平方和,例如,第一列的平方和为s12=0.88492+0.60672+…+0.82272=3.7551这便是方差贡献(图10)。在Excel中有一个计算平方和的命令sumsq,可以方便地算岀一组数据的平方和。显然,列平方和即方差贡献。事实上,有如下关系成立:相关系数矩阵的特征根=方差贡献=主成分得分的方差至于行平方和,显然与前面公因子方差(Communalities)表中的Extraction列对应的数据一样。如果我们将8个主成分全部提取,则主成分载荷的行平方和都等于1(图11),即有hi=l,sj=Xjo到此可以明口:在Communalities中‘Initial对应的是初始公因子方差,实际上是全部主成分的公因子方差;Extraction对应的是提取的主成分的公因子方差,我们提取了3个主成分,故计算公因子方差时只考虑3个主成分。

国内生产总值图9国内生产总值(GDP)的与第一主成分的相关关系(标准化数据)ABCDE5第一主成分第一主成分第二主成分公因子方差6国内生产0.8849000.3836190.12088&0.9448247居民消费0.606719-0.5981770.2713130.7995348固定资产0.9116870.1611060.2119970.9020719职工工资0.466222-0.7224100.3679380.87461710货物周转0.4858310.738275-0.2752520.85684511消费价格-0・5085630.2519090.7966330.95671812商品零售-0.6195890.5943750.4375550.92862713工並产惜0.8227290.4267370.2109700.90349614方差贡献3.7551332.1967041.2148957.16673315特征根3.7551332.1967041.2148957.166733图10主成分方差与方差贡献ComponentMatrixComponent12345678国内生产.885.384.121-.203-6.87E-021.143E-022.420E-029.192E-02居民消费.607-.598・271.409-7.61E-02.1575.525E-021.317E-02固走资产.912.161.212-.270-7.71E-02&271E-02&113E-02-7.36E-02职工工资.466-.722.368-.164.304-1.64E-02-7.62E-023.949E-03货物周转.486.738-.275.212.3052.254E-026.855E-02-6.02E-03消费价格-.509.252.797.0722.716E-02-.161.1072.435E-03商品零售-.620.594.438-.0273.531E-02.247-9.23E-021.634E-03工业产值.823.427.211.209-9.38E-02-.137-.157-2.30E-02ExtractionMethod:PrincipalComponentAnalysis.a.8corrponentsextracted.ABcDEFGHIJ112345678公因子方差2国内生产0.88490.38360.1209-0.2032-0.06870.01140.02420.0919 13居民消费0.6067-0.5980.27130.4085-0.0?610.15680.05520.0132 14固定资产0.91170.16110.212-0.2705-0.07710.08270.0811-0.074 15职工工资0.4662-0.7220.3679-0.16350.30421-0.016-0.0760・0039 16货物周球0.48580.7383-0.2750.211840.305020.02250.0685-0.00617消费价格-0.5090.25190.79660.071760.02716-0.1610.10710.002418商品零售-0.620.59440.4376-0・02670.035310.2468-0.0920.001619工业产值0.82270.+2670.2110.20888-0.0938-0.137-0.157-0.023[10方差贡献3.75512.19671.21490.402440.21280.1380.06540.0146811特征根3.75512.19671.21490.402440.21280.1380.06540.01461.133E-04图11全部主成分的公因子方差和方差贡献提取主成分的原则上要求公因子方差的各个数值尽可能接近,亦即要求它们的方差极小,当公因子方差完全相等时,它们的方差为0,这就达到完美状态。实际应用中,只要公因子方差数值彼此接近(不相差太远)就行了。从上面给出的结果可以看出:提取3个主成分的时候,居民消费的公因子方差偏小,这暗示提取3个主成分,居民消费方面的信息可能有较多的损失。至于方差贡献,反映对应主成分的重要程度,这一点从方差的统计学意义可以得到理解。在图11中,将最后一行的特征根全部乘到一起,得0.0001133,这正是相关系数矩阵的行列式数值(在Excel中,求一组数据的乘积之和的命令是product)o最后说明ComponentScoreCoefficientMatrix(成分得分系数矩阵)和ComponentScoreCovarianceMatrix(成分得分协方差矩阵),前者是主成分得分系数,后者是主成分得分的协方差即相关系数。从ComponentScoreCovarianceMatrix可以看出,标准化主成分得分之间的协方差即相关系数为0(jHk)或1(j二k),这意味着主成分之间彼此正交即垂直。初学者常将ComponentScoreCoefficientMatrix表中的数据一'"|成主成分得分或因子得分,这是误会。成分得分系数矩阵的数值是主成分载荷除以相应的特征根得到的结果。在ComponentMatrix表中,将第一列数据分别除以入1=3.755,第列数值分别除以入2=2.197,…,立即得到ComponentScoreCoefficient:反过来,如果将ComponentScoreCoefficientMatrix表中的各列数据分别乘以X1=3.755,入2=2.197,…,则可将其还原为主成分载荷即ComponentMatrix中的数据。

ComponentScoreCoefficientMatrixComponent123国内生产.236.175.100居民消费・162-.272.223固定资产.243.073.174职工工资.124-.329.303货物周转.129.336-.227消费价格-.135.115.656商品零售-.165.271.360工业产值.219.194.174ExtractsnMethod:P「incipalComponentAnalysis.ComponentScores・ComponentScoreCovarianceMatrixComponent12311.000.000.0002・0001.000.0003.000.0001.000ExtractionMethod:P「incipalConporientAnaly引s.ComponentScores・实际上,主成分得分在原始数据所在的SPSS当前数据栏中给出,不过给出的都是标准化的主成分得分(图12a);将各个主成分乘以相应的即特征根的二次方根可以将其还原为未经标准化的主成分得分。

得分1得分2得分1得分2得分3.42743-1.52320.49020.33935-178001-1.06264700551.58632-1.19211-.51028.26259-.51833-.83667.48824-.34594.85822.65619-.56565-.19958-.28604-1.09746.27330.22855-.642881.64990-2211322.615631.84235.85093.34924.97196-.32761.20459.22957.08007-1.68897.21602-.62016-.59561-71726.20176-.479531.548011.39467.49539.527421.44744-.86351-.14599.977271.03843-.21177.71673.231082.33062-.87418.08630-.59311.25733.33602-.29055-1.64444-2.18402.293711.33351.77269-1.44632.396411.10800-1.04217.487711.71494-1.04023M.36153.01475-.91716.47657.41703-1.09189.11265.62990-1.21110-.72568.23914-1.11530-.67162-.44175-.83905-.02915.92508a.标准化的主成分得分得分一|得分二|得分三.84250-2.29500.54870.66940-2.68230-1.193101.381302.39050-1.33560-1.00600.39530-.58090■1.6495073500-.387301.69230.98940-.63430-.39310-.43140-1.23100.53920.34440-.721203.25260-3.331202.930803.632301.28340.391601.91620-.49320.22900.45300.12060-1.89400.42600-.93470-.66840■1.41400.30360-.637503.052002.10290.555901.040002.18140-.95620-.288101.472901.16510-.417601.08010.259704.69350-1.31600.09560・1.16950.38750.37720-.57230-2.32800-2.46010.578902.00990.86720-2.85180.596801.24320-2.05520734701.92380-2.05120-2.05220.01630-1.80830.71770.46820•2.15300.16930.70690-2.38790-1.09420.26810-2.19880-1.01280-.49550-175310-.044301.03760b.非标准化的主成分得分图12两种主成分得分计算标准化主成分得分的协方差或相关系数,结果与ComponentScoreCovarianceMatrix表中的给出的结果一致(见图13)。第一因子第二因子 第三因子第一因子1第二因子0.000001第三因子0.000000.000001图13主成分(得分)之间的相关系数矩阵

第五步,计算结果分析。从ComponentMatrix即主成分载荷表中可以看出,国内生产总值、固定资产投资和工业产值在第一主成分上载荷较大,亦即与第一主成分的相关系数较高;职工工资和货物周转量在第二主成分上的载荷绝对值较大,即负相关程度较高:消费价格指数在第三主成分上的载;荷较大,即相关程度较高。因此可将主成分命名如下:第一主成分:投入一产出主成分;第二主成分:工资一物流主成分:第三主成分:消费价格

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论