下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1995-2006TsinghuaTongfangOpticalDiscCo.,Ltd.Allrightsreserved.1995-2006TsinghuaTongfangOpticalDiscCo.,Ltd.Allrightsreserved.StatisticalReseiirch652005332005主成分分析与因子分析的异同和SPSS软件一与刘玉玫、卢纹岱等同志商榷林海明张文霖ABSTRACTBetweenthePrincipalConponentAnalysisandtheFactorAnalysisThispaperputsforwardthedifferenceandtheI
2、dentity,whichadvancespositiveproposaltosomeusersofthistwomethodsessentially1995-2006TsinghuaTongfangOpticalDiscCo.,Ltd.Allrightsreserved.1995-2006TsinghuaTongfangOpticalDiscCo.,Ltd.Allrightsreserved.1995-2006TsinghuaTongfangOpticalDiscCo.,Ltd.Allrightsreserved.1995-2006TsinghuaTongfangOpticalDiscCo.
3、,Ltd.Allrightsreserved.设x=(Xi,为标准化随机向量(p2),/e为相关系数矩阵,凡=(用,,FJ为主成分向量,Z,=(Zi,.乙,)为因子向量.加Wp.为方便.因子、因子估计、因子得分用同一记号。一、问题的提出主成分分析与R-型因于分析是多元统计分析中的两个重要方法同是降维技术,应用范围十分广泛但通过流行甚广的SPSS软件调用这两种方法的过程命令有些便用者容易出现混淆性错误如统计研究2003年第12期发表的论文经济全球化程度的量化研究(以下称GO文)、电于工业出版社2002年9月出版的SPSSforWindows统计分析(第二版)(以下称卢书)就是这种情况。是什么原因
4、造成这些错误呢?主成分分析与R-型因子分析到底有何异同呢?经过对一些论文和一些SPSS软件教科书仔细分析、比较我们发现出错的主要原因在干有些便用者和SPSS软件教科书作者对怎样用SPSS软件得出主成分分析与R-型因子分析的结果学握不全面对主成分分析与R-型因于分析异同的认识不透彻。经过仔细查证出现的错误有:使用主成分分析时:卿述主成分分析概念出错;成分斤求解出错如凡=A“X中A“,九工仏(/,为单位矩阵儿“的意义见表1);找不到主成分F,的命名依据对主成分E命名出错;魏变量山被丢失;(测九错误地进行旋转:瞬误地进行回归求F.;惜误地把因子分析法(含初始因子分析法)当作主成分分析法。使用因子分析
5、时:将因子分析的思想叙述为主成分分析的思想;因子乙的命名出错,如用因子得分函数对因于Z.进行命名;(辣变量Xk被丢失:將主成分或因于错误地表示为BmX(B”的意义见表1):不知相关系数矩阵特征值:与因子贡献H的区别.如综合因子得分函数Z综=左呻p)Z,中的V,-错误地取为特征值io二、主成分分析与R型因子分析数学模型的异同比较相同之处:主成分分析与R-型因子分析都是对协差阵的逼近,都是打算降维解释数据集。具体为指标的正向化指标的标准化(SPSS软件自动执行).通过相关系数矩阵判断变量间的相关性求相关系数矩阵的特征值和特征向量主成分间、因子间线性无关用累计贡献率(激5%)、变量不出现丢失确定主成
6、分、因子个数加.前加个主成分与前加个因子对X的综合贡献相同、是最大化的,命名依据都是主成分、因于与变量的相关系数。不同之处:方差最大化方向,所处的坐标系(标准正交性),应用上侧重等不同见表1。主成分分析与因子分析定量上不同的显著性标志是方差。事实上.VarF.(OVarZ,=1,即尺的取值范围比乙的取值范围大(小):通常Wr%Var.即F綜的取值范围比Z综的取值范围大.这些都肯定了主成分分析与因于分析的计量值、评价体系不同。结论:主成分分析与因子分析两种方法方差、最大化 SPSS J1995-2006TsinghuaTongfangOpticalDiscCo.,Ltd.Allrightsres
7、erved.1995-2006TsinghuaTongfangOpticalDiscCo.,Ltd.Allrightsreserved.区别项目主成分分析数学模型:R-型因子分析数学模型:表达式与系数矩阵Fm=AmX.Am=(an)pXni=(丨,2,J,E=,八i是相应的特征值和单位特征向量.1(为转殊因千),因于栽荷矩阵Bm=Px!=BniC.Bm=(i,2,刖)为初始因子栽荷矩阵(八,同左)。因变量方差最大化斤依次达到信息贡献(方差)最大化.VarF,=乙没有达到方差最大化VarZ,=1。矩阵方差最大化旋转无旋转后就不是主成分了因为VarE*o有C二(6)m血为几方差最大正交旋转矩阵.B
8、m达到方差最大化。因变量对X的贡献待征值p=刀臨,叫*1通常丨。相关系数=阿命各依据用厂(血八如)式中系数绝对值大的对应变量对F)命名有时命名渚晰性低。将血的第.j列绝对值大的对应变量归为乙一类并由此对乙命名命名清晰性高(轄细)。回归过穆无。有因子得分函数BFX标准正交性是J“竝二儿(判据之一)。综合评价函数及方差F稼=,E(il)Fi,VarF综=(/)/2,=P或i+賊通常wrFift,VarZig.B卩F综的取值范围通常比z嫁大。m為二刀*/)乙工i(判据之一)UIVarZ综=(-;)/2(旋转后因于贡献从,变为忖因此权数应取为Vi!),=P或V|+v2+vmo信息贡献影响力综合评价。成
9、因清晰性的综合评价。表1R-取初始因子的方法为主成分法。方向不同直接导致主成分值、因子得分值、综合评价值和应用侧重上不同综合评价应该分开进行混淆在一起是不同计量值交替错误。三、避免出错的方法步骤1SPSS(1)指标的正向化:(2)指标数据标准化(SPSS软件自动执行);(3)指标之间的相关性判定:用SPSS软件中表CbrrelalionMatrix(相关系数矩阵)”判定;确定主成分个数加:用SPSS软件中表“IblalVarianceExpkiined(总方差解释)”的主成分方差累计贡献率85%、结合表CbmponenlMalrix(初始因子栽荷阵)”中变量不出现丢失确定主成分个数/o(5)主
10、成分代表达式(这是SPSS软件及其教科书中没完善的地方):将SPSS软件中表“QnponentMalrix”中的第/列向量除以第,个特征根的开根后就得到第/个主成分”的变量系数向量(在utran$fonn-*conpute”中进行计算)由此写出主成分F.表达式。用Fm=AmX的A=L检验之。主成分F,命名:用SPSS软件中表“CbmponenlMatrix”中的第/列中系数绝对值大的对应变量对Fs命名(有时命名清晰性低)o(7)主成分与综合主成分(评价)值(这是SPSS软件及删科书中没完善的地方):综合主成分(评价)公式UI综=石(在tranGomi-compute”中进行计算),在SPSS软
11、件中表4TbtalVarianceExplained下“InitialBgrnvcilues(主成分方差)”栏的ofVariance(方差率)”m中。Var心=(V)/po(8)检验:综合主成分(评价)值用实际结果、经验与原始数据做聚类分析进行检验(对有争议的结果可用原始数据做判别分析解决争议)o(9)综合实证分析。2.SPSS(1)(3)步骤同主成分分析步骤。(4)确定因子个数加:用SPSS软件中表85%结合表uRotatedG)nponentMalrix(旋转后因子栽荷阵)”中变量不出现丢失确定因子个数/Ho(5)求因于栽荷矩阵Hm:SPSS软件中表“RotatedCbmponenlMat
12、rix。因于Z,的命名:将SPSS软件中表RoeedGanponentMatrix”因子栽荷矩阵B,的第i列绝对值大的对应变量归为Z,类,并由此对Z,命名(命名清晰性高)。(7)求因子得分函数乙表达式厶=b旳,Vnr%二nt(yyi)/p。(9)检验:综合评价值用实际结果、经验与原始数据做聚类分析进行检验(对有争议的结果.可用原始数据做判别分析解决争议)O(10)综合实证分析。以上看出:使用SPSS软件时.主成分分析与因子分析是从初始因子栽荷阵处分开的表现为主成分分析是通过初始因于栽荷阵列向量单位化(或除相应特征值开根)得到主成分系数距阵、主成分及其值等而因子分析是通过初始因于栽荷阵进行旋转得
13、到因于栽荷阵、再通过回归得到因于得分及其值等。四、刘文、卢书正确的主成分分析结果经过仔细验算刘文、卢书虚将初始因子分析结果当成了主成分分析结果。因子分析中如果方差最大正交旋转矩阵c=4,即因子分析无旋转过程.称其为初始因子分析。表1中主成分分析与初始因子分析仍有方差、表达式与系数矩阵、回归过程、标准正交性、综合评价函数及方差5项的不同,故主成分值与初始因子得分值仍然计量不同,不能混淆。现按主成分分析法和SPSS软件应用时一对一的正确步骤给出刘文的主成分分析结果卢书啲主成分分析结果读者同理自行给出。笔者根据刘文给出的数据用SPSS软件Anal)7e菜单Factor程进行主成分分析(通过相关系数矩
14、阵判断变量间的相关性略),得出相关系数矩阵的特征根及主成分贡献率见表2特征向量矩阵见表3。由于前三个主成分包含了全部的指标所具有的信息且累计方差贡献率巳达到86.702%且无变量丢失故取3个主成分就够了.但为了与刘文燧行比较这里仍取4个主成分。表2ThtaiVarianceExplainedInitialEgenvaluesExtractionSumsofSquaredLoadingsTotal%ofVarianceCuniulalive%Total%ofVarianceChmulalive%16.04940.32740.3276.04940.32740.32775.81338.75479.0
15、815.81338.75479.08131.1437.62186.7021.1437.62186.70240.8765.84092.5420.8765.&1092.542ExtractionNfethod:PrincipalCbmponenlAnalysis.第4以后的特征值省略。表3ComponentMatrix()G)nponent1234A40.8950.333-0.1820.132X30.863-0.191-0.2970.169从0.826-0.123-0.2810.4210.728-0.6230.146-0.101小0.4070.8050.269-0.2780.5520.7660.1
16、96-0.1650.6140.7630.028-0.055-VI50.5790.7600.005-0.1290.5960.7270.2080.2350.6360.7030.0410.190列0.6190.7030.0080.147Xil0.654-0.6910.1710.237XI20.6660.6850.1660.227XI0.2740.6270.1830.285-0.1470.0160.8220.465主成分命名:表3中每一个栽荷量表示主成分与对应变量的相关系数,且系数符号与题意相符结合贡献率与正负相关性作用得出X-货物贸易占货物BP的比重、X?-外国宜接投资占国内投资总额的比重、冷-对外
17、贸易依存度、Xm-货物和服务进出口总额占(DP的比重、Xl4-对外金融资产负债总额占(DP的比重的综合影响是大至持平的(见后F诲表达式X2、X7、XU、X|2、X的系数),因此第一主成分鬥与Xj、X6、X8、Xd十分显著正相关,所以我们可以称之为本国发生的全部收益占CNP的比重、对外直接投资和接受外国直接投资总额占CDP的比重、本国直接投资额占全球直接投资额的比重、国际金融总资本流量占BP的比重综合指标;第二主成分Fi与XsX&XgXgX十分显著正相关,所以我们可以称之为BP占全球BP的比重、本国发生的全部收益占世界发生的全部收益的比重、本国直接投资额占全球直接投资额的比重、跨国并购额占全球跨
18、国并购额的比重、国际经济外向度、国际金融总资本流量占全球国际总资本流量的比重综合指标:第三主成分月仅与&十分显著正相关所以我们可以称之为外国分支机构比重指标:而第四主成分与变量没有明显的相关性因此不对其进行命名。从这里也可以看出前三个主成分包含了全部的指标所具有的大部分信息。四个主成分的表达式还不能从输出窗口中直接得到,因为ConponentNfatrix是指初始因子栽荷矩阵.为了得到四个主成分的表达式.以便求主成分值.还需进一步操作:将前四个因子栽荷矩阵输入到数据编辑窗口(为变量厲、血、為、&)然后利用FamformTcompule”,在对话框中输A%=B,/SQR(6.O49)BP可得到主
19、成分系数向量A,。同理可得到山、山、人。干是四个主成分表达式如下(这里的ZX,是尢的标准化数据):F=0.1653ZX+0.2424ZX20.0596ZX5+0.364ZX4+0.2495ZX5+0.3357ZX6+0.1113ZX7+0.2584ZX8+0.2516ZX9+0.2244ZXm+0.2659ZXU+0.2707ZXI2+0.3507ZXB+0.2961ZXU+0.2355ZXI5F2=0.3341ZX0.3016ZX2+0.0064ZX5-0.138ZX+0.3163ZX5-0.0512ZX6-0.2602ZX7+0.29192ZX8+0.2914ZX9+0.3176ZXI00
20、.2865ZXn0.284ZXI2朽二0297ZXi-0.251ZX2+0.4973ZX5+0.1406ZX40.0593ZX5+0.4498ZX6+0.3046ZX7+0.2032ZXS+0.1569ZX9-0.1766ZXIO-0.2528ZXn-0.2421ZX12+01805ZXB0.1084ZXI40.1376ZXI5应用这一线性组合计算出各主成分值最后利用综合主成分函数(=P=15):F綜=0.40327片+0.38754F2+0.07621+0.0584=0.1979乙釣0.0189乙口+0.066乙$+0.0885乙口+0.2218+0.121860.0251ZX7+0.232
21、1乙$+0.2241乙g+0.21722Ai()0.006400032乙和2+01002乙“+0.022乙口4+02095乙“可以求得各个国家世界经济全球化程度的综合主成分值(见表4)。五、主成分分析与(初始)因子分析的实证比较刘文滦2的结果为初始因于分析结果(经仔细验算确认),现将其与主成分分析结果表4进行比较。主成分分析与初始因于分析的命名依据都是初始因于栽荷矩阵表3的相应列,刘文对初始因于分析的命名准确性不勞致使相应经济分析有些偏离实际.如刘文中“中国参与经济全球化程度总体水平很低.但对生产与贸易全球化依存度及投资全球化依存度很髙”并不显现。实际结果表4中为:在华外国分支机构占世界全部外
22、国分支机构的比重很髙,表明中国参与经济全球化进程正受到世界各国的髙度关注。表4国家Fi排名排名E排名挣名加排名美国3.2936.0711.4620.80143.741英国4.4590.9841.76162.1712.179徳国1.4041冀30.2550.2381.053日本0.4461.8520.2561.23160.814法国0.8750.465-0.52140.4540.525新加坡5.2716.26161.183-0.9515-0.276意大利-0.6180.1160.54150.6513-0.297加拿大-0.43704712-0.31II0.007-0.388中国-2.18140血
23、73.0011.83-0.529巴西-L9113-0.(880.43120.146-0.8110澳大利亚-1.3610-0.92140.30100.225-0.9111韩国-1.6912045110.2770.6112-0.9212星西哥-1.67110.68130.0240.309-0.9513新西兰-0.989-1.73150.2880.733-1.0514俄罗斯2弭15019100.3090.3610-1.0615印庶-2.56160109-0.46130.3911-1.1316表4中主成分E、卜诫的值与刘文表2中因子f.(=Z.).F(=%)的值全部不等.这是二者函数方差不同造成的,这
24、里Var=1.87,VarZ=0.32.VarVar。由表4与刘文啲表2对比可知:部分国家参与经济全球化程度综合主成分值排名中中国的排名相差较大,在本文表4中,中国排第9而在刘文中国排第6:新加坡、意大利、加拿大、韩国在本文中表4分别排第6、7、8、12而在刘文沖分别排第7、8、9、13:墨西哥在本文中排第13.而在刘文中排第12o通过表4可将综合主成分结果在等距/=(3.74+/4=1.2175下可分为四类国家。第一类国家:综合主成分值取值范围为2.523,3.74。第二类国家:综合主成分值取值范围为(1-305.523Jo第三类国家:综合主成分值取值范围为(0.086.1.305Jo第四类
25、国家:综合主成分值取值范围为(-113,0.086)o通过样品的综合主成分值取值可以确定样品的类别,如美国的综合主成分值为3-74是第一类国家.英国的综合主成分值为2.17是第二类国家:但在刘文沬2中,美国的综合值为1-57在此只能划分为第二类国家英国的综合值为0.9在此只能划分为第三类国家。如果将表4中美国、英国、中国、巴西、澳大利亚、韩国、墨西哥、新西兰、俄罗斯、印度的综合主成分值在刘文表2中来确定样品的类别,结果是这些国家不在刘文滦2的取值范围-0.49,1.57内。即不同定量值矣带来混乱。以上可看出:主成分分析与因子分析的实证结果是有差异的定量值全部不同,不能混用。1995-2006TsinghitaTongfangOpticalDiscCo.,Ltd.Alllightsreserved.1995-2006TsinghitaTongfangOpticalDiscCo.,Ltd.Alllightsreserved.StatisticalReseiirch692005332005日本向知识经济的战略转型刘彦ABSTRACTIntellectualPropertystrategyisaninportantstrategyse
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年深圳市福田区荔园教育集团附属幼儿园公开招聘短期教师备考题库含答案详解
- 中国电建集团贵州工程有限公司2026届秋季招聘150人备考题库及完整答案详解一套
- 2025年新疆晨玖建设工程有限责任公司市场化选聘工作人员备考题库及1套完整答案详解
- 简约企业年终工作总结汇报模板
- 中国人民人寿保险股份有限公司重庆市分公司2026年度校园招聘备考题库及参考答案详解1套
- 2025年复旦大学附属华东医院《老年医学与保健》专职编辑招聘备考题库带答案详解
- 2025年重庆两江新区民心佳园小学校物业项目经理招聘备考题库及一套完整答案详解
- 2025年浙江省经济建设投资有限公司招聘备考题库完整答案详解
- 2025年关于公开招聘派遣至莆田市城厢区交通运输局非在编工作人员的备考题库及完整答案详解一套
- 2025年中南大学湘雅基础医学院非事业编制人员招聘备考题库及答案详解参考
- GB/T 34110-2025信息与文献文件(档案)管理核心概念与术语
- 大连市社区工作者管理办法
- 2025年河北地质大学公开招聘工作人员48名笔试模拟试题及答案解析
- 火灾探测器的安装课件
- 酒店转让合同协议书范本大全
- DB21∕T 3722.3-2023 高标准农田建设指南 第3部分:项目预算定额
- 压力管道质量保证体系培训
- 2025年度数据中心基础设施建设及运维服务合同范本3篇
- 【八年级上册地理】一课一练2.2 世界的气候类型 同步练习
- 筋膜刀的临床应用
- 中国石化《炼油工艺防腐蚀管理规定》实施细则(最终版)
评论
0/150
提交评论