主成分,因子分析步骤_第1页
主成分,因子分析步骤_第2页
主成分,因子分析步骤_第3页
主成分,因子分析步骤_第4页
主成分,因子分析步骤_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主成分分析、因子分析步骤不同点主成分分析因子分析概念具有相关关系的p个变重,经过线性组合后成为k个不相关的新变量将原数据中多个可能相关的变量综合成少数几个不相关的可反映原始变量的绝大多数信息的综合变量主要目标减少变量个数,以较少的主成分来解释原有变量间的大局部变异,适合于数据简化找寻变量间的内部相关性及潜在的共同因素,适合做数据结构检测强调重点强调的是 解释数据变异的水平,以方差为导向,使方差到达最大强调的是 变量之间的相关性,以协方差 为导向,关心每个变量与其他变量共同享用局部的大小最终结果应用形成一个或数个总指标变量反映变量间潜在或观察不到的因素变异解释程度它将所有的变量的变异都考虑在内,

2、因而没有误差项只考虑每一题与其他题目共同享用的变异,因们有误差项,叫独特因素是否需要旋转主成分分析作综合指标用,不需要旋转因子分析需要经过旋转才能对因子作命名与解释是否有假设只是对数据作变换,故不需要假设因子分析对资料要求需符合许多假设,如果假设条件不符,那么因子分析的结果将受到质疑因子分析1【分析】一【降维】一【因子分析】因子分析:.一 I :r- |国Q3-(1 )描述性统计量(Descriptives )对话框设置KMO和Bartlett 的球形度检验(检验多变量正态性和原始变量是否适合作因子分析)崎国子分析:描述统计-Statistics , 匚 叁蛊建隹 1S Im :«

3、iiiM «匣原始分析结果(1)相关些矩阵n系数e谑帼那么)E显著性水平13再生运)I .衍列式©)二i度唤象® 1.和Bartlett的求彩度检验.续取消此助j(2)因子抽取(Extraction )对话框设置 方法:默认主成分法.主成分分析一定要选主成分法分析:主成分分析:相关性矩阵.输出:为旋转的因子图 抽取:默认选1.最大收敛性迭代次数:默认25.(3)因子旋转(Rotation )对话框设置因子旋转的方法,常选择“最大方差法.“输出框中的“旋转解置因子分析:旋转一方法O无.盛大四收方值法(西最大厅空法:大平衡值鹏勺©Xtt Oblniin.Pr

4、omax(P)Delta(>X 0 I KflppMitK) 小能出|7旋就解心 “懒石曲&iBriiiliwiililmlliliwJ最大收然性诞代欢罐Q9:巨(4)因子得分(Scores )对话框设置“保存为变量,那么可将新建立的因子得分储存至数据文件中,并产生新的变量名称.陶因子分析:因子得分>座保存为堂*斤法1回归®O BartlettCB),'二 1 TAndrson -Rub in (A) >« « !rnI idtbiii!_ in;mi m rwi inH'iiirn,?示因子电处系翱传阐廿 "i

5、liri-ai lib sill .bilidoaiBIliaBiill i 111 ri i i 11 a IllhJ(5)选项(Options )对话框设置圄因子分布晒: xI缺失值rrna irrBiim-riBiararm >«< it wna irrBiairi-ri imtn arn钱按列表排辞个案(9 m 3 "-Ja BIBB 3 -* 3 3 a 3 3 占 3 3 3 J h B 3 -* 3 3 一a.按时椎除个案.使用均值擘牌:由茶疲显示格式1J按大小徘序0I康肯小素救国)急对包如下门2结果分析(1 ) KMO 及 Bartlett &#

6、39; s 检验KMO 和Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin度量.,515Bartlett的球形度检验近似卡方3.784df6Sig.,706当KMO值愈大时,表示变量间的共同因子愈多, 愈适合作因子分析.根据Kaiser的 观点,当 KMO >0.9 很棒、KMO >0.8 很好、KMO >0,7 中等、KMO >0.6 普 通、KMO >0,5 粗劣、KMO <0.5 不能接受.2公因子方差公因子方差起始撷取卫生1.000.855饭量1.000.846等待时间1.000.819味道1.000.919亲切1.000.

7、608撷取方法:主体元件分析.Communalities(称共同度)表示公因子对各个变量能说明的程度,每个变量的初始公因子方差都为1 ,共同度越大,公因子对该变量说明的程度越大,也就是该变量对公因子的依赖程度越大.共同度低说明在因子中的重要度低.一般的基准是0.4就可以认为是比拟低,这时变量在分析中去掉比拟好.(3)解释的总方差说明的变异数总计元件各因子的特征值因子奉献率因子累积奉献率总计变异的累加总计变异的累加总计变异的累加12.45149.02449.0242.45149.02449.0242.04240.84340.84321.59531.89980.9231.59531.89980.9

8、232.00440.07980.9233.66213.24694.1684.1913.82397.9925.1002.008100.000撷取方法:主体元件分析.第二列:各因子的统计值第三列:各因子特征值与全体特征值总和之比的百分比.也称因子奉献率.第四列:累积百分比也称因子累积奉献率第二列统计的值是 各因子的特征值,即各因子能解释的方差,一般的,特征值在1以上就是重要的因子;第三列是各因子的特征值与所有因子的特征值总和的比,也称因子奉献率;第四列是因子累计奉献率.如因子1的特征值为2.451 ,因子2的特征值为1.595 ,因子3,4,5的特征值在1以下.因子1的奉献率为49.0% ,因子2

9、的奉献率为31.899% ,这两个因子奉献率累积达80.9% ,即这两个因子可解释原有变量80.9%的信息,因而因子取二维比拟显著.至此已经将5个问项降维到两个因子,在数据文件中可以看到增加了2个变量,fac1_1、fac2_1 ,即为因子得分.(4)成分矩阵与旋转成分矩阵元件12径重.915.427第待时间-.787.447卫生-.775E4除追.750.597亲切.069-.776撤取方法:主体元件分析.凯崛2个元件口转轴方法;具有赊115cl正规化的最大变异法"上在3善代中收颌循环.成分矩阵是未旋转前的因子矩阵,从该表中并无法清楚地看出每个变量到底应归属于哪个因子.旋转后的因子

10、矩阵, 从该表中可清楚地看出每个变量到底应归属于哪个因子.此表显示旋转后原始的所有变量与新生的2个公因子之间的相关程度般的,因子负荷量的 绝对值0.4以上,认为是显著的变量,超过0.5时可以说是非常重要的变量.如味道与饭量关于因子 1的负荷量高,所以聚成因子1,称为饮食因子;等待时间、卫生、亲切关于因子 2的负荷量高,所以聚成因子 2,又可以称为效劳因子.(5)因子得分系数矩阵元件评分系数矩阵元件12卫生-.010.447饭量.425-.036等待时间-.038.424味道.480.059亲切-.316-.371撷取方法:主体元件分析.转轴方法:具有 Kaiser正规化的最大变异法.元件评分.

11、因子得分系数矩阵给出了因子与各变量的线性组合系数.因子 1 的分数=-0.010*X1+0.425*X2-0.038*X3+0.408*X4-0.316*X5因子 2 的分数=0.447*X1-0.036*X2+0.424*X3+0.059*X4-0.371*X5(6)因子转换矩阵元件转换矩阵元件121.723-.6912.691.723撷取方法:主体元件分析.转轴方法:具有 Kaiser正规化 的最大变异法.因子转换矩阵是主成分形式的系数.(7)因子得分协方差矩阵元件评分共变异数矩阵元件12121.000.000.0001.000撷取方法:主体元件分析.转轴方法:具有 Kaiser正规化 的

12、最大变异法.元件评分.看各因子间的 相关系数,假设很小,那么因子间根本是两两独立的 ,说明这样的分类是较合理的.主成分分析1【分析】一一【降维】一一【因子分析】(1)设计分析的统计量【相关性矩阵】中的“系数:会显示相关系数矩阵;【KMO和Bartlett的球形度检验】:检验原始变量是否适合作主成分分析.总 因子分界转述统计L色11rStati&tics单受量描述性也)丁原始分析结果Q-相关性制阵-"赛敌(£) ,嬲模型侬j贮里普性水平目巴再生®一行列式®J反映象世).举续取消帮助【方法】里选取“主成分.编国子分卷的青古承叱t主咸附=分新单1出&#

13、39;.?相关世臣阵好.M描e转的因子好但;,:'他方差矩阵的国碎石即空产0基于府任值此 将怔x于®:H |(因子的应定钟辛旦: 要提和的因子二产品式恸:叱运g拧次匚.5出.福丽j【旋转】:选取第一个选项“无.总国子分标上转':方法可.就座Q隹大四次方便法0)O展大方差汰它).曷大军御值法(E),"直橙guim汗方法 、£“巴力就出杷 翻眶U“取消:庠助【得分】:"保存为变量【方法】:“回归;再选中“显示因子得分系数矩阵以 国子分哧因子碍方M保存为变最1方法1 J回日出O BartlettC Anders on-Ru bin囹星系亩?海豆

14、丽南薛而ImiBirBniiarMimrMiiimai iiBBiirBniBirMi cmiiiiiP日变J肺泉I"助LJ的因子分析:酶缺失值 1 cllllh! llliarilBIl!ill IkilliaiallllillilllliiailllllJdlllliBIII*>曾逡理冕,频个更&j©接对用峰小素:使用平均值瞽拽田耗教显示格式1口接大“椭序国取消小系数也维财值如下因:雉.取消fw1aJ2结果分析1相关系数矩阵相关性矩阵食品衣着燃料住房交通和通讯娱乐教育文化相关食品1.000.692.319.760.738.556衣着.6921.000-.0

15、81.663.902.389燃料.319-.0811.000-.089-.061.267住房.760.663-.0891.000.831.387交通和通讯.738.902-.061.8311.000.326娱乐教育文化.556.389.267.387.3261.000两两之间的相关系数大小的方阵.通过相关系数可以看到各个变量之间的相关,进而了解各个变量之间的关系.由表中可知许多变量之间直接的相关性比拟强,证实他们存在信息上的重叠.(2) KMO 及 Bartlett ' s 检验KMO 与 Bartlett 检定Kaiser-Meyer-Olkin测量取样适当性.602Bartlett

16、 的 球形检大约 卡方62.216定df15显著性.000根据 Kaiser 的观点,当 KMO >0.9 很棒、KMO >0.8 很好、KMO >0.7 中等、KMO>0.6 普通、KMO >0.5 粗劣、KMO V 0.5 不能接受.3公因子方差Communalities起始撷取食品1.000.878衣着1.000.825燃料1.000.841住房1.000.810交通和通讯1.000.919娱乐教育文化1.000.584撷取方法:主元件分析.Communalities称共同度表示公因子对各个变量能说明的程度,每个变量的初始公因子方差都为1 ,共同度越大,公因

17、子对该变量说明的程度越大,也就是该变量对公因子的依赖程度越大.共同度低说明在因子中的重要度低.一般的基准是<0.4就可以认为是比拟低,这时变量在分析中去掉比拟好.4解释的总方差:说明的变异数总计元件起始特征值撷取平方和载入总计变异的累加总计变异的累加13.56859.47459.4743.56859.47459.47421.28821.46680.9391.28821.46680.9393.60010.00190.9414.3585.97596.9165.1422.37299.2886.043.712100.000撷取方法:主体元件分析.因子1的奉献率为49.0%,因子2的奉献率为31.

18、899% ,这两个因子奉献率累积达 80.9%,即这两个因子可解释原有变量80.9%的信息,因而因子取二维比拟显著.(5)成分矩阵(因子载荷矩阵)元件矩阵a元件12食品.902.255衣着.880-.224燃料.093.912住房.878-.195交通和通讯.925-.252娱乐教育文化.588.488撷取方法:主体元件分析.a.撷取2个元件.该矩阵并不是主成分 1和主成分2的系数.主成分系数的求法:各 自主成分载荷向量除以主成分方差的算数平方根.那么第1主成分的各个系数是向量(0.925 , 0.902 , 0.880 , 0.878 , 0.588 , 0.093 )除以,3.568后才得

19、到 的,即(0.490 , 0.478 , 0.466 , 0.465 , 0.311 , 0.049 )才是主成分 1 的特征向量.第1主成分的函数表达式:Y1=0.490*Z 交+0.478*Z 食+0.466*Z 衣+0.465*Z 住 +0.311*Z 娱+0.049*Z 燃(6)因子得分因子得分显示在 SPSS的数据窗口里.通过因子得分计算主成分得分.(7)主成分得分主成分的得分是相应的因子得分乘以相应方差的算数平方根.即:主成分1得分=因子1得分乘以3,568的算数平方根主成分2得分=因子2得分乘以1,288的算数平方根【转换】一【计算变量】+,- *未交'2 ;数据柬1

20、-BM SPSS Sti: it L5蒜翅泡垠至文件但)挪g回 现图也/ 取国) 转族fl) 分护世)宜蛹胆)邺愉&b实总H品国岂-F号褊维F升?11 :粕区因子1吁?主成分1 主成分工j1北京2 M9W22m3&7QS3器9572天津仃州1.03&33.73303117667二词-1.03S56-1.01053-1.561751.15604L 4山西. nsciq.下注口4 JlCLERI6内蒙-.72783d.1Q272-1 37481-1 25U8江宁.27382殉 1.51722.617537吉林一.9$师1 362741时的1 546S7Q-.3S2T0.4T

21、057-74193.534059有2 兆诩-.«5354«iai10湖-.05/96-16654-10948jnet1112腑工 安徽63552M 蚂口.437321291 冲1 20224 -.52713OS0S31466021314福建江西,377671_6065B-6T7581 49035-71335-1 279851.B23311 6919715山乐-J1&9S、斯四口.22087-64633河南-.91423.TG44B*1.72690-.6676111?事 .西盘视图)H显现期I(8)综合得分及排序综合得分是根据以下公式计算:3 .56K1 ,28K八月总公Y = 主成分I得分+ *生成分2得分,化简得:邛林 + 1 2K83 36K + I 28K综合得分Y为:WF>蚪遇需留也翻皓®转换势柝gt E神,切励但累声

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论