因子分析和主成分分析_第1页
因子分析和主成分分析_第2页
因子分析和主成分分析_第3页
因子分析和主成分分析_第4页
因子分析和主成分分析_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

因子分析和主成分分析实验目的学习利用SPSS进行因子分析和主成分分析。二、实验性质选修,基础层次三、主要仪器及试材计算机及SPSS软件四、实验内容因子分析五、实验学时2学时六、实验方法与步骤开机;找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS;按要求建立数据文件;进行统计分析;撰写实验报告;关闭SPSS,关机。七、实验注意事项实验中不轻易改动SPSS的参数设置,以免引起系统运行问题。遇到各种难以处理的问题,请询问指导教师.为保证计算机的安全,上机过程中非经指导教师和实验室管理人员同意,禁止使用移动存储器。每次上机,个人应按规定要求使用同一计算机,如因故障需更换,应报指导教师或实验室管理人员同意.上机时间,禁止使用计算机从事与课程无关的工作。八、上机作业例1:下表资料为25名健康人的7项生化检验结果,7项生化检验指标依次命名为X1至X7,请对该资料进行因子分析。X1X2X3X4X5X6X73.763。660.545。289。7713。744。788。594.991。3410。027。510。162.136。226。144.529.842.172.731.097。577。287.0712.661.792.100。829。037.082。5911.764.546.221。28

5.513。981.306。925。337.302.403.270。620。443。367。638。848.398.747.013。3111.683.534。761。129。649.491.0313。5713.1318。522.359。731.331。009.879.8711.063。708.592。981。179.177.859。912.627。125.493。689。722.643.431.194.693.012.175.982.763。552。015。511.341。275。814。575.383。431。661。611。572。801.782。093.725.905。761。558.845.513。981.306。925。337.302.403.270。620。443。367。638。848.398.747.013。3111.683.534。761。129。649.491.0313。5713.1318。522.359。731.331。009.879.8711.063。708.592。981。179.177.859。912.627。125.493。689。722.643.431.194.693.012.175.982.763。552。015。511.341。275。814。575.383。431。661。611。572。801.782。093.725.905。761。558.845。407。501.979.849.271.5113.69。0212.671.758.394.922.5410。053。965.241.434.944.381.036.686.499。062.817。232。301.777。794。395.372。279。467.311。0412。0011。5816。182.429。555.354.2511。742。773。511。054。944.524.508。071。792。101.298。213。082.429。103.754.661.729。416.445。1112.52。453。100。91建立数据文件。定义变量名:分别为X1、X2、X3、X4、X5、X6、X7,按顺序输入相应数值,建立数据文件,保存为“生化检验〃。选择菜单“分析一降维一因子分析”,弹出“因子分析”对话框.在对话框左侧的变量列表中选变量X1至X7,进入“变量”框,如图1。单击“描述”按钮弹出“因子分析:描述统计〃对话框,在“统计量〃中选“单变量描述性”项,输出各变量的均数与标准差,“在相关矩阵〃栏内选“系数〃,计算相关系数矩阵,并选“KMO和Bartlett的球型度检验”项,对相关系数矩阵进行统计学检验,如图2.

图1「息因子分凉3述炼计统计量R]单变量描述性EI原始分析结果U)相矣矩阵R]寒数CQ)逆模型四}显著性水平母)..再生瓯)行列式巾反映氯®■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

弱*.妙9.理旦迎.甄坦座步廛迫塑馈图2单击“抽取”按钮,弹出“因子分析:抽取”对话框,选用“主成分”方法提取因子,如图3。

图3单击“旋转〃按钮,弹出“因子分析:旋转”对话框,在“方法”栏中选择“最大方差”进行因子正交旋转,如图4。单击“得分〃按钮,弹出“因子分析:得分”对话框,选择“回归〃项估计因子得分系数,如图5.单击“确定”,得到输出结果。图4

图5实验结果考察原有变量是否适合进行因子分析桐矣距阵X1X2X3X4X5X6X7相关X11.000.580.201.909.283.2S7-.533X2.5801.000.837.166.261-.608X3.201.3641.000.436-.704-.601-.649X4.909.837.4361.000.163.203-.679X5.283.166-704.1631.000.990.427XS.287.261-.681.203.9901.000.357X7-.533-.608-.649-.678.427.3571.000表1表1显示原有变量的相关系数矩阵,可以看出大部分的相关系数都比较高各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。KMO和BMIett的整验取样足够度的Kaiser-Meyer-Olkin度量。.321Bartlett的球形度校验近似卡方320.191df21Sig..000表2由表1—2可知,巴特利特球度检验统计量观测值为326。191,相应的概率p值接近0,如果显著性水平a为0。05,由于概率p值小于显著性水平a,应拒绝零假设,可以认为相关系数矩阵与单位阵有显著差异,同时KMO值为0.321,根据Kaiser给出的KMO度量标准可知KMO值偏小,意味着因子分析的结果可能不能接受。

提取因子公因子方差初始提取X11.0007971.000773X31.000.859X41.000.980X51.000.993X61.000.976X71.000.834提取方法:主成份分■析・表3牌舞的总方差成碍初始特征值提取平方和载入旋转平方和载入合计方差的%副租%合计方茬的%舍计方差的瑶13.39549.50448.5043.39548.50448.5043.30647.23247.23222.80640.08988.5932.80640.08988.5932.89541.36188.5933.4366.23594.8284.2763.946987745.0811.161gg.gas6.004.059gg.ggi7.000.006100.000提取方法:主成愣分析,表4表3和表4为因子方差表,提取因子后因子方差的值均很高,表明提取的因子能很好的描述这7个指标。方差分解表也表明前两个因子能够解释7个指标的88.593%.综合以上,提取前两个因子最好了。因子的命名解释成借距阵m成粉13X1.746,489X2.796.372X3.709-.597X4.911.389X5-.234.963xe-.177.972X7-.886.219提取方法:主成份*a.已提取了W个成份。旋转成份蛆阵吝成粉12X1.878.161X2.878.033X3.421-.826X4.990.004X5.159,9?9X6.214.964X7-.732.547恨取方法:主成份-淀转法具有Kaiser^准化的正交旋转法。a.旋转在3次迭代后收敛『表5成份转换瓶阵成份121.921-.3892.389.921提取方法:主成份,庭转法:具有Kaiser标推化的正交旋转法*表6由表5、表6可知,由旋转成份矩阵可以看出,经旋转后,因子便于命名和解释.因子1主要解释的是XI、X2、X4、X7,命名为FAC1_1;而因子2主要解释的是其余三个指标,X3、X5、X6。命名为FAC2_1。九、课外作业:1。数据文件“development。sav”是某年我国各省发展状况的一些指标,包括人均GDP、人力资源指数CAPITAL.人均收入INCOME、人均净收入NETINC、教育指数、健康指数,试用主成分法或者因子分析法寻找这些指标主要代表了发展状况的哪些特征,以及各省市的发展程度排序.2。对某市15个大中型工业企业经济效益进行分析。经研究从有关经济效益指标中选择7个指标作分析,即:固定资产产值率、固定资产利税率、资金利润率、资金利税率、流动资金周转天数、销售收入利税率和全员劳动生产率,数据文件为“某市工业企业效益指标。sav”,试研究该市大中型工业企业经济效益的状况及差异。1、实验步骤:打开数据文件“development。sav”.选择菜单“分析一降维一因子分析”,弹出“因子分析”对话框.在对话框左侧的变量列表中选变量gdp,capital,income,netinc,education,healcare,进入“变量”框,如图1—1。单击“描述”按钮,弹出“因子分析:描述统计”对话框,在“统计量中选“单变量描述性”项,输出各变量的均数与标准差,“在相关矩阵”栏内选“系数〃,计算相关系数矩阵,并选“KMO和Bartlett的球型度检验〃项,对相关系数矩阵进行统计学检验,如图1—2。图1—1

图1—2单击“抽取”按钮,弹出“因子分析:抽取”对话框,选用“主成分”方法提取因子,如图1-3。图1—3单击“旋转〃按钮,弹出“因子分析:旋转”对话框,在“方法”栏中选择“最大方差”进行因子正交旋转,如图1-4.单击“得分”按钮,弹出“因子分析:得分对话框,选择“回归”项估计因子得分系数,如图1-5.

单击“确定”钮,得到输出结果.图1—4图1—52、实验结果考察原有变量是否适合进行因子分析相关瓶阵A■均GDP人力资源指数人均收入人均净收入EDUCATION健康指数相矣人均GDP.458.761.934.285-.061人力资源寸旨数.458■^-<4100^.261.449.658.570人均收入.761.261.346.252.129人均净收入.934.449|,U4b|.390.093EDUCATION.235.653.252.390.743健康指数-.061.129.093.743

表1—1显示原有变量的相关系数矩阵,可以看出大部分的相关系数都比较高,各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。KMO和Bartlett的枚验取样足翳度的Kaiser-lvieyer-Olkin度量号.635Bartlett的球形度检验近似卡方148.715df15Sig..000表1-2由表1—2可知,巴特利特球度检验统计量观测值为148。715,相应的概率p值接近0,如果显著性水平a为0.05,由于概率p值小于显著性水平a,应拒绝零假设,可以认为相关系数矩阵与单位阵有显著差异,同时KMO值为0.635,根据Kaiser给出的KMO度量标准可知原有变量适合进行因子分析。提取因子公因子方差初始祝取人均GDP1.000.930人力资源指数1.000.722人均收入1.000.797人均净收入1.000.961EDUCATION1.000.847健康指数1.000.859提取方法:主成份丹析、表1—3解释的总方差成份初始特征值提取平方和载入矩转平方和载入合计方差的%翱只%合计方差的%合计方差的%13.32555.41155.4113.32555.4-1155.41-12.79846.63346.63321.79129.S45S5.2551.79129.845S5.2552.31738.62285.2553.4938.21093.4654.2644.40097.8655.0881.47499.3396.040.661100.000提取方法:主成份会析。表1-4表1-3和表1-4为因子方差表,提取因子后因子方差的值均很高,表明提取的因子能很好的描述这6个指标.方差分解表也表明前两个因子能够解释6个指标的85。255%。综合以上,提取前两个因子最好了。因子的命名解释

成借瓶FF成份12人均GDP人力资源指数人均收入人均净收入EDUCATION健康指数.832733780.394.692.460-.488.431-.434-.403.B07.805提取方位:主成份'a.已提取了2个成份。成份12人均GDP.960.092人力资源指数.341.778人均收入.887.105人均净收入.960.197EDUCATION.205.897健康指数-.099.921旋转成份连FT提取方法:主成粉‘旋转法:具有Kaiser标准化的正交旋转法*日•旋转在3次迭代后收敛*旋转法具有Kaiser^淮化的正哀旋转法*表1—6由表1-5、表1—交旋转法*旋转法具有Kaiser^淮化的正哀旋转法*表1—6由表1-5、表1—6可知,由旋转成份矩阵可以看出,经旋转后,因子便于命名和解释。因子1主要解释的是人均GDP、人均收入和人均净收入,可以命名为经济因子;而因子2主要解释的是其余三个指标,人力资源指数、EDUCATION和健康指数。可以命名为民生因子.因子分析要求,最后得到的因子之间没有相关性,而因子转换矩阵显示,两个因子相关可见,对因子进行旋转是完全有必要的.(4)计算因子得分成稔12人均GDP.362-.074人力资源指数.038.324人均收入.332-.059人均净收入.350-.025EDUCATION-.030.397健康指数-.151.445提取方;法:主成份皿竟转法具有厢湘标准化的正父旋转;去°构成担分-表1—7根据表1—7可写出以下因子得分函数:F1=0.362人均GDP+0.038人力资源指数+0.332人均收入+0.350人均净收入-0。030EDUCATION—0.151健康指数F2=-0。074人均GDP+0.324人力资源指数-0。059人均收入-0.025人均净收入+0。397EDUCATION+0.445健康指数计算综合得分。单击“转换一计算变量",新建输出变量,命名为“score分”并输入其计算公式,如图1-6所示。然后,新建一个变量“rank”,一次输入1到29。很清楚地可以对29个省进行评价。

图1—6region加PcapilslincomenelinceducaliohealcareFAC1_1FAC2_1Bcorerank伐152Q412B33719143455206344190323^52QD1102S530.S162353223&549651.9E781-.008911.052I-/:-638D51B2743B2E9942SB4B14B72S.20761393:K5705101.09463424566712D39.39662179616.764戒::61494188622129663787211.23716D42267D56103124.02370617S&6719.11湖1.29711崩&天:注81G449.13492924062131821.14196-B8936.377山44731Q25i42E417154.B1C4G3-.1D2611.2GBQD.32日n.251B3D.97400211586413B85-1.069022.52307.1B9-jj.3376777B39211EGB471Q2GB-.375TE1D20SDJD1fl53361B.3545。620483D4537.如907-.71633.ai11讨土3341377540281511569744-4585078107-.0212270143.1046991425W5137-.341196.54*9-.0313里七i.44274B.5133751766.邛7B3T?627322176-OB14门巨247571.3&325912315D7661-.7628778591-.1916|'产277232.S247911446275571-.12837-.14835-.21IE252155.7437H5130235S593-5330314022-2517制37032B.6531741609433891.35603-,2?9€3-.2Bl@4B2D535477D1.5195165332417-1.73S4E-3419细。4B4840351D10266395-.57065-.1605D-.36203963266541631136213932■22320-B2867-.37212376262033761537316423-.■54346-.3S&33-.<41225234426.31330996246621&■3B01209&1B-4623lin281&33.97330512(1B2B59-22-.65839-J3393-4624;|菲301354.51286312UB194915-.68093-J9772-.5025亡州155322.07明31103622时-61906-?75?B-5726192&U94315289D174131-99092-997S6-7627291D4.1B331910297117B-.52681-1.62277-.78282E357.94333299B7102B-.54077-1.6D0SB-.7829图1—7综合以上分析,可以认为①指标人均GDP、人均收入、人均净收入代表了发展状况中的经济特征,而指标人力资源指数、健康指数、教育则代表了发展状况中的民生特征②各省市的排序如图1—7所示,即为上海〉北京〉广东〉江苏〉浙江〉辽宁〉天津〉山东>四川〉河北〉福建〉湖』北>湖南〉黑龙江>河南〉广西〉安徽〉吉林〉海南〉云南〉新疆〉江西〉陕西>山西>内蒙〉贵州〉甘肃〉青海〉宁夏2、实验步骤:打开数据文件“某市工业企业效益指标.sav”.选择菜单“分析一降维一因子分析”,弹出“因子分析〃对话框.在对话框左侧的变量列表中选变量x1至乂7,进入“变量”框,如图2-1。单击“描述”按钮,弹出“因子分析:描述统计”对话框,在“统计量”中选“单变量描述性〃项,输出各变量的均数与标准差,“在相关矩阵”栏内选“系数〃,计算相关系数矩阵,并选“KMO和Bartlett的球型度检验”项,对相关系数矩阵进行统计学检验,如图2-2。4.图2—2单击“抽取”按钮,弹出“因子分析:抽取”对话框,选用“主成分〃方法提取因子,如图2-3。蛇国子分析:抽取-月析■相关性矩阵®◎协方差矩阵应)-输出S1未旋转的因子解近,SI碎石图旧]5.6.-抽取回基于特狂值匡}特征值大于3)=©囚子的固定数星要提取的因子QD=胃大收敛性迭代次数应};25图2—3单击“旋转”按钮,弹出“因子分析:旋转”对话框,在“方法”栏中选择“最大方差”进行因子正交旋转,如图2—4。单击“得分”按钮,弹出“因子分析得分”对话框,选择“回归”项估计因子得分系数,如图2-5.7.单击“确定”钮,得到输出结果。图2—4图2—52、实验结果考察原有变量是否适合进行因子分析回定帝产产佰宰因定变产利税军箕建们用牢贫立利税宰潦动资金周转宛空*入利税宰用笑固定攵产产借田IJILILI.650.656.66D-.054.585.493J35LI1.000.902.849-.265.90^.598汗•冬.Fl油车056.9021000.98B-106.767.339置釜卞]税阵.960.8J9.9881.00D-.103.683.2S6-.054-.265-.106-.1021.000-.321-.434销菖收入利聃.505.904.767.609-.3211.000.497-93329.265-顷1.330

表2-1显示原有变量的相关系数矩阵,可以看出大部分的相关系数都比较高各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。KMO和Barllett的检验取样足辱度的Kaiser-Meyer-Olkin度星*.朋5Bartlett的球形度管验近议卡方136.426df21Sig..000表2—2由表2—2可知,巴特利特球度检验统计量观测值为136。426,相应的概率p值接近0,如果显著性水平a为0.05,由于概率p值小于显著性水平a,应拒绝零假设,可以认为相关系数矩阵与单位阵有显著差异,同时KMO值为0。635,根据Kaiser给出的KMO度量标准可知原有变量适合进行因子分析。提取因子公因子方差初始提取固定资产产值率1.000.835固定资产利税率1.000.970资金利润率1.000.963资金利税率1.000.924流动资金周转天数1.000.774销也收入利税率1.000.762全员劳动生产率E元我1.000.696提取方法;主成份分析。表2—3解辉的总方差成份初始特征值提取平方和载入旋耳专平方和载入合计方差的%累我%含计方差的%合计方差的%翱乂%14.63866.25966.2594.63866.25966.2594.21660.23060.23021.28518.36084.6191.28518.3E084.6191.70724.39084.6193.5S75.37992.99S4.3885.54398.5415.0871.247997886.013.18099.9671.002.033100.000祝取方法己主成I身将析°表2-4表2—3和表2-4为因子方差表,提取因子后因子方差的值均很高,表明提取的因子能很好的描述这7个指标。方差分解表也表明前两个因子能够解释7个指标的84。619%.综合以上,提取前两个因子最好了。

因子的命名解释成份12国定资广广值率.889.213固定资产利税率.984-.028赞金利润率.943.272资金利税率.908.315流动赏金周转关数-.284.833销售收入利税率.062-.139至员岩动生广率元J人年).5S5-.594提取方法;主成粉-8.已提取了2个成份,旋转成隔炬PP成份12国定资产产值率.906.110园定资产利税率.910.376赞金利润率.978.080资生利动率.961.028流动宣金周转天数.030-.8^9销售假入利税率.756.436圭员券动生广率兄J人年).33E763提取方法;主成份-旋转法:具有Kaiser标准化的正交旋转法。a祚铐;fra*推皆出的融”表2—5成份苒拱瓶阵成份121.935.3552.355-.935提取方法:主成份,旋转法具有Kaiser标准化的正交旋转法+表2-6由表2-5、表2-6可知,由旋转成份矩阵可以看出,经旋转后,因子便于命名和解释.因子1主要解释的是固定资产产值率、固定资产利税率、资金利润率、资金利税率和销售收入利税率,可以命名为盈利能力因子;而因子2主要解释的是其余两个指标,流动资金周转天数、和全员劳动生产率。可以命名为资金和人力因子。因子分析要求,最后得到的因子之间没有相关性,而因子转换矩阵显示,两个因子相关.可见

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论