




已阅读5页,还剩57页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2020/4/27,1,目录上页下页返回结束,6.4因子分析的上机实现,在上一章中,我们用SPSS的FactorAnalysis模块实现了主成分分析,实际上,FactorAnalysis主要是SPSS软件进行因子分析的模块,由于主成分分析与因子分析(特别是因子分析中的主成分法)之间有密切的关系,SPSS软件将这两种分析方法放到同一分析模块中。下面我们先用SPSS软件自带的数据说明FactorAnalysis模块进行因子分析的方法,然后给出一个具体案例。为了与主成分分析进行比较,我们此处仍延用SPSS自带的Employeedata.sav数据集。,【例6.1】数据集Employeedata.sav中各变量解释说明见上一章主成分分析,用FactorAnalysis模块进行因子分析。,2,目录上页下页返回结束,6.4因子分析的上机实现,打开Employeedata.sav数据集并依次点选AnalyzeDataReductionFactor进入FactorAnalysis对话框,选取educ、salary、salbegin、jobtime、prevexp变量进入Variables窗口。,点击对话框下侧的Extraction进入Extration对话框,在Method选项框我们看到SPSS默认是用主成分法提取因子,在Analyze框架中看到是从分析相关阵的结构出发求解公因子。点Continue按钮继续。如果这样交由程序运行的话,将得到与上一章输出结果5-1同样的结果,其中包括公因子解释方差的比例,因子载荷矩阵(即ComponentMatrix)等。选中Displayfactorscorecoefficientmatrix复选框,我们在主成分分析中也选了该选项,它要求SPSS输出因子得分矩阵,即标准化主成分(因子)用原始变量线性表示的系数矩阵。点Continue继续,点OK按钮运行,可以得到如下输出结果6-1:,3,目录上页下页返回结束,6.4因子分析的上机实现,2020/4/27,中国人民大学六西格玛质量管理研究中心,4,目录上页下页返回结束,6.4因子分析的上机实现,2020/4/27,5,目录上页下页返回结束,6.4因子分析的上机实现,2020/4/27,6,目录上页下页返回结束,6.4因子分析的上机实现,componentscorecoefficientmatrix(因子得分系数矩阵)是用原始变量表示标准化主成分(公因子)的系数矩阵,其关系式已在上一章给出,此处不再赘述。这里想说明的是用主成分求解公因子时因子得分系数与因子载荷之间的关系。如上面表中因子得分系数中第一个元素为0.342,它与第一主成分的方差2.477,因子载荷矩阵中第一个元素0.846之间有如下关系式:,2020/4/27,7,目录上页下页返回结束,6.4因子分析的上机实现,此处之所以是乘以2.477而不是它的平方根是因为此处主成分已经经过标准化了。同理有,可见用主成分法进行因子分析与主成分分析是完全可逆的,由此,有些研究者也用主成分求解因子分析的结果来进行主成分分析。,实际上,在进行因子分析之前,我们往往先要了解变量之间的相关性来判断进行因子分析是否合适;对此,进入FactorAnalysis对话框后,点击下方的Descriptives按钮,进入Descriptives对话框,在Statistics框架中选择UnivariateDescriptives会给出每个变量的均值、方差等统计量的值,在下部CorrelationMatrix框架中,选中Coefficients选项以输出原始变量的相关矩阵,选中Significancelevels以输出原始变量各相关系数的显著性水平。CorrelationMatrix框架还有其他一些选项来帮助我们进行判断,此处不再详细说明,点击Continue按钮继续,点击OK运行,可以得到如下结果6-2:,2020/4/27,8,目录上页下页返回结束,6.4因子分析的上机实现,输出结果6.2:,2020/4/27,9,目录上页下页返回结束,6.4因子分析的上机实现,由上面结果知原始变量之间有较强的相关性,进行因子分析是合适的。得到初始载荷矩阵与公因子后,为了解释方便往往需要对因子进行旋转,设置好其他选项后点击FactorAnalysis对话框下部的Rotation按钮,进入Rotation对话框,在Method框架中可以看到SPSS给出了多种进行旋转的方法,系统默认为不旋转。可以选择的旋转方法有Varimax(方差最大正交旋转)、DirectOblimin(直接斜交旋转)、Quartmax(四次方最大正交旋转)、Equamax(平均正交旋转)及Promax(斜交旋转),选中Varimax选项,此时,Display框架中Rotatedsolution选项处于活动状态,选中该选项以输出旋转结果。点击ContunueOK运行,除上面的结果外还可得到如下输出结果6-3:,2020/4/27,10,目录上页下页返回结束,6.4因子分析的上机实现,输出结果6.3(1),2020/4/27,11,目录上页下页返回结束,6.4因子分析的上机实现,输出结果6.3(2),2020/4/27,12,目录上页下页返回结束,6.4因子分析的上机实现,输出结果6.3(3),2020/4/27,13,目录上页下页返回结束,6.4因子分析的上机实现,由结果可以看到,旋转后公共因子解释原始数据的能力没有提高,但因子载荷矩阵及因子得分系数矩阵都发生了变化,因子载荷矩阵中的元素更倾向于0或者正负1。有时为了公因子的实际意义更容易解释,往往需要放弃公因子之间互不相关的约束而进行斜交旋转,最常用的斜交旋转方法为Promax方法,对此例进行斜交旋转,可得到如下输出结果6-4:,2020/4/27,14,目录上页下页返回结束,6.4因子分析的上机实现,输出结果6.4:(1),2020/4/27,15,目录上页下页返回结束,6.4因子分析的上机实现,输出结果6.4:(2),2020/4/27,16,目录上页下页返回结束,6.4因子分析的上机实现,输出结果6.4:(3),2020/4/27,17,目录上页下页返回结束,6.4因子分析的上机实现,可以看到,与正交旋转不同,斜交旋转的输出结果中没有RotatedComponentMatrix而代之以PatternMatrix和StructureMatrix,这里,PatternMatrix即是因子载荷矩阵,而StructureMatrix为公因子与原始变量的相关阵,也就是说,在斜交旋转中,因子载荷系数不再等于公因子与原始变量的相关系数。上面三个表格存在如下关系:,StructureMatrix=PatternMatrixCorrelationMatrix,2020/4/27,18,目录上页下页返回结束,6.4因子分析的上机实现,为了得到因子得分值,进行如下操作:在FactorAnalysis对话框,点击下方的Scores按钮,进入FactorScores(因子得分)对话框,选中Saveasvariables复选框,即把原始数据各样本点的因子得分值存为变量,可以看到系统默认用回归方法求因子得分系数(Method框架中Regression选项被自动选中),保留此设置。在此例中,我们还选中了Saveasvariables复选框,这一选项要求输出估计的因子得分值,该结果出现在数据窗口。在数据窗口,我们可以看到在原始变量后面出现了三个新的变量,变量名分别为fac1_1,fac2_1,fac3_1。这三个变量即为各个样品的第一公因子、第二公因子、第三公因子的得分。我们在前面的分析中曾提过这些得分是经过标准化的,这一点可以用下面的方法简单的验证:,2020/4/27,19,目录上页下页返回结束,6.4因子分析的上机实现,依次点选AnalyzeDescriptiveStatisticsDescriptives进入Descriptives对话框,选中fac1_1,fac2_1,fac3_1三个变量,点击OK按钮运行,可得到如下结果6-5:,输出结果6-5:(1),2020/4/27,20,目录上页下页返回结束,6.4因子分析的上机实现,可以看到,三个变量的标准差均为1(此处由于舍入原因,变量的均值不绝对等于0而是有细微差别)。得到各个样品的因子得分后,我们就可以对样本点进行分析,如用因子得分值代替原始数据进行归类分析或是回归分析等。同时,我们还可以在一张二维图上画出各数据点,描述各样本点之间的相关关系。依次点选GraphsScatter进入Scatterplot对话框,选择Simple按Define按扭,在弹出的SimpleScatterplot对话框中,分别选择fac1_1,fac2_1作为X轴与Y轴,点击OK交由程序运行,可得如下散点图:,2020/4/27,21,目录上页下页返回结束,6.4因子分析的上机实现,输出结果6.5:(2),2020/4/27,22,目录上页下页返回结束,6.4因子分析的上机实现,由此可以直观地描述原始数据的散布情况,为了研究需要,还可以很方便地输出第一因子与第三因子,第二因子与第三因子的散点图或同时生成三个因子的散点图,这只需选择不同的变量或图形类型即可,在此不再详述。,2020/4/27,23,目录上页下页返回结束,6.4因子分析的上机实现,【例6.2】(数据见表5-9)对企业经济效益指标体系的八项指标建立因子分析模型。(详细因子分析上机实现见例6-3)由spss输出方差解释表及碎石图可看出,前三个特征值较大,其余五个特征值均较小。前三个公共因子对样本方差的贡献和为87.085%,于是我们选取3个公共因子。,2020/4/27,24,目录上页下页返回结束,6.4因子分析的上机实现,TotalVarianceExplained,ExtractionMethod:PrincipalComponentAnalysis.,2020/4/27,25,目录上页下页返回结束,6.4因子分析的上机实现,2020/4/27,26,目录上页下页返回结束,6.4因子分析的上机实现,因子载荷的估计如下:,ExtractionMethod:PrincipalComponentAnalysis.a3componentsextracted.,2020/4/27,27,目录上页下页返回结束,6.4因子分析的上机实现,由上表可得出企业经济效益指标体系的因子分析模型(特殊因子忽略不计):,2020/4/27,28,目录上页下页返回结束,6.4因子分析的上机实现,2020/4/27,29,目录上页下页返回结束,6.4因子分析的上机实现,由因子分析模型可知,第一个主因子主要由固定资产利税率,资金利税率,销售收入利税率,资金利税率这四个指标所决定,这四个指标在主因子上的载荷均在0.85以上,它代表着企业经济活动中的盈利能力,而且主因子对的方差贡献已达60%之多,所以更说明是企业经济效益指标体系中的主要方面。此外,固定资产产值率对的贡献相对也较大,这也是反映企业经济活动的盈利能力的主要指标。企业要提高经济效益,就要在这个主因子方面狠下功夫。,2020/4/27,30,目录上页下页返回结束,6.4因子分析的上机实现,第二个主因子主要由流动资金周转天数所决定,说明企业经济活动中流动资金周转快慢与企业的生产经营及市场信息息息相关。企业要提高经济效益就要在产品结构的调整上想办法,要生产适销对路的产品,提高本企业产品的市场占有率。第三个主因子主要反映了企业的产值和能耗,产值和能耗反映的是投入与产出的关系。企业要提高经济效益就不能忽视降低生产成本。,2020/4/27,31,目录上页下页返回结束,6.4因子分析的上机实现,例6.3中心城市的综合发展是带动周边地区经济发展的重要动力。在我国经济发展进程中,各个中心城市一直是该地区经济和社会发展的“引路者”。因而,分析评价全国35个中心城市的综合发展水平,无论是对城市自身的发展,还是对周边地区的进步,都具有十分重要的意义。下面应用因子分析模型,选取反映城市综合发展水平的12个指标作为原始变量,运用spss软件,对全国35个中心城市的综合发展水平作分析评价。,1.原始数据及指标解释。我们选取了反映城市综合发展水平的12个指标,其中包括8个社会经济指标,分别为:,2020/4/27,32,目录上页下页返回结束,6.4因子分析的上机实现,非农业人口数(万人)工业总产值(万元)货运总量(万吨)批发零售住宿餐饮业从业人数(万人)地方政府预算内收入(万元)城乡居民年底储蓄余额(万元)在岗职工人数(万人)在岗职工工资总额(万元),4个城市公共设施水平的指标:人均居住面积(平方米)每万人拥有公共汽车数(辆)人均拥有铺装道路面积(平方米)人均公共绿地面积(平方米),2020/4/27,33,目录上页下页返回结束,6.4因子分析的上机实现,指标的选取参考了中国城市统计年鉴中指标的设置。数据来源于中国城市统计年鉴(2004)。数据见表6-1。,表6-1,2020/4/27,34,目录上页下页返回结束,6.4因子分析的上机实现,续表6-1,2020/4/27,35,目录上页下页返回结束,6.4因子分析的上机实现,续表6-1,2020/4/27,36,目录上页下页返回结束,6.4因子分析的上机实现,续表6-1,2020/4/27,37,目录上页下页返回结束,6.4因子分析的上机实现,续表6-1,2020/4/27,38,目录上页下页返回结束,6.4因子分析的上机实现,续表6-1,2020/4/27,39,目录上页下页返回结束,6.4因子分析的上机实现,续表6-1,2020/4/27,40,目录上页下页返回结束,6.4因子分析的上机实现,2.计算运行结果,将标准化后的数据导入到spss软件,依次点选Analyze-DataReduction-Factor进入FactorAnalysis对话框。把12个指标变量选入variables中,点击extraction按钮,在method选项中选择principalcomponents(这时,因子分析等同于主成分分析,如果是主成分分析,则只能选择此项),点击continue按钮,回到主对话框点击ok。见图6-2.,2020/4/27,41,目录上页下页返回结束,6.4因子分析的上机实现,图6-2,2020/4/27,42,目录上页下页返回结束,6.4因子分析的上机实现,2020/4/27,43,目录上页下页返回结束,6.4因子分析的上机实现,2020/4/27,44,目录上页下页返回结束,6.4因子分析的上机实现,此时得到的未旋转的公共因子的实际意义不好解释,因此,对公共因子进行方差最大化正交旋转。在factorAnalysis对话框中,点击rotation按钮,进入rotation对话框,选中varimax进行方差最大化正交旋转(若是主成分分析就选择none)。得输出结果6-7.,2020/4/27,45,目录上页下页返回结束,6.4因子分析的上机实现,2020/4/27,46,目录上页下页返回结束,6.4因子分析的上机实现,2020/4/27,47,目录上页下页返回结束,6.4因子分析的上机实现,图6-3,2020/4/27,中国人民大学六西格玛质量管理研究中心,48,目录上页下页返回结束,6.4因子分析的上机实现,2020/4/27,中国人民大学六西格玛质量管理研究中心,49,目录上页下页返回结束,6.4因子分析的上机实现,2020/4/27,50,目录上页下页返回结束,6.4因子分析的上机实现,得到运行结果并计算综合得分,结果见表6-2:,表6-2:,2020/4/27,51,目录上页下页返回结束,6.4因子分析的上机实现,续表6-2:,2020/4/27,52,目录上页下页返回结束,6.4因子分析的上机实现,续表6-2:,2020/4/27,53,目录上页下页返回结束,6.4因子分析的上机实现,续表6-2:,2020/4/27,54,目录上页下页返回结束,6.4因子分析的上机实现,以因子得分为x轴,因子得分为y轴,画出各城市的因子得分如下,见图6-5:,图6-5,2020/4/27,55,目录上页下页返回结束,6.4因子分析的上机实现,其操作步骤如下:在spss中点选graphs,在出来的下拉菜单中点击scatter,进入scatterplot对话框,选择simple,点击define按钮,见图6-6:,图6-6,2020/4/27,56,目录上页下页返回结束,6.4因子分析的上机实现,在弹出的simplescatterplot对话框中,分别选择fac1_1,fac2_1作为x轴与y轴,点击ok,即可得到如上因子得分图。操作图见图6-7:,图6-7:,2020/4/27,57,目录上页下页返回结束,6.4因子分析的上机实现,3.结果分析。由旋转后的因子载荷矩阵可以看出,公共因子在(非农业人口数)、(工业总产值)、(货运总量)、(批发零售住宿餐饮业从业人数)、(地方政府预算内收入)、(城乡居民年底储蓄余额)、(在岗职工人数)、(在岗职工工资总额)上的载荷值都很大,是反映城市规模的指标,反映城市工业发展规模,反映城市第三产业的发展规模,是政府作为国家的管理者和国有资产的所有者而获得的收入,则在一定程度上反映了居民的收入水平,而在我国现今的收入分配格局下,政府和居民是再分配收入的获得大户,,2020/4/27,58,目录上页下页返回结束,6.4因子分析的上机实现,因而,则在一定程度上反映了城市的国民收入水平,因而为反映城市规模及经济发展水平的公共因子,在这个因子上的得分越高,城市经济发展水平越高,城市规模越大;公共因子由于在(每万人拥有公共汽车数)、(人均拥有铺装道路面积)、(人均公共绿地面积)上的载荷较大,是反映城市的基础设施水平的公共因子,在此因子上的得分则反映了一个城市的基础设施水平;公共因子仅在(人均居住面积)上有较大的载荷,是反映城市居民住房条件的公共因子。,2020/4/27,59,目录上页下页返回结束,6.4因子分析的上机实现,有了各个公共因子合理的解释,结合各个城市在三个公共因子上的得分和综合得分,就可对各中心城市的综合发展水平进行评价了。在城市经济规模因子上得分最高的前五个城市依次是上海、北京、广州、天津和重庆,其中,上海的得分为3.58,北京的为3.37,远高于其他城市,这就是说就城市经济发展规模而言,上海、北京是我国最大的城市,且其规模远大于其他城市。城市规模较小,经济发展相对较慢的城市有西宁和银川,而海口由于城市规模小,在上的得分也较低。深圳、广州和南京在上的得分较高,而重庆、武汉得分较低,说明深圳、广州、南京的城市基础设施在全国是较好
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 室内钓鱼馆管理制度
- 家属等候区管理制度
- 库房门进出管理制度
- 形象岗卫生管理制度
- 影像科台账管理制度
- 微型消防台管理制度
- 快消品应急管理制度
- 快餐店后厨管理制度
- 总分包劳务管理制度
- 患者等候室管理制度
- 诺如病毒感染暴发调查和预防控制技术指南(2023版)
- 发行企业债法律尽职调查之访谈问题清单模版
- QData数据库一体机方案介绍
- 综合实践活动课《做凉拌菜》优质教案、教学设计、课堂实录
- 化工仓储管理系统方案
- 2021-2022学年贵州省黔东南州高一下学期期末文化水平测试数学试题【含答案】
- 四川省文化和旅游企业安全生产管理责任清单参考模板(1.0版)
- 疾病预防控制体系建设与发展
- 河南省开封市体育中心PPP项目案例分析
- 基于UG NX 5.0的箱体零件的数控加工
- Q_SLB0402-2005 产品钢印及标记移植
评论
0/150
提交评论