因子分析在CSI项目中的应用_第1页
因子分析在CSI项目中的应用_第2页
因子分析在CSI项目中的应用_第3页
因子分析在CSI项目中的应用_第4页
因子分析在CSI项目中的应用_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于因子分析在CSI项目中的应用第一页,共三十一页,2022年,8月28日因子分析的定义

在社会、政治、经济和医学等领域的研究中往往需要对反映事物的多个变量进行大量的观察,收集大量的数据以便进行分析,寻找规律。在大多数情况下,许多变量之间存在一定的相关关系。因此,有可能用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标称为因子。因子分析就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子反映原资料的大部分信息的统计学方法。对高维变量空间进行降维处理。第二页,共三十一页,2022年,8月28日

(1)因子变量的数量远少于原有的指标变量的数量,对因子变量的分析能够减少分析中的计算工作量。(2)因子变量不是对原有变量的取舍,而是根据原始变量的信息进行重新组构,它能够反映原有变量大部分的信息。

(3)因子变量之间不存在线性相关关系,对变量的分析比较方便。(4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。因子分析的特点第三页,共三十一页,2022年,8月28日

因子分析有两个核心问题:一是如何构造因子变量;二是如何对因子变量进行命名解释。因子分析有下面4个基本步骤。(1)确定待分析的原有若干变量是否适合于因子分析。(2)构造因子变量。(3)利用旋转使得因子变量更具有可解释性。(4)确定因子权重。因子分析的4个基本步骤第四页,共三十一页,2022年,8月28日

因子分析是从众多的原始变量中构造出少数几个具有代表意义的因子变量,这里面有一个潜在的要求,即原有变量之间要具有比较强的相关性。如果原有变量之间不存在较强的相关关系,那么就无法从中综合出能反映某些变量共同特性的少数公共因子变量来。因此,在因子分析时,需要对原有变量作相关分析。第一步:确定待分析变量是否适合于因子分析

第五页,共三十一页,2022年,8月28日

如果相关系数矩阵在进行统计检验中,大部分相关系数都小于0.3,并且未通过统计检验,那么这些变量就不适合于进行因子分析。(1)相关系数

r的取值在-1和+1之间。

r>0,正相关;r<0,负相关;r=0,不相关。

|r|>0.8,相关关系较强;|r|<0.3,相关关系较弱。(2)统计假设检验即显著性检验显著性差异就是实际样本统计量的取值和假设的总体参数的差异超过了通常的偶然因素的作用范围,说明还有系统性的因素发生作用,因而就可以否定某种条件不起作用的假设。如果从相关系数r=0的总体中取得某r值的概率P>0.05,我们就接受假设,认为此r值的很可能是从此总体中取得的。因此判断两变量间无显著关系;如果取得r值的概率P≤0.05或P≤0.01,我们就在α=0.05或α=0.01水准上拒绝检验假设,认为该r值不是来自ρ=0的总体,而是来自ρ≠0的另一个总体,因此就判断两变量间有显著关系。

SPSS将自动计算简单相关系数、t检验统计量得观测值和对应的概率P值方法一:简单相关系数第六页,共三十一页,2022年,8月28日1.巴特利特球形检验(BartlettTestofSphericity)如果统计量的观测值比较大,且对应的P值小于给定的显著性水平r,则相关系数矩阵原有变量存在相关性,适合因子分析;

2.KMO(Kaiser-Meyer-Olkin)检验KMO统计量的取值范围为0—1,KMO大于等于0.9,非常适合,0.8适合,0.7一般,0.6不太适合,0.5以下,极不适合。方法二:KMO和巴特利球形检验统计值的观测值对应的概率PKMO统计量第七页,共三十一页,2022年,8月28日

因子分析中有多种确定因子变量的方法,如基于主成分模型的主成分分析法和基于因子分析模型的主轴因子法、极大似然法、最小二乘法等。其中基于主成分模型的主成分分析法是使用最多的因子分析方法之一。第二步:构造因子变量第八页,共三十一页,2022年,8月28日第三步:决定旋转方法

在因子提取时通常提取初始因子后,对因子无法做有效的解释,(因子Fi不能典型代表任何一个原有变量Xi)为了更好的解释因子,可通过因子旋转的方式使一个变量只在尽可能少的因子上有比较高的载荷(Aij)。因子旋转方式有两种:正交旋转和斜交选择。为能继续保持新生成的因子的不相关性,一般选择正旋转。

方差最大法、四次方最大法、等量最大法第九页,共三十一页,2022年,8月28日第四步:确定因子权重

每个公共因子对原始数据的解释能力,称为该因子的贡献率,常用该因子所解释的总方差来衡量,它等于和该因子有关的因子负荷的平方和,实际中常用相对指标来表示,相对指标体现公共因子的相对重要性,即每个公共因子所解释的方差占所有变量总方差的比例。第十页,共三十一页,2022年,8月28日因子分析的定义和数学模型9.1SPSS中实现过程9.2SPSS结果解释9.2目录第十一页,共三十一页,2022年,8月28日

实现步骤选择命令:Analyze->DataReducation->Factor图1在菜单中选择“Factor”命令打开命令窗口第十二页,共三十一页,2022年,8月28日

图2“FactorAnalysis”对话框

实现步骤:把参与因子分析的变量选到Variable框中选择参与因子分析的样本,把作为条件变量的变量指定到该处,只有满足条件的样本数据才能参与因子分析选择参与因子分析的变量第十三页,共三十一页,2022年,8月28日

图3“FactorAnalysis:Descriptives”对话框

实现步骤:在图2窗口中单击Descriptives(输出结果)按钮打开如下对话框1.指定输出哪些基本统计量(1).各个变量的基本描述统计量(均值、标准差、样本量)(2).初始因子分析结果(因子提取前分析变量的公因子方差)2.检验变量是否适合因子分析,列举了三种常用方法确定待分析的原有若干变量是否适合于因子分析第十四页,共三十一页,2022年,8月28日图4“FactorAnalysis:Extraction”对话框

实现步骤:在图2窗口中单击Extraction

按钮打开如下对话框因子提取选择项1.因子提取方法选择项2.因子提取的依据Correlationmatrix相关系数矩阵Covariancematrix协方差阵3.输出与因子提取有关的信息Unratotedfactorsolution输出未旋转的因子载荷矩阵Screeplot输出因子的碎石图4.选择如何确定因子数目Eigenvaluseover大于该值得特征根Numberoffactors提取因子的数目第十五页,共三十一页,2022年,8月28日

图5“FactorAnalysis:Rotation”对话框因子旋转方法的选择

实现步骤:在图2窗口中单击Rotation按钮打开如下对话框1.选择因子旋转方法None不旋转Varimax方差最大法Quartimax四次方最大法Exqumax等量最大法其他为斜交旋转法2.指定输出与因子旋转相关的信息Rotatedsolution表示输出旋转后的因子载荷矩阵Loadingplot(s)表示输出旋转后的因子载荷散点图第十六页,共三十一页,2022年,8月28日图6“FactorAnalysis:FacforScores”对话框计算因子得分的方法

实现步骤:在图2窗口中单击Scores按钮打开如下对话框1.表示将因子得分保存到spss变量中,生成几个因子便产生几个spss变量。在Method中指定计算因子得分的方法Regression为回归法,系统默认2.输出因子得分系数矩阵第十七页,共三十一页,2022年,8月28日图7“FactorAnalysis:Options”对话框缺失值的处理方式及因子载荷矩阵的输出方法2.指定因子载荷矩阵的输出方式Sortedbysize表示以第一因子得分的降序输出因子载荷矩阵Suppressabsolutevalueslessthan输入一个数值,表示只输出大于该值的因子载荷第十八页,共三十一页,2022年,8月28日因子分析的定义和数学模型9.1SPSS中实现过程9.2SPSS结果解释9.2目录第十九页,共三十一页,2022年,8月28日结果1:原有变量的相关系数矩阵结果2:巴特利特球检验和KMO检验结果3:因子分析的初始解结果4:因子解释原有变量方差的情况结果5:因子碎石图结果6:因子载荷矩阵结果7:旋转后的因子载荷矩阵输出结果列表按照第二部分的操作命令,得到如上7个结果,下面将分别对7个结果进行解读第二十页,共三十一页,2022年,8月28日案例分析:影响网点业务发展的因素对影响网点业务发展的24个指标进行因子分析,样本来源:243个网点评价第二十一页,共三十一页,2022年,8月28日考察原有变量是否适合进行因子分析(1)具体操作如图2和图3:借助于相关系数矩阵、巴特利特球状检验和KMO检验大部分的相关系数值大于0.3大部分的检验值小于0.05(结果1:原有变量的相关系数矩阵)第二十二页,共三十一页,2022年,8月28日结果2:巴特利特球检验和KMO检验检验统计值的观察值较大概率P小于0.05假设检验显著性水平KMO大于0.8考察原有变量是否适合进行因子分析(2)由此得出原有变量适合进行因子分析第二十三页,共三十一页,2022年,8月28日结果3:因子分析的初始解(一)按照图4操作,得到因子分析的初始解如右表所示,Initial列表示如果对原有24个变量提取所有特征根,原有变量的所有方差都可被解释,变量的共同方差均为1,第二列表示采用主成分分析法提取因子并选取特征根值大于1的特征根,可以看到大部分的变量有60%左右的信息可被因子解释,网点周边资源变量的信息丢失较为严重(接近60%)因此,本次因子提取的总体效果并不理想,该结果未达到因子分析的目标(降维)重新制定提取特征根的标准,指定提取8个因子(Numberoffactors处输入8),分析结果如下表:第二十四页,共三十一页,2022年,8月28日结果3:因子分析的初始解(二)重新制定提取特征根的标准,在图4中指定提取8个因子(Numberoffactors处输入8),分析结果右表:由表可知,此时24个变量的共同方差均较高,各个变量的信息丢失都较少,因此本次因子提取的总体效果较理想。第二十五页,共三十一页,2022年,8月28日结果4:因子解释原有变量方差的情况第一列为因子编号,以后三列组成一组,每组中数据项的含义依次是特种根值、方差贡献率、累计方差贡献率初始因子解的情况因子解的情况最终因子解的情况(因子旋转后所得)因子旋转后,累计方差比没有改变(76.174),重新分配了各个因子解释原有变量的方差,改变了各因子方差贡献,使得因子更容易理解。(比如:第一个因子旋转前后对总方差的解释度由42.031变为15.602)按照图5操作,按照方差最大法旋转第二十六页,共三十一页,2022年,8月28日结果5:因子碎石图右图中,横坐标为因子数目,纵坐标为特征值。由图可见,第一个因子的特征值很高,对解释原有变量的贡献最大,第8个以后的因子特征值都较小,对解释原有变量的贡献很小,已经成为可被忽略的碎石,因此提取8个因子是适合的。第二十七页,共三十一页,2022年,8月28日结果6:因子载荷矩阵从表中可以看到,变量在第1个因子上的负荷都很高,意味着它们与第1个因子的相关程度高,其余因子与变量的相关性相对较小,另外可以看到,这8个因子的实际含义比较模糊,所以采用了方差最大法对因子载荷矩阵进行旋转,得到结果7,如下页所示:第二十八页,共三十一页,2022年,8月28日结果7:旋转后的因子载荷矩阵分别将在每个因子上的载荷较高的变量归为一起。因为输出时使用了以第一因子得分的降序输出因子载荷矩阵,所以前6个变量为第一个因子的变量,依次类

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论