因素分析方法_第1页
因素分析方法_第2页
因素分析方法_第3页
因素分析方法_第4页
因素分析方法_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于因素分析方法因素分析——FactorAnalysis系统分析与决策的四个进程:对系统进行描述性分析解析性分析预测性研究系统决策 因素分析法属于描述性分析,它能保证在数据信息损失最小的前提下,从大规模的原始数据群中,迅速将重要的信息提取出来,将高维的数据进行降维处理,迅速的揭示出系统中的因子结构,使人们对系统达到尽可能充分的认识,提高决策者的洞察力和分析效率。又称作因子分析。第2页,共20页,2024年2月25日,星期天因子分析 因子分析是通过变量或样本的相关系数矩阵内部结构的研究,找出能控制所有变量的少数几个随机变量去描述多个变量之间的相关关系。即将观察变量分类,将相关性较高的、联系较密切的、包含重复信息较多的变量分在同一类中,使不同类的变量之间的相关性较低,每类变量代表了一个本质因子或基本结构。因子分析就是寻找系统中这种不可观测的因子或结构的方法。第3页,共20页,2024年2月25日,星期天因子分析 在许多实际问题中,涉及的变量众多,各变量间还存在错综复杂的相关关系,这时最好能从中提取少数综合变量,这些综合变量彼此不相关,是不可测的潜在因素,但对观测变量的变化起支配作用,且包含原变量提供的大部分信息。因子分析就是为解决这一问题提供的统计分析方法。 例如:P159东西部地区各主成份的提取第4页,共20页,2024年2月25日,星期天因子分析的目的和任务目的:

寻求变量的基本结构、简化观测系统,即减少变量维数。用一个变量子集来解释整个问题。主要目的是研究一种假设的结构,用m(m<p)个假设的公共因子来解释和说明p个变量之间的相互依赖结构及其复杂关系。任务:

寻找共性因素,且能解释各主因子的意义第5页,共20页,2024年2月25日,星期天主成份分析主成分分析只是一种中间手段,其背景是研究中经常会遇到多指标的问题,这些指标间往往存在一定的相关,直接纳入分析不仅复杂,变量间难以取舍,而且可能因多元共线性而无法得出正确结论。主成分分析的目的就是通过线性变换,将原来的多个指标组合成相互独立的少数几个能充分反映总体信息的指标,便于进一步分析。第6页,共20页,2024年2月25日,星期天模型形式1.1公共因子与特殊因子 从总体中提取的综合变量:F1,F2,…,Fm(m<p)称为(总体的)公共因子。一般来说,公共因子不可能包含总体的所有信息,每个变量Xi除了可以由公共因子解释的那部分外,总还有一些公共因子解释不了的部分,称这部分为变量Xi的特殊因子,记为:

i。 故因子模型描述为:变量Xi的信息=公共因子可以表达部分

公共因子不可表达部分 目前,公共因子可以表达的部分由公共因子的线性组合表示。即上面的因子模型可以写成以下的形式:第7页,共20页,2024年2月25日,星期天1.2正交因子模型 其中m<p,F1,F2,…,Fm称为所有变量的公共因子;

i称为变量Xi的特殊因子。模型假设:公共因子是互相不相关的。特殊因子和公共因子不相关。

第8页,共20页,2024年2月25日,星期天1.3因子载荷矩阵1.矩阵A称为因子载荷矩阵(componentmatrix)系数aij称为变量Xi在因子Fj上的载荷(loading)。即变量Xi在公共因子Fj上的载荷aij就是Xi与Fj的相关系数。反映公共因子对观察变量的影响程度。因子载荷越高,表明该因子包含原有指标的信息量越多。2.载荷矩阵的估计:主成分法。

主成分法是估计载荷矩阵的一种方法,由于其估计结果和变量的主成分仅相差一个常数倍,因此就冠以主成分法的名称。学习的时候,不要和主成分分析混为一谈。主成分法是SPSS系统默认的方法,在一般情况下,这是比较好的方法。以数据“应征人员”为例,按特征值大于1提取公共因子。在用不同方法获得因子载荷时,公共因子对总体方差的贡献率以主成分法为最高:第9页,共20页,2024年2月25日,星期天第二节变量的共同度与因子的方差贡献率2.1变量的共同度定义载荷矩阵A的第i行元素的平方和:称为变量Xi的共同度(communality)。共同度表示公共因子在多大的程度上解释变量Xi。2.2公共因子的方差贡献率定义载荷矩阵A第j列的平方和:称为因子Fj对总体的贡献(initialeigenvalues)。第10页,共20页,2024年2月25日,星期天共性方差:

也称方差贡献率,是用某个公共因子占总方差的百分比来说明共性因素的对观测变量总体的作用大小。公共因子个数的选择应考虑:因子所能解释的方差比率或贡献率;与利用有关专业知识所得结果的合理一致性通过这几种途径和手段对研究结果给予合理解释的可能性和可靠性。 一般,所选公共因子的个数应保证使其方差累计贡献率大于85%,且主成份个数与变量个数的比值越小越好。第11页,共20页,2024年2月25日,星期天第三节方差最大正交旋转3.1因子旋转的意义1.正交因子模型只是一个数学模型,所得的因子在专业上不一定能反映问题的实质,或者说:因子作为一个综合变量,其专业意义在许多情况下不容易解释。因子旋转就是针对这一问题,提出的一种改进的方法。2.因子旋转的依据:因子模型的不唯一性。

正是由于因子模型的不唯一性,如果模型不适合专业解释,那么作一个正交变换T(即因子旋转),在新模型中再去寻找因子的专业解释。经转换后的公共因子具有最大的载荷离散总平方和D。由此确定的因子载荷矩阵B,对每个公共因子来说,载荷最为分散,因此比较容易对因子的专业意义作出解释。第12页,共20页,2024年2月25日,星期天第四节因子得分4.1因子得分函数 因子模型将总体中的原有变量分解为公共因子与特殊因子的线性组合: 按照这个思路,也可以把每个公共因子表示成原变量的线性组合: 称这个线性表达式为因子得分函数。用它可以计算出每个观察值在各公共因子上的取值,从而在一定程度上解决了公共因子不可观察的问题。获得因子得分函数的关键问题是怎样估计参数bj1,bj2,…,bjp。第13页,共20页,2024年2月25日,星期天*4.2因子得分的估计(Thompson方法) 根据回归分析中最小二乘法,应有: 但是,是不可观察的。因此上述公式尚不能给出因子得分函数的系数估计。在总体变量标准化的条件下,根据正交因子模型的假设是总体与因子的样本相关系数,所以可以用因子载荷矩阵A的第j列代替。第14页,共20页,2024年2月25日,星期天第五节KMO检验与Bartlett球形检验5.1因子分析对样本的要求 和任何统计分析问题一样,因子分析也要求样本具有一定的容量。这从两个方面来说:从变量个数p考量,则样本容量n应有n

5p;即使这样,样本容量也不能太少,一般应在100以上。以上要求在实际问题中往往都达不到。这时可以适当放宽要求,结合检验来判断结果的可靠性。第15页,共20页,2024年2月25日,星期天5.2因子分析可行性与效果检验1.Bartlett球形检验检验各变量是否独立,通过相关阵是否单位阵来判断。只有在原假设:各变量相互独立被拒绝,因子分析才能进行。2.KMO检验检查各变量间的偏相关性,用来判断因子分析效果:0≤KMO≤1。通常使用的标准是:当KMO

0.7,因子分析效果较好,越大越好 当KMO<0.5,此时不适合用因子分析法。第16页,共20页,2024年2月25日,星期天5.3关于因子的解释 因子分析得到的公共因子应该可以解释,即有实际意义。否则,就应该重新设计原始变量集合。第17页,共20页,2024年2月25日,星期天第六节实例——东西部经济发展因子分析准备数据选择因素定性分析收集数据

工业农业GDP投资自然资源……定义变量

注意因素不等于变量,变量必为等间隔测度或比率的数值型,用于计算彼此间的相关系数。数据要求

注意变量的标准化、归一化、无量纲化处理,总量与相对量问题等。第18页,共20页,2024年2月25

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论