2016暑期数模培训—因子分析.ppt_第1页
2016暑期数模培训—因子分析.ppt_第2页
2016暑期数模培训—因子分析.ppt_第3页
2016暑期数模培训—因子分析.ppt_第4页
2016暑期数模培训—因子分析.ppt_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,2016暑期数学建模培训因子分析,2016年7月31日,数学系,DepartmentofMathematics,一、什么是因子分析,因子分析也是一种降维、简化数据的技术。它通过研究众多原始变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个抽象的变量来表示其基本的数据结构。这几个抽象的变量被称作因子,能反映原来众多变量的主要信息。原始变量是可观测的显在变量,而因子一般是不可观测的潜在变量。因子分析在某种程度上可以被看成是主成分分析的推广和扩展。,一、什么是因子分析,因子分析思想最早由英国心理学家斯皮尔曼在1904年发表的一篇文章开始。他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,住住其他各科成绩也比较好,从而推想是否存在某些潜在的公共因子,或某些一般智力条件影响着学生的学习成绩。在商业企业的形象评价中,消费者可以通过一系列指标构成的一个评价指标体系,评价百货商场各个方面的优劣。但消费者真正关心的只是三个方面:商店的环境、商店的服务和商品的价格。这三个方面除了价格外,商店的环境和服务质量,都是客观存在的、抽象的影响因素,都不便于直接测量,只能通过其他具体指标进行间接反映。因子分析就是一种通过显在变量找出和测评潜在变量,通过具体指标测评抽象因子的统计分析方法。,二、潜在因子,因子分析的过程就是找寻出隐藏在一组测量到的变量中的些最基本的但又无法直接测量到的潜在变量或潜在因子或公共因子。比如,如果要测量学生的学习积极性,那么课堂中的积极参与、作业完成情况以课外阅读时间就可以用来反应积极性。而学习成绩可以用考试成绩来反映。在这里,学习积极性与学习成绩是无法直接用一个度量(比如一个问题)测准,它们必须用一组度量方法来测量,然后把测量结果结合起来,才能更准确地把握。换句话说,这些变量无法直接测量。可以直接测量的可能只是它所反映的一个表征,或者是它的一部分。在这里,表征与部分是两个不同的概念。表征是由这个潜在因子直接决定的。隐性变量是因,而表征是果,比如学习积极性是课堂参与程度的一个主要决定因素。,三、因子分析的数学模型,数学模型(正交因子模型),公共因子是各个原始变量所公有的因子,解释变量之间的相关关系。独特因子,顾名思义是每个原始变量所特有的因子,表示该变量不能被公共因子解释的部分。原始变量与因子分析时抽出的公共因子的相关关系用因子负荷(factorloadings)表示。,三、因子分析的数学模型,三、因子分析的数学模型,三、因子分析的数学模型,四、因子分析中的几个重要结论,因子分析数学处理的最后结果通常以因子载荷矩阵的形式给出,这个矩阵的一般形式如下表所示。,四、因子分析中的几个重要结论,四、因子分析中的几个重要结论,五、载荷矩阵的求解,要建立实际问题的因子模型,关键要根据样本数据估计因子载荷矩阵A,对A的估计方法很多,有主成分法、主轴因子分解法、极大似然法、末加权最小平方、广义最小二乘法、最小二乘法、A1pha因子分解和映像因子分解等。,五、载荷矩阵的求解,五、载荷矩阵的求解,五、载荷矩阵的求解,六、因子旋转,六、因子旋转,六、因子旋转,六、因子旋转,综上所述,不同的因子旋转方式各有其特点。因此,究竞选择何种方式进行因子旋转取决于研究问题的需要。如果因子分析的目的只是进行数据简化,而因子的确切含义是什么并不重要,就应该选择正交旋转。如果因子分析的目的是要得到理论上有意义的因子应该选择斜交因子。事实上,研究中很少有完全不相关的变量,所以从理论上看斜交旋转优于正交旋转。但是斜交旋转中因子之间的斜交程度受研究者定义的参数的影响,而且斜交选装中所允许的因子之间的相关程度是很小的,因为没有人会接受两个高度相关的共同因子。如果两个因子确实高度相关,大多数研究者会选取更少的因子重新进行分析。因此,斜交旋转的优越性大打折扣。在实际研究中正交旋转(尤其是Varimax旋转法)得到更广泛的运用。,六、因子旋转,七、因子得分,七、因子得分,因子分析与主成分分析1.都是用于降维、简化数据,都是要将可观测的众多原始变量变成尽可能少的综合变量的统计技术;2.能够进行因子分析和主成分分析的相关性检验完全相同;3.同样利用方差累计贡献率或特征值下限来确定提取公共因子或主成分的数目。但是两者的最终目标并不完全一致,导致操作过程和应用的差异。,八、因子分析与主成分分析,(1)因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成各变量的线性组合。(2)主成分分析的重点在于解释各变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。(3)主成分分析中不需要有假设,因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子之间也不相关,共同因子和特殊因子之间也不相关。(4)主成分分析中,当给定的协方差矩阵或者相关矩阵下特征值是唯一的时候,因此主成分一般是唯一的(不考虑倍数关系);而因子分析中因子不是唯一的,可以旋转得到不同的因子。,八、因子分析与主成分分析,(5)因子分析与主成分分析都需要指定提取因子或主成分的条件,如因子或主成分入选的特征值下限(通常取1),也可指定提取因子或主成分的数目(譬如2、3)。在主成分分析时,提取三个主成分与提取两个主成分的区别是前者的第一、第二主成分完全等同于后者,只是多出一个第三主成分。在因子分析时,提取三个因子与提取两个因子的式子会不一样。,八、因子分析与主成分分析,(6)和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,此情形也可以使用因子得分做到。所以这里的区分也不是绝对的。,八、因子分析与主成分分析,总体来说,主成分分析主要是作为一种探索性的纯数学上的某种优化技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析通常与聚类、判别、回归分析等方法合用。主成分可以不需要实际意义,公共因子必须要能进行实际解释的。对因子进行命名解释是因子分析的非常重要环节,如果无法对因子作出合乎实际的解释,整个分析只能算无效的,必须更换条件重新运算。,八、因子分析与主成分分析,在算法上,主成分分析和因子分析很类似,不过,在因子分析中所采用的协方差矩阵的对角元素不再是变量的方差而是和变量对应的共同度(变量方差中被各因子所解释的部分)。,八、因子分析与主成分分析,例:对30名学生某次考试的数学、物理、化学、语文、历史、英语6门功课成绩,作因子分析。,九、因子分析SPSS实现实例,九、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论