10因子分析.doc_第1页
10因子分析.doc_第2页
10因子分析.doc_第3页
10因子分析.doc_第4页
10因子分析.doc_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

因 子 分 析因子分析最早开始于1904年英国著名统计学家斯皮尔曼(C.Spearman)发表的一篇文章。看看他是如何引入因子分析的。斯皮尔曼在这一篇研究人的智力的定义和测量的文章中,对某学校33个学生6门功课(古典语、法语、英语、数学、判别和音乐)的成绩进行分析。33个学生6门功课成绩的样本相关系数矩阵如表表 33个学生6门功课成绩的样本相关系数矩阵如表古典语法语英语数学判别音乐古典语10.830.780.700.660.63法语0.8310.670.670.650.57英语0.780.6710.640.540.51数学0.700.670.6410.540.51判别0.660.650.540.5410.40音乐0.630.570.510.510.401表中的相关系数(不考虑对角线上的值)自左到右越来越小,值得注意的是同一列上的值比起前一列上的值基本上按同样的比例减少。例如,第2列与第1列在同一行上两个相关系数的比值它们基本上是相等的。又如,第3列与第2列在同一行上两个相关系数的比值它们基本上也是相等的。第4列与第3列,第5列与第4列及第6列与第5列在同一行上两个相关系数的比值也都是基本上是相等的。根据相关矩阵行与行之间的关系,可以建立什么样的模型来描述它们呢?考虑到相关系数矩阵与协方差阵有下列关系:相关系数:相关阵 所以对33个学生6门功课成绩的样本协方差阵来说,也有与相关系数完全相同的情况,同一列上的协方差值比起前一列上的协方差值基本上按同样的比例减少。根据样本协方差阵这样一个情况,斯皮尔曼推测总体协方差阵具有下面的性质:对任意给定的第列和第列,只要,(因为比值与行无关)斯皮尔曼然后进一步推测,总体协方差阵,也就是这6门功课成绩的协方差阵,有这样的结构其中,。这也就是说,它的协方差阵的结构为 根据协方差阵的这样一个结构,斯皮尔曼指出可以对这6门功课的成绩建立模型由数据建立一个模型需要统计学家对数据的敏锐地观察力。而建立的模型能否得到人们的认可依赖于能不能给模型一个合理的解释,即能不能用模型来解释实际问题。模型很好地解释了课程的考试成绩的结构问题,从而解释了人的智力的结构问题。模型说明每一门功课的成绩都是由两部分组成。前一部分中的是对所有课程的考试成绩都有贡献的一个随机变量。为此称是公共因子,而把称为特殊因子,并假设公共因子与特殊因子相互独立,特殊因子之间相互独立,特殊因子的方差分别为。不失一般性,假设公共因子的方差为1。有了这些假设,不难验证,由模型推得的协方差阵形如上面所示,从而证明同一列上的协方差值比起前一列上的协方差值有那样的关系。模型中的称为第门课程考试成绩的因子负荷,它可直观地理解为公共因子对第门功课的考试成绩作了多大程度的贡献。有人把这个公共因子看成是人的阅读能力。不同的人有不同的阅读能力,所以它是一个随机变量。显然,阅读能力对这6门课程的考试成绩都有贡献,不同的课程,阅读能力对它的贡献是不同的。上述模型只是一个公共因子的因子模型,自从斯皮尔曼提出了这个模型之后,开始了因子分析的理论及它在很多领域的应用研究。因子分析是主成分分析的推广和发展,它也是多元统计分析中降维的一种方法。因子分析是研究相关阵或协方差阵内部的依赖关系,它将多个变量综合为少数几个因子,以再现原始变量与因子之间的相关关系。下面几个实际问题说明应用因子分析来构造因子模型。例:为了了解学生的学习能力,观测了个学生个科目的成绩(分数),用表示个科目(例如代数、几何、语文、英语、政治),表示第个学生的个科目的成绩。我们对这些资料进行归纳分析,可以看出各个科目(即变量)由两部分组成:其中是对所有都起作用的公共因子,它表示智能高低的因子;系数称为因子载荷,表示第个科目在智能高低因子上的体现;是科目(变量)特有的特殊因子。这就是一个最简单的因子模型。进一步地可把这个简单因子模型推广到多个因子的情况,即全部科目所共有的因子有个,如数学推导因子、记忆因子、计算因子等,分别记为,即用这个不可观测的互不相关的公共因子(也称为潜在因子)和一个特殊因子来描述原始可测得相关变量(科目),并解释分析学生的学习能力。他们的系数称为因子载荷。例:调查青年对婚姻家庭的态度(分类),抽取个青年回答了个问题,这些问题可归纳为如下几个方面:对相貌的重视、对孩子的观点、对老人的态度等,这也是因子分析的模型,每一方面就是一个因子。例:考察人体的五项生理指标:收缩压,舒张压,心跳间隔,呼吸间隔和舌下温度。从生理学的知识可知,这五项指标是受植物神经支配的,植物神经又分为交感神经和副交感神经,因此这五项指标至少受到两个公共因子的影响,也可用因子模型去处理。通过以上几个实例,我们可以看到,因子分析的主要应用有两方面。一是寻求基本结构,简化观测系统,将具有错综复杂关系的对象(变量或样品)综合为少数几个因子(不可观测的随机变量),以再现因子与原始变量之间的内在联系;二是用于分类,对个对象或个样品进行分类。公因子重要性的分析因子旋转因子旋转的目标之一就是对所提取的抽象因子的实际含义进行合理解释。有时直接根据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义。例如,可能有些变量在多个公共因子上都有较大的载荷,有些公共因子对许多变量的载荷也不小,说明它对多个变量都有较明显的影响作用。这种因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很难对因子的实际背景进行合理的解释。这时需要通过因子旋转的方法,使每个变量仅在一个公共因子上有较大的载荷,而在其余公共因子上的载荷比较小,至多达到中等大小。这时对于每个公共因子而言(即载荷的每一列),它在部分变量上的载荷较大,在其他变量上的载荷较小,使同一列上的载荷尽可能地靠近1和靠近0,两极分离。这时突出了每个公共因子和其载荷较大的那些变量的联系,矛盾的主要方面显现出来了,该公共因子的含义也就能通过这些载荷较大变量做出合理的说明,这样也显示了该公共因子的主要性质。因子得分在因子分析模型中,如果不考虑特殊因子的影响,当且可逆时,我们可以非常方便地从每个样品的指标取值计算出其在因子上的相应取值:,即该样品在因子上的“得分”情况,简称为该样品的因子得分。但是因子分析模型在实际应用中要求,因此,不能精确计算出因子的得分情况,只

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论