主成分分析与因子分析.ppt_第1页
主成分分析与因子分析.ppt_第2页
主成分分析与因子分析.ppt_第3页
主成分分析与因子分析.ppt_第4页
主成分分析与因子分析.ppt_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主成分分析法和因子分析,报告什么? 假定你是公司的财务经理,掌握了公司的所有数据,如固定资产、流动资金、借款金额和期限、各种税、工资薪金支出、原料消费、产值、利润、折旧、员工数、员工分工与教育程度等。 如果能让我介绍一下上述公司的状况的话,就能按照原样提供这些个的指标和数字吗? 当然不能。 要高度概括各个方面,用一两个指标简单明了地说明情况。 可以喀呖声,将许多变量降维,每个人都会遇到具有许多变量的数据。 例如全国和各地区的多数经济和社会变量的数据各学校的研究、教育等各种变量的数据等。 这些个的数据的共同特征是变量大,在这样的许多变量中,有很多相关联的,即存在许多重复信息。 人们想找到那些少数

2、的“代表”进行说明。 在本章中,降低“主成分分析法”(principal component analysis )和“因子分析”(factor analysis )两个变量次元数,介绍使说明、理解、分析变得容易的方法。 实际上,主成分分析法可以说是因子分析的特例。 在部署主成分分析法之前,让我们看一下下面的示例。 成绩数据(student.sav )、100名学生的数学、物理、化学、国语、历史、英语成绩如下表(一部分)所示。 本例可以提出的问题是,当前的问题是这个数据的6个变量是否可以用1个或2个综合变量来表现,这个1、2个综合变量中包含多少原始信息呢? 可以使用找到的综合变量对学生进行排序吗

3、? 这种与数据相关的问题可以推广到企业、学校的分析、排名、判别、分类等问题上。 您可以选择打印组件、打印组件、打印组件、打印组件、打印组件、打印组件。 我的意思是,每个观测值都是六个维度空间中的一个点。 我们想用低维度空间表现6维度空间。 6维度空间不能直接观察,所以从2维度空间开始说明主成分分析法的原理。 另外,主成分分析法原理是,当散点呈椭圆状分布时,表示长轴的变量表示数据的主要变化,表示短轴的变量表示数据的次要变化。 但是,坐标轴通常不与椭圆的短轴平行。 因此,必须找到椭圆的长轴,并将其转换为新变量与椭圆的长轴平行。 如果长轴变量代表数据中的大部分信息,则将原始两个变量替换为该变量(截断

4、二维)即可完成降维。 椭圆(球)的长轴大幅度异原来如此,降低维度也是理所当然的。 您可以选择、或者、或者、或者、或者、或者、或者、或者、或者、或者、或者、或者、或者、或者、或者、或者、或者、或者、或者、或者、或者、或者、或者、或者您可以在几何上解释、平移、旋转座标轴、旋转座标轴、旋转座标轴、旋转座标轴、旋转座标轴、旋转座标轴、旋转座标轴、旋转座标轴、旋转座标轴、旋转座标轴、旋转座标轴、旋转座标轴、旋转座标轴、旋转座标轴、旋转座标轴、旋转座标轴、旋转座标轴。 可以由、样本数据标准化解决的平移问题,由于旋转变换的公式:主成分分析法,在多维变量的情况下与二次元类似,虽然也有高维的椭球体,但只是直观上

5、看不到。 首先找出高维椭球体的主轴,将代表大量数据信息最长的几个轴作为新变量,使得主成分分析法基本完成。 请注意,高维椭球体的主轴也与二维的情况相同,相互垂直。 在这些个相互正交的新变量是原始变量的线性组合,被称为主成分。、主成分分析法的数学模型假定我们正在研究的实际问题之中有p个指标,将该p个指标看作p个随机变量,标记为X1、X2、Xp,主成分分析法将该p个指标的问题转换成研究p个指标的线性组合的问题,并且这些个讨论新的、这样的多个指标主成分分析法的常规方式是确定原始指标的线性组合Fi。 满足主成分之间相互独立,即不重叠的信息。 即,主要成分的方差依次减少,重要性水平依次减少,即,每个主要成

6、分的系数平方和为1。 即样本数据标准化求解平移问题的旋转变换公式:主成分分析法表明,二维椭圆有两个主轴,三维椭圆有三个主轴,有几个变量,有几个主成分。 选择的主要成分越少,降低维度越好。 什么是标准? 那就是,这些个选择的主要成分所代表的主轴长度之和占主轴长度总和的大部分。 有些文献提出,所选主轴的全长约占所有主轴长度之和的85%即可,但实际上,这只不过是粗略的说法,具体选择几个取决于实际情况。 同时,对于我们的数据,SPSS输出在这里的Initial Eigenvalues在这里的6个主轴的长度上也被称为特征值(数据相关阵列的特征值)。 前两个成分特征值的累积占总方差的81.142%。 后特

7、征值的贡献越来越少。 特征值的影响从SPSS的所谓碎石图也可以看出,因子载荷反映了主成分和变量之间的相关系数。 (因子载荷模式),主成分载荷和因子载荷可使第一因子和第二因子的载荷点为二维格拉夫,以视觉感知方式表示它们如何解释原始变量。 这个图叫做负荷图。 该图左边的三个点是数学、物理、化学三科,右边的三个点是语文、历史、外语三科。因子分析、主要内容、1、因子分析2、因子分析模型3、因子载荷沉积基质的若干统一特征4、因子旋转5、因子得分6、在SPSS上进行因子分析的步骤、因子分析通过研究多个变量之间的内部依存关系,得出观测数据中的基本这些个的虚拟变量能够反映原许多变量的主要信息。 原变量是可观测

8、的显性变量,虚拟变量是不可观测的潜在变量,被称为因子。 例如,在企业形象和品牌形象的研究中,消费者可以通过由24个指标组成的评价系统来做评估百货店在24个方面的优劣。 一、什么是因子分析,但消费者主要关心的是店铺环境、店铺服务和商品价格三个方面。 因子分析方法通过24个变量,可以找到反映实体店环境、店铺服务水平和商品价格的3个潜在因素,并综合做评估实体店。 三个这些个共性因子可表示为、和不可观测的潜在因子。 24个变量共有这些个3个因子,但是每个变量有独自的个性,不包含的部分称为特殊因子。 二、因子分析模型、数学模型,设置一个变量表示,注意:因子分析和回归预测不同,因子分析中的因子是比较抽象的概念,回归因子与非常明确有实际意义的主成分分析法和因子分析也不同,主成

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论