实验课教学大纲--系统分析与设计2_第1页
实验课教学大纲--系统分析与设计2_第2页
实验课教学大纲--系统分析与设计2_第3页
实验课教学大纲--系统分析与设计2_第4页
实验课教学大纲--系统分析与设计2_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验二 主成分分析-基于SPSS软件一、实验目的及要求掌握利用SPSS软件进行主成分分析的基本操作方法,试着理解SPSS软件给出的分析结果,并通过主成分分析去认识和理解因子分析的思想及过程。二、实验内容利用SPSS软件进行主成分分析,了解SPSS进行主成分析的步骤。三、实验原理主成分分析(Principal Components Analysis,PCA)也称为主分量分析,是一种通过降维来简化数据结构的方法;主成分分析因子分析中的一种方法,掌握了主成分析也就基本掌握了因子分析,因子分析的SPSS操作过程与主成分析类似,以下简单对因子分析的原理及步骤进行介绍。我们在对某种现象进行描述时,总是要从

2、不同的方面来说明,才能够对所描述对象有一个比较完整认识,而每一个方面往往就是一个变量,这样就会涉及到很多变量,给问题的分析增加难度。另一方面,这些变量之间往往又存在一定程度的联系,有的甚至是非常密切的联系,这就使我们用来分析的数据所包含的信息在一定程度上有所重叠。因子分析的目的就是使数据简化,即用较少的几个因子去表示具有相互关系的原始变量。因子分析基本思想是从观测到的个变量的相关性入手,将相关性较高的变量归为一类,认为这些相关性紧密的变量背后会有起主导作用的内在原因,或者说有某个内在原因使得这些变量的关系紧密。如果共找出()个这样的内在原因,我们说这个变量有个公共因子。这样每个观察变量都可以写

3、成个互不相关的公共因子的线性组合的形式,即因子分析的数学模式。其中为公因子,可理解为原始变量共同具有的公共因素,或者说潜在变量,每个公因子至少要对两个原始变量起作用,否则将列入特殊因子。为特殊因子,他们都是不可观测的随机变量,每个特殊因子只对对应的一个原始变量有作用。用矩阵表示为:。因子分析的基本步骤:1.确定待研究的问题。首先要明确这次研究的目的,在相关理论的指导下,结合以往研究结果,再根据研究者自己的判断,确定研究中应该包括哪些变量。在选择变量时应注意所选变量必须是定距或定比变量;而样本量则应保持在变量个数的45倍以上。2.建立相关系数矩阵,检查变量之间的相关性。因子分析的目的就是用潜在变

4、量来解释具有相关关系的原始变量。所以变量之间必须具有较强的相关关系,才能适用于因子分析。3.选择提取因子的方法。提取因子的方法有主成分法、主因子法、最大似然法、最小二乘法、最小残差法等等,而一般常用的是主成分法和主因子法。4.确定因子的个数。常用的确定因子个数的方法有以下三种:1)根据研究者的设计方案或有关经验或知识事先确定;2)变量共同度,即原始变量对公因子依赖的程度,用因子载荷矩阵中第行元素的平方和表示,则有:。反映了公因子对的影响,可以看成是公因子对的方差贡献,即全部因子反映原始变量信息的百分比。越接近于1,说明原始信息保留的越多。根据对原始信息保留量的大小来确定因子个数。3)因子的累计

5、方差贡献率。公因子对向量的贡献,用因子载荷矩阵中第列元素的平方和表示,则有: 。反映了公因子对各原始变量所提供的方差贡献的总和,是衡量公因子相对重要性的指标。一般要求所提取的公因子的累计方差贡献率应在60%以上。5.因子旋转。得到初始因子载荷矩阵后,虽然它能反映因子与原始变量之间的关系,但是由于因子与很多变量都有关系,不便于对因子进行解释,这时就需要将因子载荷矩阵进行旋转。因子旋转的方法有正交旋转和斜交旋转两类,一般用正交旋转比较多,即在因子载荷矩阵后乘以一个正交矩阵。正交旋转不会影响每个变量的共同度,也不会影响所有公因子的累计方差贡献率,但是每个因子的方差贡献率会改变,最终达到某些变量在某个

6、因子上的载荷较高,而在其它因子上的载荷却很低的目的,便于对每个因子的含义进行解释。最常用的正交旋转法是“方差最大正交旋转”。斜交旋转用于因子之间有相关关系的情况。6.解释因子和命名。通过因子旋转后,因子对哪些原始变量有显著的负荷就比较清楚了,这时可以根据这些变量所隐含的意义来对因子进行解释和命名。四、实验案例公司老板在对应聘者进行面试时,从15个方面进行了打分,这15个方面分别是:x1申请书的形式;x2外貌;x3专业能力;x4讨人喜欢;x5自信心;x6精明;x7诚实;x8推销能力;x9经验;x10积极性;x11抱负;x12 理解能力;x13潜力;x14交际能力;x15适应性。下面是48名应聘者

7、的得分情况。试对变量进行因子分析,并对因子给出合理的解释。应征者x1x2x3x4x5x6x7x8x9x10x11x12x13x14x151672587883897571029105810991059988810378369897499868104568565928458765568884492855887767776871059658666799888888108108981089998998810910999109997888859898881010471021010710310101093101147100108395910810251247104101078288101037136981

8、054944454768148989638252667561548875410275366461669678989887686101797779586678667818688488643367264196784785442683542048788910526798892138688810536788582298789101010310810810823710799910103991091082498710810101029799108256977459324444542678785482345655627210798910535676452863535350033005029434330000

9、440050304656941031332273315547841032553483323357791032537552332357791032236452343464338113332523567433090102315336985566822245663374964108891397532384966997912108552391069109101010101081010101040106910910101010101010101010411078021201020300104210380110010000001043349824536213338447776988688108865459

10、61097710215578454698101079103157994447071035010002200004806101501000220000实验过程:1)建立数据文件。按要求定义各变量名,输入原始数据。2)选择Analyze Data Reduction Factor,选择x1-x15变量进入Variables图63)点击Descriptive,设置需要输出的描述统计量(如图7)。图74)点击Extraction,对因子分析的方法、提取标准、显示结果等进行设置(如图8)。图85)点击Rotation,设定因子旋转(如图9)。图96)点击Factor Scores,对因子得分进行设定(如

11、图10)。图10结果说明:申请书自信心精明推销能力积极性抱负理解能力潜力适应性申请书1.000.098.223.270.348.288.335.366.587外貌.237.431.371.477.341.550.506.507.384专业能力.043.001.077.046.094.044.198.290.140讨人喜欢.306.302.483.347.393.347.503.606.327自信心.0981.000.808.816.704.842.721.672.250精明.223.8081.000.826.698.758.883.777.416诚实-.106.410.356.231.280.

12、215.386.416.003推销能力.270.816.8261.000.811.860.766.735.548经验.549.015.147.233.337.195.299.348.693积极性.348.704.698.8111.000.780.714.788.623抱负.288.842.758.860.7801.000.784.769.435理解能力.335.721.883.766.714.7841.000.876.528潜力.366.672.777.735.788.769.8761.000.574交际能力.468.482.527.549.613.547.549.539.396适应性.587

13、.250.416.548.623.435.528.5741.000上表是简化了的相关矩阵太大,由表中数据可知:不少变量间相关性比较高,故可做因子分析。KMO and Bartlett's TestKaiser-Meyer-Olkin Measure of Sampling Adequacy.784Bartlett's Test of SphericityApprox. Chi-Square648.300df105Sig.000上表显示的是KMO检验和巴特莱特球形检验的结果,一般KMO值越接近1表明各变量间的相关程度差别不大,这时适合做因子分析;巴特莱特球形检验用来检验变量之间的

14、相关性,从本例来看,各变量间均具有较强的相关性,也适合做因子分析。CommunalitiesInitialExtraction申请书1.000.732外貌1.000.426专业能力1.000.881讨人喜欢1.000.873自信心1.000.884精明1.000.822诚实1.000.850推销能力1.000.893经验1.000.781积极性1.000.788抱负1.000.879理解能力1.000.852潜力1.000.885交际能力1.000.885适应性1.000.795Extraction Method: Principal Component Analysis.上表显示了按照设置的

15、标准提取公因子后各变量中的信息被提取的程度,从表中可以看出除第二个变量外,信息量提取还是比较高的。下表列出的是总的变量解释程度的说明。按照设定的提取特征值大于1来提取,可以取前四个公因子,这四个公因子提取了原始信息的81.51%。Compo-nentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %17.50049.99749.9977.50049.99749.99722.05713.71163.7082.05713.

16、71163.70831.4629.74973.4561.4629.74973.45641.2088.05481.5101.2088.05481.5105.7394.92786.4386.4903.26889.7067.3542.35792.0638.3102.07094.1339.2551.70295.83510.1981.32297.15711.1501.00298.15912.092.61498.77313.085.56499.33814.064.42999.76715.035.233100.000下图称为碎石图,是按主成分对应特征值从大到小顺序排列的,从另一方面来协助确定公因子的提取个数

17、。下表给出的是因子载荷矩阵,既因子表达式。由表中数据可得如下因子表达式。加*号说明是标准化后的值。Component MatrixaComponent1234申请书.445.617.372-.120外貌.583-.049-.019.289专业能力.109.339-.502.708讨人喜欢.616-.181.574.364自信心.800-.356-.293-.180精明.865-.189-.184-.071诚实.433-.577.359.448推销能力.882-.056-.244-.231经验.365.795.100.073积极性.864.068-.099-.165抱负.873-.097-.254-.208理解能力.907-.033-.136.092潜力.912.034-.079.213交际能力.710-.114.561-.232适应性.646.605.104-.025a. 4 components extracted.下表是因子得分系数矩阵,其实是进行主成分分子的最终结果。按主成分表达式可表示如下:Rotated Component MatrixaComponent1234申请书.117.829.107-.138外貌.437.151.401.228专业能力.062.128.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论