多元统计分析课程设计_第1页
多元统计分析课程设计_第2页
多元统计分析课程设计_第3页
多元统计分析课程设计_第4页
多元统计分析课程设计_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多元统计分析课程设计多元统计分析课程设计题目:因子分析方法在大学生的价值观测验中的应用学院:班级:学生姓名:学生学号:指导教师:2012年6月15日课程设计任务书姓名班级学号设计题目因子分析方法在大学生的价值观测验中的应用理论要点因子分析是主成分分析的推广和发展,它也是将具有错综复杂关系的 变量综合为数量较少的几个因子,以再现原始变量与因子之间的相互 关系,同时根据不同因子还可以对变量进行分类, 它也是属于多元分 析中处理降维的一种统计方法。设计目标通过因子分析方法对大学生的价值观测验做预测分析,应用于实际。研究方法 步骤首先,对原始数据标准化以消除量纲的影响;第二步,建立指标间的 相关系数阵

2、R;第三步,求R的特征值和特征向量;第四部,建立因 子载何阵;第五步,对因子载何阵实行方差最大旋转。预期结果通过执行spss来求得相关统计量,如相关系数矩阵、特征值和特 征向量、因子载荷等。计划与进 度的安排课程设计安排一周 第一次(1-2天) 第二次(3-4天) 第三次(4-6天) 第四次(7天):写,分四次完成:上网搜查有关的资料,并开始考虑设计的方法写论文的前言、摘要、以及理论依据部分写论文的问题描述、问题分析以及求解计算部分 亏论文的结论部分以及最后的审核和排版、打印等多元统计分析课程设计摘要在科学研究中,往往希望尽可能多的收集反映事物(研究对象)的多个变 量,以期能对问题有比较全面、

3、 完整的把握与认识。多变量的大样本虽然能为科 学研究提供大量的信息,但是在一定程度上增加了数据采集的工作量,更重要 的是在大多数情况下,许多变量之间可能存在相关性,这意味着表面上看来彼 此不同的变量并不能从各个侧面反映事物的不同属性,而恰恰是事物同一种属 性的不同表现。如何从众多相关的指标中找出少数几个综合性指标来反映原来 指标所包含的主要信息,这就需要进行因子分析(Factor Analysis ),它是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子反映原始数 据的大部分信息的统计方法。因子分析的特点为:(1) 因子变量的数量远少于原有的指标变量的数量,对因子变量的分析能 够减

4、少分析中的计算工作量。(2)因子变量不是对原有变量的取舍, 而是根据原始变量的信息进行重组 结构,它能够反映原有变量大部分的信息。(3)因子变量之间不存在线性相关关系,对变量的分析比较方便。(4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和 反映。关键词因子变量,因子载荷,变量共同度,公共因子目录摘要 I因子分析在大学生价值观测验中的应用 -1 -第一章绪论 -1 -第二章基本理论 -2 -2.1数学模型 -2 -2.2因子分析的基本步骤 -3 -第三章问题的描述 -5 -第四章问题的分析以及求解计算-6 -第五章结论 -6 -总结 -9 -参考文献 -9 -ii多元统计分析课

5、程设计因子分析在大学生价值观测验中的应用第一章绪论在社会、政治、经济和医学等领域的研究中往往需要反映事物的多个变量进 行大量的观察,收集大量的数据以便进行分析,寻找规律。在大多数情况下,许 多变量之间存在一定的相关关系。因此,有可能用较少的综合指标分析存在的于 各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合 指标成为因子。因子分析就是用少数几个因子来描述许多指标或因素之间的联 系,以较少几个因子反映原资料的大部分信息的统计学方法。因子分析,也叫因素分析,就是通过寻找众多变量的公共因素来简化变量中 存在复杂关系的一种统计方法,它将多个变量综和为少数几个 “因子”以再现原

6、始变量与“因子”之间的相关关系。因子分析的主要应用有:寻找基本结构。在多元统计中,经常遇到诸多变量之间存在强相关的问题,它会对分析带来许多困难。通过因子分析,可以找出 几个较少的有实际意义的因子,反映出原来数据的基本机构。例如,调查高校师 生具有的素质中,通过因子分析从 20个指标中概括出师德、专业知识、教学实 践性知识、教学操作能力、社会适应能力、班主任工作能力、语言表达能力和心 理素质8个基本指标。 数据化简。通过因子分析可以找出少数的几个因子代替 原来的变量做回归分析、聚类分析、判断分析等。-1 -多元统计分析课程设计第二章基本理论2.1数学模型因子分析的出发点是用较少的相互独立的因子变

7、量代替原来数据的大部分信息,可以通过下面的数学模型来表示:XiaiiFi%F2ai m Fma1X2a2mFm2XP=a F a Fpi I 1 p2 2apmFma/p其中,Xi、X2、X3、Xp为p个原有变量,是均值为零、标准差为1的标准化变量,F1,F2,Fm为m个因子变量,m小于p,表示成矩阵形式为:X 二 AF a ;其中F为因子变量或公共因子,它们可以理解为高维空间中互相垂直的m个坐标轴。A为因子载荷矩阵,如果把变量Xi看成是m维因子空间中的一个向量, 则3j为Xi在坐标轴Fj上的投影,相当于多元回归中的标准回归系数。:为特殊 因子,表示了原有变量不能被因子变量所解释的部分, 相当

8、于多元回归分析中的 残差部分。因子分析把每个原始变量分解成两部分:一部分由所有变量共同具有的少数 几个因子构成,即所谓公共因素部分;另一部分是每个变量独自具有的因素, 即 所谓独特因子部分。其中F1,F2,Fm叫做公共因子,它们是在各个变量中共同出现的因子。我们可以把它们看做多维空间分布中互相垂直的m个坐标轴。:i(i =1,2,p)表示影响Xi的独特因子,指原有变量不能被因子变量所解释的部 分,相当于回归分析中的残差部分。色叫做因子负荷(载荷),它是第i个变量在第j个主因子上的负荷或叫做第i个变量在第j个主因子上的权值,它反映了 第i个变量在第j个主因子的相对重要性。因子分析中的几个概念说明

9、如下:1. 因子载荷在各个因子变量不相关情况下,因子载荷 色就是第i个原有变量和第j个因 子变量的相关系数,即Xi在第j个公共因子变量上的相对重要性。 因此3j绝对值 越大,则公共因子Fj和原有变量Xi关系越强。2. 变量共同度变量共同度,也称为公共方差,反映全部公共因子变量对原有变量 Xi的总方 差解释说明比例。原有变量Xi的共同度为因子载荷矩阵A中的第i行元素的平方m和,即:hi =x aj。原有变量xi的方差可以表示成两个部分:h:和;:。第一部 分hi2,反映公共因子对原有变量的方差解释比例,第二部分 ;i2反映原有变量方 差中无法被公共因子表示的部分。因此,第一部分 h:越接近于1,

10、说明公共因子 解释原有变量越多的信息。可以通过该值,掌握该变量的信息有多少被丢失了。如果大部分变量共同度都高于0.8,则说明提取的公共因子已经基本反映了个原 始变量80%以上的信息,仅有较少的信息丢失,因子分析效果较好。可以说, 各个变量的共同度是衡量因子分析效果的一个指标。3. 公共因子Fj的方差贡献公共因子Fj的方差贡献定义为因子载荷矩阵 A中第j列各元素的平方和,p即:Sjai2。公共因子Fj的的方差贡献反映了该因子对所有原始变量总方差的解释能力,其值越高,说明因子重要程度越高。2.2因子分析的基本步骤因子分析的主要过程可简述为如下几个步骤。1. 确定因子分析的前提条件因子分析是众多的原

11、始变量中综合出少数几个具有代表性的因子,这必定有一个前提要求,即原有变量之间具有较强的相关性。如果原有变量之间不存在较 强的相关关系,则无法找出其中的公共因子。因此,在因子分析时,需要对原有 变量做相关分析。通常可采用如下几种方法。(1) 计算相关系数矩阵计算原有变量的简单相关系数矩阵。观察相关系数矩阵,如果相关系数矩阵 中的大部分相关系数值小于0.3,则各个变量之间大多为若相关,这就不适合做 因子分析。如果一个变量与其他变量间相关很低,则在下一分析步骤中可考虑剔 出此变量。(2) 进行统计检验在因子分析过程中提供了几种检验方法来判断变量是否适合做因子分析。主要统计方法有如下两种。*巴特利特球

12、形检验KM(检验2. 提取因子决定因子提取的方法(即求初始因子)的方法很多,有“主成分分析法”、“主轴因子法”、“极大然法”、“最小乘法”、“Alpha因子提取法”和“映像因子 提取法”等等。最常用的是“主成分分析法”和“主轴因子法” ,其中又以“主 成分分析法”的使用最为普遍。在提取因子的过程中涉及下列名词,现分别说明。特征值特征值是指每个变量在某一公共因子上的因子负荷量的平方总和, 又叫特征 根。在因子分析的公共因子提取中,特征值最大的公共因子会最先被提取, 最后 提取的公共因子的特征值最小。因子分析的目的就是使因子维度简单化, 希望以 最小的公共因子能对总变异量做最大的解释, 因而提取的

13、因素愈少愈好,而提取 因子之积累解释的变异量则愈大愈好。(2) 因子的贡献率每个公共因子对原始数据的解释能力,可以用该因子所解释的总方差来衡量,通常称为该因子的贡献率,它等于和该因子有关的因子负荷的平方和,实际中常用相对指标来表示。相对指标体现公共因子的相对重要性, 即每个公共因子 所解释的方差占所有变量总方差的比例。3. 决定旋转方法旋转法使得因子负荷量更易于解释。 在因子提取时通常提取初始因子后, 对 因子无法做有效的解释。为了更好地解释因子,必须对负荷矩阵进行旋转,旋转 目的在于改变每个变量在各因子的负荷量的大小。旋转方法有两种:一种为正交旋转,如“方差极大正交旋转法”、“四次方极大正交

14、旋转法”、“等量方差极大正 交旋转法”;另一种为斜交旋转,如“斜交旋转法”、“迫近最大方差斜旋转法” 等。正交旋转时,坐标轴在旋转过程中始终保持垂直, 新生成的因子保持不相关 性。斜交旋转中坐标轴中的夹角可以是任意度数, 新生成的因子之间不能保持不 相关性。在使用过程中一般选用正交旋法。4. 因子的命名因子的命名是因子分析的一个核心问题。 旋转后可决定因子个数,并对其进 行命名。对于新因子变量的命名解释要根据新因子变量与原变量的关系, 即观察 旋转后的因子负荷矩阵中某个新因子变量能够同时解释多少原变量的信息。5. 计算因子得分计算因子得分是因子分析的最后一步。 因子变量确定后,便可计算各因子在

15、每个 样本上的具体数值,这些数值就是因子的得分,形成的新变量成为因子变量,它 和原变量的得分相对应。有了因子得分,在以后分析中就可以因子变量代替原有 变量进行数据建模,或利用因子变量对样本进行分类或评价等研究,进而实现降维和简化的目标。第三章问题的描述如表1所示为20名大学生关于价值观的9项测验结果,包括合作性、对分 配的看法、行为出发点、工作投入程度、对发展机会的看法、社会地位的看法、 权力距离、对职位升迁的态度、以及领导风格的偏好。要求根据这9项内容进行因子分析,得到维度较少的几个因子。表120个大学生的9项测验结果ABCDEFGHI1分配岀发点工慨人友展机会社埶位权力确职位昶领导晞216

16、16131816171516163181915161818 1817194171717141718 16161651717171619181920196_ 16151616181815161672017161713181719188131616201516191417920181817诃1918191810141615191919IS19141119192014201917201219191414L&n16171813151518161818191718H16171517151816E131517141214規18151513n161416U1516161716ITIT10111318

17、17201716201816171516141614151719戈16151716161G1516 H201619181517121918182116161318161715161622第四章问题的分析以及求解计算实现步骤步骤 1:在“ Analyze ” 菜单“ Data Reduction ” 中选择 Factor 命令。步骤2:在弹出的Factor Analysis对话框中,从对话框左侧的变量列表中选择 这9个变量,使之添加到 Variables 框中。步骤 3:单击 Descriptives 按钮,弹出 Factor Analysis : Descriptives 对话 框。Stati

18、stics框用于选择输出哪些相关的统计量。步骤 4:单击 Extraction 按钮,弹出 Factor Analysis : Extraction 对话框, 选择因子提取方法。因子提取方法在Method下拉框中选取。步骤 5:单击 Factor Analysis 对话框中的 Rotation 按钮,弹出 Factor Analysis : Rotati on对话框。该对话框用于选择因子载荷矩阵的旋转方法。旋转的目的是 为了简化结构,以帮助我们解释因子。步骤6:单击Factor Analysis 对话框中的Scores按钮,弹出Factor Analysis : Scores对话框。该对话框用

19、以选择对音质得分进行设置。步骤7:单击Factor Analysis对话框中的 Options按钮,弹出Factor Analysis :Options对话框。该对话框可以指定输出其他因子分析的结果,并选择对缺失数 据的处理方法。选中 Exclude cases listwise 项,单击 Continue 按钮返回 Factor Analysis 对话框,完成设置。单击 0K按钮,完成计算。第五章结论Factor An alysisKMO and Bartlett's TestKaiser-Meyer-Olkin Adequacy.MeasureofSampling.585Bartl

20、ett'sTestof Approx. Chi-Square74.733Sphericitydf36Sig.000CommunalitiesInitialExtraction合作性1.000.722分配1.000.848-6 -多元统计分析课程设计-7 -多元统计分析课程设计岀发点1.000.708工作投入1.000.504发展机会1.000.863社会地位1.000.871权力距离1.000.799职位升迁1.000.681领导风格1.000.486Extraction Method: Principal Component Analysis.Component123合作性.493-

21、.626.295分配.596-.701-.029岀发点.823-.130-.120工作投入-.222.537-.407发展机会.787.479.122社会地位.133.558.737权力距离.763.248-.394职位升迁.781.239.117领导风格.650.194-.162Component Matrix(a)Extraction Method: Principal Component Analysis. a 3 components extracted.Component123合作性.157.835-.024分配.314.799-.333岀发点.733.400-.105工作投入.09

22、0-.698-.095发展机会.834.004.409社会地位.100-.071.925权力距离.879-.045-.154职位升迁.752.191.282领导风格.695.051.010Rotated Component Matrix(a)Extraction Method: Principal Component Analysis. Normalization.a Rotation converged in 5 iterations.Rotation Method: Varimax withKaiserComponent1231.902.424.0782.330-.797.5063-.27

23、6.431.859Component Transformation MatrixExtraction Method: Principal Component Analysis. Normalization.Rotation Method: Varimax withKaiser-8 -多元统计分析课程设计Component Plot in Rotated Space-9 -多元统计分析课程设计-# -多元统计分析课程设计Compolent 2Comp onent 1Comp onent 3Component123合作性-.065.447.091分配.035.355-.199岀发点.217.102-.118工作投入.148-.425-.203发展机会.249-.058.249社会地位-.068.091.772权力距离.343-.181-.248职位升迁.207.041.180领导风格.242-.073-.070Component S

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论