主成分分析法在SPSS中的操作及在 学生成绩评价中的应用_第1页
主成分分析法在SPSS中的操作及在 学生成绩评价中的应用_第2页
主成分分析法在SPSS中的操作及在 学生成绩评价中的应用_第3页
主成分分析法在SPSS中的操作及在 学生成绩评价中的应用_第4页
主成分分析法在SPSS中的操作及在 学生成绩评价中的应用_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、毕毕 业业 论论 文文题题 目目 主成分分析法在 SPSS 中的操作及在 学生成绩评价中的应用 学学 院院 数学科学学院 专专 业业 数学与应用数学 班班 级级 数学 1302 班 学学 生生 朱越文 学学 号号 20130921154 指导教师指导教师 邢顺来 二一七年五月二十日济南大学毕业论文I摘 要主成分分析也称主分量分析,是用降维的思想,把分析中较多的相关因素生成少数几个无关综合因素的一种方法。在多元统计方法中,主成分分析是一种基本的统计方法。它不单将多指标转化为较少的综合指标,并且能给出比较客观的权重。在本文中,首先对主成分分析的基本原理、基本模型、几何意义和求解主成分的方法进行介绍

2、。再依赖 SPSS 软件实现主成分分析方法在成绩分析的应用。本文采用的数据是济南大学 2013 届数学科学学院 1302 班的成绩,对 SPSS 得出的结果进行分析评价,分析得出大学四年开设的所有课程主要与 11 个主成分因子有关,再对这 11 个因子进一步归类,得出大学生考研与这 11 类主成分因子归纳出的 8 类因子有很大的关联性,并依据结果再进行评价。使得教师根据这种分析方法,能够给学生在大一到大三期间明确需要补漏的方向,从而提高学生的考研成功率。关键词:主成分分析;SPSS;综合指标;多元统计 济南大学毕业论文IIABSTRACT Principal component analysi

3、s, is an analysis of ways to reduce the number of indicators into a few comprehensive indicators. Many of the revaluation methods of human factors, the principal component analysis as a basic statistical method, not only multi-indicators into less comprehensive indicators, and can give a more object

4、ive weight. In this paper, we first introduce the basic principle, basic model, geometric meaning and principal component method of principal component analysis. And the rely on SPSS software to achieve the application of principal component analysis in performance analysis. The data used in this pa

5、per are the results of 1302 classes of 2013 School of Mathematical Sciences in Jinan University. The results obtained from SPSS are analyzed and evaluated. All the courses offered by four years are mainly related to 11 principal component factors. The factors are further classified, and it is conclu

6、ded that the college entrance examination is of great relevance to the 7 factors of the 11 principal component factors, and the results are evaluated according to the results. So that teachers based on this analysis method, to the students clearly need to trap the direction of the students, so as to

7、 improve the success rate of students PubMed.Key words: Principal component analysis; SPSS; comprehensive index; multivariate statistics济南大学毕业论文III目 录摘要.IABSTRACT. . . . .II1 前言. . . .11.1 研究的背景和意义.11.2 研究的历史和现状.11.2.1 主成分评价的历史.11.2.2 主成分评价的现状.21.3 本文的结构安排.22 主成分分析.32.1 数学模型和几何意义.32.1.1 数学模型.32.1.2

8、几何意义.42.2 基本原理.62.2.1 基本定义和性质.62.2.1 总体主成分.62.2.1 样本主成分.6 2.3 基本算法和步骤 .93 求解主成分.123.1 总体主成分.123.1.1 从协方差矩阵求解主成分.123.1.2 从相关阵求解主成分.123.2 样本主成分.124 SPSS 软件的简单介绍.155 学生成绩分析评价.175.1 主成分分析在 SPSS 中的具体操作步骤.175.2 对 SPSS 的输出结果进行说明.185.3 对 SPSS 得出的数据进行分析评价.275.4 对分析结果要改进的地方进行说明.31结论. .33参考文献.34致谢.35济南大学毕业论文11

9、 前言1.1 研究的背景和意义 Karl Pearson 早在 1901 年就提出了“主成分”这一观点,但仅仅只针对于非随机变量,Harold Hotelling 基于此,在 1933 年把它延拓到了随机变量这一领域8。 在多种研究领域中,经常选取几个因素进行分析,就是为了避免丢失重要的信息。在多元统计中这些“因素”也叫“变量”。比方说超市的业绩时,会考察到很多因素,比如说收入、支出、进货数量、进货质量、利润等。全部都列举出来的话,会有很多因素4。在考察问题时,若是要考虑很多因素,不只是会增加计算量那么简单,将原本就简单的问题变得不那么简单,更甚者会使本来就有相关性的因素造成更多的信息重叠,这

10、会使得最后统计的结果的解释能力变弱 11。回归分析的时候,它的成效就因为研究的因素之间存在的多重共线性的问题而受到质疑。所以人们想让这些存在高度相关的变量有所“改变”,使原来因素中的绝大部分的信息能用极少的几个无关的新的因素来表示,再对新的因素进行分析,从而能够解决问题。对这几个新变量再进行剖析时,在一定概率上可能再得到一个新的总指标,依这样的方法分类,题目可能会解决了14。主成分分析(PCA)是旨在用降维的思想来解决问题的,也就是会使问题从高维降到低维来处理,正是解决上述文字情况的一类方法。它是一类最佳的能保证信息丧失最少,并能将有关的因素转变生成较少的无关的因素的一种综合的多元统计分析的方

11、法。在分析中,“主成分”就是转变生成的新的指标 8。“主成分”是原始变量的一种线性无关组合。这这样子解决问题时,只需要考虑转变生成的新的指标就可以了,既能抓住首要矛盾,又不遗漏信息,使得新变量之间线性无关,更容易让我们分析解决问题 14。基于 SPSS 的主成分分析评价在很多方面都得到应用,例如对河流水质评价的应用、对学生成绩评价的应用、对公路客运量预测的应用、对工业经济效益的研究等等。而本文便是对学生平时成绩进行分析评价11。1.2 研究的历史和现状1.2.11.2.1 主成分分析的历史 主成分分析,首先是由英国生物统计学家的皮尔生(Karl Pearson)从非随机变量引入的,尔后又由美国

12、的数理统计学家赫特林(Harold Hotelling)于 1933 年将这类方法推行到随机向量。主成分分析从开始就为研究评价提供了有力的理论支持13。济南大学毕业论文21.2.21.2.2 主成分分析的现状在我国,南开大学的邱东教授为主成分分析做出了巨大贡献,他对主成分分析进行了长期的研究。在此基础上,还有许多专家学者也致力于对主成分分析的理论探究,有白雪梅、孟生旺等,并且在研究过程中,主成分分析综合评价问题应用到了许多领域,例如在医学、教育和环境等方面17。1.3 本文的结构安排本文整体结构分为五大章,概括如下:第一章:介绍了主成分分析的探究背景和意义,历史及其现状。第二章:先详细介绍了主

13、成分分析的基本原理,又对主成分分析的数学模型及其几何意义进行说明。 第三章:介绍如何求解主成分。第四章:对 SPSS 软件进行简单介绍。第五章:是基于主成分分析方法,利用 SPSS 软件对学生的成绩进行分析,对得出的结果评价。并对本文存在的不足进行说明。 济南大学毕业论文32 主成分分析2.1 数学模型和几何意义2.1.1 数学模型 主成分分析是一种旨在将多个变量用线性变换的方法来选出少数几个的主要变量的多元统计分析方式。它是借助一个正交变换,将原本相干的随机变量转换成新的不相干变量8。在代数上这个角度来看,是将原随机变量的协方差矩阵转换成了对角阵;在几何上这个角度来看,是将原坐标系转化成新的

14、正交坐标系,使其指向样本点散布最开的p个方向,从而实现对多维变量的一种降维7。在主成分分析中,特征值的提取依据的是最小均方误差提取法6。 主成分分析的数学模型为:其中,是 p 个主成分。pzzz,21 那么主成分分析的基本分析步骤如下:(1)先对原有变量进行坐标变换,可得:ppppppppppxuxuxuzxuxuxuzxuxuxuz22112222121212121111其中:jijiiiiipkkkUxDUzzUxDUxDUzuuu)(),cov()()()var(1222221(2)提取系统中的主成分是第一主成分,它满足的条件为:1zppppppppppXuXuXuzXuXuXuzXuX

15、uXuz22112222121212121111济南大学毕业论文4)var(max)var(1111xuzuu是第二主成分,它满足的条件为:2z)var(max)var(10),cov(22221XUzuuzz以此类推,得到其他的主成分。2.1.2 几何意义 个指标,则品观察个样品,其中每一个样问题中,有假定在我们探讨的实际pn个个点。假设最终选取了维空间的个样品便是维空间,这个指标将组成这mnpnpp。 。)()(。21nm。pm,y,yyYm主上就是用降维的思维空间来处理,这实际维空间问题转换到么主成分分析就是把mp想8。相关关系,这就,并且这两个变量之间和我们假设只有两个变量21。xx个

16、样则这组成的一个二维平面,和重叠信息。再由变量就意味着这两个变量有nxx21品点在这个二维平面中分布的情况犹同椭圆状。1y1x2x2y图(1)济南大学毕业论文5轴的方向都有很大轴方向还是个样品点不管是沿着)可以看出这由图(211xxn。来表现其中的离散水平的方差定量的表示可以的方差和的离散性,观测变量21xx有非数据所包罗的信息将会中的任何一个,则原始和那么,假如只是考察21xx常大的损失。但如果细察椭圆的长短轴,就会发现:在长轴的方向,有较大数据变化,取椭圆的短标轴取椭圆的长轴方向,坐小。那么坐标轴但是短轴方向变化却很21yy轴方向,这就相当于做在平面上做一个坐标变换,也就是将原来的坐标轴依

17、逆时针方 8。21yy 和角度后,获得新坐标轴向旋转由旋转变换公式cossinsincos212211xxyxxy矩阵形式为:的一个线性组合,它的、是原始变量、其中,2121xxyyXLxxyy2121cossinsincos是正交矩阵,它满足:知识可知,是旋转交换阵,由代数上式中,LLILLLL,1 的信息轴上,这对数据所保罗在数据信息大部分都集中经过旋转变换后,原来1y波动可以用个点的波动(上这)可以看出,二维平面图(起到一个浓缩作用。从n1轴也就是短轴上的波,但在轴也就是长轴上的波动现在方差表现)大部分是体21yy轴上的波考虑比较扁平,我们可以仅相差较大,那么椭圆就动却很小。如果长短轴1

18、y空间来解问题就可以转化到一维这样一来,二维的空间轴上的波动可以忽略。动,2y济南大学毕业论文6变量关系也不大。一个变量而不考虑问题时,即使仅考虑决。也就是在研究某些21yy大量分析表明,长短轴相差越大,椭圆越变平,降维也会越合理12。 关性(图形中表现为的信息外,还具有不相,除了起着浓缩包含在,2121xxyy正交),这就使在探讨复杂问题的时候避开了信息重叠时的虚假性。 探讨多维变量构成的空间时,它们会构成一个高维椭球,不能直接观察。每个变量都对应有一个坐标轴,则有几个变量就有几个坐标轴。首先要先把椭球的各个轴都找出来,再把最长的几个轴作为新变量,这样,主成分分析的降维也就完成了。 通过上述

19、分析可以得出,主成分分析的过程其实就是坐标系旋转的过程,各个主成分与原来变量的线性关系其实就是新的坐标系与原始坐标系的变换关系10。在新的坐标系中,第一主成分所对应的坐标轴得方向是原始数据中波动最大的方向,依次是第二主成分所对的坐标轴方向,以此类推8。2.2 基本原理2.2.1 基本定义和性质2.2.1.12.2.1.1 主成分的基本定义 个指标对应有个样品,其中每个样品际问题中,设有假定在我们所探讨的实pn。设随机变量为个随机变量的问题,记个指标看成是,我们将这),(21pxxxXpp个指标问题,转化要将这。那么主成分分析就是,它的协方差矩阵是均值是pX的新指标就的线性变换,那么产生问题。先

20、实现对个指标的一种线性组合为探讨这Xp 学模型为:。那么主成分分析的数是主成分,记成pyyy,21XlxlxlxlyXlxlxlxlyXlxlxlxlyppppppppppp2211222221122112211111济南大学毕业论文7则由上式,可得pjllyjjj, 2 , 1,)var(pkjllyykjkj, 2 , 1,),cov(,同时使得组合,即的而主成分是那些不相关)(0),cov(,21kjyyyyykjp组满足这样条件的中的方差尽可能大,但pkjkjyyypkjllyy, 2 , 1,),cov(21也满足条件,但,机常数合若干个。因为对于随jcyc pjllccyjjj,

21、2 , 1,)var(2会随 c 的增大而无限增大,问题将变得没有实际意义9。一种相对简便的方法是仅考虑为单位长度上的一种系数向量,满足jlpjllllljpjjjj, 2 , 1, 1, 122221即于是,我们给出主成分的下述定义5。定义 1 第的第为我们称线性组合pppjjjjjxxxxlxlxlXly,212211个主成分。如果其系数向量满足下列条件:), 2 , 1(pjj,即减,重要程度依次递减)主成分的方差依次递(最大;)最大方差条件:(;)正交条件:(;)正则条件:(4)var(3, 1, 2 , 1, 0211jjjkjjjllyjkjkllll)var()var()var(

22、21XlXlXlp 在实际探讨中,常常只选取前面几个方差最大的主成分作为原始变量进一步分析15。2.2.1.22.2.1.2 主成分的性质 性质(1) 主成分的协方差矩阵是对角阵,其对角线元素为特征根,p21,济南大学毕业论文8即。p21varLLY)(证明:由于为的特征根,而是对应的特征向量,所以有。又因为jjljjjll , 2 , 1, 0)ycov(kjkjpkjllllllykjkkkjkj,。pjllllyjjjjjj, 2 , 1,)var(j所以,主成分的协方差阵是对角阵,且对角线元素为的特征根9。性质(2) 协方差阵和的对角线元素之和(迹)相等,即)()(11trtrjpjj

23、jpj证明:,即。)()()()(trLLtrLLtrtrjpjjjpj11上述的性质(2)说明主成分分析并未使总方差的大小发生改变。但主成分分析的目的是为了削减指标的个数,所以一般是不会取 p 个主成分,而是仅留个)(pmm主成分,这就必定导致总方差的削减。若是忽略这后个主成分的方差在总方差p-m中所占的比例很小,那么不会给总方差带来很大的影响11。 定义 2 把叫作第 j 个主成分的贡献率,把称为前 m 个主ipij1/jyipiimi11/成分的累计贡献率8。myyy,21 根据问题的要求,可选取 m 个成分使得累计贡献率能够达到 75%85%。即只要用前 m 个主成分就能够基本的反映个

24、体间差异,这样既不会遗漏太多信息,又能够达到削减指标的目的。m 个选择可以借助 SPSS 中的碎石图(Scree Plot)。 性质(3) jjijil/)y,(xij证明:令为单位向量,第 j 个元素为 1,则,)0 , 0 , 1 , 0 , 0(jeXexjj济南大学毕业论文9ijiijiiijijijijijllelelelXeXlXeyx)var(),cov(),(cov又因为,于是jjjiixy)var(,)var(jjijiijjijiijijijllyxyxyx)var()var(),(cov),( 定义 3 第 i 个主成分与原始变量它们之间的相关系数称为因子载荷量。iyjx

25、 因子载荷量反映了原指标与主成分的关系的紧密程度,它为主成分解释提jxiy供了相当重要的依据。在解释主成分的含义或是第 j 个原始变量对第 i 个主成分的重要性时,可以根据因子负荷量绝对值的大小来说明。它的绝对值越靠近 1,表明与主成分的关系越紧密,对的解释越重要;它的绝对值越靠近 0,表明jxiyjxiy与主成分的关系越疏远,对的解释越不重要14。jxiyjxiy定义 4 这 m 个主成分,它对原始变量的贡献率为:m21,yyyjx2121j1),(ijimijjijmimlyx( 它反映了前 m 个主成分所能提取原始变量信息的比率,据此我们可以判断提jx取的主成分解释原始变量的能力。特别地

26、,时,也就是说 p 个主jxpm 1j)(p成分对的贡献率为 1,这时不会造成信息的损失。若仅选个主成分,那jx)(pmm么它的贡献率必然会小于 18。2.3 基本算法和步骤 1. 计算数据形成的相关阵 11。 2. 根据探讨问题时是采用协方差阵求主成分,还是采用相关阵求主成分,是用所选定的初始变量的特征来判断的。济南大学毕业论文10 3. 求解协方差阵或相关阵的主成分的标准化的特征向量和特征根12。 4. 确定主成分个数。 可以遵循以下几条原则16: (1)主成分的累计贡献率。一般来说,在累计贡献率达到 75%85%时就可以了。 (2)特征根。因为主成分的方差与特征根相等,则特征根可以看成是

27、主成分影响力度大小的指标。可以仅保留那些能解释至少的主成分,若是根据相关阵去求p1主成分,要保留大于 1 的那些特征根所对应的主成分。这种方法也缺少理论支持,尽少盲目使用。 (3)碎石图。碎石图的横坐标是主成分,纵坐标是特征根。在 SPSS 中提供了这类方法。 (4)综合判断。大量的实践证明,如果是根据累计贡献率来确定主成分时,主成分个数往往偏多,而如果是采用特征根来确定主成分时,主成分个数又偏低。所以,先用碎石图,观察碎石图比较平缓的时候所对应的主成分的个数,再结合特征根和累计贡献率,来确定主成分的数量。 (5)写出主成分的表达式,计算各样品的主成分得分。 若从原 p 个指标提取了 m 各主

28、成分,则ppmmmmppppxlxlxlyxlxlxlyxlxlxly22112222112212211111将这 n 个样品的原始变量值代入上式,可以得到每一个样品的主成分得分,进行后续的统计分析5。即后续的统计分析将不再使用原始的变量,而是采用提取的主成分。其基本流程图为:济南大学毕业论文11求相关矩阵 R求 R 的特征值和特征向量是否使用 PCA 模型否采用其他分析方法筛选整理原始数据原始数据的无量纲处理求解主成分是济南大学毕业论文123 求解主成分3.1 总体主成分总体主成分3.1.1 从协方差矩阵出发求解主成分从协方差矩阵出发求解主成分设 p 维随机向量的协方差矩阵为,则),(21p

29、xxxXpppppppp)(x),x(x),x(x),x(x)(x),x(x),x(x),x(x)(x2122221112112112122121211varcovcovcovvarcovcovcovvar的 p 个特征值是,其对应的 p 个单位化特征向量是。并p21plll,21设为 X 的主成分,则。)y,y,y(21pYLLXLY)()(varvar 引理 设 A 是 n 阶对称阵,其特征根为,对应的单位化特征n21向量为,则nlll,2111,2, 1,0supixxijxlAxxj且当时,二次型达到上确界。1ilxAxx 由定义 1 得:第一主成分,满足时,最大;第二主成Xly111

30、11ll)(Xl1var分,满足在及=0 即时,最大;Xly22122ll),cov(21XlXl021ll)(Xl2var第 j 个主成分,满足在及即时,Xlyjj1jjll)(0),cov(jkXlXlkj0kjll最大;第 p 个主成分,满足在及)(XlivarXlypp1ppll即时,最大。由引理可知,求)。p。,(kX)X,l(lkp1210cov0kpll)var(Xlp的主成分便是求协方差矩阵的特征根及对应的单位化特征向量6。),(21pxxxX3.1.2 从相关矩阵出发求解主成分从相关矩阵出发求解主成分 上述的3.1.13.1.1 是根据原始变量的协方差阵来求解主成分的,但这样

31、的结果很容济南大学毕业论文13易受原始的 p 个变量的计量单位和它量纲的影响。因为不同的量纲会导致各变量取值分散水平差异较大,这时总体方差主要容易受方差较大的变量的控制,而主成分分析是优先考虑方差较大的变量,这会使它在主成分中所占的地位不同。为了减少由单位的不同及量纲的不同所带来的一些不合理的影响,常常将各原始变量作标准化处理。令标准化变换后的变量为pjxxExzjjjj, 2 , 1,)var()( 此时向量的协方差阵是相关系数阵。基于相),(21pzzzZppjixx),(关矩阵来求解主成分以及根据协方差阵来求解主成分是相似的。主成分也具有前面所述的各种性质,不同的是在形式上更为简单7。现

32、将对用的各种性质总结如下: (1)主成分的协方差阵是对角阵 ,它的对角线元素是相关系数阵的特征根;p,21 (2);jpjpRtrtr1)()( (3)第 j 个主成分的贡献率是,前 m 个主成分的累积方差贡献率是;pj/pipj/1 (4);ijiijlyx),( (5)。2121) j (),(ijimiijmimlyx3.23.2 样本主成分样本主成分 上述的 3.13.1 中研究的是总体主成分,但在实际研究中,总体的协方差阵以及相关阵通常是未知的,需要通过样本数据来估计,然后进行主成分分析15。设有n 个样品,每个样品观察 p 个指标。设,则样本数据可表示为8:),(21ipiiixx

33、xX),(211111nnpnpXXXxxxxX则总体协方差阵和相关阵分别可以用样本协方差阵 S 和样本相关阵 R 来估计)(11)(1XXXXnsSkknkppij济南大学毕业论文14jjiiijijppijsssrrR,)(其中,。kinkijkjikinkijxnxxxxxns111, )(11以 S 替代,以 R 替代,依照总体主成分的求解方法可以求出样本主成分。事实上,利用样本数据来求解主成分的过程即求样本相关阵的特征向量和特征根或样本协方差的过程17。 若记标准后的变量为 Z。作标准化变换jjkjkjnknkjjkjjsxxzxnsxnx,)(11,12112 则标准化后的样本协方

34、差阵 S 与相关阵 R 相同,且ZZnR11 利用标准化后得到的样本数据来求解主成分就会变得更加简便。济南大学毕业论文154 对 SPSS 软件的简单介绍 SPSS 是当今世界上最优秀的统计软件之一,SPSS 的全称为(Statistical Package for Social Science),也就是社会科学统计软件4。它具有操作简便、统计方法先进成熟,并且与其他软件交互性好的特点,所以在自然科学、医疗卫生、经济管理等方面被广泛应用。自 1968 年以来,经历多次改革的 SPSS,现在的最新版本是 SPSS 24.0。IBM 公司于 2009 年把 SPSS 收购,现更名为 IBM SPS

35、S5。最新的 SPSS 又增加了一些新的功能模块,使它的功能变得更加强大,操作上也更加突出它的个性化,也更好地适应了不同用户对数据分析这方面的需求6。 因它是使用的图形交互用户界面,它的操作简单且界面友好,使用户仅通过菜单便能完成大部分的操作,而且它支持各种格式的数据软件,并提供了多种应用软件的接口。所以在本文的数据分析中,SPSS 是一种较方便的分析数据软件。除了本文的主成分分析,在 SPSS 中还包含很多其他的分析方法,例如:描述性统计分析、方差分析、回归分析、相关分析等4。SPSS 软件不仅操作方便简单友好,而且它也易学易用、易于阅读。在对数据处理分析时,不再忙于编程和统计,而可以将时间

36、和精力集中在各种市场研究方法、社会研究方法、营销业务等问题上。由于它的简单易学,一般稍有基础的学者学习几天便可以用 SPSS 去做简单的数据分析处理。但是若想真正地应用好 SPSS,要求研究使用者要掌握基本的数理统计知识,并能运用此软件多进行实践,在实际操作中掌握和了解得出的统计结果的实际意义。一般说来,SPSS 可以帮助数学基础不够的使用者来运用现代统计技术。操作者仅需考虑是采用哪种统计方法,并初步了解对分析结果的解释,而不需要它具体的运算过程,就可以在参考使用手册的基础下完成对数据的定量分析。在 SPSS 软件中采用 EXCEL 表格的方式录入,是比较常用的数据接口,它能方便的从其他的数据

37、库中录入数据。在 SPSS 界面中包含很多常用和较成熟的统计方法,可以满足非统计专业人士处理数据的需要。SPSS 的功能也很全面。它提供了数据的获取、数据的准备和管理、数据的分析、结果报告这一整个的数据分析的完整步骤,所以它基本包括了数据分析的整个步骤,特别适合制作研究报告的相关图表、设计调查方案、对数据进行统计分析4。并且,它也具有一整套对数据输入、统计分析、编辑、图形制作、表格等功能,仅仅在SPSS Base 中就包含了从简单到复杂的多元统计法,例如生存分析、非参数检验、探索性分析、列联表分析、统计描述、偏相关、秩相关、二维相关、一元方差分析、协方差分析、因子分析、判别分析、聚类分析等常见

38、的分析方法。对于较常见的统计方法,在输出对话框中就能完成绝大部分 SPSS 的命令语句。同时在此软件中,能打开多个数据集和多格式的数据文件。例如 EXCEL、Acces、Dbase、SAS 等。结果也可以保存为 word、html、PPT、txt 等 7 种图形文件。济南大学毕业论文16在本文中,是对数据进行主成分分析,所以利用 SPSS 是最简便的处理方法,因它的好用好学好操作,更容易进行分析评价。济南大学毕业论文175 学生成绩分析评价5.1 主成分分析在 SPSS 中的具体操作步骤 在 SPSS 中用降维的因子分析(自 SPSS 22.0 改版以来,主成分分析并到了因子分析中),此次的数

39、据分析是采用的济南大学数学科学学院 2013 届数学与应用数学1302 班学生大一至大四的成绩。下面是对主成分分析再 SPSS 软件中的操作进行具体说明2: (1)在菜单中选择分析降维因子分析。 (2)将研究的 44 个课程变量导入变量框。 (3)在因子分析的描述统计对话框中依次在因子分析对话框中的描述-提取-旋转-得分中选择相应的命令。如图所示:图(2) 图(3)图(4) 图(5)济南大学毕业论文18图(6) 图(7)图(8) (4)则依次在 SPSS 的输出结构中得到公因子方差,总方差解释表,碎石图,成分矩阵,旋转后的成分矩阵,成分转换矩阵,旋转后的空间组建图,成分的分析矩阵,成分协方差矩

40、阵8。5.2 对 SPSS 的输出结果进行说明 (1)输出了公因子方差表。因为变量之间的相关程度不同,所以需要建立相关因子。济南大学毕业论文19图(9) 图(10) (2)输出总方差解释表,在表里的初始特征值就是这 44 个数据相关性矩阵的特征值。前 11 个成分特征值已占总方差的 86%,而后面的特征值的贡献也越来越少。济南大学毕业论文20图(11)图(12) (3)输出碎石组件图图(13) (4)输出成分矩阵。济南大学毕业论文21图(14)图(15) 在图(14)、(15)中的每一列代表的每个主成分作为原始变量组合的比例。由图知,第一、第二、第三.第十一个主成分与原始变量之间的关系,其线性

41、表达式为:济南大学毕业论文2244434241403938373635343332313029282726252423222120191817161514131211109876543211259. 055. 0760. 0795. 0687. 0387. 0339. 0441. 0686. 0676. 0661. 0384. 0610. 0064. 0763. 0383. 0736. 0558. 0647. 0044. 0325. 0707. 0804. 0821. 0705. 0654. 0803. 0795. 0772. 0511. 0831. 0765. 0827. 0255. 031

42、9. 0754. 0868. 0873. 0787. 0761. 0863. 0824. 0759. 0573. 0 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxy44434241403938373635343332313029282726252423222120191817161514131211109876543212010. 0549. 0226. 0211. 0316. 0346. 0429. 0487. 0558. 0195. 0246. 0477. 0010. 0402. 0128. 0291. 0187. 0094. 0000. 060

43、7. 0212. 0271. 0074. 0230. 0042. 0099. 0096. 0036. 0095. 0019. 0275. 0034. 0178. 0437. 0092. 0056. 0099. 0187. 0267. 0399. 0020. 0014. 0190. 0348. 0 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxy44434241403938373635343332313029282726252423222120191817161514131211109876543213065. 0364. 0173. 0071. 001

44、9. 0664. 0447. 0493. 0066. 0269. 0282. 0200. 0331. 0218. 0171. 0336. 0180. 0305. 0122. 0130. 0349. 0124. 0040. 0168. 0047. 0345. 0086. 0036. 0256. 0241. 0179. 0202. 0003. 0464. 0258. 0029. 0079. 0149. 0225. 0194. 0179. 0408. 0389. 0122. 0 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxy (5)输出成分旋转矩阵,说明了

45、44 个课程变量与得出的主成分因子之间的关系:1110987654321511109876543214111098765432131110987654321211109876543211253. 0111. 0056. 0198. 0061. 0110. 0034. 0138. 0504. 0236. 0633. 0012. 0186. 0098. 0021. 0130. 0076. 0028. 0129. 0190. 0118. 0878. 0106. 0005. 0193. 0011. 0028. 0010. 0184. 0178. 0288. 0046. 0814. 0030. 0101

46、. 0472. 0137. 0101. 0078. 0197. 0129. 0167. 0064. 0749. 0372. 0258. 0442. 0173. 0062. 0001. 0367. 0093. 0183. 0329. 0374. 0fffffffffffxfffffffffffxfffffffffffxfffffffffffxfffffffffffx 第一因子主要和数学分析 1、高等代数 1、数学分析 2、数学分析 3、高等代数2、概率论与数理统计、复变函数、常微分方程、近世代数、实变函数、数理方程、模糊数学有很强的正相关。因此可以将第一因子命名为“计算因子”。 第二因子主要和大

47、学英语 1、大学英语 2、大学英语 3、大学英语 4 有很强的正相关。因此可以将第二因子命名为“英语因子”。 第三因子主要和毛泽东思想和中国特色社会主义、思想道德修养与法律基础、马克思主义基本原理概论有很强的正相关。因此可以把第三因子命名为“政治因子”济南大学毕业论文23。 第四因子主要和大学物理 F、多媒体技术及应用、数学模型有很强的正相关。因此可以把第四因子命名为“实践应用因子”。 第五因子主要和点集拓扑学、解析几何、泛函分析、微分几何有很强的正相关。因此可以将第五因子命名为“空间证明因子”。 第六因子主要和书写技能、教师专业发展基础、教学教育学、中外教育史有很强的正相关。因此可以讲第六因

48、子命名为“教师专业技能因子”。 第七因子主要和算法与程序设计、数值分析有很强的正相关。因此可以将第七因子命名为“编程因子”。 第八因子主要和课程与教学论、现代教育技术应用、教师心理健康有很强的正相关。因此将第八因子命名为“教学基础技能因子”。 第九因子主要和教师语言、心理学、教育学有很强的正相关。因此将第九因子命名为“教师基础知识因子”。 第十因子主要和教师心理学、班级管理、教育法律与法规、中学生心理辅导与学习方法、形式与政策有关。因此可以将第十因子命名为“教师外在储备知识因子”。 第十一因子与分析代数续有关。将第十一因子命名为“分析代数因子”。这一因子在后续评价中可以不做考虑。因为这一因子只

49、与一门课程有关,且这一课程是大四仅开设的一个半月的课程,与大学生的考研的相关性不大。 (6)输出旋转后的空间组件图。 济南大学毕业论文24图(16) (7)输出成分得分系数表图(17)济南大学毕业论文25图(18) 由图(17)、(18)可以得出每个学生所对应的每个因子之间的关系10。得出它们间的关系表达式为444342414039383736353433323130292827262524232221209181716151411321111098765432110.060-0.130.068-0.1550.0740.017-0.067-0.027-0.0870.0070.050-0.080

50、-0.076-0.0200.1160.0240.0090.069-0.0870.019-0.0380.094-0.0630.009-0.107-0.095-0.1220.0090.0510.132-0.1470.0250.098077. 0037. 0012. 0035. 0009. 0147. 0061. 0179. 0114. 0098. 044. 0 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxf444342414039383736353433323130292827262524232221201918171615141312111098765

51、43212058. 0026. 0028. 0051. 0092. 0273. 0215. 0301. 0187. 0035. 0028. 0009. 0007. 0118. 0075. 0114. 0091. 0034. 0050. 0047. 0009. 0016. 0024. 0029. 0006. 0036. 0004. 0016. 0017. 0169. 0027. 0027. 0054. 0036. 0080. 0028. 0035. 0021. 0069. 0018. 0001. 0061. 0031. 0078. 0 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

52、xxxxxxxxxxxxxxf4443424140393837363534333231302928272625242322212019181716151413121109876543213128. 0027. 0047. 0092. 0040. 0064. 0038. 0003. 0052. 0342. 0027. 0377. 0005. 0033. 0081. 0009. 0056. 0037. 0030. 0057. 0143. 0003. 0003. 0069. 0162. 0056. 0057. 0060. 0101. 0211. 0127. 0101. 0163. 0051. 002

53、8. 0149. 0082. 0073. 0118. 0142. 0014. 0045. 0029. 00.008xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxf济南大学毕业论文261111111111111111111111111111111111109876543214050. 0091. 0051. 0091. 0135. 0091. 0085. 0147. 0097. 0070. 0004. 0073. 0015. 0053. 0204. 0055. 0103. 0034. 0000. 0056. 0078. 0255. 0060. 0134.

54、 0317. 0029. 0117. 0296. 0014. 0172. 0054. 0336. 0093. 0103. 0029. 0183. 0057. 0105. 0023. 0056. 0103. 0052. 0056. 0006. 0 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxf44434241403938373635343332313029282726252423222120191817161514131211109876543215034. 0166. 0267. 0071. 0238. 0012. 0162. 0092. 0144.

55、 0011. 0109. 0027. 0035. 0045. 0070. 0105. 0044. 0011. 0106. 0058. 0173. 0076. 0169. 0202. 0061. 0368. 0092. 0055. 0067. 0038. 0013. 0135. 0056. 0042. 0004. 0014. 0048. 0075. 0059. 0069. 0127. 0007. 0055. 0186. 0 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxf052. 0228. 0035. 0034. 0019. 0072. 0123. 0

56、011. 0008. 0023. 0059. 0100. 0004. 0029. 0027. 0268. 0038. 0048. 0205. 0045. 0152. 0197. 0039. 0076. 0006. 0001. 0068. 0062. 00072. 0152. 0002. 0007. 0035. 0439. 0044. 0045. 0047. 0083. 0091. 0080. 0009. 0033. 0031. 0021. 0111111111111111111111111111111111109876543216xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

57、xxxxxxxxxxxf44434241403938373635343332313029282726252423222120191817161514131211109876543217122. 0140. 0099. 0143. 0057. 0088. 0165. 0054. 0130. 0078. 0392. 0028. 0429. 0067. 0076. 0213. 0121. 0193. 0148. 0061. 0061. 0036. 0100. 0027. 0071. 0019. 0087. 0016. 0073. 0155. 0046. 0039. 0063. 0089. 0060.

58、 0123. 0064. 0032. 0033. 0041. 0032. 0065. 0011. 0098. 0 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxf44434241403938373635343332313029282726252423222120191817161514131211109876543218069. 0054. 0069. 0019. 0047. 0019. 0085. 0050. 0020. 0044. 0006. 0002. 0040. 0365. 0071. 0191. 0027. 0004. 0062. 0369.

59、 0302. 0034. 0011. 0073. 0015. 0082. 0047. 0013. 0004. 0029. 0032. 0043. 0040. 0024. 0068. 0055. 0048. 0005. 0041. 0047. 0013. 0008. 0087. 0070 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxf44434241403938373635343332313029282726252423222120191817161514131211109876543219027. 0037. 0026. 0063. 0149. 00

60、60. 0064. 0139. 0010. 0028. 0042. 0019. 0028. 0069. 0017. 0147. 0056. 0091. 0016. 0080. 0140. 0089. 0117. 0084. 0018. 0132. 0113. 0088. 0105. 0064. 0002. 0046. 0016. 0131. 0436. 0120. 0056. 0038. 0058. 0050. 0073. 0033. 0192. 0232. 0 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxf444342414039383736353

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论