




已阅读5页,还剩18页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学生知识结构的多元统计评价以信息与计算科学2004级为例摘要:本文结合四川农业大学信息与计算科学专业2004级学生学习的具体实际,应用因子分析和聚类分析方法对学生必修课成绩进行实证分析,获取本专业学生所具有的知识结构,并用SPSS软件实现运算,结果表明我校制定的本专业人才培养目标与社会需求基本一致。关键词:知识结构,因子分析,聚类分析,SPSSStudents knowledge of multivariate statistical evaluation- Information and Computational Science, Grade 2004 as an exampleAbstract :This paper union the specific realities which for Sichuan Agricultural University Information and Computational Science, Grade 2004 levels of students study, the application factorial analysis and the cluster analysis method to the student required course result carries on the empirical analysis, gains knowledge structure which this college major has, and realizes the operation with the SPSS software, the result indicated my school formulation this professional raises the goal basically with the social demand consistent.Keywords : Knowledge structure, Factorial analysis, Cluster analysis, SPSS1 前言多元统计分析起源于20世纪初,1928年Wishart发表论文多元正态总体样本协差阵的精确分布,可以说是多元分析的开端。70年代初期在我国才受到各个领域的极大关注,30余年来我国在多元分析的理论研究和应用上也取得了很多显著成绩,有些研究工作已达到国际水平,并已形成一支科技队伍,活跃在各条战线上。多元统计分析是从经典统计学中发展起来的一个分支,是一种综合分析方法,它能够在多个对象和多个指标互相关联的情况下分析它们的统计规律。各种统计软件包如SAS,SPSS等的应用,使实际工作者利用多元统计分析方法解决实际问题更简单方便。重要的多元统计分析方法有:多重回归分析(简称回归分析)、判别分析、聚类分析、主成分分析、对应分析、因子分析、典型相关分析、多元方差分析等1-2。教育部于1998年颁布的新的本科专业目录中明确设置了信息与计算科学专业,它包含了原来数学类的计算数学及其应用软件、运筹学与控制论和信息论,专业口径大大地拓宽。该专业强调用数学的思想与当今计算机界所倡导的建立开放、沟通、网络化,以素质教育和尝新教育为核心的教育理念相一致,有形技术和无形技术相结合构成了本专业的真正内涵。这一专业设置不仅较好地适应了新世纪以信息技术为核心的全球经济发展格局下的数学人才培养与专业发展,而且也对数学类专业的招生带来了正面影响。该专业培养的学生应该是“强基础、宽口径、重实际、有侧重”的人才,要实现这个培养目标,必须树立厚基础、宽口径、个性化发展的专业教育理念3,使毕业生不仅有扎实的数学基础,同时具备一定的编程能力,涵盖理科和工科的范围。我校从2003 年开设信息与计算科学专业。2008年,本专业第二届学生就要毕业了,为了使毕业生对自己大学四年所学的知识结构有充分的认识,同时为了更好地指导以后各届学生学习,本文专门就学生的知识结构进行分析,应用因子分析和聚类分析对四川农业大学信息与计算科学专业2004级56名学生进行知识结构分析,确定能力倾向,具有很强的实用价值。2综合评价原理与方法总体思路:从多元统计理论出发,选定四川农业大学生命科学与理学院信息与计算科学专业2004级56名学生作为研究对象,通过对课程进行分析,获取本专业学生所具有的知识结构。同时对学生的专业课成绩进行分析,力求找出每位学生的优势以便对他们定位,数据处理使用因子分析和聚类分析方法。2.1 因子分析2.1.1 因子分析的概念和思想因子分析(Factor Analysis)是多元统计分析中一种非常重要的方法,它是利用降维的思想,从研究变量相关矩阵内部结构出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多元统计方法4。我们的科学研究大多是多变量大样本,虽然提供了丰富的信息,但却增加了数据采集和处理的难度。更重要的是在大多数情况下,许多变量之间存在一定的相关关系,从而增加了问题分析的复杂性。因子分析就是将大量的彼此可能存在相关关系的变量转换成较少的彼此不相关的综合指标的一种多元统计方法。这样既可减轻收集信息的工作量,且各综合指标代表的信息不重叠,便于分析。因子分析的基本思想是根据相关性大小将变量分组,使得同组内的变量之间相关性较高,不同组的变量相关性较低,每组变量代表一个基本结构,用一个不可观测的综合变量表示,这个基本结构称为公共因子,对于所研究的问题就可用最少个数的不可观测的公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。2.1.2 因子分析的模型设个可能存在相关关系的测试变量含有个独立的公共因子,测试变量含有独特因子,诸间互不相关,且与也互不相关,每个可由个公共因子和自身对应的独特因子线性表出为: 用矩阵表示为:模型简记为: 且满足:; ; 即不相关,且均值皆为0,方差皆为1; ,即不相关,且都是标准化的变量,假定也是标准化的,但并不相互独立。式中的称为因子载荷矩阵,其元素(即中各方程的系数)表示第个变量在第个公共因子上的载荷,简称因子载荷,如果把看成维因子空间的一个向量,则表示在坐标轴上的投影。因子分析的目的就是通过模型或。以代,由于一般有,从而达到简化变量维数的目标。2.1.3 因子分析的步骤围绕浓缩变量提取因子的核心目标,因子分析通常包括以下四个主要步骤:(1) 相关性判定。借助变量的相关矩阵、KMO检验和Bartlett检验方法进行分析,相关矩阵是因子分析直接要用的数据,根据结果进一步判断应用因子分析方法是否合适;(2) 提取因子。将变量综合成少数几个因子是因子分析的核心思想,在这一步要确定因子的格式和求因子求解的方法;(3) 因子旋转。建立因子分析模型的目的不仅要找出主因子,更重要的是知道每个主因子的明确意义,这一步的目的是通过坐标变换使因子解的实际意义更容易解释;(4) 计算因子得分。因子得分是各个因子在每个样本上的得分值,有了因子得分值就可以在其他的分析中使用这些因子6,10。2.2 聚类分析2.2.1 聚类分析的概念和分类聚类分析(Cluster Analysis)是根据研究对象的特征对其进行分类的多元分析技术的总称7。聚类分析的基本思想是根据对象间的相关程度进行类别的聚合。在进行聚类分析之前,这些类别是隐蔽的,能分为多少种类别事先也是不知道的。聚类分析的原则是同一类中的个体有较大的相似性,不同类中的个差异很大8。根据分类对象的不同可把聚类分析分为样本聚类和变量聚类。对样本的聚类又称为Q型聚类,就是对样本单位的观测量进行聚类,是根据被观测的对象的各种特征,即反映被观测对象的特征的各变量值进行分类。不同的分析目的选用不同的指标(变量)作为分类的依据。对变量的聚类又称为R 型聚类。反映同一事物特点的变量有很多,我们往往根据所研究的问题选择部分变量对事物的某一方面进行研究。由于人类对客观事物的认识是有限的,往往难以找出彼此独立的有代表性的变量,而影响对问题的进一步认识和研究。因此往往先要进行变量聚类,找出彼此独立且有代表性的变量,而又不丢失大部分信息。根据分类原理的不同可将聚类分析分为系统聚类法(或称为分层聚类法)、动态聚类法、快速聚类法、模糊聚类法、有序聚类法,其中系统聚类方法是最常用最基本的一种聚类分析方法。系统聚类法(Hierachical Clustering Methods)是目前应用最为广泛的一种聚类方法,其基本思想是:首先是个样本各自成一类,然后规定类与类之间的距离,选择距离最小的两类合并成一个新类,计算新类与其它类的距离,再将距离最小的两类进行合并,这样每次减少一类,直到达到所需的分类数或所有的样本都归为一类为止。聚类的结果可以用聚类图(树状图)形象地描绘出来9-10。2.2.2 聚类分析的步骤不管是对样本的聚类分析还是对变量的聚类分析,一般来说,聚类分析至少都应该包括以下五个步骤:(1) 选择变量。因为聚类分析是根据所选定的变量对研究对象进行分类,聚类的结果仅仅反映了所选定变量所定义的数据结构,所以变量的选择在聚类分析中非常重要。选择变量时要注意克服“加入尽可能多的变量”这种错误倾向,并不是加入的变量越多,得到的结果越客观。有时,由于加入一两个不合适的变量就会使得分类结果大相径庭。所以,聚类分析应该只根据在研究对象上有显著差别的那些变量进行分类。(2) 计算聚类统计量。聚类统计量是根据变换以后的数据计算得到的一个新数据。它用于表明各样本或变量间的关系密切程度。常用的统计量有距离和相似系数两大类。(3) 计算相似性。相似性是聚类分析中的一个基本概念,它反映了研究对象之间的亲疏程度,聚类分析就是根据研究对象之间的相似性来进行分类的。(4) 选择聚类方法。根据聚类统计量,运用一定的聚类方法,将关系密切的样本或变量聚为一类,将关系不密切的样本或变量区分开。选择聚类方法是聚类分析最重要的一步。(5) 聚类结果的解释和证实。得到聚类结果后,最后一步还应该对结果进行验证和解释,以保证聚类解是可信的11-12。3问题的提出与分析3.1 问题的提出本文所用的数据是我校信息与计算科学专业2004级的27门必修课和三门实践教学共30门课程的成绩,这些课程表示如表1:表1 课程表课程代码课程代码课程代码C语言计算机应用基础数值计算方法大学英语计算机原理思想道德修养邓小平理论概论解析几何体育总成绩法律基础离散数学文献检索概率论与数理统计马克思主义哲学原理现代计算科学基础高等代数马克思主义政治经济学原理形势与政策管理信息系统毛泽东思想概论运筹学汇编语言普通物理计算机操作系统(实践教学)计算机图形学数学分析计算机网络技术(实践教学)计算机网络数学模型实用软件技术(实践教学)为了获取较为全面的信息,本论文选用了该专业56人的30门课程的成绩。由于涉及的变量(课程)较多,直接进行比较分析较为烦琐,因此首先考虑采用因子分析方法减少变量个数,之后再进行比较分析和综合评价。3.2 问题分析3.2.1 因子分析及结果 把学生成绩数据(附件1)导入到SPSS中,调用SPSS中的“因子分析”,设立各种参数及输出选项,即可得到因子分析的结果。(1) 考察变量是否适合进行因子分析首先考察收集到的变量之间是否存在一定的线性关系,是否适合采用因子分析提取因子。这里借助变量的相关系数矩阵、KMO检验和Bartlett检验方法进行分析。结果如表2。从变量的相关系数矩阵(附件2)可以看到:大部分的相关系数都大于0.3,各变量呈较强的线性关系,表明能够从中提取公因子,适合进行因子分析。表2 KMO和Bartlett的检验取样足够度的 Kaiser-Meyer-Olkin 度量.720Bartlett 的球形度检验近似卡方1008.653435 df Sig.000由表2可知:KMO值为0.720,巴特利特球度检验统计量的观测值为1008.653,相应的概率P值接近0。显著性水平为0.05,由于概率P值小于现有水平,则应拒绝原假设,认为相关系数矩阵与单位阵有显著差异。这些都说明本论文中的数据比较适合进行因子分析 13。(2) 提取因子 根据变量的相关系数矩阵,采用主成分分析法提取因子,由于选取特征值大于1的特征根时,所提取的信息只有57.78%,信息丢失较为严重。为了使因子提取的总体效果理想,重新指定了提取特征根的标准,指定提取15个特征根,分析结果如表3、4 、5所示。表3 公因子方差初始提取初始提取Z110.8581Z1610.8758Z210.8702Z1710.8356Z310.8596Z1810.8822Z410.8817Z1910.8612Z510.9116Z2010.9473Z610.8581Z2110.8541Z710.8875Z2210.9593Z810.8808Z2310.9345Z910.8458Z2410.8816Z1010.8979Z2510.9085Z11Z12110.86890.7683Z26Z27110.83160.8587Z1310.9328Z2810.9099Z1410.9200Z2910.9168Z1510.9125Z3010.9125表3是指定提取15个特征根下因子分析的初始解,显示了所有变量的共同度数据。第二、五列是因子分析初始解下的变量共同度,它表明:对原有30个变量如果采用主成分分析方法提取所有特征根(30个),那么变量的所有方差都可被解释,变量的共同度均为1(变量标准化后的方差为1)。事实上,因子个数小于变量的个数才是因子分析的目标,所以不可提取全部特征根;第三、六列是在指定提取条件提取特征根时的共同度,此时所有变量的共同度均较高,信息丢失都较少。可以说本次因子提取的总体效果较理想。表4 因子解释变量总方差成分初始特征值提取平方和载入旋转平方和载入合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 %111.08436.94736.94711.08436.94736.9474.61115.36915.36922.1607.20144.1472.1607.20144.1472.3997.99823.36731.8026.00650.1531.8026.00650.1532.3837.94331.31041.5495.16355.3161.5495.16355.3161.8986.32637.63751.4744.91360.2301.4744.91360.2301.5495.16442.80161.2814.27164.5001.2814.27164.5001.5335.11047.91171.2114.03868.5381.2114.03868.5381.4974.98952.90081.0093.36371.9021.0093.36371.9021.4654.88457.7849.9013.00474.905.9013.00474.9051.4364.78762.57210.7992.66377.569.7992.66377.5691.3934.64367.21511.7702.56880.137.7702.56880.1371.3804.60271.81612.7152.38482.521.7152.38482.5211.3744.58176.39713.6472.15884.679.6472.15884.6791.2774.25580.65214.5961.98886.667.5961.98886.6671.2304.10084.75215.5251.74988.416.5251.74988.4161.0993.66488.41616.4551.51789.933 17.4171.38991.322 18.3931.31092.633 19.3811.27193.904 20.3191.06394.967 21.3111.03796.004 22.228.75996.763 23.213.70997.472 24.195.64998.121 25.143.47898.599 26.133.44399.042 27.117.39299.434 28.074.24799.680 29.057.19199.872 30.038.128100.000 表4中,第一列是因子编号,以后三列组成一组,每组中的数据项的含义依次是特征根值、方差贡献率和累计方差贡献率。第一组数据项(第二列第四列)描述了初始因子解的情况。可以看到:第1个因子的特征根为11.084,解释原30个变量总方差的36.947%,累积方差贡献率为36.947%,其余数据含义类似。在初始解中由于提取了30个因子,因此变量的总方差均被解释掉。第二组数据项(第五列第七列)描述了因子解的情况。可以看到:指定的15个因子共解释了变量总方差的88.416%。总体上,变量的信息丢失较少,因子分析效果较理想。第三组数据项(第八列第十列)描述了最终因子解的情况。可见,因子旋转后,没有影响变量的共同度,但却重新分配了各个因子解释变量的方差,改变了各因子的方差贡献,使得因子更易于解释。表5 因子载荷矩阵成分123456789101112131415Z6.842-.191-.159-.009.070-.065-.131.166.164.038.028.033-.027-.052.015Z3.814.025.186-.133.015.099.029.014-.123-.039.008.097-.242-.220-.021Z19.794.178-.143.086-.055-.151-.043-.017.065.028.190-.136-.137.093.235Z16.792-.229.051-.124-.061.064.151.019-.142.212.095-.107.108.080-.210Z21.769.188.021.040-.133-.106-.211-.045.145-.012-.228.156-.134.170-.077Z14.762-.251-.253.175-.056.098-.066-.181.068.041-.042-.095.272-.202-.008Z5.749.109-.142.048-.241.338-.040.023.102-.092-.269-.130.033.122-.131Z2.745-.211.023.176-.105-.023.114.035-.382-.005.035-.096.102-.216-.017Z12.715.079-.319.117-.044-.033-.004-.146.076-.241.033.098-.106-.049-.153Z24.696.094.327.199-.102.083.045-.059.092-.141-.124-.220.212-.234.164Z27.690.123-.371.048-.009.013.193-.303-.114.260-.052.017-.077.018-.091Z1.664.181-.375-.086-.094-.042.358.206.034-.063-.053.180-.076.094-.016Z17.651.226.356-.027.287.075.001-.101-.279-.096-.052.111-.048-.128.119Z4.649-.150-.153-.343.323-.105.121.108-.042.199-.251-.129-.020-.108-.149Z7.635.222.141.241.120-.113-.010.092-.138-.107-.058.428.300.095.079Z9.627-.237.115-.442-.135.034-.223.082-.058.144.185.075-.201-.018.081Z18.625-.095-.233-.021.031.055-.231.418.059-.362.112-.214-.005.045-.025Z13.598-.342-.122.246.014-.191-.228.041.095.424.023.040.013.055.314Z10.578.268.172-.026-.083.432-.081.027-.104.005.430-.170.044.187.002Z8.510.463.137-.036-.475-.212-.067.200-.074.012-.215-.003-.049.009.131Z26.276-.624.203-.012.393.023-.192.115.227-.189-.160.036-.072-.018.015Z28-.022.511-.420.144.426.244.062.158.305.151.143.064.151-.125.052Z29.311.444.427.204.155-.212.169-.132.361.069.054-.213-.265-.158-.077Z25.315-.181.553.258-.222.338-.062.058.270.241.006.208.059.075-.224Z20.451.099.210-.466.067-.419.016-.221.160-.034-.036-.209.328.257-.005Z15.213.378.110.059.634.149-.332.051-.278.121-.165-.107-.038.190-.063Z23.455-.168.018.461.150-.508-.074-.120-.094-.135.309.051-.025.077-.234Z22.310-.411.041.296.163.255.517-.172-.015-.125-.116-.091-.166.314.228Z11.486-.033.259-.354.172-.057.504.253.130-.020.179.166.101-.013.023Z30.459.007-.121-.413.055.224-.214-.558.132-.165.095.207.017-.048.083表5显示的是因子载荷矩阵,是因子分析的核心内容。根据该表数据得到本文的因子分析模型如下: 由表5可知,30个变量在第1、2、3、4个因子上的载荷很高,意味着它们与第1、2、3、4个因子的相关程度高,同时第1个因子是最重要;其他因子与变量的相关性均很小,对变量的解释作用不显著。(3) 计算因子得分这里,采用回归法计算因子得分系数,并输出因子得分系数。具体结果如表6所示。表6 因子得分系数成分123456789101112131415Z1.307.238-.231-.081-.101-.115-.094-.084-.123-.006-.091.090-.062.122-.081Z2-.144.082.491-.059-.127-.065.032-.111.005.088.147.076-.141-.072-.181Z3.016.211.039-.075.165.205-.049.038.047-.039.181-.009-.061-.108-.414Z4.076.277.203-.024-.134.007-.332.058.263-.113-.004-.315-.049-.109.076Z5.371-.211.083-.243-.091-.094.001.062.078-.190.005-.156.202.097.124Z6.064.061-.033.174-.019.010-.021.197-.070.011-.109-.038.010-.118-.054Z7-.032.025-.081-.023.001-.321-.138-.043.033.133-.141.733.134-.010.083Z8.223-.085-.065.123-.222.107-.034-.118-.044-.278.238.249-.106-.138.016Z9-.067.205-.207.289.181-.014.198.014-.011-.095.227-.105-.020-.166-.181Z10-.128-.017-.063-.038.026-.086.728-.158.070.072-.070-.110.114.077.061Z11-.140.546-.128-.094-.060.003.046.036-.227-.012-.184.184.046.048.094Z12.251-.059-.034-.259.198.044-.081.064-.104.278-.032-.070-.031-.035-.144Z13-.170-.109-.077.823-.066-.017-.039-.053-.026-.141-.084.120-.001.072.018Z14-.088-.155.521.035.103-.069-.106.028-.141-.020-.204-.015.045-.089.093Z15.006-.111-.084.004-.113-.094.049.018.751-.001-.001-.050.006.043.070Z16-.030.212.172-.067-.135-.190.089-.199.107.151.047-.286.237-.022.162Z17-.162.081.092-.059.181.115-.027-.007.231-.072.127.336-.161.044-.202Z18.185-.078-.020-.173-.227-.086.401.445-.058.054-.046-.066-.220-.103.014Z19-.001-.104-.180.362-.001.196.297-.055-.094-.016-.008.007-.276.148.027Z20-.070-.049-.022-.042-.001-.055.029-.023-.006.030.008.000-.035.031.900Z21.353-.150-.317.015.051.023-.207.037.111.020.126.030.198-.016.061Z22.045-.081-.206.065-.044.029.086.009.016-.133.103.053-.115.907.032Z23-.035-.034-.081-.118-.047.018.042-.012-.003.813.063-.060.031-.073.028Z24-.148-.192.492-.050-.044.275.036.145-.171-.277-.063.235-.096.015.115Z25.028.043-.087-.035-.034-.027-.054-.016-.027.054-.076-.068.814-.076-.037Z26-.001-.015-.087-.008.048.048-.156.579.048-.036.022.018.045.080-.022Z27.110.044.080.084.129-.019-.204-.388.136.091-.024-.236.037.121-.049Z28-.070.092.045.113.022.056.037.021-.026-.087-.711.042.036-.105-.070Z29-.010.028-.037-.031-.029.766-.070.028-.035.091-.071-.311.039-.019-.042Z30-.068-.109-.070-.050.767-.035-.007.020-.107-.039-.044.097-.033.011.049根据表6中的数据,我们可得到因子得分函数如下: 最后,由回归法计算出各因子的得分,各因子得分的均值为0,标准差为1,正值表示高于平均水平,负值表示低于平均水平。其中加权平均的权重是使用每一个因子所能解释总方差的比重,计算出各位学生的总因子,即: 运用表6中的数据及公式在Matlab中编程14-15,Matlab源程序见(附件3),对数据进行标准化及计算各因子得分,运用各因子得分及公式计算得到总因子得分及学生的排名如表7。表7 总因子得分及排名姓名总因子F总排名姓名总因子F总排名姓名总因子F总排名陈宇-0.053829刘小娟0.28409翁治林0.64222周延军-0.004426邓丽-0.098831黄炜-0.038828李大东-0.190839曹艳0.099320魏权森0.146619刘全-0.258245张燕0.0362722周军辉-0.392553赵兵-0.182538王威0.175117陈洪祥0.242213杨侠麟-0.249744余昊熠-0.271647罗伟-0.229942李辉0.046121舒廷廷0.51314郭宇-0.290650周何川-0.465456李日诚0.35857邹渝-0.288349马锐-0.219941张洋-0.063930赵林-0.272548王炜-0.102832张军-0.264246陈建平-0.301751李克勇-0.178037郭庆-0.438455郭航0.68521周岩0.223514吕超凡-0.012127涂倩0.191616侯骥-0.106033付刚-0.125834李慧0.260911罗桂林-0.201240杨鹏0.164518邓燕0.269510陈斌-0.365552余川0.020224谢婷0.28768李家强-0.406054郑波0.017425雷春燕-0.152036李世兴0.028023张勇-0.239243舒娟-0.129535杨志辉0.242712韩强0.45445罗彬0.204515戴天燕0.42226蒋忠强0.57853 通过因子分析得到的表7的结果,与实际情况非常吻合,在实际中通过其他方法计算的结果基本一致,前几名的排名完全一样,其他的也基本没什么大的变动,这说明我们所得到的因子分析结果很理想。3.3 聚类分析及结果3.3.1 对变量聚类分析调用SPSS中的“系统聚类法(Hierarchical Cluster)”,将课程相近的归为一类。通过对多种聚类方法的比较,最后选用最小偏差平方和法(Wards Method),距离测度选择欧氏距离的平方(Squared Euclidean distance)。聚类的结果用树形图表示如图1。图1 课程聚类的树形图 分析因子载荷矩阵,结合本专业人才培养方案及图1的分类,对本专业的课程分析如下:(1) 第一类:概率论与数理统计()、高等代数()、离散数学()、数学分析()、数学模型()、数值计算方法()等课程的系数较大,因此把第一类看成是这些课程的综合指标,这些课程是信息与计算科学学生从事数学的基础性课程,体现了毕业生在数学方面的基本能力。(2) 第二类:马克思主义政治经济学原理()、马克思主义哲学原理()、毛泽东思想概论()、邓小平理论概论()、思想道德修养()和法律基础(),这类课程主要是树立学生科学的世界观、正确的人生观和价值观,坚定自己的社会主义、共产主义信念,敬业爱岗、具有良好的思想品德、社会公德和职业道德。(3) 第三类:C语言()、汇编语言()、计算机图形学()、计算机网络()和计算机原理(),这类课程主要体现本专业的毕业生具有基本的算法分析、设计能力和较强的编程能力;能运用所学的理论、方法和技能解决某个领域某些科研或生产中的实际课题。(4) 第四类:计算机操作系统(实践教学)()、计算机网络技术(实践教学)()和实用软件技术(实践教学)(),这类课程反映学生掌握计算机网络和软件的基本操作、使用,使本专业学生能够根据工作需要构建新的网络及运用软件解决实际问题的能力。3.3.2 对学生聚类分析调用SPSS中的“系统聚类法(Hierarchical Cluster)”,将整体水平相近的学生归为一类。通过对多种聚类方法的比较,最后选用中位数法(Median Clustering),距离测度选择欧氏距离的平方(Squared Euclidean distance)。聚类的结果用树形图表示如图2:图2 学生聚类的树形图根据图2的聚类结果,可以有很多种分类方法,在这里,结合表7中的总因子得分及排名,可以将本专业56名学生分为四类。 第一类:戴天燕、韩强、蒋忠强、翁治林、舒廷廷、郭航,这类学生由于各门课程都很优秀,建议这类学生应继续深造,报考研究生,即使不读研,毕业后也可以从事研究方面的工作; 第二类:周岩、王威、杨鹏、谢婷、刘小娟、罗彬、邓燕、李慧、李辉、曹艳、魏权森、杨志辉、陈洪祥、李日诚、李世兴、涂倩,这类学生虽然成绩不如第一类,但是各门课程同样很优秀,但是这类学生在语言、文字方面有一定的优势,建议这类学生毕业后可以从事行政、人力资源方面的工作;第三类:陈宇、周延军、侯骥、邓丽、张燕、吕超凡、余川、郑波、黄炜、张洋、马锐、王炜、陈建平,这类学生虽然成绩一般,但是在计算机方面却拥有一定的优势,建议这类学生毕业后可以从事计算机行业的工作;第四类:付刚、李克勇、赵兵、罗桂林、罗伟、雷春燕、舒娟、李大东、张勇、杨侠麟、周何川、罗桂林、陈斌、李家强、刘全、余昊熠、张军、郭庆、周军辉、郭宇、邹渝、赵林,这类学生成绩并不理想,可能是他们在大学期间没有努力学习,也可能是他们不适合信息与计算科学专业的学习,建议这类学生毕业后,根据自己的兴趣爱好,选择自己喜欢的工作,兢兢业业地工作,同样可以创造出不菲的业绩。这里需要指出的是,以上结论只是对学生的能力倾向分析,做出了建议,在择业的过程中,还应该考虑社会需求,个人兴趣爱好等多种因素。聚类分析的理论基础还不是很成熟和完善,选择不同的距离或选择不同的聚类方法得到的聚类结果不同,带有一定的主观性。因此,在实际的研究过程中,可以选择不同的聚类方法,通过对各种分类结果的分析、对比,对所研究的对象的知识结构中可以得到分析全面和更加深入的认识,得到更加准确的结论,而且聚类分析只是一中提出假设的方法和手段,提出假设的合理性只有通过时间的检验才能得到验证。4 结果讨论通过对学生成绩定性的分析与我校教学计划的比较,本专业的知识结构基本符合培养目标。但是本专业的课程设置在学生个体培养方面使得某些学生的特长不突出、学习表现平平,很难对他们的能力倾向做出结论,一方面是学生个人努力程度不够,另一方面学校也应该考虑
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030功能饮料行业市场发展分析与发展趋势及投资前景预测报告
- 2025-2030功能性食品行业市场深度调研及前景趋势与投资研究报告
- 2025-2030功能性食品原料创新趋势与消费者偏好调研报告
- 2025-2030共享经济发展现状及未来转型方向研究报告
- 2025-2030全球抗菌肽药物研发管线布局与治疗领域拓展报告
- 聚焦2025年:抽水蓄能行业技术创新与市场拓展研究报告
- 2025年绿色能源产业绿色制造技术创新路径研究报告
- 2025年初中光伏发电试题及答案
- 2025年电工基础试题及答案
- 2025年猜食物的测试题及答案
- 机加工安全生产培训考核试题及答案(班组级)(精)
- 电梯从业证考试试题及答案解析
- 第二十四届上海市青少年计算机创新应用竞赛 python校内选拔试题及答案
- 《细胞》PPT课件-完美版
- 托育园厨师安全工作责任书
- 《编程猫系列》第1课-Hello-编程猫(课件)
- GB 16899-2011自动扶梯和自动人行道的制造与安装安全规范
- 非典型骨折课件
- 封闭区倒塌围墙修复施工方案
- 户口本翻译样本-Word范文-Word范文
- 企业融资计划书2022
评论
0/150
提交评论