




已阅读5页,还剩14页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
II对一所重点学校某个班成绩的综合分析摘 要随着社会竞争的越来越激烈,家长和老师对于学生成绩的态度愈加重视,对于学生将来的发展与前途也同样感到一丝忧虑,因此及时公布学生的学习成绩并且能够增其长补其短对于学生将会有很大的帮助。本文利用某所重点学校某个班的成绩单来分析这个班学生成绩的优劣,以达到取长补短的目的,主要应用了 SPSS 软件对成绩进行了综合性的分析。关键词:综合分析;SPSS 软件;成绩III目录1.对应分析的概述 .12.聚类分析的概述 .32.1 聚类分析的定义 .32.2 聚类的方法分类 .32.3 系统聚类法的基本步骤 .33.判别分析的概述 .43.1 判别分析的基本思想 .43.2 判别分析与聚类分析的关系 .44.在 SPSS 软件上的操作步骤 .54.1 对应分析的操作步骤 .54.2 聚类分析与判别分析的操作步骤 .65.结果分析 .75.1 对应表 .75.2 汇总 .75.3 概述行点和概述列点 .85.6 特征值 .115.7 显著性检验 .115.8 标准化典型判别式函数系数 .115.9 结构矩阵 .125.10 群组重心的函数 .125.11 分类函数系数 .136.结论 .147.对创新的认识 .15参考文献 .16附 录 .1711.对应分析的概述对应分析(correspondence analysis)又称为相应分析,是一种目的在于揭示变量和样品之间或者定性变量资料中变量与其类别之间的相互关系的多元统计分析方法。根据分析资料的类型不同,对应分析分为定性资料(分类资料)的对应分析和连续性资料的对应分析(基于均数的对应分析) 。其中,根据分析变量个数的多少,定性资料的对应分析又分为简单对应分析和多重对应分析。对两个分类变量进行的对应分析称为简单对应分析,对两个以上的分类变量进行的对应分析称为多重对应分析。对应分析实际是在 型因子分析和 型因子分析的基础上发展起来的一种RQ方法。对应分析将 型因子分析和 型因子分析结合起来进行统计分析,它是从型因子分析出发,而直接获得 型因子分析的结果。克服了由于样品容量大,R进行 型因子分析带来的计算上的困难。另外根据对原始数据进行规格化处理,Q找出 型因子分析和 型因子分析的内在联系,可将变量和样品同时反映到相同坐标轴的一张图形上,便于对问题的分析和解释。对应分析的重要输出结果之一在于,把变量与样品同时反映到相同坐标轴(因子轴)的一张图形上,结合计算结果,在绘出的图形上能够直观地观察变量之间的关系、样品之间的关系以及变量与样品之间的对应关系。为此也有人认为,对应分析的实质是将变量、样品的交叉表变换成为一张散点图,从而将表格中包含的变量、样品的关联信息用各散点空间位置关系的形式表现出来。随着计算机软件的应用,对应分析的方法在社会科学和自然科学领域都有着广泛的应用价值。特别是近年来在市场调查与研究中,有关市场细分、产品定位、品牌形象以及满意度研究等领域正得到越来越广泛的重视和应用。对应分析的关键是利用一种数据变换,使含有 个变量 个样品的原始数pn据矩阵,变换成为一个过渡矩阵 ,并通过矩阵 将 型因子分析和 型因子ZZRQ分析有机地结合起来。具体地说,首先给出进行 型因子分析时变量点的协差阵 和进行 型因子分析时样品点的协差阵 ,由于 和 有ZAQBZ相同的非零特征根,记为, ,m21 ),in(0p2依据证明,如果 的特征根 对应的特征向量为 ,则 的特征根 对应AiiUBi的特征向量就是 ,根据这个结论就可以很方便地借助 型因子分析而得iVZUR到 型因子分析的结果。因为求出 的特征根和特征向量后很容易地写出变量Q点协差阵对应的因子载荷矩阵,记为 。则Fmppp muuF 21221211这样,利用关系式 也很容易地写出样品点协差阵 对应的因子载荷阵,iVZUB记为 。则Gmnnnvv 2122 1211从分析结果的展示上,由于 和 具有相同的非零特征根,而这些特征根AB正是公共因子的方差,因此可以用相同的因子轴同时表示变量点和样品点,即把变量点和样品点同时反映在具有相同坐标轴的因子平面上,以便显示出变量点和样品点之间的相互关系,并且可以一并考虑进行分类分析。2.聚类分析的概述32.1聚类分析的定义聚类分析是统计学中研究“物以类聚”问题的多元统计分析方法。聚类分析又称群分析,它是研究对样品或指标进行分类的一种多元统计方法。所谓的“类” ,通俗地说就是相似元素的集合。2.2聚类的方法分类聚类分析的内容十分丰富,按其聚类的方法可分为以下几种:系统聚类法、调优法、最优分割法、模糊聚类法、图论聚类法、聚类预报法。本文中应用的是系统聚类法:开始每个对象自成一类,然后每次将最相似的两类合并,合并后重新计算新类与其他类的距离或相近性测度,这一过程一直继续直到所有对象归为一类为止。并类的过程可用一张谱系聚类图描述。2.3系统聚类法的基本步骤(1)计算 n 个样品两两间的距离,得样品间的距离矩阵 。类与类之间)0(D的距离本文应用的是类平均法。所谓类平均法就是:两类样品两两之间平方距离的平均作为类之间的距离,即: 采用这种类间距离的聚 类221epqijiGDdn方法,称为类平均法。(2) 初始(第一步:i=1)n 个样本各自构成一类,类的个数 k=n,第 t类 (t=1,2,n) 。此时类间的距离就是样品间的距离(即)(ttXG) 。)0()1(D(3)对步骤 i 得到的距离矩阵 ,合并类间距离最小的两类为一新类。)1(iD此时类的总个数 k 减少 1 类,即 k=n-i+1.(4)计算新类与其他类的距离,得新的距离矩阵 。若合并后类的总个)0(D数 k 扔大于 1,重新步骤(3)和(4) ;直到类的总个数为 1 时转到步骤(5) 。(5)画谱系聚类图;(6)决定总类的个数及各类的成员。43.判别分析的概述3.1判别分析的基本思想判别分析是用于判断个体所属类别的一种统计方法。根据已知观测对象的分类和若干表明观测对象特征的变量值,建立判别函数和判别准则,并使其错判率最小,对于一个未知分类的样本,将所测指标代入判别方程,从而判断它来自哪个总体。当然,这种准则在某种意义上是最优的,如错判概率最小或错判损失最小等。其前提是总体均值有显著差异,否则错分率大,判别分析无意义。3.2判别分析与聚类分析的关系区别:判别分析是在研究对象分类已知的情况下,根据样本数据推导出一个或一组判别函数,同时指定一种判别准则,用于确定待判样品的所属类别,使错判率最小。聚类分析预先不知道分类,它要解决的问题,正是对给定的未知分类的样品进行分类,它是一种纯统计技术,只要有多指标存在,就能根据各观测的变量值近似程度排序,只是描述性的统计,而判别分析能对未知分类观测判别分类,带有预测性质。联系:两者都是研究分类问题,两种方法往往联合起来使用。样品聚类是进行判别分析之前的必要工作,根据样品聚类的结果进行判别分析。54.在 SPSS软件上的操作步骤4.1对应分析的操作步骤(1)打开 SPSS 文件,在表格下方有两个选项,分别是数据试图和变量视图,点击变量视图选项,在前三行分别输入“学号” 、 “科目” 、 “成绩” ,其中学号与科目的值项需要做如下设置:在弹出的值标签对话框里,在值这一项里输入“1” ,标签输入“1” ,再点击“添加”按钮,依次添加到 40 为止,在科目的值标签对话框内,在值这一项中输入“1” ,标签输入“语文” ,点击“添加”按钮,再依次添加“2”对应标签为“数学” , “3”对应标签为“外语” , “4”对应标签为“体育” ,综上分别完成对 1 号至 40 号学号以及 4 项科目进行数字的赋值。然后点击数据视图进行数据输入,数据输入按照成绩单输入(成绩单见附录) ,如:第一行第一列输入“1” ,第二列输入“1” ,第三列输入“82” ,第二行第一列输入“2” ,第二列输入“1” ,第三列输入“81” ,以此类推,共输入160 行数据。在 SPSS 的数据视图中输入数据后,再依次点选数据加权个案,进入加权个案的对话框,系统默认是对观测值不使用权重,选中加权个案选项,此时下面的频率变量被激活,选中成绩并点击箭头,使变量成绩充当权数的作用,点击确定。 (2)数据输入完成后,选择分析降维对应分析,然后把“学号”选入“行” ,再点击“定义范围”来定义范围为 1(最小数值)到 40(最大数值) ,之后点击更新,再点击继续。之后同样地,把“科目”选入“列” ,并定义其范围为 14。然后点选“模型” ,在出现的对话框中选择数据标准化方法,本次分析距离度量点选 Eucliden,下面的标准化方法选择选项被激活,有 5 种可供选择的数据标准化方法,本次分析选择第 5 种:使列总和相等,删除均值,其余选项为默认,点击确定运行。(3)图表编辑:根据 SPSS 对数据的计算,会得到一系列的表格,对对后一张叠加散点图进行部分操作,双击叠加散点图会弹出一个图表编辑器,点击“向 X 轴添加参考线”又会弹出一个属性对话框,把位置坐标改为 0,关闭对话框,点击“向 Y 轴添加参考线” ,同上步骤将位置坐标改为 0,关闭图表编辑器,此时叠加散点图被分为 4 各区域,方便于接下来的结果分析。64.2聚类分析与判别分析的操作步骤1.再次打开 SPSS 文件,点击变量视图选项,在前七行分别输入“学号” 、“语文” 、 “数学” 、 “外语” 、 “体育” 、 “总分” 、 “概况” ,其中概况的值项需要做如下设置:在弹出的值标签对话框里,在值这一项里输入“1” ,标签输入“优” ,再点击“添加”按钮,依次添加“2”对应标签为“良” , “3”对应标签为“及格” , “4”对应标签为“不及格” ,综上分别完成对 4 种概况进行数字的赋值。然后同样点击数据视图进行数据输入,数据输入依然按照成绩单输入(成绩单见附录) 。2. 数据输入完成后,选择分析分类系统聚类,然后把“语文” 、 “数学”、 “外语” 、 “体育”选入变量中,然后点击“绘图” ,在出现的对话框中勾选谱系图,其余选项为默认,点击继续,确定运行。3.再次选择分析分类判别,然后把“概况”选入分组变量中,再点击“定义范围”来定义范围为 1(最小数值)到 4(最大数值) ,然后将“语文” 、“数学” 、 “外语” 、 “体育”选入自变量中,然后点击“Statistics” ,在出现的对话框中勾选平均值与 Fishers,其余选项为默认,点击继续,确定运行。75.结果分析5.1对应表表 5.1对应表科目学号 语文 数学 外语 体育 有效边际1 82.000 120.000 71.000 95.000 368.0002 81.000 119.000 77.000 90.000 367.0003 83.000 115.000 69.000 91.500 358.5004 72.000 115.000 75.000 95.000 357.000输出的第一部分对应表是由原始数据学号与科目分类的列联表,可以看出观测总数 n=40,说明原始数据中没有记录缺失,有效边际为行列数的总和。5.2汇总表 5.2第二部分汇总表给出了总惯量以及每一维度所揭示的总惯量的百分比的信息。可知总惯量为 0.01,卡方值为 0.4,有关系式:总惯量=卡方值*观测总数(0.4=0.01*40) ,由此可以清楚地看到总惯量与卡方值的关系,同时说明总惯量描述了列联表行与列之间总的相关关系。奇异值所反映的是行与列个状态在汇总惯量比例 置信奇异值相关维数 奇异值 惯量 解释 累积 标准差 21 .075 .006 .548 .548 .002 -.0412 .052 .003 .264 .813 .0023 .044 .002 .187 1.000总计 .010 1.000 1.0008二维图中分值的相关程度,实际上是对行与列进行因子分析产生的新的综合变量的典型相关系数,其在取值上等于特征值的平方根。惯量比例部分是各维度分别解释总惯量的比例及累计百分比,从表中可以看出第一维和第二维的惯量比例占总惯量的 81.3%,因此可以选取两维来进行分析。5.3概述行点和概述列点表 5.3概述行点 a维中的得分 贡献点对维惯量 维对点惯量学号 质量 1 2 惯量 1 2 1 2 总计1 .025 .242 -.385 .000 .020 .071 .348 .611 .9592 .025 .403 -.322 .000 .054 .050 .659 .293 .9523 .025 .168 -.301 .000 .009 .044 .259 .575 .8354 .025 .341 -.172 .000 .039 .014 .767 .136 .903第三部分是对列联表行与列个状态有关信息的概括(概述行点只截取了部分数据) 。其中,质量部分分别指列联表中行与列的边缘概率。维中的得分是各维度的分值,指行列各状态在二维图中的坐标值。如语文坐标为(-0.00,-0.143) 。惯量是每一行(列)与其重心的加权距离的平方,可以看出 I=J=0.01,即行剖面的总惯量等与列剖面的总惯量。贡献部分是指行(列)的每一状态对每一维度(公共因子)特征值的贡献及每一维度对行(列)各个状态的特征值等贡献。如第一维度中,外语对应的数值最大,为 0.975,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 难点详解公务员考试《常识》专项测评试题(含答案及解析)
- 考点解析自考专业(小学教育)真题及完整答案一套
- 难点详解沪科版9年级下册期末测试卷及参考答案详解【培优B卷】
- 二零二五年度离婚协议起草与婚姻解除后财产分割及子女权益保护合同
- 二零二五年度离婚协议中双方社交圈融合服务合同
- 2025版股权抵押物投资顾问及资产管理协议
- 2025版漫画创作与社交媒体平台合作合同范本
- 二零二五年度汽车维修保养与维修救援服务协议
- 二零二五年度工业防雷安全评估与解决方案合同
- 二零二五年绿色建筑电气安装工程合同规范
- 地下通道水泵房管理制度
- 溺水患者急救培训
- 2026版步步高大一轮高考数学复习讲义第十章 §10.1 计数原理与排列组合含答案
- 人力公司营销策划方案
- 医院医疗用房管理制度
- 股权代持协议终止协议书
- 捡土豆装车合同协议书
- 国际压力性损伤溃疡预防和治疗临床指南(2025年版)解读
- 海天对客户分级管理
- 薪资抵扣协议书模板
- 血管内导管相关性血流感染预防与诊治指南(2025)解读课件
评论
0/150
提交评论