论文_成绩分析.doc_第1页
论文_成绩分析.doc_第2页
论文_成绩分析.doc_第3页
论文_成绩分析.doc_第4页
论文_成绩分析.doc_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

期末考试成绩数据分析摘要:为学生尽力提供合理而有效的教学是学校一直以来所追求与重视的。在教学过程中,学校注重的是学生各学期以来对知识的掌握程度,并以成绩作为其衡量标准。成绩统计分析是高校考试质量管理的重要组成部分。通过对考试成绩的统计分析, 可以挖掘考试中蕴藏着的大量信息资料, 从而掌握教师的教学效果和学生的学习状况,本文的主要问题是分析几组成绩的显著性及相关性,通过对大量数据的统计分析,运用了单因素分析、层次分析、方差分析、分布检验等多种方法对成绩进行具体分析检测。问题一,本文首先对已给的数据进行处理,然后运用spss软件,根据数理统计的K-S检验原理证明得到的各班成绩均服从正态分布,再根据单因素方差分析法,对各学生成绩作显著性检验,最后得到对于同一个课程,两个专业学生的成绩没有显著性差异;问题二与问题一类似,但考察的是数学水平,即是总的数学成绩的综合分析。本文先通过层次分析模型求得各门课程占总成绩的比重,得出两专业的总成绩,通过总成绩来判断数学水平高低。然后再运用问题一的单因素方差分析模型进行显著性检验,得到两个专业数学水平没有明显不同;问题三,我们统计得出一个包含着四门课程成绩的样本,通过对样本数据进行spss的“双变量相关性检验”得出线代和概率论的成绩与高数成绩正相关显著;问题四,本文先问题一、二、三进行总结,并利用excel整理并求出各专业各课程的方差和平均值,最后总结得出看法:无论什么专业,高数在大学数学的学习中起着非常重要的作用,其它数学学科与它成正相关。关键词: spss K-S检验 层次分析 单因素方差分析 相关性 excel一、 问题重述表一、表二分别是某高校A专业和B专业的高等数学上册、高等数学下册、线性代数、概率论与数理统计三门公共数学课程的期末考试成绩数据,请根据数据试着分析并解决以下几个问题:(1)针对每门课程分析,两个专业学生的分数是否有明显差异?(2)针对专业分析,两个专业学生的数学水平有无明显差异?(3)通过数据分析说明:高等数学成绩的优劣,是否影响线性代数、概率论与数理统计的得分情况?(4)根据你所作出的以上分析,阐述你对于大学数学课程学习方面的看法。二、 问题的分析 第一问针对每门课程要求分析不同专业学生成绩是否显著不同。可以先把专业当作变量,成绩当成因变量,利用k-s检验原理证明样本服从正态分布。再利用单因素方差分析判断不同专业各学科之间差异是否显著。以上分析采用spss软件均可轻松处理。 第二问和第一问原理基本一样,但要先对数据进行处理,要求数学水平,先要求出总的数学成绩,这需要用层次分析求出权重从而得出总成绩的表达式,再用第一问的单因素方差分析模型判断差异是否显著。 第三问是判断高数1,高数2与线代、概率论间成绩的相关性问题。首先我们要分别整合出四门学科的一组综合指标作为样本,然后通过对样本数据进行spss的“双变量相关检验”来判断它们之间的相关性。第四问是分析归纳问题。先归纳前三问的分析结果,然后求出各科目的平均值,并用excel绘图观测各科目之间的关系,综合分析并提出看法及合理化建议。三、 模型假设与约定1、本题显著性水平默认为0.05。2、假设两个班学生的整体程度和基础差异不大。3、假设0分当缺考处理,有0分的那组数据没有处理意义。4、假设样本准确,处理做出的分析是接近实际,能够反映实际状况的。5、学生和学生之间,班级和班级之间的成绩是相互独立的,没有影响的。四、 模型的建立与求解第一问求解:第一问要求对每门课程进行分析不同专业学生成绩是否显著不同。判断显著不同,可以通过先比较平均值,如果数值相近再比较方差。方差数值越大差异越显著,即平均偏离程度越大。首先,对已给的数据进行处理,筛选数据并剔除掉包含“0”成绩的每组数据,先根据K-S检验原理判断各班成绩是否服从正态分布,再根据单因素方差分析法,对各学生成绩作显著性检验。我们将专业看做因子,讨论专业对成绩高低的影响。A和B看做因子所处的两个不同水平。而每个班的成绩即是试验的样本值。根据实际情况,学校评价相关成绩指标时均用平均成绩计算。我们在比较不同专业学生各科成绩是否显著性不同时,把每科该专业各班所有人的平均成绩作为该班的综合成绩。本文中处理数据均用平均值计算。首先证明样本是否服从正态分布。可以运用spss的1样本K-S检验进行处理。先用excel表格得出各班平均成绩(结果保留小数点后两位)如下表:A专业科目高等数学1高等数学2线性代数概率论1班平均成绩68.3262.9266.9572.822班平均成绩65.6066.9171.2975.063班平均成绩76.3570.4774.7677.85B专业科目高等数学1高等数学2线性代数概率论1班平均成绩71.4169.1571.1568.322班平均成绩71.3466.9271.3065.603班平均成绩76.1074.2372.3176.354班平均成绩67.9770.1471.6971.14激活数据管理窗口,定义变量名A专业、B专业,输入各专业学生的平均成绩,运行“分析 - 非参数检验 - 旧对话框 - 1样本K-S”运行结果如下:描述性统计量N均值标准差极小值极大值A专业高数1370.08965.5916265.6076.35B专业高数1471.70663.3414967.9776.10A专业高数2366.76793.7779662.9270.47B专业高数2470.11023.0590166.9274.23A专业线代370.99933.9165366.9574.76B专业线代471.6133.5163171.1572.31A专业概率375.24202.5236672.8277.85B专业概率475.12212.8060872.4579.08由上面两个表中可以看出,各科的P值(渐进显著性(双侧)均大于0.05,说明要检验的样本与正态分布没有显著性差异,即都服从正态分布。由于本题是要分析不同专业学生的同一门科目成绩是否有显著差异,因为只有专业这单一因素,所以本文采用建立单因素方差分析模型。单因素方差分析方法原理:在方差相等的假定下,要检验n个总体的均值是否相等,须首先给定原假设和备择假设。原假设 :均值相等即=备择假设 :均值不完全不相等则可以应用F统计量进行方差检验: F=该统计量服从分子自由度a-1,分母自由度为ab-a的F分布。给定显著性水平a,如果根据样本计算出的F统计量的值小于等于临界值,则说明原假设不成立,总体均值不完全相等,差异并非仅由随机因素引起。在spss中打开数据管理窗口,定义变量名学科、专业按顺序输入相应数值,专业定为数值1和2,然后运行 “分析 - 比较均值 - 单因素ANOVA ”进行单因素方差分析,得到如下结果:描述N均值标准差标准误均值的 95% 置信区间极小值极大值下限上限高数11370.08965.591623.2283256.199283.979965.6076.352471.63753.351641.6758266.304376.970767.9776.10总数770.97414.089421.5456667.192074.756265.6076.35高数21366.76793.777962.1812157.383076.152962.9270.472470.11003.059031.5295265.242474.977666.9274.23总数768.67773.553561.3431265.391271.964262.9274.23线代1371.00003.913072.2592161.279480.720666.9574.762471.6125.51771.2588670.788772.436371.1572.31总数771.35002.31198.8738469.211873.488266.9574.76概率论1375.24332.520011.4549368.983381.503472.8277.852475.12252.806531.4032770.656779.588372.4579.08总数775.17432.46156.9303872.897777.450972.4579.08ANOVA平方和df均方F显著性高数1组间4.10814.108.213.664组内96.233519.247总数100.3406高数2组间19.148119.1481.691.250组内56.619511.324总数75.7676线代组间.6431.643.102.762组内31.42856.286总数32.0716概率论组间.0251.025.003.955组内36.33157.266总数36.3566由上表并结合F值表(附录表3)可以分析得出:高数1:因为F=0.213 0.05,即由方差分析得到两专业的高数1成绩无明显差异。高数2:因为F=1.691 0.05,即由方差分析得到两专业的高数2成绩无明显差异。线性代数:因为F=0.102 0.05,即由方差分析得到两专业的线性代数成绩无明显差异。概率论:因为F=0.003 0.05,即由方差分析得到两专业的概率论成绩无明显差异。第二问求解:求解针对专业分析,两个专业学生的数学水平有无明显差异,这与第一问解法相似,不过要先求出数学水平的表达式,即要求出四科科目总成绩成绩。这需要构建一个层次模型求出各科在总成绩中的权重,然后再运用第一问的单因素方差分析模型来判断总成绩是否显著相关,将专业看做对成绩的影响因素进行分析。每个变量的样本值为每个专业各班成绩的平均值。层次分析模型首先建立层次分析模型:综合成绩高数1高数2线代概率论取=,用matlab求得的最大特征根和它对应的特征根向量(代码在附录中),结果如下图:即l=4.0458它所对应的特征根向量为a=(0.6664,0.6090,0.3619,0.2323)。因为矩阵中,对于成对比较阵A: 一致性指标(l为A的最大特征根,n为矩阵A的阶数) 随机一致性指标 一致性比率验证:,此时RI=0.90 , 所以该矩阵合适,a可以作为各门成绩在总成绩中占的比重。求得综合成绩单因素方差分析模型先用excel在表格中根据上面求出的方程计算出各专业的总成绩,然后在spss中打开数据管理窗口,定义变量名专业和总成绩,然后按顺序输入相应总成绩,专业依次定为数值1,2。然后运行 “分析 - 比较均值 - 单因素ANOVA ”进行单因素方差分析,得到如下结果:描述总成绩N均值标准差标准误均值的 95% 置信区间极小值极大值下限上限1106130.352017.669281.71619126.9491133.754986.53178.322148134.505516.767241.37826131.7817137.229389.21176.61总数254132.772117.237531.08158130.6421134.902286.53178.32ANOVA总成绩平方和df均方F显著性组间1065.53211065.5323.623.058组内74109.015252294.083总数75174.547253由上表可以分析得出:因为F=3.623 F1-a(1,300) 0.05,即由方差分析得到总成绩即数学水平无明显差异。第三问求解:第三问是要求判断高数1,高数2与线代、概率论间成绩的相关性问题。即要求高数1,高数2与线代、概率论是否显著相关。将高数1,高数2,线代,概率论学科成绩看做四个总体,分别把A、B专业同学的成绩作为样本。然后分别对高数1,高数2进行相关性分析。在spss中打开数据管理窗口,定义变量名A专业各科目和B专业各科目,输入各科目的成绩,然后运行 “分析 - 相关 - 双变量 ”进行相关性分析,得到如下结果:描述性统计量均值标准差NA专业高数169.8712.184106A专业高数266.6611.237106A专业线代71.0511.177106A专业概率论75.2612.171106相关性A专业高数1A专业高数2A专业线代A专业概率论A专业高数1Pearson 相关性1.538*.519*.404*显著性(双侧).000.000.000N106106106106A专业高数2Pearson 相关性.538*1.584*.439*显著性(双侧).000.000.000N106106106106A专业线代Pearson 相关性.519*.584*1.582*显著性(双侧).000.000.000N106106106106A专业概率论Pearson 相关性.404*.439*.582*1显著性(双侧).000.000.000N106106106106*. 在 .01 水平(双侧)上显著相关。上面两个表是A专业相关系数大小及其显著性检验结果表,其中带“*”说明是显著相关。从表中可看出:高数1和线代的相关系数r=0.519* 0,显著性p=0.0000.01,因此正相关性显著;高数1和概率论的相关系数r=0.404* 0,显著性p=0.0000.01,因此正相关性显著;高数2和线代的相关系数r=0.584* 0,显著性p=0.0000.01,因此正相关性显著;高数2和概率论的相关系数r=0.439* 0,显著性p=0.0000.01,因此正相关性显著。描述性统计量均值标准差NB专业高数171.8014.196149B专业高数270.4410.103149B专业线代71.7012.260149B专业概率论75.1314.135149相关性B专业高数1B专业高数2B专业线代B专业概率论B专业高数1Pearson 相关性1.280*.370*.414*显著性(双侧).001.000.000N149149149149B专业高数2Pearson 相关性.280*1.414*.323*显著性(双侧).001.000.000N149149149149B专业线代Pearson 相关性.370*.414*1.528*显著性(双侧).000.000.000N149149149149B专业概率论Pearson 相关性.414*.323*.528*1显著性(双侧).000.000.000N149149149149*. 在 .01 水平(双侧)上显著相关。上面两个表是B专业相关系数大小及其显著性检验结果表,其中带“*”说明是显著相关。从表中可看出:高数1和线代的相关系数r=0.370* 0,显著性p=0.0000.01,因此正相关性显著;高数1和概率论的相关系数r=0.414* 0,显著性p=0.0000.01,因此正相关性显著;高数2和线代的相关系数r=0.414* 0,显著性p=0.0000.01,因此正相关性显著;高数2和概率论的相关系数r=0.323* 0,显著性p=0.0000.01,因此正相关性显著。第四问求解: 要阐述对于大学数学课程学习方面的看法,首先,从前三问的分析中作出综合总结:(1)不同专业的学生在学习相同课程的分数没有明显差异;(2)不同专业的学生的数学水平没有明显差异;(3)高等数学成绩与线性代数、概率论的得分情况显著相关且呈正相关。根据成绩可分析统计出以下表:各专业课程平均成绩表科目A专业高数1A专业高数2A专业线代A专业概率论平均分69.9766.7771.1575.33科目B专业高数1B专业高数2B专业线代B专业概率论平均分71.7770.5972.2075.18各专业课程方差表 科目A专业高数1A专业高数2A专业线代A专业概率论方差148.44126.27124.92148.14科目B专业高数1B专业高数2B专业线代B专业概率论方差167.61101.51151.10199.79用excel绘制以上表格如下图:从上面两个折线图我们可以看出:B专业的平均分要比A专业的平均分高一点,两个专业都是高数2的平均分最低,概率论的平均分最高;A专业中高数2的方差最小,概率论的方差最大。总的成绩波动比较大。B专业中各科的方差都很接近,总的成绩比较稳定。综上所述,得出以下看法:专业的不同几乎不影响数学成绩的优劣,高数与其它数学课程呈显著正相关,所以要学好高数。特别是高数2这门课,考试平均分不高,所以要多花精力在这上面。学好高数对后续的数学课程很有帮助。5、 结果分析及模型检验1、判断是否服从正态分布检验(以A专业为例):判断是否服从正态分布,用spss一般有两种做法:通过作图或进行正态性检验。但单一的skewnes和kurtosis的检验结果不大可靠,往往要结合几项结果作出判断。所以接下来就要在Graphs模块中,通过作Q-Q图来验证是否服从正态分布。如果数据对称分布,紧靠在在直线的两边,就可以认为符合正态分布。激活数据管理窗口,定义变量名A专业各科目,输入各专业学生的成绩,运行“分析 - 描述统计 - Q-Q图 ”。运行结果如下:从Q-Q图中可以看出图中数据点对称分布,紧靠在在直线的两边,说明是服从正态分布的,说明K-S验证结果正确。 同理可得A专业其它科目的Q-Q图如下:以上三个图中各数据点均对称分布,紧靠在在直线的两边,说明都是服从正态分布的,说明K-S验证结果正确。2、 单因素方差分析法检验:定义变量科目代号和成绩,将高数1,高数2,代数和概率论分别用1,2,3,4代替,用spss进行多重比较进行检验,得结果如下:多重比较因变量(I) 科目代号(J) 科目代号均值差 (I-J)标准误显著性95% 置信区间下限上限A专业LSD121.362913.91429.736-7.491810.21763-.910423.91429.821-9.76527.94434-4.455423.66148.255-12.73833.827421-1.362913.91429.736-10.21767.49183-2.273333.91429.576-11.12816.58144-5.818333.66148.147-14.10122.464531.910423.91429.821-7.94439.765222.273333.91429.576-6.581411.12814-3.545003.66148.358-11.82784.7378414.455423.66148.255-3.827412.738325.818333.66148.147-2.464514.101233.545003.66148.358-4.737811.8278B专业LSD121.527501.89525.436-2.60195.65693.025001.89525.990-4.10444.15444-3.485001.89525.091-7.6144.644421-1.527501.89525.436-5.65692.60193-1.502501.89525.443-5.63192.62694-5.01250*1.89525.021-9.1419-.883131-.025001.89525.990-4.15444.104421.502501.89525.443-2.62695.63194-3.510001.89525.089-7.6394.6194413.485001.89525.091-.64447.614425.01250*1.89525.021.88319.141933.510001.89525.089-.61947.6394*. 均值差的显著性水平为 0.05。 从上表可以看出,经过多重比较之后,出现了课程代号2和课程代号4即高数2和概率论存在相关性不显著,可以看出按均值进行处理可能会与实际有偏差。模型有待改进。6、 模型的优缺点与改进优点:本文建立了单因素方差分析模型,该模型适用范围较广,能有效地对于问题进行合理的求解。同时运用spss软件进行求解在很大程度上减少了计算的冗余度,方便快捷。缺点:从验证中可以看出,文中许多数据的处理是按均值进行的,与实际稍有偏差。改进:可以搜集更多资料,比如学科的实用程度和受欢迎程度,作为参考融入第四问的解题中,从而可以合理地做到一方面减轻学生的学习负担,另一方面为学生择取更宜于实际运用的学科,从而将模型更好地运用到实际生活中。七、 参考文献1SPSS18.0教程中文完整版2姜启源.数学模型(第三版).高等教育出版社3盛骤.概率论与数理统计( 第四版).高等教育出版社8、 附录表一:A专业三个班的各科成绩学号A专业1班A专业2班A专业3班高数上册高数下册线代概率高数上册高数下册线代概率高数上册高数下册线代概率1820506369748596798189932606668736562718480667874376766082606460716064656946061777364747680876473855666469838572848973828489669656763667289939985959777765717271658288948897968667560637564686966706946972606766606561676560707310606460757864828392977070116060603666698181626665601276696389859193819277729413646677854560686067627077148065837564696666846476811563648172606470717160776816604266626460686060696389177382918864606482766070701886786260606260606061627119626469847462616186626072208565888060736572616060672161626381636571608770798622613741644473708293951009623676276737866808562847380246040506078666466756473802560666083606472846049603526604060686062767788796562276446746960657367958695862890849392716980638344608129433950696061608760716980306762608386738384917875803188756582606360776361918832867569656064616692879495337340606000006064716534436560606069606073667292357366608560766069366063817761607186376574687738788165753940表二:B专业四个班的各科成绩学号B专业1班B专业2班B专业3班B专业4班高数上册高数下册线代概率高数上册高数下册线代概率高数上册高数下册线代概率高数上册高数下册线代概率170636366856670969376878766707985262656877604608660606064696576803616175637673608990756773776685854606674697860726793898997706373735716979656064647674838281847673906868180909493759080627365886583957376065653760788371809378756477808696368716260716174657172658382609606460609074909569766470727979851085600626173806870646570606163821186738569456463908571687873716368128881808980627061936669869578677413746589816762769680767484757268881487668684606045638388877660716764159181838769806883608763557465727616757563787971869194838796687780821782968690856582936560797260828895189393989787888997837260516063787019658182937766778589666776828487932079768280606365606560606060676369213864605265697474746673830646781229063602479647247628560626161806223667466657877828179906083696483902443646360646266898775514960693931259062606686899094938380900846661267260726867827478887875746070676927436060726460826976828192676060622882667477604960616969668885766689296081606581608680766083696062606530878983906049606179606967658260603192726977727581797762607683637576328649617074606079408046227474827033796960606366868079608281606377643460616773948093969094959668746081356062706691777184657778837464638736726365656070607873698590607373393764607467604007365877484387078608781646072647277603960666588618760654060646070备注:考试成绩为百分制。表三:F值表F值表(方差分析用)附表()P0.05r1(较大均方的自由度)r2123456789101214161820r211612002162252302342372392412422442452462472481218.519.019.219.219.319.319.419.419.419.419.419.419.419.419.42310.19.559.289.129.018.948.898.858.818.798.748.718.698.678.66347.716.946.596.396.266.166.096.046.005.965.915.875.845.825.80456.615.795.415.195.054.954.884.824.774.744.684.644.604.584.56565.995.144.764.534.394.284.214.154.104.064.003.963.923.903.87675.594.744.354.123.973.873.793.733.683.643.573.533.493.473.44785.324.464.073.843.693.583.503.443.393.353.283.243.203.173.15895.124.263.863.633.483.373.293.233.183.143.073.032.992.962.949104.964.103.713.483.333.223.143.073.022.982.912.862.832.802.7710114.843.983.593.363.203.093.012.952.902.852.792.742.702.672.6511124.753.893.493.263.113.002.912.852.802.752.692.642.602.572.5412134.673.813.413.183.032.922.832.772.712.672.602.552.512.482.4613144.603.743.343.112.962.852.762.702.652.602.532.482.442.412.3914154.543.683.293.062.902.792.712.642.592.542.482.422.382.352.3315164.493.633.243.012.852.742.662.592.542.492.422.372.332.302.2816174.453.593.202.962.812.702.612.552.492.452.382.332.292.262.2317184.413.553.162.932.772.662.582.512.462.412.342.292.252.222.1918194.383.523.132.902.742.632.542.482.422.382.312.262.212.182.1619204.353.493.102.872.712.602.512.452.392.352.282.222.182.152.1220214.323.473.072.842.682.572.492.422.372.322.252.202.162.122.1021224.303.443.052.822.662.552.462.402.342.302.232.172.1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论