华东师大数学教学测量和评估教案04教学评估及其方法_第1页
华东师大数学教学测量和评估教案04教学评估及其方法_第2页
华东师大数学教学测量和评估教案04教学评估及其方法_第3页
华东师大数学教学测量和评估教案04教学评估及其方法_第4页
华东师大数学教学测量和评估教案04教学评估及其方法_第5页
已阅读5页,还剩21页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章教学评估及其方法在教学中,通过教学测验可以获得有关的信息和数据,根据这些数据进而对教学的价值和发展趋势等作出分析、评判,这就是在教学测量的基础上作出教学评估。本章将概述教学评估的意义、基本程序、指标系统及教学评估的一般方法。第一节教学评估概述一、教学评估的意义所谓教学评估就是对教学效果进行价值上的估量和评判。具体地说,它是依据预定的教学目标,通过教学测量等手段,广泛地收集信息,并运用恰当的信息处理技术,获取可靠的证据,对教学效果、教学任务完成情况,以及学生学习的质量和发展水平进行分析,作出估量与评判。教学评估的主要目的是探索教学工作的规律,调节教学内容,改进教学方法,提高教师的教授水平和学生的学习水平,促进教学目标的实现。合理地使用评估过程中的各类信息,就能使评估工作发挥多方面的作用:1.衡量实现教学目标的程度。在教学工作的前期,通常都要全面地制定一套教学目标,作为一切教学活动的依据。但是在教学实际中,往往由于多种原因,以致偏离教学目标。以教学目标为依据的教学评估工作和其他教学工作结合在一起,就像一把“尺子”能够及时地度量出每个学生达到教学目标的程度及他们在各自基础上获得发展的程度,并能从整体上判断教学工作的效果。2.控制教学过程。教学中要保证教学质量,必须自始至终地实施教学过程的管理和监控。教学评估能及时获取各类反馈信息,经分析研究,发现问题,找出原因,寻求解决问题的办法。因此,教学评估是控制教学过程、保证教学质量的基本手段。3.鉴别教与学的效果。在日常教学工作中常常需要对某个范围里的学生进行分类或选拔,教学评估能多方位地收集信息,应用科学的信息处理方法,根据不同的分类或选拔原则,把学生学习成绩的差异显示得更加确切、全面,使所需的分类更公正、合理。教学评估的鉴别功能不但适用于学生,也适用于教师、教材和教学方案。二、教学评估的基本程序为了获得有价值的信息和比较准确的评估结论,我们在着手评估工作时,必须考虑它的实施步骤。教学评估工作由以下步骤组成。1.确定评估的要求。评估工作必须明确其目的、目标和实施的对象、手段等有关要求。确定评估目的,就是确定“为什么评”的问题。有的评估是为了鉴定教学成果,有的评估是为了探索教学规律,有的评估是为某种决策提供依据。不同的评估目的,在组织、内容及方法上是有所不同的。例如,在以鉴定教学成果为目的的评估中,评估的准则和测量的工具都应严格按教学目标的规定。在以选拔为目的的评估中,评估的准则和测量的工具除了符合教学目标的规定外,还要考虑选拔工作的特殊需要。确定评估目标就是确定“评什么”和“评谁”的问题。是评教师的教法,还是评学生的学习;是评学校的管理体制,还是评有关的课程设置;是评认知领域的内容还是评情感领域的内容;等等。确定实施对象就是确定“由谁提供信息”的问题。教学工作涉及学生、教师、学校管理人员、教学辅助人员和家长等,他们都可以是信息的提供者,我们应该结合评估目标选择合适的实施对象。例如在评估教学效果时,往往把学生作为主要的实施对象,因为学生对知识的掌握情况能直接地、广泛地、客观地反映教学效果;而在评估教材的难易程度时,却应以教师为主要实施对象,因为教师有长期使用教材的经验。在有些评估工作中,评估结论要依赖于不同对象之间的比较。例如要评估教学新方案的效果,为了使评估结论更具有说服力,不但要收集和分析新方案实验班的有关信息,还要收集和分析非实验班的信息,以便对比。对比班虽然不是我们评估的对象,但应作为实施对象。在这种情况下,对比班的确定,要十分注意它与实验班的可比性基础,如学生的原有基础,教师的教学水平等都应是比较接近的。这样才能解释学生的后期差异与教学新方案之间的关系。确定实施手段就是确定“怎样获得信息”的问题。常用的手段有测试、问卷调查、实地听课和座谈会等。教学评估的有关要求都应在评估工作的早期确定,否则可能导致信息量的不足,影响评估工作的效率和质量。2.选择和编制测量工具。要收集评估所需的信息,一般要通过某种方式的测试或调查。在进行数学教学评估时,通常是通过数学测验,了解学生对数学知识的掌握程度和他们的数学能力水平;通过问卷调查和交谈,了解学生对数学的情感水平和学习条件等情况。这时,我们把测试用的试卷和调查用的问卷(包括交谈用的提纲)叫做测量工具。依靠这些工具收集信息。由于各种测量工具都具有其特殊的功能,因此要结合评估目标,选择合适的测量工具。3.收集和处理信息。在编制测量工具同时,就应考虑到信息的收集问题,避免把时间和精力花在一些无用的信息上,也不要使必要的信息被遗漏和混淆。原始信息是评估工作的基础,因此原始信息的收集和整理一定要做到准确、完整、有序、便于使用。以测试为例,从评阅试卷、登记分数到输入计算机,工作量大而且单调、枯燥、烦琐,要增强做好这项工作的责任心,把操作误差减小到最低程度。当发现了数据遗漏的现象,如在登分表上某个学生的姓名、学号被遗漏,或某部分的分数被遗漏,要尽力将这些数据补齐,或作出某种约定,使得这些有遗漏现象的数据也能在一定范围内发挥其作用。一般不要轻易剔除原始数据,要保证原始数据的完整性。为了便于原始数据的管理和使用,对它们的整理,要讲究一定的编排技术,做到井然有序,查找方便。原始信息一般不便于直接用于评估,而需要作统计处理,使原始信息中蕴含的特征明朗化,才能从中获取评估的依据。在数据处理时,有些基本统计数据是必不可少的,如测试成绩的平均分、标准差、成绩分布、各试题的得分率和一些有关的百分比等。除此之外,还可根据评估工作的需要再作一些更深入、细致的数据分析处理。4.作出评估结论。依据对各类信息(数量化的和非数量化的)的综合分析研究,对照评估目标,作出价值上的判断,获得评估结论。三、教学评估的指标系统在评估工作的初期,我们对评估目标的讨论往往是比较笼统的和原则性的。为了便于操作,便于编制测量工具,必须把这些目标分解成具体的、可测量的、可操作的形式,这种形式称为指标及指标系统。指标是由目标确定的。例如要评估学生的数学水平,就要把“数学水平”具体化,它包含哪些数学内容,可分解为几个水平层.104.次,每一项内容及其相应的水平都可称为一项指标。每项指标一般只能反映目标的某个局部,要全面地体现目标,必须建立与目标紧密相连的一群指标,即指标系统。指标系统是目标的一种具体的、可测量的、可操作的分解形式。虽然指标系统应具有和目标完全一致的内涵,但实际上,指标只能从某一个侧面反映目标。例如,目标是评估学生的运算能力,而运算能力包括四则运算、指数运算、对数运算、解方程、解不等式等、如果我们选定其中的一种或几种为“运算能力”的代表,那么它所反映的事实不可避免地有片面性。如果把各类运算都作为指标,那相应的测试对学生来说负担太重,况且仍然是通过各类具体的试题来反映“能力”这个抽象的事实的,其中的差距无法消除。因此,指标系统所包含的内容只是相应目标的内容的一个子集,这个子集中的元素应该是目标内容中最有代表性的。构建指标系统的具体做法可分如下几步:1.确定内容范围和水平状态。例如,要评估初中三年级学生的数学学习水平,那么内容范围可以是初中三年级的数学教学内容,也可以是整个初中阶段的数学教学内容,或者再补充些内容。选定内容范围的原则是有利于评估目标的实现。在内容范围确定之后,还要估计学生群体在这些内容上所可能表现出的最高水平状态和最低水平状态。2.对内容和水平进行分解。在认知领域中,由于评估目标常常和教学目标是基本一致的,所以可按照相应的教学目标的分类法进行分解。在非认知领域中,此项分解工作要视具体的内容而定。例如要评估新的教学方案,而这项评估所涉及的内容是很广的,可以把评估的内容分解成三个主要部分:一是新方案的设计和实施过程的规范性和科学性;二是新方案效果解释的可信性和有效性;三是新方案的意义。这里的分解是很粗糙的,在实际操作中每部分都可再分解成若干条更具体的内容。把评估的内容进行分解后,再把水平范围分解成若干个水平层次。3.选取评估指标。例如,在初中三年级的教学内容中有代数、几何,而代数、几何的每一项内容又分别有概念、运算、作图、证明和应用等,应该选哪些具体内容作为评估指标呢?这既要考虑到所选的内容应具有一定的代表性和覆盖率,也要参考评估目标的特殊要求而有所侧重。4.对指标赋以权重。评估所涉及的内容虽然很广,但各内容对于评估工作的重要程度却不会是一样的,于是有必要对各指标赋以适当的权重,为综合评估作好准备。目前,常见的权重分配方法是综合专家们的意见而确定的,而专家们大多是根据评估目标、教学目标和解释评估结论的价值高低等多方面因素来确定的。通过以上几个步骤,一项评估工作的指标系统就基本构成了。借助于指标系统,我们就可以编制测量工具,对实施对象进行测量,获取信息,比较分析,最后实现评估目标。

第二节教学评估的方法依据测验目的和测量结果,科学地对教学进行评估,还必须掌握教学评估的方法。一、绝对评估绝对评估是以特别设定的目标为标准,只以评估对象达到设定目标的程度为依据,比较评估对象与设定目标相符程度的评估方法。绝对评估也称标准参照评估。1.绝对评估的标准体系绝对评估的标准体系包括合格标准和等级标准,这些标准由绝对评估目标所包含内容的多少而确定。以教学绝对评估为例,由单元测验目标、期中测验目标、期末测验目标和毕业会考目标等不同层次的目标确定的标准体系就不同。(1)等级不连续标准体系绝对评估一般采用二级(通过与不通过)标准体系。但这种标准体系太笼统,因而通常也采用三级标准体系或五级标准体系。以被试在测验中的答对率为依据,可以建立三级标准体系:答对率在85%以上——掌握得好与较好(第一级);答对率在70%~84%——掌握得一般(第二级);答对率在69%以下——掌握得较差(第三级)。三级标准体系中,可任选一级作为合格标准。如果选第二级为合格标准,则第一级也合格,而第三级不合格。以答对率为依据,还可以建立五级标准体系:答对率在95%~100%——掌握得很好(第一级);答对率在85%~94%——掌握得好(第二级);答对率在75%~84%——掌握得较好(第三级);答对率在65%~74%——掌握得一般(第四级);答对率低于65%——掌握得较差(第五级)。五级标准体系较三级标准体系细一点,能对评估对象进行细致的区分。和三级标准体系一样,我们也可根据测量目标来选定合格标准级。如果选定第三级为合格标准级,则第一级、第二级也合格,而第四级、第五级不合格。制定等级指标体系的好处在于,把“好”、“很好”、“较好”、“一般”、“差”等数量化,易于分类和统计操作。它的不足之处是等级化后,不易发现各级内的学生差异。(2)等级连续标准体系为了避免等级不连续标准体系的不足,可以用学生的答对率构成绝对评估指标体系。显然,闭区间[0,1]中的每一点都是一个评估等级,因而这个标准体系被称为等级连续标准体系。这个标准体系也可以直接采用实得分构造,这只要把闭区间[0,1]换成闭区间[0,满分数]就可以了。在等级连续标准体系中,任选一个值都可固定为合格标准级。例如,选0.6为合格标准级,则不小于0.6的级构成的区间[0.6,1]均为合格级,而小于0.6的级构成的区间[0,0.6)均为不合格级,这与二级标准体系类似。等级连续标准体系虽然避免了等级不连续标准体系的缺点,但也失去了易于分类和统计操作等优点。在实际操作过程中,可以结合绝对评估的具体目标选择标准体系和确定合格标准。2.绝对评估的数量方法绝对评估可以划分为群体绝对评估和个体绝对评估两种实施形式。个体绝对评估只要将学生的答对率或被评对象在各项指标上的实现程度求和,然后与绝对评估指标体系所规定的合格指标相比较即可得出结论。随着考试理论研究的深入,对考题已提出了最低要求度的概念。从绝对评估的角度来看,最低要求度就是合格指标。计算并确定最低要求度是绝对评估数量化的第一步,也是关键的一步。对于群体进行绝对评估,可以根据群体的特征和目标,增添新的评估指标和等级目标,如群体的方差、平均数、中位数等。对被评群体,只要将其实际值与目标值相比较,就可判明该群体是否合格。二、相对评估相对评估是以个体的水平与同一群体的平均水平或常模相互比较,从而确定其水平等级的评估方法。在教学评估中,比较某学生与班级内其他学生成绩(水平)的高低,这实际上是以整体的水平作为“尺子”来衡量学生的学习情况,因而相对评估也常被称为常模参照评估。1.相对评估的排序方法将被评个体按其达到目标的程度及在群体中的高低顺序依次排列,同时注明群体数的排列方式(可用二维数组(x,y)来表示,其中x表示其在群体中的序,y表示群体中个体的总数)的评估方法叫相对评估排序法。相对评估排序法直观易操作,因而是最基本的相对评估方法。例如(3,y)表示某学生在测试群体中处于第三的位置,而相对其他学生情况,则由y确定。若取y=10,则可表明其成绩是上等;若y=4,则其成绩是下等。由于排序法只注重排序而略去了具体差异的多少,故在相对评估中较少采用。2.相对评估的标准分法为了克服上述相对评估排序方法的不足,使相对评估更趋完善,可采用相对评估的标准分法。标准分的计算由公式分,S表示群体成绩的标准差。标准分Z的取值直接反映了学生相对水平。若Z=0,则该生成绩一般;若Z>0,则成绩高于平均分,此时Z的值越大,成绩相对于群体而言就越好;若Z<0,则与Z>0的情形相反。由于标准分Z可能出现负值,这给应用带来许多不便,而且与人们通常对分数的看法不太相符,为此把标准分Z转化成T分数,其转化公式为T=50+10Z。于是T分数与人们的习惯相一致。应该指出,这种转化方法并非唯一,有时还可以采用其他的转化公式。利用标准分还可以对学生群体进行分类。(1)用等距分法分类如果测试群体中学生成绩的最高分为3,最低分为-3,并设想将学生分成五类,则只需把闭区间[-3,3]五等分,得五个区间[-3,-1.8)、[-1.8,-0.6)、[-0.6,0.6)、[0.6,1.8)、[1.8,3],若依次记为E、D、C,B、A,则只要根据某学生的标准分所在的区间,就可判定这个学生属于哪一类。(2)按权率分类给出各类人数的权率,不妨设A、B、C、D、E各类人数的权率分别为q1、q2、q3、q4、q5,可以查标准正态分布表,确定临界点a1、a2、a3、a4,使其满足P(x>a1)=q1,P(x>a2)=q2+q1,P(x>a3)=q3+q2+q1,P(x>a4)=q4+q3+q2+q1,其中x表示标准分。设学生的成绩(标准分)为x,当x≥a1时,则评为A类;当a2≤x<a1时,则评为B类;当a3≤x<a2时,则评为C类;当a4≤x<a3时,则评为D类;当x<a4时,则评为E类。(3)按系统聚类分类上述两种对学生标准Z分数的分类过程中,由于各类间临界点的确定似乎有点“武断”,就有可能导致标准Z分数非常接近的学生被划分为两个不同的类,扩大这些学生间的差异。用系统聚类方法可以克服这一不足。其步骤是:先把n个个体各自看成一类,规定个体之间或类之间的距离(一般采用欧氏距离),然后把距离最短的两类合并为一个新类,得n-1类,再把其中最接近的两类合并,得n-2类,如此下去,最后所有的个体全在一类。根据实际情况,给定一个阈值T,将类与类之间的距离小于T的聚为一类,就可把n个个体分成若干类。设A、B、C、D、E五名学生的数学测试成绩(可用标准Z分数,也可用原始分数,二者分类结果一致,此处为了计算简便,采用原始分)分别为45分、35分、76分、60分、93分,按系统聚类法分类的步骤如下。第一,将五名学生成绩由低到高排序,学生的排列为B、A、D、C、E。第二,规定取个体间的距离为一维欧氏距离dij,即学生i与学生j的成绩差的绝对值。此处有:db.A=10,dA.D=15,dD.C=16,dC.E=17。第三,合并距离最短的个体为一个新类。此处A与B的距离最短,将A、B合并为一个新类{A,B},并把其平均成绩作为类{A,B}第四,比较新类{A,B}与邻近学生D之间的成绩之差为20不是最小,而邻近类dD,C=16为最小。第五,把C、D按第三步处理,得新类{C,D}及其成绩68。第六,类似第四步可求得{A,B}与{C,D}的成绩之差为68-40=28,{C,D}与E的成绩之差为25。此时,后者较小。第七,合并类{C,D}与E为一个新类{C,D,E},并把的成绩。第八,求得{C,D,E}与{A,B}的成绩之差为76.3-40=36.3。第九,合并{A,B}与{C,D,E}为一新类{A,B,C,D,E}。第十,将以上合并过程作成图4-1。第十一,规定一个适当的阈值T,确定类数并判定各学生所属的类,例如取T=20,作为分类标准,则五名学生被分为三类:第一类含A、B,第二类含C、D,第三类含E;如果取T=30作为分类标准,那么五名学生被分为两类,B与A为一类,剩下的为另一类。3.相对评估的差异显著性检验用系统聚类方法对学生进行成绩分类,符合人们最朴素的分类观念,能够较充分地显示学生之间的差异。但由于教育测量自身的误差,是否能把所有表现在成绩上的差异都视为其真实水平的差异?差异显著性检验,在一定程度上可以解决上述问题。这个方法的基本思想是,如果两个对象的真实水平是一样的,那么在同一次测验中,其测验成绩间差异很大的概率是很小的。如果在一次测验中发生了很大的差异,则可认为两个对象的真实水平是有显著差异的。下面以两个群体的成绩为例,说明检验的方法。群体中的人数(m,n≥50)。如果两

体有无差异的临界值。有时事先给定Δx,要求这种判断的置信水平。这时首先求出然后查标准正态分布表求出α,即可求出1-α。例如,已知一次考试中男、女学生的数学成绩的标准差分别为21.50分和20.24分,现抽取92名男生、64名女生的数学成绩求得其平均分分别为76.90,72.31。试在95%的置信度下,判断男、女生成绩有否显著差异。由α=0.05,查标准正态分布表,得Z0.025=1.96,从而临界值故有95%的把握断言,在本次考试中,男、女学生的成绩无显著差异。置信水平为82.3%,由此可见,尽管在95%的置信水平下可认为男、女生本次考试中的平均分之差4.59分,是二者水平相同的正常差异,但随着临界值Δx的减小,其置信水平也随之下降。4.相对评估的百分等级法百分等级是一种适用于次序变量的相对位置的数量,常记为PR。其构造方法是,对一次考试的所有得分从最低分到最高分,分成一百个等级,得分的数值在这一百个等级中所处的位置,叫做这个分数值的百分等级。实际操作中只要求出低于某分数的人数与总人数之比,即可求出该分数的百分等级。例如,某学生在一次数学考试中得70分,全班45人有9人比其分数低,则该生的百分等级为:一般地,与百分等级相对应的原始分数称为该百分等级的百分位数,常用PPR表示。根据求中位数的原理,用线性插入法可导出百分位数的公式其中,Lb是该百分位数所在组的下根,PR是百分等级,N是总频数,Fb是对应Lb的以下累积频数,f是该百分位数所在组的频数,i是组距。由此公式可求出百分位数PPR的百分等级为例如,根据157个学生数学测验成绩(见表4-1),求PR=10所对应的原始分和PPR=47.5所对应的百分等级。由PR=10知,所求原始分在第2组,此处N=157,组距为5,f=9,Lb=14.5代入公式可求得PPR=19.33,即所求的原始分为19.33。由PPR=47.5知,该生在第8组,将Lb=44.5,f=16,Fb=122,i=5代入公式可求得PR=83.82,即47.5分对应的百分等级为84。将分数组作为横轴,百分等级为纵轴,计算各分数组的以下累积频率,将分数组与对应的以下累积频率在坐标系内描点、连线,就可作出百分等级和百分位数的分布图(图4-2)。应该注意的是,百分等级虽然直观且易于操作,它能为同一个受测者在不同测验上,或者不同受测者在同一个测验上的百分位数提供相互比较。但是,百分等级不具有等距性和可加性,因而不能进行分数的组合。三、个体内差异评估个体内差异评估是以评估对象在自身基础上的变化程度为依据所进行的评估,也是把评估对象的某些侧面特征和本身的另一些侧面特征相比较的评估方法。评估个体的学习进(退)步情况,或评估学生自己的智能和学力的差异都属于个体内差异评估的范畴。个体内差异评估与相对评估、绝对评估不同,它的标准只针对个体而言,并不要求群体中所有个体都遵循相同的标准,因而适合于对学习效果的评估。1.利用成就值作个体内差异评估设某学生考试实得分的标准T分数为Y,智力T分数为X(智力原C·A表示实足年龄水平),规定成就值(AS)=Y-X。在Y与X高度相关时,统计经验表明:AS>10者学力向上,AS<-10者学力不振,其他情形的学力倾向不能判定。例如对某学生而言,Y=70,X=55,则AS=70-55=15,这个学生的学力向上。2.利用标准分作个体内差异纵向评估(1)直接利用标准分进行个体内差异评估对个体的某一特性的不同标准Z分数值,按测试收集的时间先后,构成该生的标准Z分数序列{Zi},设状态转移量ΔZi=Zi+1-Zi(i=1,2,…,n),则ΔZi>0表示该状态向良性发展,有进步;ΔZi<0表示该状态向恶性发展,在退步;ΔZi=0表示该状态维持现有水平。比较ΔZi与ΔZi(j>i,j≤n),可判明各步转移的优劣。例如,某学生连续五次测验的标准分为-0.44,-0.51,1.00,0.09,0.20,计算,得ΔZ1=-0.07,ΔZ2=1.51,ΔZ3=-0.91,ΔZ4=0.11,这表明,该生的学习呈波浪式的提高趋势。(2)利用N-评价法进行个体内差异评估N-评价法是按学生进步因素评定学生成绩的方法。其操作方法是:第一,求出一门学科k次测验中每个学生的标准Z分数,并按时间进行的先后组成标准Z分数序列{Zi}。第二,利用数理统计知识,可以建立测验序数的数与相应的标准Z分数的关系式Zj=αk+βkj+e,其中,αk,βk为未知参数,e为误差。若k>1,根据数理统计知识可以求出化简,可得第四,规定学生进步分数为第五,规定全部k次考试后的这门学科成绩为而xj为第j次考试实得分。对于上面的例题,设五次考试中该生考试的实得分为x1=66,x2=60,x3=82,x4=71,x5=80,可以求出由已知Zi(i=1,…,5)值,利用第三步可以求出相应的成绩进步分为这样可求得全部k(k=2,3,4,5)次考试后这门学科的成绩分别为N2=62.58,N3=82.26,N4=77.19,N5=77.5,而N1=x1=66。从N分数的构造可以看出,它既反映了绝对评估的要求,又体现了相对评估的要求,因而N分数列较好地刻划了个体内差异的变化。N分数增大,说明学习呈进步趋势;N分数减少,说明学习呈退步状态;N分数不变,说明学习状态的水平不变。为了更精确地利用N分数,还可以根据每个学生的N分数,求出他们在各次考试中所得N分数的标准Z分数,再进行评估。

第三节数学学习水平评估举例学习水平评估是教学评估的重要组成部分。全国第一次初中数学教学抽样调查的报告科学地评估了1987届初中学生的数学学习水平,从中可以进一步看出数学学习水平评估的意义、内容和方法。这次教学调查采用分级分层整群随机抽样方法,从京、津、晋、沪、苏、皖、粤、鄂、桂、陕、甘、吉、黑、川、滇等15个省(自治区、直辖市)抽取605所学校的49603名学生作为调查对象。调查方式主要是对学生进行数学测试。以数学教学大纲为依据所设计的测试题(见附件一)分为Ⅰ试和Ⅱ试,Ⅰ试中全是客观性试题,主要考查数学基础知识,满分为100分;Ⅱ试中全是陈述性试题,主要考查数学基本技能和能力,满分也为100分。命题时设想两试成绩之和不低于120分为数学学习的合格水平。一、全体被试的数学学习水平全体被试的两试总平均成绩为130.89分,其中Ⅰ试平均成绩为73.73分,Ⅱ试平均成绩为57.16分。这表明全体被试在数学基础知识、基本技能和基本能力方面的平均成绩达到合格水平,并且达到数学教学大纲规定的基本要求。全体被试两试成绩的标准差为52.41分,表明学生成绩的离散程度是相当高的,数学学习水平也很不平衡。Ⅰ试和Ⅱ试的变异系数(标准差除以平均分)分别为0.32和0.53,则进一步反映学生在基本技能和能力方面的离散程度高于在基础知识方面的离散程度。从Ⅰ试的成绩分布(图4-3)可以看到,成绩高于80分的学生占51.6%,这一部分学生较好地掌握了数学基础知识;但尚有26%的学生的成绩低于60分,他们对基础知识掌握得较差。图4-3述表明,学生的比率对测试成绩呈递增趋势。从Ⅱ试的成绩分布(图4-4)可见,成绩高于80分的学生占28.8%,这一部分学生较好地掌握了数学基本技能和能力;但成绩低于60分的学生的比率高达47.8%,这一部分学生的数学技能和能力较差。图4-4还表明,全体学生的数学技能和能力处于“两头大、中间小”的分布状态。从Ⅰ、Ⅱ两试的成绩分布(图4-5)可见,成绩高于120分的学生仅占62.7%,这一部分学生达到了数学教学大纲所规定的基本要求;但处于合格水平以下学生的比率是很高的。图4-5还表明,学生的比率对测试成绩呈递增趋势。二、各省被试的数学学习水平从各省的平均成绩(表4-2)可以看到,11个省的两试平均成绩都超过120分,其中5个省超过140分;Ⅰ试平均成绩超过60分的有14个省,其中5个省超过80分;Ⅱ试平均成绩超过60分的只有7个省。这就是说,有三分之一的省在这次测试中取得了较好的成绩,另有三分之一的省的成绩不够理想。通过考查各省学生成绩的标准差(表4-2),可以进一步发现,各省内部学生水平的离散程度也非常高,并且成绩较低省的情况更为严重。比较Ⅰ、Ⅱ两试成绩的变异系数还可以看到,各省普遍存在着Ⅱ试成绩的离散程度高于Ⅰ试成绩的离散程度的现象。尽管成绩的离散程度有随着成绩的增大而减小的趋势,但是Ⅱ试成绩变异系数与Ⅰ试成绩变异系数比值的高低和成绩高低之间并无联系。三、各校被试的数学学习水平从各校Ⅰ试、Ⅱ试平均分的频率分布(表4-3)可以看到,有466所学校的Ⅰ试的平均成绩超过60分,占学校总数的77%,学生数占79.2%;有263所学校Ⅱ试的平均成绩超过60分,占学校总数的43.5%,学生数占44.6%。可以认为,有五分之四的学校在基础知识的教学上基本上达到了要求,有五分之二多一些的学校在基本技能和能力的教学上基本上达到了要求。从Ⅰ、Ⅱ两试平均分的频率分布(表4-4)可以看到,Ⅰ、Ⅱ两试的总平均成绩超过120分的学校有372所,占学校总数的61.5%,学生数占63.8%;另有57所学校两试的总平均成绩低于80分,占学校总数的9.4%,学生数占7.7%。总的来看,有五分之三的学校数学教学基本上达到了要求,但有近十分之一学校的数学教学质量很差。各校总平均分的标准差为35.24分,说明学校与学校成绩之间的差距也比较大。成绩最好的学校两试总平均成绩为198.08分(其中Ⅰ试平均成绩为99.54分,Ⅱ试平均成绩为98.54分),成绩最差的学校两试平均成绩仅为27.99分(其中Ⅰ试平均成绩为22.26分,Ⅱ试平均成绩为5.73分),相差170.09分(Ⅰ试相差77.28分,Ⅱ试相差92.81分),也说明了这个问题。所有被调查学校中,属于厂矿、城市、城镇和农村的学校分别有33、83、47和422所,相应的学生数分别为2524、8778、5023和33278。按1986年初中会考成绩排序,把城市学校序列、城镇学校序列、农村学校序列各截成上、中、下三层,使其学生数依次占该类学生总数的25%、50%、25%。为了简便,我们用K1、K2、K3分别表示城市的上、中、下三层学校;用K4、K5、K6分别表示城镇的上、中、下三层学校;用K7、K8、K9分别表示农村的上、中、下三层学校;对厂矿学校,统一用K0表示。现在进一步考察这十类学校学生的数学学习水平。十类学校学生的平均分和标准差如表4-5所示。这十类学校学生的平均分按由大到小的次序排列为K1、K7、K4、K8、K9、K5、K2、K0、K3、K6。从十类学校学生成绩的标准差来看,K4的成绩最为稳定;K1,K7次之;K9的成绩波动最大,K0,K8次之。平均分与标准差的相关系数为-0.71,则反映了成绩越好水平越稳定的趋势。对十类学校学生成绩的两个主成分(有关主成分分析的原理和方法,可见参考书[12])值(表4-6)进行聚类分析,其结果如图4-6所示,由图表明,十类学校构成七个水平层次,A.K1;B.K7,K4;C.K8;D.K9,K5,K2;E.K0;F.K3;G.K6。从中可以发现,城市中的上层学校成绩最好,属第一级水平;城镇和农村的上层学校比城市的上层学校差,但彼此成绩接近,同属第二级水平;农村的中层学校成绩优于城市、城镇的中层学校,为第三级水平;而农村的下层学校与城市、城镇的中层学校成绩接近,同为第四级水平;厂矿学校、城市下层学校和城镇下层学校分别为第五、六、七级水平。相邻各级水平之间的距离,按照从小到大的顺序是AB、DE、FG、BC、EF、CD。四、男女学生的数学学习水平全体被试中,男女学生各占58.1%和41.9%。从表4-7可见,男学生的I试、II试、I、II两试的平均分都大于女学生相应的平均分,分别相差2.72分、3.25分和5.97分;I试男学生成绩的标准差小于女学生成绩的标准差,II试、I、II两试都恰好相反。由独立大样本平均数差异的U检验可知,在5%的显著性水平下,男女学生I试、II试、I、II两试的平均分都有显著差异。与直接比较平均分所不同的是,男女学生I试平均分差异的显著性程度高于男女学生II试平均分差异的显著性程度。从表4-8可见,在15个省中,有14个省男学生的I试、II试、I、II两试的平均分都大于女学生相应的平均分。从表4-9又可见,只有5个省男女学生I试、II试,I、II两试成绩标准差的大小与全体被试中男女学生的情况相同。由独立大样本平均数差异的U检验可知,有7个省男女学生I试、II试、I、II两试的平均分都有显著差异,另有4个省I试、II试

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论