教育统计与测量详细版

上传人：汤*** IP属地：北京上传时间：2023-04-01 格式：PPTX 页数：117 大小：2.59MB 积分：25 举报 版权申诉

已阅读5页，还剩112页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第四章测验分数的解释和应用

第一节分数与常模一、分数的种类与含义（一）分数的定义（二）分数的种类

1、原始分数：在测量工具上直接得到的测值（数字），叫原始分数。

2、导出分数：以原始分数为依据，按照特定的规则转化推导出来的。

3、相对评分分数

4、绝对评分分数

2023/4/11可以确定原始分数意义的参照物大体有两类：一是其他被试的测值，即其他被试在所测特性上的普遍水平或水平分布状态；二是社会在所测特性上的客观要求，即被试在所测特性上发展应该达到程度的标准。相对评分分数：通过被试间相互比较而确定意义的分数叫相对评分分数。绝对评分分数：通过拿被试测值跟应有标准作比较来确定其意义的分数叫绝对评分分数2023/4/12二、什么是常模（一）常模常模：测验常模简称常模，即指一定人群在测验所测特性上的普遍水平或水平分布状况。（二）常模的建立

1、科学抽样（标准化样组或常模组的含义）

2、科学施测

3、统计分析

4、建立常模（三）常模的种类

1、发展常模：年龄常模和年级常模

2、组内常模：百分等级常模和标准分数常模2023/4/13三、年龄常模（一）发展常模的涵义历史上第一个提出常模这一科学概念的，是法国心理学家比纳，他最早建立了智力测验的年龄常模。发展常模就是某类个体正常发展进程各特定阶段的一般水平。2023/4/14

2023/4/15一个儿童的实际年龄是5岁，在治理测试时通过5岁组的全部条目，还通过6岁组的两个条目和7岁组的一个条目，他的智力年龄是：A、5岁B、5岁6个月C、5岁2个月D、5岁4个月B2023/4/16比例智商的局限性人的智力随年龄增大而提高和成熟，但其在各年龄段的发展速度并不相同，呈现先快后慢的态势，并在某年龄成熟后就趋于稳定不再变化了。由于有这类缺陷，比例智商就逐渐被人们放弃了用平均数或中位数来代表各年龄组被试在测验上的普遍水平，是合理而适宜的，这就是年级常模。2023/4/17四、年级常模（一）年级常模的建立在为多个年级进行教学的科目建立测验常模时，要确保各年级学生实际构成的代表性样组。然后编制的测验其项目确能代表打算测查的各个年级的教学内容与要求，项目难度跨距要相当地大，数量也要比较多。建立以年级为横轴、测验分数为纵轴的直角坐标系。最后，利用这条曲线就可求得各测验分数对应的年级常模表。2023/4/18（二）年级常模的局限1.许多学校科目并不连年授课，所以无法求年级常模；即使是多学年授课的科目，随年级的递升内容重点也不断转移。2.所得年级等值常易引起误解。于是人们努力开发组内常模。2023/4/19第二节百分等级常模与应用一、组内常模（一）组内常模的涵义组内常模：解释被试原始分数的参照体系，即被试所属那类群体的人，在所测特性上测验取值的分布状况。组内常模就是以常模组的测验分数分布状态作为参照系的常模，它所说明的是被试特质水平在常模组内的相对地位，而不是与某一年龄或年级被试的一般水平相等同。（二）组内常模的种类百分等级常模标准分数（Z值）常模2023/4/110常模的建立2023/4/111二、百分等级常模（一）百分等级常模的含义将测验分数跟转化出的百分等级对照，即得各分数的百分等级（二）求取百分等级的方法

1、常模组测验分数未经整理时的求法

2、整理成次数分布表后的求法（三）百分等级在正态分布表上的表示2023/4/1122023/4/113百分等级在正态分布表上的表示2023/4/114（四）百分等级常模的应用

1、应用

2、局限（百分等级不是等单位的量度）不能把某一被试不同测验上的百分等级值累加求和！百分等级值只有可比性而无可加性！标准分数值是等单位量度，既具可比性又具可加性，可以累加求和、求平均，能作进一步的量化分析。2023/4/115第三节标准分数常模和应用一、标准分数常模的意义（一）标准分数常模的概念标准分数常模：用被试所得测验分数转换成的标准分数来揭示其在常模团体中的相对地位的组内常模（二）标准分数的计算公式标准分数就是以它所属分数组的标准差为单位的，对它所属分数组的平均数的距离。（三）标准分数的性质（标准分数是等单位量度）2023/4/116（四）标准分数常模表的建立首先，要求出这组分数的平均数与标准差然后，再求出考察的某个观测分数离该组平均数的离差是多少接着，拿这个离差值去跟该组标准差值求比例Z值不但有正值，还一定会有负值。2023/4/117

一组分数全部都转换成标准分数后，原始测验分数组的平均数与标准差，在转换出的标准分数组中，就会成为平均数为0，标准差为1。也就是说，等于平均数的测验分数转换成标准分数后，其值为零；两测验分数差值恰好等于测验分数组标准差那么大时，其标准分数的差就会为1。如果一个测验上的被试成绩呈现正态分布，以后我们将进一步说明，绝大部分被试成绩的标准分数，都会在+3.000与

-3.000之间取值。2023/4/118标准分数常模建立的步骤1.从明确界定好的该测验应该的测查的被试总体中，抽取一个容量足够大的代表性样组，即建立起常模组（常模团体）2.对该代表性样组按就有规范施测该测验，获得代表性样组中每一被试的测验分数，即得到常模团体的测验分数组。3.求取常模团体测验分数组的平均数和标准差，按公式求取标准分数，跟测验原始分数的对照表，就得到标准分数常模表。2023/4/119

2023/4/120二、线性变换后的标准分数常模几种典型的线性转换标准分数韦克斯勒IQ：平均数为100，标准差为15斯坦福-比纳IQ：平均数为100，标准差为16T值：平均数为50，标准差为102023/4/121三、标准分数的应用（一）揭示分数在分数组中的相对地位（二）不同测验的分数作比较（三）不同测验分数的求和2023/4/122不同测验间分数的比较与求和若两个测验上原始分数分布状态相同，比如都呈正态分布，将某测验上的分数予以标准化，求出其导出分数Z值，一个目的是要明确揭示其在整个分数组中的相对地位，另一个目的就是要为跟其他不同测验上的分数作比较开辟可能性。2023/4/123例：已知某地区代表性样组的身高平均数和标准差，体重平均数和标准差，现在在该地区测出一个体的身高与体重，问该个体的身高发育得更好一些还是体重发育得更好一些？求解办法：求出该个体的身高Z和体重Z，看哪个数值大，即为发育更好。例：已知某代表性样组身高平均数和标准差，体重平均数和标准差，问这个代表性样组究竟是身高的差异程度大，还是体重的差异程度大？求解办法：求出身高的差异系数CV和体重的差异系数CV，看哪个数值大，即差异大。2023/4/124等级分布表

分等和百分位数2023/4/125练一练比纳智力测验运用的常模属于(

)

A.百分等级常模

B.标准分数常模

C.年级常模

D.年龄常模D2023/4/126练一练下列属于发展常模的是

A．百分等级常模

B．标准分数常模

C．年级常模

D．组内常模C2023/4/127练一练

2023/4/128练一练下表是某市6岁女生的平均身高、体重和8岁女生的平均身高的统计数据。现该市有位6岁女生身高114厘米，体重29千克；有位8岁女生身高135厘米。

试问：(1)这位6岁女生的身高与体重哪一项发育得更好一些?

(2)这位6岁女生与那位8岁女生相比较，谁的身高发育更好一些?

(结果保留2位小数)

S6岁女生平均身高(厘米)1106.26岁女生平均体重(千克)253.78岁女生平均身高(厘米)1259.7答案：2023/4/129练一练已知一组分数Z1，Z2，…，Zn，其平均数为5，标准差为2，若使Ti=100+15Zi，则新数据T1，T2，…，Tn的平均数及标准差各是多少?答：新数据的平均数为105，标准差为30。P1082023/4/130练一练假设某次人事选拔考试分数服从正态分布，平均数为80分，标准差为10分，现欲选出30％高分者录取，问分数线应当为多少?(结果保留2位小数，Z值表附后)ZYP.50.51.52.53.54.35207.35029.34849.34667.34482.19146.19497.19847.20194.20540(曲线下的面积与纵高)答案：2023/4/131练一练假定某市初二学生参加标准化语文、数学和英语测验，所得三科成绩均接近正态分布，各科的平均分、标准差及其中四位学生的各科成绩列于下表，试计算这四位学生各科成绩的标准分并比较他们总成绩的优劣。(结果保留到小数点后两位数。)答案：

S甲乙丙丁语文81.5885947680数学89.513928086103英语72.59758180872023/4/132假设某次人事选拔考试分数服从正态分布，平均数和标准差分别为75分和10分，现欲选出40％高分者录取，问分数线应当为多少?(z值表附于卷后，结果保留2位小数)附：正态分布表

(曲线下的面积与纵高)

ZYPZYP.25

.26

.27

.28

.29.38667

.38568

.38466

.38361

.38251.9871

.10257

.10642

.11026

.114091.25

1.26

1.27

1.28

1.29.18265

.18037

.17810

.17585

.17360.39435

.39617

.39796

.39973

.40147答案：2023/4/133

第五章测验质量分析第一节测验项目的难度和区分度

一、测验项目的难度（一）难度的定义难度：被试完成项目作答任务时所遇到的困难程度。难度指数：定量刻画一个测验项目的被试作答困难程度的量数就叫项目的难度指数。2023/4/134

2023/4/135难度的计算（三）测验难度在正态分布表上的表示项目难度指数p，就可用正态分布曲线下，从右尾端算起的跟横轴（即所没特质水平取值的数轴）所夹面积来代表。假设阴影部分所夹全部面积为60%，即难度指数p=0.60，也就是全部被试在这个项目上的通过率为60%，失败率为40%2023/4/136（四）测验项目的恰当难度和恰当难度分布

1、标准化常模参照测验恰当难度：接近0.5

恰当难度分布：0.30至0.70之间

2、标准参照测验难度由项目的考核要求是否体现了应有标准和教学目标来决定。

3、筛选测验恰当难度是对能力处于这一水平点的被试来说，通过率为0.52023/4/137不同难度测验在正态分布表上的表示

2023/4/138A.量表的低分端耸起B.量表的高分端耸起C.测验分数全距若测验的总分分布呈正偏态，说明测验过难，就要修改测验，把其中一些难题调易一点；若测验总分分布呈负偏态，说明测验过易，就要把测验中一些易题改难一点。直到被试样组总分分布接近正态为止。二、测验项目的区分度（一）项目区分度的涵义项目区分度：就是项目区别被试水平高低的能力的量度。倘若，高水平被试，在测验项目上能得高分，而低水平被试则只能得低分，测验项目区分被试高分能力就强；假定高水平被试和低水平被试在测验项目上所得分数并无差别，项目提供不出被试水平差异的信息，它的区分能力就很弱；如果情况还要糟糕，高水平被试在测验项目上反而得低分，低水平被试在测验项目上所得分数却不低，这种项目的性能就跟测验目的相背离，在测验中就只能起干扰破坏作用。2023/4/139要确定项目区分度，就先要确定能代表测验目的的标准。一个代替的办法就是把初步编成的一批测验项目，由专家认真加以排行，找出大家公认的好项目，编成一份试验性测验去施测，然后将各个项目上的被试得分去跟测验总分求相关。凡是相关一致性高的项目就认定为区分力强的项目，而相关低甚至呈负相关的项目，就认定为区分力弱或无效的项目。这种标准就是测验内部而非测验外部标准。2023/4/140（二）项目区分度的计算

1、相关分析法（1）（1，0）记分项目的计算求点双列相关系数（2）（K，0）记分项目的计算求积差相关系数

2、极端分组法（高低分组得分率差）将全体被试按总分多寡排除，然后取得分最多的27%的被试作高分组，得分最少的27%的被试作为低分组，最后求这两个组上项目得分率（通过率）的差来作为区分度指数的取值。2023/4/141第5题分数满分为18分连续性变量，求积差相关系数2023/4/142

x2y2xy7510-4-3169127114-81641-87415-52254-108394-41616-1686137049006912-10-110011080101-319-37815-1214-27612-3-19138215329467713-2040085126-1361-6811522444831441161490181151212555119019747180497913

1100110019809018107917919308918816807517109517115503219018206014808506414816602111516023002023/4/143

0016115021023032148148155060064166168171171075079179181182085188089090190193095198110011002023/4/144

691271147415751076127713781580108115821583983148512861390182023/4/145“高低分组”法求出的区分度指数值，不会恰好等于“相关系数”法求出的值，这是因为后者使用了全部实测资料，而前者却丢弃了总分处于中部的被试资料，因而只能是较为粗糙的估计值。2023/4/146项目区分度指数的取值范围及评价项目区分度指数的取值范围在-1.00至1.00之间区分度指数值若在0.20以下，说明项目区别被试优劣的能力很差，应该从测验中淘汰这类项目；区分度指数取值在0.20至0.29之间，说明要通过修改来提高其区分能力；区分度指数取值在0.30至0.39之间，说明区别能力合格；区分度指数取值大于0.40，试题区别被试优劣的能力很强，是性能优良的试题。2023/4/147第二节测验的信度一、信度的意义（一）信度的定义：

测验在测量它所测特质时所得到的分数（测值）的一致性。2023/4/148影响信度的因素测验项目抽样不妥语言表达引起误解施测环境影响施测时指导语、完成时限、主被试关系评分过程的偏向与误差被试的动机和情绪信度只受随机误差的影响，测验信度就是指导对随机误差的控制。2023/4/149

2023/4/150信度就是测验控制误差能力的量度误差大，观察分数离真分数就远，多次施测应付前后显著不一致误差小，观察分数离真分数就近，多次施测时前后一致性就会好2023/4/151二、信度的估计

2023/4/152信度系数：利用同一测验向同一批被试重测两次所得的两批独立测值，求出其间的相关系数，就可利用这种重测相关系数作为测验信度的估计值。这样的相关系数就叫信度系数。稳定性系数：由于重侧法十分强调特质的稳定性，所以用这种方法求取的信度系数就叫做稳定性系数。等值性系数：用平行形式相关求得的信度系数，因为特别强调两测验形式的等值关系所以又叫等值性系数2023/4/153三、信度系数的应用

2023/4/154

2023/4/155结论信度系数取值小，测量标准误就会大，被试真分数可能落在那个区间的长度就会宽；如果信度系数取值大，测量标准误就会小，被试真分数所可能落在的那个区间的长度就会窄。公开大规模使用的标准化测验，其信度系数的取值不应小于0.90；主要用来起预测作用的标准化测验，最好能接近或大于0.952023/4/156重测相关求信度系数，多用于智力、能力倾向和人格特点等。稳定性系数多用于预测性测验。学业成就测验、同一科目的测验多用平行等值测验。内部一致性系数多用于能力倾向测验，智力测验。2023/4/157第三节测验效度一、效度的意义测验效度，就是测验实际上测到它打算要测的东西的程度。（相对性）P139测验效度既受随机误差的影响，也受系统误差的影响。测验效度的估计可用逻辑思辨和统计数学分析方法。2023/4/158测验效度是测验工作的正确性问题，是测验分数的实际有效性问题，是测验质量高低的根本表现所在，是测验性能的最重要指标。测验效度不能由测验编制者或使用者的主观意愿来确定，也不能简单地仅根据测验所冠以的名称来，它只能根据有关这一测验的客观资料来证实。也就是说，测验效度是需要通过客观性的实际工作来验证的。测验的有效与否和程度如何，是要针对测验的实际使用目的来说的。2023/4/159测验效度是相对的，通常采用逻辑思辨和统计数学分析等方法，来确定该测验的实际有效性。2023/4/160二、效度的种类（一）内容效度（P141）内容效度就是测验项目构成应测行为领域代表性样本的程度。内容效度的估计办法：1.专家判断的办法2.统计分析的办法内容效度与表面效度2023/4/161内容效度效标关联效度结构效度表面效度指从被试或非专业人员看，测验表现得是否在有效地测验着应测的东西。学业成就与智力测验，应力争有高的表面效度。人格测验和态度测验，有时被试并不愿意直陈自己内心想法，不必追求高的表面效度。2023/4/162二、效度的种类（二）效标关联效度（P142）效标关联效度：就是指测验预测个体在类似或某种特定情境下行为表现的有效性。效标污染：就是效标测量值的评定，受到了测验分数值的信息的影响。防止效标污染的有效办法就是降低表面效度。2023/4/163内容效度效标关联效度结构效度二、效度的种类（三）结构效度（P144）结构效度：就是测验测得心理学理论所定义的某一心理结构或特质的程度。估计结构咨询的办法：1.分析结构与特质的性质2.分析不同测验间的相关性3.因素分析法2023/4/164内容效度效标关联效度结构效度三、效度系数与估计误差

2023/4/165效度系数的取值很少能超过0.70，一般取值能达到0.40就相当不错了。韦氏成人智力测验的言语智商跟大专学生学业成绩间的相关大致在0.40~0.60间操作智商与瑞文智力测验间的相关，大约在0.702023/4/166

2023/4/167练一练下列对误差的理解不正确的是(

)

A.误差可以避免

B.误差可以控制

C.误差是客观存在的

D.误差可以分为测量误差和抽样误差A2023/4/168练一练衡量测验工具的正确性的指标是(

)

A.测验难度

B.测验效度

C.测验信度

D.测验区分度B2023/4/169练一练在标准（目标）参照测验中，其项目的难度应该是

A．尽量接近0.50

B．由被试的实际通过率决定

C．由项目的考核要求是否体现应有标准和教学目标来决定

D．针对划界点（决断点）水平来确定C2023/4/170练一练T分数的平均分和标准差分别为

A.(50,10)B.(10,50)

C.(15,100)D.(100,15)A

2023/4/171练一练能反映对测验控制误差能力的量度的质量指标是A．测验信度

B．测验难度C．测验区分度

D．测验效度A2023/4/172

学生0102030405060708091011121314151617181920总分8482766072747684889078809294968890787674题分10000001111011111000有一是非选择测验题，每题采用(0，1)记分，共100题，满分100分。下表是20位学生在该测验中的总成绩及第3题的得分情况。

(1)试求第3题的区分度；(2)该题的区分度强吗?(Sx=8.88，结果保留2位小数)(计算公式：答案：2023/4/173练一练某人格测验信度系数rxx

=0.84，测验分数标准差为15分：

(1)求测验的测量标准误；

(2)若甲、乙、丙三人所测成绩分别为127分，130分，135分，计算他们的真分数所可能

落在的分数区间。答案：2023/4/174第六章测验的主要类型与应用第一节学业成就测验第二节心理测验2023/4/175第一节学业成就测验一、学业成就测验的主要类型按课堂教学运用测验的一般顺序来分：

安置性测验

形成性测验

诊断性测验

终结性测验按解释测验分数的方法不同来分：

常模参照测验与标准参照测验按成就测验的实施方式与测验载体来分：

口头测验，纸笔测验，操作测验按测验编制程序的严格程度来分：

标准化成就测验与教师自编课堂成就测验2023/4/176安置性测验：学期开始或单元教学开始时确定学生实有水平以便针对性地做好教学安排而经常使用的测验。1.学生是否具备成功地学习这一课程或这一单元所必需的基本知识和技能；2.对于将要学习的新内容，学生已经了解与掌握了哪些内容;3.不同学生的学习能力、学习兴趣、学习习惯以及学习特点是什么？安置性测验也称为准备性测验和调查摸底性测验2023/4/177形成性测验：在教学进行过程中实施的用于检查学生掌握知识和进步情况的测验，这可为师生双方提供有关学习成败的连续反馈信息。1.对成功的学习起了强化作用2.暴露学习中的不足以便及时改正与完善形成性测验主要用于改进学习与教学形成性测验有时也称作单元测验和阶段测验2023/4/178诊断性测验：为探测与确定学习困难原因而施测的一类测验。诊断性测验能发现那些用形成性测验所难以准确辨别的学习困难，这些困难往往是学习困难者较长期存在且周期性出现的认知缺陷。1.诊断性测验一般注重于与诊断相关的目标，对每一特定的目标需要包括大量题目，每个题目之间只有很小的差异。2.测验题目依据于对成功学习特殊技巧的详细分析以及觉的学习错误的分析研究。3.题目难度一般较低，重在确定学生所犯学习错误的类型以及学习困难根源所在。4.诊断性测验一般限于课程教学中有限总分内容，且通常按若干部分的分数与测验记录来分析，很少用测验全部内容。2023/4/179终结性测验：在课程结束或教学大周期结束时，用于确定教学目标达到程度和学生对预期学习结果掌握程度的一类测验，称为终结性测验。1.对学生的学习情况作出全部的检查与总结，并评定一个分数或等级。2.评价教师教学的有效性。3.预测学生在其后学习上的情况。2023/4/180终结性测验的特点1.尽管终结性测验并不一定都要到期终才进行，但它却包括更广泛的教学内容，通常是一门课程或一个学期教学内容的有效抽样。2.终结性测验具有更高的概括性水平，它不仅要检查学生在基本术语、基本概念、基本原理和基本方法等方面的掌握情况，而且要从教学内容及教学目标整体上检查学生运用上述这些基本知识去分析问题、解决问题的综合能力。3.终结性测验题目内容抽样相对于上述其他类型的测验来讲，更具广泛性和代表性，因而需要有一个良好的抽样方案。4.终结性测验题目的难度分布全距相对来讲更大一些。2023/4/181常模参照测验主要用于常模参照测验：实是参照着常模使用相对位置来描述测验成绩水平的一种测验。1.鉴别与评价学生的能力发展水平，这种发展水平是一种相对比较的结果，因而，有利于个别差异的诊断与研究。特别是，这种比较可以在班内、校内、地区内、国内或同年龄人群内进行，因此，在许多情况下，便于我们了解学生的学习进步与能力发展情况。2.用于教育工作中的选拔与分流方面的决策。有选拔就必然要区分，搞选拔就必然作分流或淘汰。借助常模参照测验，就可以更有科学依据地作出各种有关选拔与分流方面的教育决策。2023/4/182标准参照测验标准参照测验：跟一组规定明确的知识能力标准或教学目标内容对比时，对学习者的测验成绩作出解释的一类测验。标准参照测验通常有三个方面的用途：1.说明学习者掌握所规定的教学内容的程度，以便作出掌握和未掌握、合格和不合格的分类决策；2.在许多情况下，需要通过标准参照测验给学习者一个成绩，以提供学习者个人学习经历和已达水平的证明资料。3.评价课堂教学和课程编制的有效性。因此，标准参照测验在学校教育教学过程中应用最为广泛。形成性测验、终结性测验都归为标准参照测验。2023/4/183标准参照测验与常模参照测验的差异1.常模参照测验的成绩通常是一种相对评分，采用相对的等级分数、百分等级或标准分数体系，说明的是初试在某一初试团体中的相对地位；标准参照测验的成绩通常是一种绝对评分。说明的是初试达成某一教学目标，或掌握某一范围内的知识技能的实有程度。2.常模参照测验难度方面多为中等而不用偏难与偏易的题目，以增加测验的区别功能与选拔功能；标准参照测验在设计意图上考虑的是测验内容抽样是否良好地代表一组既定的能力标准或既定的教学目标，题目难度要与既定的学习任务相匹配，而不管题目是偏易还是偏难。3.常模参照测验通常只用少量题目，标准参照测验通常用较多数量的题目进行分项解释。2023/4/184标准参照测验与常模参照测验的相同1.它们一般都以所学过的教学内容为命制题目的素材2.它们都使用大体相同的题目类型3.它们都需要讲究测验的质量（如信度和效度等）4.它们通常都有相同的答题方式及评分准则5.它们通常都以相同的方式来安排题目以构成试卷6.有的学业成就测验同时具有常模参照和标准参照的特点2023/4/185口头测验口头测验，常用于测量那些用纸笔难以全面综合地加以考察的知识技能及态度。1.使用特定语言回答问题的能力2.综合有关信息，提出问题的能力3.阐述观点并为自己的观点作解释与辩护的能力4.口头表达时逻辑思维及概括能力5.知识理解的广度与深度6.态度、气质与情感方面的特殊表现口头测验常用的方法：高声朗读，教师提问，抽签回答，专题发言，小组讨论随意发言，师生一般会谈，根据情景讲故事，角色扮演。

2023/4/186纸笔测验纸笔测验的优点：1.提高测验的效率，即同时可以进行大团体的测验2.便于完整记录学生在题目作答上的反应3.便于施测和评分过程的规范化和标准化，从而提高学业成就测验的信度与效度4.便于对测验中答题信息的分析研究缺点：1.教师不能对学生的回答或学生的观点作及时的询问2.纸笔测验所测量的教学目标，一般局限于认知领域，对于动作技能及情感方面的目标则难以测量3.特别是，那些过分注重客观题的纸笔测验，往往只涉及到课程内容中有明确界定的掌握性结果，而对发展性目标中那些高级心智技能，则重视不够。2023/4/187操作测验操作测验要求作出实际行为反应。实验技能考核需要遵循如下三条基本原则：1.实践性为主原则2.全面性原则3.客观化原则2023/4/188标准化成就测验标准化成就测验：是由专家编制的，按照系统的科学程序组织实施、建立统一的标准并对测量衰减作了严格控制的学业成就测验。1.由有关教育测量专家和学科专家编制，标准化成就测验也可称为专家编制的成就测验。2.实现了测验全过程的标准化。3.测验题目经过专家审查，常常还抽取代表性被试样本进行预测，具有质量指标，如难度与区分度4.备有测验指导手册，对测验目的、内容标准、试题形式、施测要求等，都作了明确而具体的说明；对测验分数的解释提供了统一的准则。5.通常备有等价的或平行的几份测验6.测验的质量经过检验，信度高、效度好。一般信度在0.9以上。2023/4/189教师自编课堂成就测验教师自编课堂成就测验：由教师个人或教师集体结合课堂教学要求而编制的学业成就测验，统称为教师自编课堂成就测验。目的在于改进课堂教学和促进学生发展。1.简易性2.灵活性3.随意性4.测量性能较差2023/4/190二、学业成就测验命题双向细目表的设计（一）对教育目标分类的认识：美国布鲁姆的观点：知识、领会、应用、分析、综合、评价我国教育工作者的观点：识记、理解（领会）、简单应用和综合应用（二）编制命题双向细目表的方法2023/4/191知识：是回忆或辨认某些特定的事实领会：它指的是初步理解材料的意义应用：是能够运用已学过的材料，把它们合规则地用到具体的新的情境中以便解决新问题的一种能力，如迁移能力。分析：是把事物整体分解为部分，以便了解整体与部分以及部分与部分之间的关系综合：是把各个部分有机地组织成一个整体的能力评价：指的是根据一定的标准对事物的价值作出全科逻辑的判断2023/4/192编制双向细目表的方法2023/4/193三、学业成就测验中常用题型及特点填空题和简答题是非题匹配题选择题论述题，证明题，计算题，作图题，作文题等2023/4/194客观题：评分规则明确，依照规则，无论谁去评分，都会得出相同的分数，这类题目称之为客观题。典型的客观题类型常见的有填空题，简答题，是非题，匹配题，单项选择题，多项选择题等。主观题：如论述题，证明题，计算题，作图题，作文题等。2023/4/195主观题的特点1.不允许简单猜测，适于考察分析综合能力、组织表达能力以及计算与推论等较为复杂的心智技能2.提倡自由反应，有利于考察应用能力乃至创造能力3.可以获得较为丰富的作答反应过程资料，便于分析被试的技能、策略和知识缺陷等4.内容和形式更为接近教学与实践中的问题情境，被试不陌生、好接受，教师命拟比较方便2023/4/196主观题的不足1.作答反应费事，有大量的书写任务2.单位时间中施测的问题量减少，限制了测验内容的覆盖面，不利测验效率的提高3.允许被试以文字技巧和作答风格来搪塞胡弄主试4.评分易受阅卷者主观因素的影响2023/4/197奥梯斯等在第一次世界大战其间开发出了现在广为流传的“选择题”题型2023/4/198四、当前学业成就测验的发展标准化建设题库计算机化自适应测验以项目反应理论为代表的现代测量理论的兴起2023/4/199第二节心理测验心理测验的概念（P176）心理测验是通过对一组标准刺激所引起的行为样组的客观分析，对人们的心理特征及个别差异进行估测、描述和诊断所编制的心理测验，称为标准化心理测验，有时也称为心理量表。2023/4/1100一、心理测验的主要用途1.人才选拔2.人员安置与人事管理3.临床心理学研究4.学校心理服务

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

教育统计与测量详细版

文档简介

温馨提示

最新文档

评论

教育统计与测量详细版

文档简介

温馨提示

最新文档

评论

相关文档