心理测量第七章测验的项目分析课件_第1页
心理测量第七章测验的项目分析课件_第2页
心理测量第七章测验的项目分析课件_第3页
心理测量第七章测验的项目分析课件_第4页
心理测量第七章测验的项目分析课件_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章

测验的

项目分析第七章测验的

项目分析1导学

项目分析是在组成测验之前,通过预测被试对组成测验的各个题目(项目)的反应进行的分析。它是编制和修订测验的重要环节。

通过本章的学习可解决三个问题:一、掌握什么是测验的难度,如何计算测验的难度(重点)二、掌握什么是测验的区分度,如何计算测验的区分度,难度和区分度的关系怎样(重点)三、掌握项目分析的其他特殊形式

导学项目分析是在组成测验之前,通过预测被试对2第一节难度

一、难度的定义二、难度的计算三、难度水平的确定四、测验的难度与测验分数的分布五、常态化等距难度量表

第一节难度一、难度的定义3一、项目的难度难度,是指项目的难易程度。在能力测验中通常需要一个反映难度水平的指标,在非能力测验中,类似的指标是“通俗性”,即取自相同总体的样本中,能在答案上回答该题的人数。

一、项目的难度4二、难度的计算难度通常以答对百分比作指标。(一)二分法记分的项目若试题为二分法记分项目(即答对给1分,答错记0分)时,难度的指标通常以通过率表示,即以答对或通过该题的人数的百分比来表示:P=R/N×100%

式中,P代表项目的难度,N代表全体被试者人数,R为答对或通过该项目的人数。

二、难度的计算5(二)非二分法计分的项目当测验项目是问答题或其他不能用二分法计分的形式时,常常对部分正确的反应也给一定的分数。对于这类型题目,一般用下面的公式计算难度:P=X/Xmax×100%式中X为全体受测者在该题上的平均分,Xmax为该题的满分。

(二)非二分法计分的项目6(三)分组法当被试人数较多时,则可根据测验总成绩将被试分成三组:分数最高的27%被试者为高分组(NH),分数最低的27%被试者为低分组(NL)。分别计算高分组和低分组的通过率,以两组通过率的平均值作为每一题的难度。其公式为:P=(PH+PL)/2式中P代表难度,PH和PL分别代表高分组和低分组通过率。

(三)分组法7(四)难度的校正由于选择题允许猜测,所以通过率可能因机遇作用而变大。备选答案的数目越少,机遇的作用越大,越不能反映测验的难度。为了平衡机遇对难度的影响,吉尔福特提出了一个难度的校正公式:CP=(KP-1)/(K-1)式中CP为校正后的通过率,P为实际得到的通过率,K为备选答案的数目。

(四)难度的校正8三、难度水平的确定进行难度分析的主要目的是为了筛选项目,项目的难度多高合适,取决于测验的目的、性质以及项目的形式。在教育工作中,有些测验的目的是为了考察学生对某方面的知识、技能是否掌握,此时可以不考虑难度。当测验用于选人时,应该比较多的采用那些难度值接近录取率的题目。三、难度水平的确定9对于选择题来说,P值一般应大于概率水平。P值等于概率,说明题目可能过难或题意不清,被试者凭猜测作答;P值小于概率无意义,说明题目质量有问题。对于选择题来说,P值一般应大于概率水平。P值等于概率,说明题10四、测验的难度与测验分数的分布测验的难度直接依赖于组成测验的项目的难度。通过考察测验分数的分布,可以对测验的难度做出直观检验。由于人的心理基本上是呈常态分布的,而我们目前所采用的统计方法大都以正态分布为前提,因此大多数测验在设计时希望分数呈现常态分布的模型。如果被试样本具有代表性,对于中等难度的测验,其测验总分应接近常态分配。四、测验的难度与测验分数的分布11五、常态化等距难度量表以通过率作为难度指标,实际上是以顺序量表来表示难度,它仅仅能指出题目难度的顺序或相对难度高低。因此美国教育测验服务社建议用转换过的分数来表示试题难度值。其转换公式为Δ=13+4Z,(Δ为难度指标,Z为标准分数,13为转换公式的平均值,4为转换公式的标准差)由于Z分数通常只取±3之间的数值,因此可知:

五、常态化等距难度量表12P=0.9987时,Z=-3,故Δ=13+4(-3)=1P=0.9772时,Z=-2,故Δ=13+4(-2)=5P=0.8413时,Z=-1,故Δ=13+4(-1)=9P=0.5000时,Z=0,故Δ=13+4(0)=13P=0.1587时,Z=+1,故Δ=13+4(+1)=17P=0.0228时,Z=+2,故Δ=13+4(+2)=21P=0.0013时,Z=+3,故Δ=13+4(+3)=25由此可见,常用的Δ值域介于1~25之间,Δ值越大,试题越难;Δ值越小,试题越容易。

P=0.9987时,Z=-3,故Δ=113第二节区分度

一、区分度的定义二、确定区分度的方法三、区分度的相对性四、区分度与难度的关系

第二节区分度一、区分度的定义14一、区分度的定义区分度是指测验项目对所测量的心理特性的区分程度或鉴别能力。若区分度高,则水平高者得分高,水平低者得分低。若区分度低,则无鉴别力。

一、区分度的定义15(一)相关法即以某一项目分数与效标分数(或测验总分)的相关作为该项目区分度的指标。相关越高,区分能力越好。

(一)相关法16(二)鉴别指数

区分度分析的一种简便方法是比较测验总分高和总分低的两组被试在项目通过率上的差别:D=PH-PL式中PH为高分组在某项目上的通过率,PL为低分组在某项目上的通过率。二者通过率之差为鉴别指数D。D值越大,项目的区分度越高,即项目越有效。

(二)鉴别指数17三、区分度的相对性区分度的值亦具有相对性,这表现在以下四个方面:(一)采用不同的计算方法区分度的值不同(二)用相关法计算的区分度值受样本大小影响(三)用两个极端组通过率的差异作为区分度的指标,其值受分组标准的影响。(四)区分度的大小与样本的同质性有关。

三、区分度的相对性18四、区分度与难度的关系区分度与难度有密切关系。例如,某项目的通过率为1.00或0,则说明高分组与低分组在通过率上不存在差异,因此鉴别指数D为0。假如,项目的通过率为0.50,则可能是高分组的所有人都通过了,而低分组却无人通过,这样D的最大值为1.00。从上面的分析中可以看出,难度越接近0.50,项目的潜在区分度越大,难度越接近1.00或0时,项目的潜在区分度越小。

四、区分度与难度的关系19但是在实际编制测验中,不能要求所有项目的难度均为0.50。事实上,如果测验的所有项目都是中等难度,只有项目的内在相关为零时,整个测验才能产生正态分布。考虑到一般测验项目之间都有某种相关,难度的分布广一些,梯度多一些,是合乎需要的。但是在实际编制测验中,不能要求所有项目的难度均为20难度与区分度都是相对的,是针对一定团体而言的。一般来说,较难的项目对高水平被试区分度高,较易的项目对低水平被试区分度高,中等难度的项目对中等水平的被试区分度高。由于人的多数心理特征呈正态分布,所以当需要人作最大程度的区分时,项目难度的分布也以正态为好,即特别难与特别容易的项目较少,越接近中等难度的项目越多,而所有项目的平均难度为0.50。

难度与区分度都是相对的,是针对一定团体而言的。一般来21第三节项目分析的特殊形式

一、备选答案的反应模式二、速度测验的项目分析三、标准参照测验的项目分析四、项目—团体的相互作用五、有效性与可靠性的矛盾

第三节项目分析的特殊形式一、备选答案的反应模式22一、备选答案的反应模式对于选择题,除了分析其难度和区分度外,还要分析被试对每个备选答案的反应情况。一般主要做以下分析:(一)如果正确的备选答案被所有被试选择,则说明该题目太容易或者题目中可能提供了某种暗示:(二)如果某个错误答案没有一个被试选择,说明该项目不具迷惑性,错得过于明显;

一、备选答案的反应模式23(三)如果所有被试都选择了同一错误答案,可能是编制测验时把答案定错了,也可能是在教学中发生了错误;(四)如果高分组被试的选择集中在两个答案上,二者选择率相近,说明该题可能有两个正确答案或另一个答案也有一定道理;

(三)如果所有被试都选择了同一错误答案,可能是编制测验时把答24(五)如果高分组对正确答案的选择与低分组相等或低于后者,说明所考察的东西与水平无关;(六)如果一个题目被试未答人数过多或选择各个备选答案人数相等,则说明题目过难或题意不清,使得被试无法做答或凭猜测做答。

(五)如果高分组对正确答案的选择与低分组相等或低于后者,说明25二、速度测验的项目分析就难度来说,速度测验前部的项目通过率高,后部的项目通过率低,即使后边的项目比前边容易,也会出现这种情况。就区分度来说,速度测验前部的项目几乎人人都能通过,因此鉴别力很低;测验后部的项目只有能力强、反应快或总分高的被试才能通过,因而鉴别力被高估。二、速度测验的项目分析26由此看来,在速度测验中,不管项目本身性质如何,只要出现在测验前部,只有较低的难度和区分度,而出现在测验后部,便有较高的难度和区分度。由此看来,在速度测验中,不管项目本身性质如何,只要出现在测验27三、标准参照测验的项目分析在标准参照测验中,只要研究者和测验编制者认为是重要的项目,不管其通过率和鉴别力如何,都可以包含在测验中。对这种测验最好通过比较前测与后测的结果来进行项目分析。

三、标准参照测验的项目分析28四、项目—团体的相互作用不同的团体具有不同的文化背景,因而在知识技能上也有某种差异。这些差异会在测验分数上反映出来。由此带来的一个问题是,同样的项目对于不同的团体可能有不同的通过率,这不但会影响难度的绝对值,还可能影响难度的等级顺序。

四、项目—团体的相互作用29在测验编制中也有另外一种情况,不是选择团体间差异尽可能小的项目,而是选择使团体差异尽可能大的项目。

由于项目—团体相互作用的复杂性,所以对项目的选择标准不能做刻板的规定。对于引起一定团体的显著差异的项目是保留还是淘汰,取决于编制测验的目的。并且,对测验分数的解释时,一定要了解该测验的选题依据。

在测验编制中也有另外一种情况,不是选择团体间差异30五、有效性与可靠性的矛盾有效性与可靠性的矛盾是由信度和效度的复杂性引起的。信度有多种,效度也有多种。同质性(跨项目间的一致性)信度是构想效度的必要条件,稳定性(跨时间的一致性)信度是预测效度的必要条件。这两个目标在某些方面不能共存。前者要求项目之间有高度相关,后者却要求很低的相关;前者要求项目有同等难度,后者却要求项目难度广泛分布。

五、有效性与可靠性的矛盾31一个测验在追求一个目标时,必须在另一个目标上有所牺牲。对于多数心理测验来说,项目间中等程度的相关,便可使二者调和,获得较为满意的信度和效度。测验的信度、效度受项目的难度、区分度、内部一致性等多种因素的交互影响,所有这些指标间的关系是非常复杂的,因此不能把它们割裂开来分析。

一个测验在追求一个目标时,必须在另一个目标上有所32第七章

测验的

项目分析第七章测验的

项目分析33导学

项目分析是在组成测验之前,通过预测被试对组成测验的各个题目(项目)的反应进行的分析。它是编制和修订测验的重要环节。

通过本章的学习可解决三个问题:一、掌握什么是测验的难度,如何计算测验的难度(重点)二、掌握什么是测验的区分度,如何计算测验的区分度,难度和区分度的关系怎样(重点)三、掌握项目分析的其他特殊形式

导学项目分析是在组成测验之前,通过预测被试对34第一节难度

一、难度的定义二、难度的计算三、难度水平的确定四、测验的难度与测验分数的分布五、常态化等距难度量表

第一节难度一、难度的定义35一、项目的难度难度,是指项目的难易程度。在能力测验中通常需要一个反映难度水平的指标,在非能力测验中,类似的指标是“通俗性”,即取自相同总体的样本中,能在答案上回答该题的人数。

一、项目的难度36二、难度的计算难度通常以答对百分比作指标。(一)二分法记分的项目若试题为二分法记分项目(即答对给1分,答错记0分)时,难度的指标通常以通过率表示,即以答对或通过该题的人数的百分比来表示:P=R/N×100%

式中,P代表项目的难度,N代表全体被试者人数,R为答对或通过该项目的人数。

二、难度的计算37(二)非二分法计分的项目当测验项目是问答题或其他不能用二分法计分的形式时,常常对部分正确的反应也给一定的分数。对于这类型题目,一般用下面的公式计算难度:P=X/Xmax×100%式中X为全体受测者在该题上的平均分,Xmax为该题的满分。

(二)非二分法计分的项目38(三)分组法当被试人数较多时,则可根据测验总成绩将被试分成三组:分数最高的27%被试者为高分组(NH),分数最低的27%被试者为低分组(NL)。分别计算高分组和低分组的通过率,以两组通过率的平均值作为每一题的难度。其公式为:P=(PH+PL)/2式中P代表难度,PH和PL分别代表高分组和低分组通过率。

(三)分组法39(四)难度的校正由于选择题允许猜测,所以通过率可能因机遇作用而变大。备选答案的数目越少,机遇的作用越大,越不能反映测验的难度。为了平衡机遇对难度的影响,吉尔福特提出了一个难度的校正公式:CP=(KP-1)/(K-1)式中CP为校正后的通过率,P为实际得到的通过率,K为备选答案的数目。

(四)难度的校正40三、难度水平的确定进行难度分析的主要目的是为了筛选项目,项目的难度多高合适,取决于测验的目的、性质以及项目的形式。在教育工作中,有些测验的目的是为了考察学生对某方面的知识、技能是否掌握,此时可以不考虑难度。当测验用于选人时,应该比较多的采用那些难度值接近录取率的题目。三、难度水平的确定41对于选择题来说,P值一般应大于概率水平。P值等于概率,说明题目可能过难或题意不清,被试者凭猜测作答;P值小于概率无意义,说明题目质量有问题。对于选择题来说,P值一般应大于概率水平。P值等于概率,说明题42四、测验的难度与测验分数的分布测验的难度直接依赖于组成测验的项目的难度。通过考察测验分数的分布,可以对测验的难度做出直观检验。由于人的心理基本上是呈常态分布的,而我们目前所采用的统计方法大都以正态分布为前提,因此大多数测验在设计时希望分数呈现常态分布的模型。如果被试样本具有代表性,对于中等难度的测验,其测验总分应接近常态分配。四、测验的难度与测验分数的分布43五、常态化等距难度量表以通过率作为难度指标,实际上是以顺序量表来表示难度,它仅仅能指出题目难度的顺序或相对难度高低。因此美国教育测验服务社建议用转换过的分数来表示试题难度值。其转换公式为Δ=13+4Z,(Δ为难度指标,Z为标准分数,13为转换公式的平均值,4为转换公式的标准差)由于Z分数通常只取±3之间的数值,因此可知:

五、常态化等距难度量表44P=0.9987时,Z=-3,故Δ=13+4(-3)=1P=0.9772时,Z=-2,故Δ=13+4(-2)=5P=0.8413时,Z=-1,故Δ=13+4(-1)=9P=0.5000时,Z=0,故Δ=13+4(0)=13P=0.1587时,Z=+1,故Δ=13+4(+1)=17P=0.0228时,Z=+2,故Δ=13+4(+2)=21P=0.0013时,Z=+3,故Δ=13+4(+3)=25由此可见,常用的Δ值域介于1~25之间,Δ值越大,试题越难;Δ值越小,试题越容易。

P=0.9987时,Z=-3,故Δ=145第二节区分度

一、区分度的定义二、确定区分度的方法三、区分度的相对性四、区分度与难度的关系

第二节区分度一、区分度的定义46一、区分度的定义区分度是指测验项目对所测量的心理特性的区分程度或鉴别能力。若区分度高,则水平高者得分高,水平低者得分低。若区分度低,则无鉴别力。

一、区分度的定义47(一)相关法即以某一项目分数与效标分数(或测验总分)的相关作为该项目区分度的指标。相关越高,区分能力越好。

(一)相关法48(二)鉴别指数

区分度分析的一种简便方法是比较测验总分高和总分低的两组被试在项目通过率上的差别:D=PH-PL式中PH为高分组在某项目上的通过率,PL为低分组在某项目上的通过率。二者通过率之差为鉴别指数D。D值越大,项目的区分度越高,即项目越有效。

(二)鉴别指数49三、区分度的相对性区分度的值亦具有相对性,这表现在以下四个方面:(一)采用不同的计算方法区分度的值不同(二)用相关法计算的区分度值受样本大小影响(三)用两个极端组通过率的差异作为区分度的指标,其值受分组标准的影响。(四)区分度的大小与样本的同质性有关。

三、区分度的相对性50四、区分度与难度的关系区分度与难度有密切关系。例如,某项目的通过率为1.00或0,则说明高分组与低分组在通过率上不存在差异,因此鉴别指数D为0。假如,项目的通过率为0.50,则可能是高分组的所有人都通过了,而低分组却无人通过,这样D的最大值为1.00。从上面的分析中可以看出,难度越接近0.50,项目的潜在区分度越大,难度越接近1.00或0时,项目的潜在区分度越小。

四、区分度与难度的关系51但是在实际编制测验中,不能要求所有项目的难度均为0.50。事实上,如果测验的所有项目都是中等难度,只有项目的内在相关为零时,整个测验才能产生正态分布。考虑到一般测验项目之间都有某种相关,难度的分布广一些,梯度多一些,是合乎需要的。但是在实际编制测验中,不能要求所有项目的难度均为52难度与区分度都是相对的,是针对一定团体而言的。一般来说,较难的项目对高水平被试区分度高,较易的项目对低水平被试区分度高,中等难度的项目对中等水平的被试区分度高。由于人的多数心理特征呈正态分布,所以当需要人作最大程度的区分时,项目难度的分布也以正态为好,即特别难与特别容易的项目较少,越接近中等难度的项目越多,而所有项目的平均难度为0.50。

难度与区分度都是相对的,是针对一定团体而言的。一般来53第三节项目分析的特殊形式

一、备选答案的反应模式二、速度测验的项目分析三、标准参照测验的项目分析四、项目—团体的相互作用五、有效性与可靠性的矛盾

第三节项目分析的特殊形式一、备选答案的反应模式54一、备选答案的反应模式对于选择题,除了分析其难度和区分度外,还要分析被试对每个备选答案的反应情况。一般主要做以下分析:(一)如果正确的备选答案被所有被试选择,则说明该题目太容易或者题目中可能提供了某种暗示:(二)如果某个错误答案没有一个被试选择,说明该项目不具迷惑性,错得过于明显;

一、备选答案的反应模式55(三)如果所有被试都选择了同一错误答案,可能是编制测验时把答案定错了,也可能是在教学中发生了错误;(四)如果高分组被试的选择集中在两个答案上,二者选择率相近,说明该题可能有两个正确答案或另一个答案也有一定道理;

(三)如果所有被试都选择了同一错误答案,可能是编制测验时把答56(五)如果高分组对正确答案的选择与低分组相等或低于后者,说明所考察的东西与水平无关;(六)如果一个题目被试未答人数过多或选择各个备选答案人数相等,则说明题目过难或题意不清,使得被试无法做答或凭猜测做答。

(五)如果高分组对正确答案的选择与低分组相等或低于后者,说明57二、速度测验的项目分析就难度来说,速度测验前部的项目通过率高,后部的项目通过率低,即使后边的项目比前边容易,也会出现这种情况。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论