(应用数学专业论文)irt框架下的多级评分模型应用研究.pdf_第1页
(应用数学专业论文)irt框架下的多级评分模型应用研究.pdf_第2页
(应用数学专业论文)irt框架下的多级评分模型应用研究.pdf_第3页
(应用数学专业论文)irt框架下的多级评分模型应用研究.pdf_第4页
(应用数学专业论文)irt框架下的多级评分模型应用研究.pdf_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 项目反应理论( i r t ) 【lj 是在克服了经典测量理论( c l a s s i c a lt e s tt h e o r y ,c t t ) 的 各种局限性后发展起来的一种全新的测量学理论,项目反应理论的发展首先建立在潜在 特质理论的基础之上,其主要内容就是揭示被试在测验项目上的反应行为与测验所测的 被试潜在特质之间的关系。 相对于经典测量理论,项目反应理论具有明显的优势,它所采用的项目参数( 如: 难度、区分度、猜测指数等) ,是一种不会受样本影响的指标。这些参数的获得,不会 因为接受测验的被试样本的变化而不同;同时,对被试的能力的估计不会因为试题的不 同而不同,等等。正是由于项目反应理论的这些优势,它在心理测量和考试领域有了广 泛的应用,最广泛的就是多级评分模型在能力测试中的应用。本文将讨论i r t 框架下的 多级评分模型应用,旨在为试题质量评估和试题库建设提供参考资料。 关键词:项目反应理论;二值评分模型;多级评分模型;参数估计 a b s t r a c t i t e mr e s p o n s et h e o r y ( i r t ) i sac o m p l e t e l yn e wt e s tt h e o r yd e v e l o p e da f t e ro v e r c o m i n g t h ev a r i o u sl i m i t a t i o n so ft h ec l a s s i ct e s tt h e o r y ( c t t ) t h ed e v e l o p m e n to fi t e mr e s p o n s e t h e o r yi sf i r s t l yb a s e do nt h el a t e n tt r a i tt h e o r y i t sm a i nc o n t e n ti st or e v e a lt ot e s tt h e r e l a t i o n s h i p sb e t w e e nt h er e s p o n s eb e h a v i o ro ft h et e s t e do nt h et e s ti t e ma n d t h el a t e n tt r a i to f t h et e s t e di nt h et e s t c o m p a r i n gt ot h ec t t ,t h ei t e mr e s p o n s et h e o r yh a so b v i o u sa d v a n t a g e s t h ei t e m p a r a m e t e ri tu s e d ( s u c ha sd i f f i c u l t y ,d i s t i n c t i o nl e v e la n dg u e s s i n gi n d e x ) i sak i n do fi n d e x w h i c hn o ta f f e c t e db ys a m p l e s a c c e s st ot h e s ep a r a m e t e r sw i l ln o tc h a n g e 、析t l lt h ec h a n g eo f t h ev a r y i n gs a m p l e st e s t e d m e a n w h i l e ,t h ee s t i m a t i o no ft h ec a p a b i l i t yo ft h et e s t e dw i l ln o t c h a n g ew i t ht h ec h a n g eo fd i f f e r e n te x a mq u e s t i o n s d u et ot h o s em e n t i o n e da d v a n t a g e so f i t e mr e s p o n s et h e o r y ( i r t ) ,i th a sb e e nw i d e l yu s e di nt h ep s y c h o l o g ya n dt e s t s ,e s p e c i a l l y t h ea p p l i c a t i o no fe x t e n s i v em u l t i l e v e ls c o r em o d e li nt h ep r o f i c i e n c yt e s ts c o r em o d e l t h i s t h e s i sw i l le x p l o r et h ea p p l i c a t i o no fm u l t i - l e v e ls c o r em o d e lu n d e rt h ef r a m e w o r ko fi r tt o p r o v i d et h er e f e r e n c em a t e r i a l sf o r t h ea s s e s s m e n tq u a l i t yo ft e s tq u e s t i o n sa n dt h eb u i l d i n go f t e s tq u e s t i o n s 、b a n k k e yw o r d s :i t e mr e s p o n s et h e o r y ;b i n a r ys c o r em o d e l ;m u l t i l e v e ls c o r i n gi t e m ;p a r a m e t e r e s t i m a t i o n i i 独创性声明 本人郑重声明:所提交的学位论文是本人在导师指导下独 立进行研究工作所取得的成果。据我所知,除了特别加以标 注和致谢的地方外,论文中不包含其他人已经发表或撰写过 的研究成果。对本人的研究做出重要贡献的个人和集体,均 已在文中作了明确的说明。本声明的法律结果由本人承担。 学位论文作者签名: 学位论文使用授权书 本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即: 东北师范大学有权保留并向国家有关部门或机构送交学位论文的复印件和电子 版,允许论文被查阅和借阅。本人授权东北师范大学可以将学位论文的全部或部 分内容编入有关数据库进行检索,可以采用影印、缩印或其它复制手段保存、汇 编本学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名: 乏缝 指导教师签名: 储签器荨1 y 签巍同 飙辨7 ) 日 期 学位论文作者毕业后去向: 电话: 邮编: 0 4 3 1 - 8 6 1 6 8 7 4 4 1 3 0 0 3 2 牲 东北师范大学硕士学位论文 引言 考试在教学中起着“指挥棒”的作用,科学化的考试对学生的发展有许多积极作用, 如何客观、科学地反映和评价每一位学生的专业理论水平和实际应用能力,定量化比较 不同学校、不同老师、不同教学模式的教学质量和效果,充分发挥考试对改进教学的反 馈功能以及考试对教学的“指挥棒”作用,是我国高等教育必须解决的一个重要课题。 【2 】 当前,考试的指导理论主要有两种:( 1 ) 以真分数理论为代表的经典测试理论( c c t ) , ( 2 ) 项目反应理论( i r t ) 。经过了近百年的发展,经典测试理论建立了一系列题目分 析的公式,如表示难度的p 值,表示区分度的题目与测试相关系数,估计分数真值的标 准误差及由此推算出来的信度公式等。经典测试理论对建立试卷、考分转换与等值等均 有一套较为完整的方法。但此理论仍有不够完善的地方:考生分数和题目难度有着密切 关系,即题目难度是相对于考生而言的。如何使得题目参数稳定,不受受测样本影响, 项目反应理论正是在这种背景下出现的。项目反应理论是以受测者的回答问题的情况, 题目特征函数的运算,推测受测者的能力。项目反应理论建立了深刻地、综合地反映 考生作答反应与题目质量及能力水平间关系的非线性模型,估计出的能力水平不依赖于 特定的施测题目样本,而且能明确算出信息量即测量精度。 i r t 的模型不下2 0 余种,本文讨论在i r t 框架下的多级评分模型的应用,旨在为试 题质量评估和试题库建设提供参考资料。 东北师范大学硕士学位论文 一、ir t 简介 ( 一) lr t 产生的历史背景 项目反应理论的产生是以经典测验理论为前提的。2 0 世纪以来,c t t 一直是教育、 心理测量工作的基础。该理论也被称为真分数理论( t r u es c o r et h e o r y ) ,它的基本思 想是:每个个体都有某些无法直接观察的被称为“真分数 ( t ) 的心理变量。其数学模 型可表示为: 观察分数= 真分数+ 误差,即 x = t + e ( 1 ) 显然,这是一个线性模型,表示在观察分数和真分数之间存在着线性关系。( 1 ) 式 就是c t t 中信度( r e l i a b i l i t y ) 的基本定义。在这里,c t t 假定误差与真分数是相互独立 的。基本定义表明,信度为真分数变差与实得分数变差之比。但在实际的心理、教育测 量中,真分数、真变差是不可能直接测量到的。著名心理学家陈立先生也指出,i r t 注 意到c t t ,如斯皮尔曼没有认识到真分数与随机变误有关阳1 。这样,对信度就常用 儿= = l s e x 2 s t 2 ( 2 ) 来估计。即用误差变差对信度作估计。因此,( 2 ) 式提供了对测验信度作估计的基础。 在对c t t 的实际应用中,通常是根据实际测验结果估计信度。常用的方法有三种: 稳定系数、等值系数和内在一致性系数。这三种方法都应用了平行测验的思想,即假设 有两个或两部分难度、鉴别力相同的测验,它们所测定的是同一心理特征,也是“平行 的,以这两个平行测验之间的相关来说明某个测验的可靠程度。根据求得的信度,即可 对测验标准误差作估计,即 s e 。= s t 再瓦。 ( 3 ) 在c t t 中,信度、测量标准误的概念几十年来一直被运用着,几乎每一编制良好的 测验都应有效度指标。估计信度的一些重要公式,如斯皮尔曼一布朗公式、测量标准误 公式、库德一理查逊公式及库理2 0 号公式等颇为著名,已为教育、心理测量工作者们 所熟悉。但是,随着科学的发展,c t t 虽然有了较长的历史并得到许多公认的成果,但 人们也开始对c t t 中的信度这一“基石 提出疑问。 因为,c t t 其中的一个缺点就是和它的一个基本概念信度密切相关的。前已提 及,信度的概念是根据平行测验而定义的,由于完全平行的测验实际上是很难实现的, 即使是用同一组测验项目对同一组考生施测,也不可能达到完全平行的程度。而c t t 是 在平行测验的假设下估计测验的信度和测量标准误,以及达到预期信度所需的测验长 度。由于平行测验的假设在实际中不可能实现,所以,由此而进行的各种估计就不会非 2 东北师范大学硕士学位论文 常精确。另外,信度系数的计算涉及到测验总分的变异性,而这种变异性又和考生的能 力的异质性程度有关,即信度是和考生样组有关的,同一个测验施测于不同的考生组时, 它的信度是变化的。总之,笔者认为,c t t 的缺点涉及到理论中的各个基本概念之间的 相互依赖、相互制约。测量专家们认为,c t t 中最基本的四个概念是项目难度、项目区 分度、信度和正确应答测验分数。项目难度和项目区分度、信度都依赖于考生组的能力 水平分布,即正确应答测验分数,而考生的正确应答测验分数又依赖于项目的难度。显 而易见,这种基本概念间的相互依赖、互为前提,就不可避免地为该理论带来许多难以 克服的技术问题。 在教育统计文献中,可以找到经典测验模型及其测量方法的许多已经得到完全证实 的缺点。如:( 1 ) 无法根据受测者的水平进行动态测试。( 2 ) 测试的有效程度太低。( 3 ) 题目参数严重依赖样本,并且无法建立得分与题目参数之间的函数关系。项目反应理论 是针对经典测量理论的不足而提出来的,其理论基础是潜在特质理论。项目反应理论建 立了深刻地、综合地反映考生作答反应与题目质量及能力水平间关系的非线性模型,估 计出的能力水平不依赖于特定的施测题目样本,而且能明确算出信息量即测量精度。与 经典测试理论相比,它有以下优点h 1 :( 1 ) 试题参数估计更准确;( 2 ) 定义了信息函数, 根据信息函数来选择测试的试题,使得挑选试题更为科学、合理:( 3 ) 试题参数的估计 独立于被测试样本;( 4 ) 能力参数的估计也独立于试题样本;( 5 ) 可以在得分与题目参 数之间建立函数关系,适合编制自适应考试系统。i r t 的诞生,改变了人们编制测验的 思路和指导原则,改变了测验呈现和记分的方式,也改变了对测验分数的处理方法。 ( 二) ir t 的发展史 项目反应理论的基本思想起源于上世纪3 0 年代末和4 0 年代初,在本文中,有必要 提及几个有代表性的人物。理查森于1 9 3 6 年首次提出了i r t 的参数估计方法;劳勒于 1 9 4 4 年提出了一系列关于i r t 领域中基本的理论问题,推出了几种很有价值的参数估计 方法;格特曼于1 9 4 4 年提出了“无误差模型 ( 一种确定性模型,即理想量表项目) , 是以后i r t 中项目特征曲线的雏形。1 9 4 6 年,塔克( t u k e r ) 正式提出“项目特性曲线 概念。所谓项目特性曲线,就是表征被试的能力或特质水平与其对一个测验项目的正确 反应概率之间关系的二维曲线图。不同的项目特性曲线假设对应着不同项目反应模型, 目前应用最广的项目反应模型是二级评分的单维非线性模型,以伯恩鲍姆提出的逻辑斯 蒂模型为代表,连续型模型与多维模型比较复杂,都还处于理论研究阶段。 1 9 5 2 年,美国心理和教育测量学家洛德提出的著名的正态卵形模型,其项目反应函 数是j 下态卵形函数,其表达式为: a ( o - b ) 1一三,2 p ( 口) = c - i - ( 1 一c ) i p 2 d t( 4 ) 二q 2 死 1 9 5 7 年,伯恩鲍姆提出了逻辑斯蒂模型( l o g i s t i c 模型) 。他所假定的项目特性曲 线描述的是各种特质水平的被试( 一般用0 表示) ,对某一测验项目的正确反应概率( 一 3 东北师范大学硕士学位论文 般用p ( 0 ) 表示) 。一定能力或特质水平的被试对某一测验项目的正确反应概率只与该项 目的质量有关。被试的答对概率与其物质水平之间的关系是非线性的,即当物质水平0 大或小到一定的程度以后,答对概率p ( 0 ) 随之变大或变小的速度显著变小。研究表明, 这种曲线的形状,是一条以其拐点为对称中心的s 形曲线。 实际上,洛德提出的正态卵形函数与逻辑斯蒂函数相比,在计算结果上并无大的区 别,所绘制的曲线也大体相同,然而,在实际中大多采用后者。其中主要有以下两个方 面的原因:首先是它形式上的简洁,更具数学模型的特点;其次是它便于用对数关系作 处理,因而模型的项目质量参数和能力参数估计起来较为方便。 4 东北师范大学硕士学位论文 二、ir t 二值评分模型 项目反应理论的基础模型主要有j 下态肩形曲线模型( n o r m a l0 9 i v em o d e l ) 、逻辑 斯蒂克模型( l o g i s t i cm o d e l ) 。 ( - - ) 正态肩形曲线模型啼1 第一个项目反应理论模型是洛德在1 9 5 2 年出于理论研究的需要而提出的双参数正 态肩形曲线模型( t w o p a r a m e t e rn o r m a lo g i v em o d e l ) 。由于s 形项目特征曲线形同 于一累积分布函数且是中心对称的,自然假设曲线可用正态分布函数的形式来描绘它。 洛德给出的模型表达式为: 纵g ) = a i ( q - b ,) 古专如 ( 5 ) 其中g 是能力参数,其取值是正负无穷的,q 是第i 个项目的区分度参数,包是第i - 个项目的难度参数,a ( g ) 表示能力为g 的被试在项目i 上正确作答的概率。这是个积分 形式的函数表达式。b ( g ) 盼取值在q = o o 时取0 ,在g = 帕时取1 。 ( 二) 逻辑斯蒂克模型 1 9 5 7 年至1 9 5 8 年,伯恩鲍姆( a b i r n b a u m ) 将洛德的双参数正态肩形曲线模型改 换成了双参数的逻辑斯蒂克模型( 2 p l m ) 。 p ( x ,f = 1ig ,口f ,6 f ) = 1 1 + p - 1 7 a i ( q l - b 1 ) 】 ( 6 ) 其中d = 1 7 ,q 、匆和g 的意义与正态肩形曲线模型中是完全一样的。 为了计量测量中低能力被试在多重选择题上对正确作答的猜测而出现的非o 现象, 伯恩鲍姆建议增加一个猜测概率参数c ,模型继而变为: p ( x ,f = llg ,a f ,b f ,c ) = ( 1 一c f ) 1 + p 一1 7a l ( q j - b t ) 】 ( 7 ) 这就是三参数逻辑斯蒂克模型( 3 p l m ) 。当猜测系数c = 0 时,该模型为双参数 l o g i s t i c 模型( 2 p l m ) ;当猜测系数q = 0 且区分度q = 1 时,该模型为单参数l o g i s t i c 模型( 1 p l m ) ,又称为r a s c h 模型。 东北师范大学硕士学位论文 三、ir t 多级评分模型 早期的项目反应模型都用于二值评分项目,到7 0 年代,计算机技术和软件的发展 使得处理l ,0 数据的单维i r t 模型成为可能。但是对于多值评分项目,研究者在参数 估计,模型一资料拟合检验等方面受到巨大的压力。这种状况到8 0 年代才有了好转。 现在已建起了许多用于多值评分项目的单维项目反应模型。用于多值数据的主要代表模 型有塞姆吉玛的等级反应模型( g r a d e dr e s p o n s em o d e l ) ,马斯特斯的分部评分模型 ( p a r t i a lc r e d i tm o d e l ) 以及莫雷卡的拓广的分部评分模型( g e n e r a l i z e dp a r t i a l c r e d j tm o d e l ) 。 ( - - ) 等级反应模型( g r a d e dr e s p o n s em o d e i ,g m r ) 叫 1 9 6 9 年,塞姆吉玛首先给出了用于有序多值评分项目的i r t 模型等级反应模型 “1 。它破了过去项目反应模型只能用于二值评分项目的限制,为建立多值评分的项目反 应模型开了一个先例。其原理是: 假设项目的满分值为乃( 乃1 ) ,项目可评为乃+ 1 个分值,即o ,1 ,乃。用西表 示能力值为吼的被试在第题上得分不低于f 分的概率,于是瓦。= l ,赢“= o ,即得 0 分以上的概率是1 、得乃+ 1 分以上的概率是0 。用表示该被试在第题上恰得,分 的概率,则 p 叫= p :,一p :,( f = 0 ,1 ,厂j ) ( 8 ) 假设选两参数的逻辑斯蒂克模型,则 p :j ,= 1 + e x p 一d 口( g 。一bj ,) 】 一1 ,( r = 0 ,1 ,) ( 9 ) 其中,d = 1 7 ,口,为第,题的区分度,6 f l 是在第歹题上的得f 分以上的难度值,在 塞姆吉玛的等级反应模型中,一个项目各个等级上的难度是严格单调递增的,如在第 题上各难度等级是单调递增的,即b 一 b j 2 - g - 4 b 夕。 ( 二) 分部评分模型( p a r tiaic r e ditm o d el ,p c m ) 嘲 分布评分模型是所有有序多值评分项目模型中最简单的,它仅含有两组参数,一组 是被试能力参数,一组是项目难度参数。分部评分模型由马斯特斯于1 9 8 2 年提出,是 6 东北师范大学硕士学位论文 拉希二值评分项目模型的一种直接应用。其原理是:对某多级评分试题,做出完全正确 的反应需要经过若干步骤,步骤之间具有某种次序,被试不可能略去某一中间步骤对下 一步作答,而且各步骤的难度又不一定是逐步递增的,这是分部评分模型与等级反应模 型的一个重大不同。此时模型描述为: t k = e x p ( 一吆) 】e x p 【( g 口一) 】t = o 1 ,乃 ( 1 0 ) 其中乃是试题_ ,的满分值,f 是被试在此项目上的得分,为第,题上已完成了x - 1 步后欲完成第x 步的难度。( g ) 表示具有能力q 的被试口在项目,上得r 分的概率。 ( 三) 拓广的分部评分模型( g e n e r ai z e dp a r tia lc r e ditm o d ei ,g p c m ) 马斯特斯的分部评分模型假设所有项目的区分度参数相等,因此在模型中只有项目 难度参数,被认定为拉希族模型。1 9 9 2 年莫雷卡在分部评分模型基础上通过取消项目区 分度一致性的假设而推演出一个更具普遍性的模型,即拓广的分部评分模型,其公式表 示为: p 胁( g ) :ex p hd 口,( g b i h ) 】窆exp 窆d 口。( g b j h ) 】 ( 1 1 ) 其中d 是量表因子取1 7 ,a i 是斜率参数,屯是项目类型界阀参数。斜率参数q 表 示在该项目中,当能力g 水平改变时类型反应变化的程度。p r o ( q ) 按习惯称为项目的类 型反应函数。 7 东北师范大学硕士学位论文 四、参数估计的实现 项目反应理论的实际应用,首先需要解决参数估计问题,“实施项目反应理论依赖 于对项目参数和被试能力估计的统计技术 ,但与二级评分模型相比,由于在多级评分 模型中,每一个项目的每一等级有对应其难度和区分度,这就使其参数估计十分复杂, 从而加大了估计的难度,因此一直未能得到很好的应用。本文将通过对被试的分组,克 服参数估计的难度,对这一问题进行初步的探讨。 假设在一次测试中有n 个项目,试卷总分为l 分,有n 个被试参加测试,其卷面总 分为厶,三2 ,ol 矽5 三,版7 = 1 俐,设总分为三,的被试的能力为p ,这里假设总 分相同的被试的能力相同,显然这种假设具有合理性7 。 , 一“ 设总分为三,的被试的能力为秒,= 兰兰, 。 仃工 其中。,和仃,分别是总分的均值和方差。 若n 个被试共有g ( g m ) 种得分,则被试按能力可分成g 组,秒。是每一个能力区。 g 间g 的中点,g = 1 ,2 ,g ,设每一组被试的数目分别为f i ,f z ,f 6 ,则= n 。 g = l 假设每一个项目有m 种反应类型,那么每组中选择每一个类型的人数依次为 “r 2 ,r k ,r _ ,而且= 。 k = l 其中选择反应类型为k 的频数为仇= 手,p t = 1 。 , m ,g k = l 能力为巳的被试对k 类反应做出正确反应的概率为 忍魄) = e 戗) ,且兰最仅) :i 。 k = l 因此,已妓) :l 一芝只魄) 。 k = l 令r 是一个g xn 的矩阵 8 o 七p 州料 一 = 埘p 此因 东北师范大学硕士学位论文 r = k ) g 。 若能力为吃的被试答对k 类级别以上的概率为 只幸魄) 2 两评碉1 。 其中a k ,b 。分别为区分度和难度 令吼魄一b k ) = 彘+ 以以。 假定a l = a 2 = = 口。= a ,即m 个等级的区分度相同,则有: p + 脚魄) = o p + 川仅) = o + 己魄) p m - 2 魄) = 己一。魄) + 匕魄) 埘 巧( 唿) = e ( 以) r = k + 1 只( 吃) = 最( 唿) k = 2 巧( 唿) = 1 对应地,有: 乞( 吃) = c 一。( 以) 一巧( 吃) 巴q ( 吃) = 焉一:( 色) 一z 一。( 唿) 只( 哝) = t 。( 吃) 一耳( 巳) # ( 巳) = 露( 以) 一只( 吱) 令最( 色) = 最,巧( 吃) = 巧,则有 七一1露 1 + p 一口( 口一以一1 )1 + e - a ( 口一) 其中最为对第k 个等级作出正确反应的概率 9 东北师范大学硕士学位论文 似然函数为: p ( r a , 反,铭) 2 耳g 考与2 置1 磴跆钟 厂f 对数似然为: gm 三= l o g p ( r o e ,反,移) = c + l o g p k 则r kl o g p k 七芝l g = lk = l = 1l o g ( 1 一蜀) + 吃l o g ( p 1 一g ) + + 厶一1l o g ( p ;_ 2 一只二) + r kl o g ( p k _ t 一巧) + r k + ll o g ( p k 一只:1 ) + + l o g ( e 一1 ) 似然方程为ja o 六l 0 f : l 丝:0 由于最一。= 哎:一哎。,最= 哎。一露,只+ 。= 露一哎。,最+ := 哎。一哎:, 则砑a l ,盖仅与磊书氕,彘+ 。有关 即有塑:o ! 一= i - 一 8 考k 考k n j a 专k 专 所以二阶导数阵包括: 二阶导数筹,等, 二阶混合导数 = 0 。 瓣a 2 l ,器及器a 考k 8 考k “j8 考k 8 考k d 6 考k a 九 而珞= 仇r k + l = p 州 则 1 0 a 2 a 考: a 2 l g = l a 彘a 磊一l g = l + 东北师范大学硕士学位论文 疋p m 最+ 1 ) ( 一巧) ( 巧 ( 牟晓) ( 砭。研一。) 害 :兰争( 耳研) ( 哎。 坛a 磊+ 。身砭。一“一“ 丽8 2 l = 蚤白m ,g 百万a 2 p t 一薹善乓每【_ 品= 一薹陪p k + l e ki 矗+ ;g 取期望得: 令巧反= 哌,则 。r ,a 2 三、 气万j g :一y 厶 g = l昭陪甘懈 令尸秒= 哌孔小 1 9 t + 1 , 嘞+ c 等一等删,2 2 露或+ 。一。】 巧识障( 一职峨巩) 一嚣( 露。+ 棚 g g = l ( 爿k + l 砘州。 + l l l = 七州。 j 可筹 = 一;g 荟m 嘛一畦 a 2 l a 考k 8 九 1 - 争厂彬pi 丝= ! 二丝 j - g = l 正哌哝l 竽kl 1 n e w t o n r a p h s o n 迭代公式为 卣 参 厶一。 五 + l j f i k = 一考k 九 磊 磊 磊一。 a a 1 2 0 a l 五 2 2a 2 3 人 a 2 2a 3 3 , 1 1 m 。 丝露 6 l、, “、,岛一始 e 令 e n 殂 m 人 八;人 。l + 东北师范大学硕士学位论文 五、实例 采用精心编制的小学生学业成就测试数学测试卷,对内蒙古、云南、浙江、甘 肃、河北、河南六个省5 8 所学校2 1 3 9 人进行了测试,并用以上方法对测试结果进行了 分析。 ( 一) 测试卷介绍 本测试卷的目标是检验六年级( 即小学毕业班) 结束时达到数学课程标准规定目标 的实际状况,测试的内容以数学课程标准为依据,兼顾人教版、北师大版、苏教版等版 本教材的具体内容安排。 测试时间为5 0 分钟,农村学校可以为6 0 分钟。 本测试卷由第一题4 道选择题、第二题6 道填空题、第三题1 0 道解答题共计2 0 道 题目构成。 知识、技能的考察级别依次是:了解( 认识) 、理解( 会) 、掌握( 将其与“灵活运 用 合并为一个级别) ,共三个级别。 过程性目标( 含活动经验等) 的考察级别依次是:经历( 感受) 、体验( 体会) 、探 索,共三个级别。 能力水平区分为四个级别:了解,理解( 会,能) ,掌握( 探索) ,非常规运用( 内 容迁移,体会) 。 全卷估计难度系数:第一题难度估计为0 8 2 5 ,第二题为o 8 ,第三题为o 7 7 ,全 卷综合难度系数估计为0 7 8 6 。 ( 二) 部分测试题 1 铺地毯问题 为了迎接一年级的新同学,学校要在大厅的平台与台阶上,从上到下铺一条长地毯, ( 楼梯侧面如下图所示) j 采 1 2 东北师范大学硕士学位论文 ( 1 ) 至少需要多长的地毯? ( 2 ) 如果想选一块长方形的地毯,台阶的宽是2 米,这块地毯的面积至少是多少 平方米? 知识点:理解周长的概念;掌握长方形的概念 能力水平:能计算长方形的面积;会解决非常规问题( 达到非常规运用水平) 估计难度系数:0 8 5 2 “热水器里的水 的变化问题 2 晚饭后,爸爸去洗澡,热水器里装有3 0 0 升水,他洗了1 4 分钟,用了3 的水,然 后停止洗澡。7 分钟后,小明去洗澡,他洗了7 分钟,把热水器内的水用完。 ( 1 ) 爸爸洗澡用了多少升的水? ( 2 ) 下面哪幅图描述了热水器内水的体积随时间变化的情况? 墓村升 卜 t l 弋 鲁a v 4 并- 弋 弋 蔫木,开 蔓 i i i c 知识点:理解分数的概念;掌握j 下比例关系 能力水平:能探索具有正比例关系的量;会解决非常规问题( 达到非常规运用水平) 估计难度系数:0 7 5 3 “设计编号”问题 育红小学有6 个年级;每个年级是有3 个班;每个班运动员人数在2 0 , - - - 3 0 人之间。 ( 1 ) 请你根据以上信息为本校学生运动员设计一套编码。要求体现出学生所在年 级、班级、在本班编号、性别。请写出编码方案,即编码共几位? 每一位所代表的意义。 ( 2 ) 王小美是6 年1 班3 号运动员,按照你设计的方案,她的编码是什么? 知识点:综合运用代数知识寻找规律 能力水平:探索水平( 能利用编码表达给定问题中的规律) 估计难度系数:o 8 1 3 东北师范大学硕士学位论文 4 包装问题 手帕纸生产厂家要把4 包手帕纸包成一个促销包。 甸m 刁刁刁 ( 1 ) 你能想出几种包装方法? 请你画在下面。 ( 2 ) 张阿姨想知道下图所示的两种方法包装四包手帕纸,哪种包装方法更省纸? 能用数据说明你的理由吗? a b ( 3 ) 不需要计算你就能知道哪种包装方案节约包装纸吗? 知识点:长方体的表面积、体积 能力水平:能进行长方体体积计算;会解决非常规问题( 达到非常规运用水平) 估计难度系数:0 7 5 跑道中的数学问题 下图是一个运动场,跑道是由一段直道和一个半圆形弯道组成的。 ( 1 ) 学校要在这个运动场的里面铺上草坪,铺草坪的面积是多少平方米? ( 2 ) 李强沿着这个运动场的四周跑一圈,一共跑了多少米? ( 3 ) 体育老师要画2 0 0 米跑道,最内圈半圆形的半径是2 8 8 米,每条跑道宽1 2 1 4 东北师范大学硕士学位论文 米,如果第一跑道( 最内圈) 的起跑线已经画好,问第二、三跑道的起跑线比第一跑道 各应提前多少米? ( 4 ) 下面的表格给出了这次运动会上女子2 0 0 米和4 0 0 米决赛的部分成绩。 2 0 0 米4 0 0 米 李新3 1 8 1 秒赵郁馨 6 8 8 3 秒 王娜3 2 0 2 秒谢婷6 9 0 5 秒 张天一3 2 0 9 秒姚石6 9 6 4 秒 下图展示了其中一种比赛所进行的冲刺阶段的画面。请判断这是女子2 0 0 米比赛还 是女子4 0 0 米比赛? 知识点:掌握周长的概念;掌握圆的周长、长方形的周长计算方法 能力水平:掌握简单图形的周长计算 估计难度系数:0 8 6 营养配餐问题 福童赍黪等 移l 馑 g 鑫鳓审各罾蓐靛铲的套静 恕 禽场袁豫簧幻礓纭黪i 暖零泡务黪 ,一,。 1 2 多友嚣张允事。一磁 牛餮走均嚣嬖蛋白爆瓤免。 籀纺2 3 免。碳职纯备物l2 0 免以厦维生袁等簧缎谚镎。 东东要了这样一份饭菜:2 0 0 克牛肉、5 0 克青菜、5 0 克米饭 1 5 ;7:3一us舢蚍眨奠n溉强 0 摊鼻m 4 7 : m曼o”h疆:n l , ,一 - 。 7 s j 娜船,瓯l m 口 。 翘舄丧爱品奄泛舞姆 始。 誓麓 争晦曼呜囊麓长雾老 东北师范大学硕士学位论文 ( 1 ) 如果你是一名营养师,请你计算一下小明午餐中的营养成分吧。 ( 2 ) 东东这顿午饭选择得好不好? 请说明理由。 ( 3 ) 东东的午餐中,哪种营养成分基本符合营养师的建议? 哪种营养成分与营养 师的建议有较大的出入? 你能给东东提一些建议吗? 知识点:四则混合运算 能力水平:探索综合问题中的有关量之间的关系;综合运用有关知识解决问题 估计难度系数:o 7 ( 三) 分析结果 表一:部分学生能力参数估计 s u b j e c ti d e n t i f i c a t i o nw e i g h t f r e q u e n c y s c o r en a 炮 g r 伽pw e i g h tm e a nc a t e g o r ya t t e m p t sa b i l i t ys e 0 0 0 2 1j u n i o r j1 2g r o u p0 1 1 o o1 2 0 1 0 0 1 0 0一1 0 8 4 70 5 5 8 3 0 0 0 4 1 j u n i o r _ s 1 4g r o u p0 1 1 0 01 1 0 1 0 0 1 0 01 9 7 4 00 6 5 9 6 0 0 0 6 1j u n i o r _ sl 6g r o u p0 1 1 o o1 1 0 1 0 0 1 0 0 一2 1 1 5 50 6 4 5 5 1 6 东北师范大学硕士学位论文 0 0 0 8 i j u n i o r _ _ s 1 8g r o u po l 1 0 01 2 0 1 0 0 1 o o一1 8 5 6 80 6 3 4 5 0 0 1 0 i j u n i o r _ s l 1 0g r o u po l 1 0 01 2 5 1 o o 1 0 0一1 0 9 1 00 5 6 1 5 0 0 1 2 i j u n i o l u 1 1 2g r o u po l 1 0 01 2 5 1 0 0 1 0 01 4 9 1 20 5 8 6 9 0 0 1 5 ij u n i o l ul 1 5g r o u po l 1 o o1 2 5 1 0 0 1 0 01 4 1 6 40 5 9 7 5 0 0 1 7 ij u n i o r _ s1 1 7 g r o u po l i 0 01 3 5 1 o o 1 o o一0 6 6 3 90 5 3 0 7 0 0 1 9 ij u n i o i ul 1 9g r o u p0 l 1 0 01 2 5 1 o o 1 0 01 4 9 1 20 5 8 6 9 0 0 2 02 0g r o u p0 11 0 0 1 7 东北师范大学硕士学位论文 i j u n i o r _ s 1 l i t e mb l o c k1m c o i s c o r i n gf u n c t i o n: s t e pp a 尉w t e r: s e : g u e s s i n gp a r a m e t e ri s i t e mb l o c k2m c 0 2 s c o r i n gf u n c t i o n: s t e pp a 鼬蛳t e r: s e : g u e s s i n gp a r a m e t e ri s i t e mb l o c k3m c 0 3 s c o r i n gf u n c t i o n: s t e pp a r a m t e r: s e : g u e s s i n gh 删e t e ri s i t e mb l o c k4m c 0 4 s c o r i n gf u n c t l 0 n: s t e pp a i 蝴e r : s e : g u e s s i n gp a r a m e t e ri s i t e mb l o c k5m c 0 5 1 0 01 3 01 o o1 2 1 6 2 0 5 7 6 0 表二:题目参数估计 1 0 0 02 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 e s t i m a t e df o rc a t e ( 幻r y2 1 0 0 02 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 e s t i 姒t e df o rc a t e ( 沁r y2 1 0 0 02 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 e s t im _ a t e df o rc a t e ( 幻r y2 1 0 0 02 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 e s t i m a t e df o rc a t e g o r y2 s c o r i n gf u n c t i o n:i 0 0 02 0 0 0 s t e pp a 尉蜘t e r:0 0 0 00 0 0 0 s e :0 0 0 00 0 0 0 g u e s s i n gp a r a m e t e ri se s t i m a t e df o rc a t e g o r y2 i t 酬b l o c k6m c 0 6 s c o r i n gf u n c t i o n s t e p p a r a m t e r s e 1 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 0 1 8 东北师范大学硕士学位论文 g u e s s i n gp a r a m e t e ri se s t i m a t e df o rc a t e ( 抑r y2 i t e mb l o c k7m c 0 7 s c o r i n gf u n c t l 0 n:1 0 0 02 0 0 0 s t e pp a r a m t e r :0 0 0 00 0 0 0 s e :0 0 0 00 0 0 0 g u e s s i n gp a r a m e t e ri se s t i m a t e df o rc a t e ( 幻r y2 i t e mb l o c k8m c 0 8 s c o r i n gf u n c t i o n:1 0 0 02 0 0 0 s t e pp a 尉瑚t e r :0 0 0 0 0 0 0 0 s e :0 0 0 00 0 0 0 g u e s s i n gp a r a m e t e ri se s t i m a t e df o rc a t e g o r y2 i t e mb l o c k9o e 0 9 s c o r i n gf u n c t i o n: s t e pp m 认m t e r: s e : i t e mb l o c k1 0o e i o s c o r i n gf u n c t l 0 n: s t e pp a r a m t e r: s e : i t e mb l o c k1 1o e l l s c o r i n gf u n c t i o n: s t e pp 舢己a m t e r : s e : i t e mb l o c k1 2o e l 2 s c o r i n gf 【j n c t l 0 n: s t e pp 删t e r: s e : i t e mb l o c k1 3o e l 3 s c o r i n gf u n c t i o n s t e pn 删t e r 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 2 0 0 0 0 1 5 6 0 0 5 6 2 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 - 1 6 1 6 0 1 1 1 2 0 0 0 0 6 8 5 0 0 4 9 2 0 0 0 - 0 5 3 2 1 9 3 0 0 0 - 0 1 5 6 o 0 5 1 3 0 0 0 1 6 1 6 0 1 3 2 3 0 0 0 - 0 6 8 5 0 0 4 5 3 0 0 0 0 5 3 2 东北师范大学硕士学位论文 s e :0 0 0 00 0 7 60 1 0 8 i t e mb l o c k1 4o e l 4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论