(应用数学专业论文)网络试题库系统成卷理论的研究及成卷质量的评价.pdf_第1页
(应用数学专业论文)网络试题库系统成卷理论的研究及成卷质量的评价.pdf_第2页
(应用数学专业论文)网络试题库系统成卷理论的研究及成卷质量的评价.pdf_第3页
(应用数学专业论文)网络试题库系统成卷理论的研究及成卷质量的评价.pdf_第4页
(应用数学专业论文)网络试题库系统成卷理论的研究及成卷质量的评价.pdf_第5页
已阅读5页,还剩63页未读 继续免费阅读

(应用数学专业论文)网络试题库系统成卷理论的研究及成卷质量的评价.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 瓣代凌不叛发震,教鸯搴建,这瑗关乎人类鑫身素溪发震躲攀业,毽焱以蚕 种不同的方式不断漾勃发展。顺应世界范围内信息技术的高速发展,利用计算机 辅助教学越来越显示出其优越性。无论在国内绒者国外,有智能成卷功能的试题 霹系统是警今计算税辅囊教举应露的热门研究话题。焉嚣随着网络技术静不辑发 展,试题库系统也必将朝着网络化方向发展。 本文怒对网络试题瘁系绞的成卷壤论及成渗覆量进幸亍磺究,莠且把磺突藏果 应用到国家高等教育出版社资助项目“大学数学系列网络试题库系统”的改进和 完善中。 本文瓣该网络试题瘁系绫在痰卷瓒论纛残豢算法上存在夔不怒送行了论透, 指出成卷理论对于试题库系统质量的煎要性和现阶段对成卷理论研究的相对缺乏 以及对成卷算法进行改进的必要。 本文的主要工作是对残卷理论中缀箕重要懿难度分奄益线的研究以及辩成卷 质量的评价。首先,在研究难度分布曲线中,建立了学嫩成绩分布模型,研究发 瑷学生成续戆分毒其实著不严格爨从转统“豢摸”理论中豹歪态分蠢,嚣鼹度分 布曲线的确定却与学生成绩分布模型肖着极其密切的关系,因此由此确定的难度 分布曲线商着坚实的理论基础。其次,首次引入满意度的概念,狡试卷的难度、 内容、每越辩瀛、遴型、平秘分寇不及格率等方嚣建立满意度疆栎,蠹诧建立了 评价成卷质量总满意度的满意度模型。并用此模型比较了旧的成褥算法的成卷结 果与毅成卷算法的成卷结果,发现经改进后的毅簿法在惑满意度上有很大的提离。 辩次,对内容覆盖程度进行偏差值眈较,发现新算法的程内容覆盏方面也憝优于 原算法的。最后,通过对用改进后的成卷算法所成的试辫进行学生实测,对试题 瀵疫、试憨区分凌、试卷售凌耪试卷效疫疆令臻标遗行绞诗分褥,结莱表鹗成卷 结果是令人满意的。 荚键词试题库系统;数学模鳌;学生成绩分带模鍪:满意度;滚度;区分度; 信度;效魔 华南理工大学理学硕士学位论文 a b s t r a c t e d u c a t i o nt h a ti sap r o j e c tt h a tw i l le f f e c tt h ed e v e l o p m e n to fh u m a n b e i n g ,i s d e v e l o p i n gi nm a n yw a y s w i t ht h ea g e sp r o g r e s s c o m p u t e ra i de d u c a t i o ni sm o r e a n dm o r e s h o wi t sa d v a n t a g ei nt h ei n f o r m a t i o nw o r l da st h ei tt e c h n o l o g yi s d e v e l o p i n g 。w h a t e v e r i nd o m e s t i ca n do v e r s e a s ,t e s tq u e s t i o nb a s es y s t e mw i t ht h e i n t e l l i g e n te x a mp a p e rc o n s t r u c t i o ni st h eh e a tt o p i ci nt h ef i e l do fc o m p u t e r a i d e d u c a t i o n m o r e o v e r , a st h en e t w o r kt e c h n o l o g yi sa d v a n c i n g ,t h et e s tq u e s t i o nb a s e s y s t e m w i l lb ea p p l i e di nt h en e t w o r k t h em a i nw o r ko ft h i sp a p e rf o c u s e si nt h et h e o r yo f p a p e r c o n s t r u c t i o na n d p a p e r sq u a l i t y , a n da p p l yt h ef r u i to f t h es t u d yi nt h ei m p r o v e m e n ta n d p e r f e c t i o no f t h en e t w o r kt e s tq u e s t i o ns y s t e mo f c o l l e g em a t h e m a t i c s ,w h i c hi ss p o n s o r e db yt h e n a t i o nh i g h e re d u c a t i o np r e s s i nt h i sp a p e r ,t h ed e f i c i e n c yo ft h e t h e o r ya n d t h ea l g o r i t h mo f p a p e r c o n s t r u c t i o n o ft h eo l ds y s t e ma r ed i s c u s s e d t h er e s u l tf i g u r eo u tt h a tt h et h e o r yi si m p o r t a n tt o t h ei m p r o v et h ep a p e r q u a l i t y t h el a c k o fr e s e a r c ho f t h e o r yo fp a p e rc o n s t r u c t i o n w i l li m p a c tt h e p e r f e c t i o no f t h ep a p e rc o n s t r u c t i o ns y s t e m ,w h i c hw i l li n f l u e n c et h e a l g o r i t h mo fp a p e rc o n s t r u c t i o n s o ,t h ei m p o r t a n tw o r k i st od or e s e a r c hf o rt h e t h e o r yo fp a p e rc o n s t r u c t i o na n di m p r o v e t h e p a p e rq u a l i t y t h er e s e a r c hf o rd i f f i c u l t yd i s t r i b u t i o n ,w h i c hi si m p o r t a n tt ot h et h e o r yo f p a p e rc o n s t r u c t i o n ,a n df o r t h ee v a l u a t i o no f t h eq u a l i t yo fe x a m p a p e r i st h em a i n w o r ko ft h i sp a p e r t h ef i r s t ,i nt h er e s e a r c hf o rd i f f i c u l t yd i s t r i b u t i o n ,t h em o d e lo f e x a ms c o r ed i s t r i b u t i o ni se s t a b l i s h e d w ef i n dt h a tt h ee x a ms c o r ei sn o t s t r i c t l y c o m p l i e dw i t ht h en o r m a ld i s t r i b u t i o n ,w h i l et h ed i f f i c u l t yd i s t r i b u t i o ni sv e r yb a s e d o nt h ee x a ms c o r ed i s t r i b u t i o n ,s ot h ed i f f i c u l t yd i s t r i b u t i o nf r o mt h et h i sd i s t r i b u t i o n i ss e t u po nt h ef i r mt h e o r yb a s i s t h es e c o n d ,t h e d e g r e e o fs a t i s f a c t i o ni sf i r s t l y a p p l i e d i nt h er e s e a r c h t h ei n d e xi se s t a b l i s h e di nt e s td i f f i c u l t y ,t e s tc o n t e n t ,s p a n f o r q u e s t i o n ,q u e s t i o nt y p e ,a v e r a g es c o r eo f t e s ta n d p a s sr a t i o no ft e s t ,a n dt h em o d e l o f d e g r e e o fs a t i s f a c t i o nf o rt h ee v a l u a t i o no ft h eq u a l i t yo fe x a m p a p e r i ss e t u p t h i s m o d e li sa p p l i e di nc o m p a r i n gt h ep e r f o r m a n c eo ft h eo l d p a p e r c o n s t r u c t i o n a l g o r i t h m a n dn e w p a p e rc o n s t r u c t i o na l g o r i t h m ,a n dw eg e tt h ec o n c l u s i o nt h a tt h e n e w a l g o r i t h ma c h i e v e sm o r ei m p r o v e m e n ti nt h ed e g r e eo fs a t i s f a c t i o n 。t h et h i r d ,w e t h e t h i r d ,w ec o m p a r e dt h ed e g r e eo fc o n t e n tc o v e r a g eb e t w e e nt h eo l dp a p e r a b s t r a c t c o n s t r u c t i o na l g o r i t h ma n dn e wp a p e rc o n s t r u c t i o na l g o r i t h m ,a n df i n dt h en e wo n ei s b e t t e r t h el a s t ,w ei m p r o v et h ep a p e rc o n s t r u c t i o na l g o r i t h mw i t ht h en e w t h e o r y , a n d a p p l y t h ee x a m p a p e r si nt h ep r a c t i c a le x a m ,w h i c h a r ec o n s t r u c t e db yt h en e w a l g o r i t h m t h r o u g ht h ea n a l y s i so f t h ed a t ao ft h e s ep a p e r sq u e s t i o nd i f f i c u l t y , q u e s t i o nd i s t i n g u i s h ,p a p e r sa c c e p t a n c ea n dp a p e r se f f i c i e n c y , w eg e tt h ec o n c l u s i o n t h a tt h er e s u l to ft h en e w a l g o r i t h m i sv e r ys a t i s f a c t o r y k e y w o r d s t e s tq u e s t i o nb a s es y s t e m ;m a t h e m a t i c a lm o d e l ;e x a ms c o r e d i s t r i b u t i o nm o d e l ;d e g r e eo f s a t i s f a c t i o n ;d i f f i c u l t y ;d e g r e eo f d i s t i n g u i s h ;a c c e p t a n c e ;e f f i c i e n c y m 华南理工大学 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研 究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文 不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研 究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完 全意识到本声明的法律后果由本人承担。 作者签名:璇致 日期:枷弓年厂月,雪日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定, 同意学校保留并向国家有关部门或机构送交论文的复印件和电子版, 允许论文被查阅和借阅。本人授权华南理工大学可以将本学位论文的 全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫 描等复制手段保存和汇编本学位论文。 保密口,在年解密后适用本授权书。 本学位论文属于 不保批 ( 请在以上相应方框内打“4 ”) 作者签名:冰敦 导师签名:洪救 日期:m 专年,月,乎日 日期:如) 年,月如日 第一章绪论 第一章绪论 1 1 研究的意义和现状 1 1 1 意义 第二次世界大战以来,经济的发展促进了教育的发展,社会对考试的需求呈 指数增长,考试发展成相对独立的行业。如美国的e t s ,举办各种考试,其影响 越来越大,我国的高等教育自学考试,高等学校入学考试,研究生入学考试,以 及近年来发展起来的公务员、律师、注册会计师等的资格考试,也都是影响很广 的考试。为了使这些考试具有公平性、稳定性,编制试题库的任务就提到日程上 来。题库由大量试题集合而成,是具有必要测量性能参数的试题的有机集合。试 题要结构合理,包括各种内容、各种难度的试题,数量比例由学科内在结构决定。 题库要由计算机系统管理。要用优良的数据库存贮试题,并且有优良的成卷算法, 迅速生成合乎用户要求的试卷,因此试题库是人工智能研究的一个重要课题。 当今世界已经是一个信息时代的世界,智能这一名词也已经不知不觉地渗透 到人们生活的各个角落,而拥有智能成卷功能的试题库系统的出现更是教育界中 一项革命性的技术突破,它不仅把教师从繁琐的考试准备工作中解放出来,大大 减轻了教师的工作量,而且实现了教学与考试的分离,让任课老师必须按照教学 大纲要求认真备课,认真组织教学内容,改进教学方法,对提高教学质量和整体 教学水平都有十分重要的意义。 在试题库系统中,智能成卷算法是其核心。试题库系统能否生成高质量的试 卷,除了试题库中试题的质量要好外,一个合理且效率高的成卷算法是关键所在。 正确而客观地评价一个成卷系统的优劣,对于有效改进成卷算法有重要意义。 1 1 2 选题背景 从1 9 8 6 年开始,在国家教委高教司领导和推动,以及各课程教学指导委员会 的组织下,许多高校都投入了大量的人力物力,对一些课程进行试题库的研制与 开发,并且取得了一定的成绩。但是当时的试题库系统普遍存在着低水平重复现 象严重、缺乏统一的检验标准、缺乏统一的设计目标以及成卷系统缺乏智能性等 缺点“。 为了适应现代化教育事业的需要,1 9 9 2 年1 2 月,国家教委高教司在西安交 通大学召开了关于研制试题库系统通用软件的研讨会,在会议上,包括我们华南 理工大学在内的多所高校的专家共同探讨了试题库系统研制的经验,并且对通用 华痞理工大学理学硕士学位论文 软件系统。1 9 9 3 年1 0 月,高教司在北京昌平石油大学召开了“通用试题库系统” 豹正式投标会,经专家严辏评审,最矮决定囊华南理王大学试题库研制缀全面具 体负责,西安交通大学与清华大学参与研帛4 ,共同开发。 经过3 年多的努力,该系统完满完成,1 9 9 6 年9 月7 日在北京,国家教委可 淤管理中心主持了逛华毒瓒工大学等疆裁“惑等学校试邋疼逶麓软件系统”熬技 术鉴定会,会议商度评价并肯定了该通用软件系统的系统理论以及在软件上实现 的成果,其后更幽高等教育出版社出版发行该试题库通用系统的单机版。 随着耐代的笈麓,擎梳舨试遂露系统逐渐暴露出了局限往。单枫舨静系统只 能在一裔计算机上使用,如果要在蛹外的机器上使用,则必须要在该台机器上再 安装一次系统;磊且单援舨瓣系统爨藿点是实现了戒卷,不能实现考试系统,印 成卷后只能把试卷打印出来供考试使用。但是如果利用现代网络技术,使得在系 统在一台计算机上运行以后,其它计算机都可以依靠网络共享试题库资源,而且 迩使网上考试残为可戆。嚣此,为了逶应运裰教育的黪鏊盏发袋,开发瓣络试瑟 库系统势在必行。 2 0 0 0 年1 1 月,高等教育出舨社对“网终试题库系统”进行了招标,牮南理 工大学凭着其在邋蠲试题瘁系统研制上的突出表现,以及在试惩库研究方面的深 厚基础和技术力= 璧,再次成功中标承担了“大学数学系列网络试题库系统”的设 诗与开发任务,劳翌于2 0 0 2 年3 月鞭瀵宠残菇通过验收。 但蹙我们也_ 陵该清楚肴到,网络试题库的成功开发虽然取得了定的成果, 并且己缀投入使用,但其中仍然有缀多问题需要解决,有一些不足的地方仍然需 要完善。比如,京逸题组卷模型酶求瓣中,对子解质蠢麓改进仍然有一定瀚空闯; 对成卷理论没有进行深入的研究;由于成卷算法的结果多数情况下不是一个最优 孵,仅是一个随杭较往勰,所以有拜寸成卷结果不一定符合要求,需要教烬( 专家) 评定,影响了系统的易用隐。本人的毕业设计和论文最是针对原阏络试题库系统 的不足,完成成卷理论在知识库的理论基础以及试卷质量评价等方面的工作。 。 。3 蜣有智畿试题痒系统现状 1 单机版智能试题库系统 瑷簿单机版“菇等学校磐能试纛霹逶爰敦搏系统”楚一个基于知识熬餐襞设 计型专家系统。它比较系统地建立了试题的指标体系,在知识获取,成卷理论以 及系统结构设计上都取得了一定的成果。整个通用软 牛试题库系统分为三大部分 1 2 1 : 第部分:知识获取与维护系统。这部分的功能是向课程专家获取课程知识, 越课程知识进行缀护,对鞠关知识遴霉楣容瞧检查等。 第二部分:成溢系统。这部分是通用软件试题库系统的核心。运用选题策略, 2 第章绪论 挑选出适当的试题组成一份试卷,同时要完成试题赋分,试卷排版等功能。 第三郄分:统诗分 厅系统。这部分系统通过对成绩数据进季亍绞计计算,为反 映成绩系统的性能和教学状况提供有螽的参考信息。 从数据流的角度来看,我们给出系统的结构图,这三大部分的有机结台就可 以受热胡确了。 图1 - 1 试题痒系统结梅 f i g u r e1 - 1 t h es t r u c t u r eo f t h es y s t e m o f b a s e o f t e s t q u e s t i o n s 2 。网络版智能试题库系统f 3 】 肤运行环境和实现工具来看: 网络试题库系统采用“浏览器,服务器”模式,运行时分为服务器端和客户端。 在簸务器溪一般霞瘸台式缀务器,辍务器上装蠢w e b 撮务器、应越缀务器秘数据 库服务器等软件。在客户端则只需在p c 机上运行浏览器即可。 试题痒应用服务器中的应用逻辑是用a s p 来开发的,使用豹语言是v b s c r i p t 。 试题库系统采用w i n d o w s 2 0 0 0 作为操作系统,懿i i s 作为w e b 服务器和应掰服务 器,以m ss q ls e r v e r 7 0 作为数据库服务器。 3 牮南理工大学理学硕士学谴论文 从运行模式来看: 霹终试题库系统的运行模式可以从硬 牛和软件两个方蟊考虑, 在硬件结构上,如下图所示: 图1 2 网络试题库系统运行模式( 硬件结构上) f i g u r e1 - 2t h e m o d eo ft h en e t w o r k s y s t e mo fb a s eo ft e s tq u e s t i o n s 在软件结构上,试题库系统的软件部分建立在应用服务器上,所有予系统的 软件模块都存放在应用服务器上,由应用服务器负责调用和执行,获得运行结果。 褥指标露和知识瘗羽都是瑷数据瘁形式存敖纛数据瘴暇务器上,垂数据瘁缎务器 负责其管理和访问。其工作原理如( 图1 3 ) 所示; 匿斗叫三三 一匿卜罾啦塑卜+ 圈 1 。商w e b 疆 务器发送请 求; 2 接收w e b 溅务器遥嚣 的叶面,井解 释。 1 将w e b 浏 览器的数据包 经网络寻址发 送到w e b 服务 器; 2 将w e b 服 务器的返回经 网络寻垃按送 到w e b 淄览 器; 1 。接收霹终翔 户的请求,把两 络访问请求转 化为参数,发送 鞘应用服务纂 进行处理: 2 接受应用服 务器的结果返 醋,并以弼页翁 形式返回给用 户。 应用辍务器存放 试题库系统的应 用逻辑。 1 接收w e b 服务 器传递鹣参数,诱 用相应的应用逻 辑处理请求; 2 囱w e b 服务器 返回箍璎结果; 3 想数据库连接 工具发送s q l 语 句: 4 接收数据库连 接工具返回的结 果。 受责连接鼓键 阵服务器的赢 用服务器。 1 + 接收应蹋服 务器s q l 瀑 句: 2 向数据库服 势器发送s q l 漤句; 3 接收数据库 服务器的结粜 遁圄; 4 ,把结果避瞄 给应用服务器。 存教斌越熬指 标库和系统的 知识席。 1 接收s q l 语 句,并运行该语 句获得结果; 2 把结果返回 数据霹连接工 图1 - 3 网络试题库系统的工作原理( 软彳牛上的结构) f i g u r e l 一3t h ep r i n c i p l eo ft h en e t w o r ks y s t e mo fb a s eo ft e s tq u e s t i o n s 4 ;, 女g ,上 i 女 上 女* ;,l * # ,;r * ;中 第一章绪论 从总体功能结构来看: 网络试题库系统有三大类用户:系统管理员、教师和学生。在教师中又分为 辅导站教师和一般教师。 不同类型的用户拥有不同的可用功能,具体为: 系统管理员:用户管理;数据库管理;试题管理;试卷库管理;练习卷库 管理。 辅导站教师:成卷;查询试卷:更新试卷库;更新练习卷库。 一般教师:成卷;查询试卷。 学生:考试;练习。 系统总体功能框图如( 图1 - 4 ) 所示: 图1 - 4 网络试题库系统的总体框图 f i g u r e1 - 4t h es t u c t u r eo f t h en e t w o r k s y s t e m o fb a s eo ft e s tq u e s t i o n s 2 1 本论文的主要工作及意义 2 1 1 工作 根据本文选题背景中所述,当前的网络试题库在成卷方面仍然存在一些不足, 5 华南理工大学理学硕士学位论文 这些问题将会对试题库的威用产生影响,因此为了使得已有的网络试题库系统更 擞适合实际应用,本人的毕业论文就这些不足的方面遂行了讨论,以高等数学科 目为铡,提出了解决的方法,并完成成卷理论在知识麾的理论蒸础以及试卷质量 评价等方面的工作。 本论文静主要王终包揍: 1 运用多元统计理论知识,建立学生成绩分布模型,从而确定成卷中需要 用到的核心分布曲线一一难度分布曲线,使得难度分布曲线的确定有了严密的理 论基碇,筢够有效姥提高成卷质量。 2 对经过改良的成卷算法与原成卷算法进行比较,引入满意度的概念,在 难度满意度、波套瀵意度、辩闻段潢意度、乎均分满意发帮不及格率满惑度等方 面进行全面比较,说明算法改善后确实有明簸的效果。 3 引入偏熬值,对经过改良的成卷算法与原成卷算法在内容覆盖稷度方面 进行了魄较,诬鞠经过改庭懿残卷雾法在痰容覆盖程麓方覆毙缀骞算法凳优,麸 而使得机器所成的试卷有更加合理的内容分布。 4 。用改进厦的成卷算法戒卷詹,给学生进行测试后,对反馈回来的考试成 绩迸彳亍统计分析,在试题难度、试题区分度、测验信度耱测验教潼四个掰标进行 分析,从学生实测的角度检验新算法的效果,结果表明效果良好。 其中蔫3 点楚零文鲍爨点硬究工俸。 2 2 2 意义 本文豹意义烹要有: 1 ) 从理论上成功建立学生成绩分布数学模型,并由此确定出难度分布曲线, 是网络试题库系统在成卷理论上的熏大突破。 2 ) 狡诗窭用满意度_ 稀偏差篷来播述翡戒卷蒺量的评徐方法,获多个不同方 面科学地评价成鬻质量,为成卷算法的改进指明了方向。 3 ) 利用学生鹣实测数据进行成卷质量的评价,为以后的硬究提供了有力豹 依据。 6 第二章网络试题库系统算法上改进的必要性 2 1 对知识库的确定理论不足 在现行试题库成卷算法中需要用到以一定的知识库作为根据,当中除了指标 库和内容濑节表等硬性规定的知识表示外,难度分布曲线、内容分布曲线、时间 羧分毒麴线等知识交示剩霰簧按照一定戆矮裂( 算法) 确定。露在成卷舅法孛, 难度分布曲线则是熟中最为蘸要的核心曲线,它的合理与否将极大程度影响成卷 璇量。在现彳亍试题麾系统中,对这条分布曲线巍勺确定采用了完全恁专家经骏确定 的方法( 参觅下表,潋高等数学课程淹倒) 。由予诧分布虢线没有穰据学生实际莳 考试成绩分布来确定,也就魑说,对该条曲线的确定缺慧足够的理论依据,因此 该分毒燕线并不一定戆我袁鼹佳兹难发分商,悉在残卷算法中,逸题策赂蘩严辏 以难度分稚曲线为依据,故成卷质量不一定能达到最佳,有待改谶。 表2 - 1 旧成卷算法中高等数学难度时间分布表 t a b l e2 - lt h et a b l eo f d i f f i c u l t y - t i m et a b l ea b o u ts e n t h i o r yi no l d a r i t h m e t i c 7 牮嘉理工大学理学硕士学位论文 j _ l 自= e _ 目日j = | _ _ ! = 日_ _ ! _ e e = e e # d 自日_ 目 i i i i i i | _ 日e # 自自日e _ j ,自e ! 躺 2 2 在选题策略上的不足 应豫题稻证镧越在试豢串占据分蹩不大,徨其痿爨往往是试卷交量豹耋要方 面,而这点却是成卷曲线上没有反映的。旧算法在论文中【3 l 采用先选威用题和 涯明题务一道,薅将大题浚翻选取黥策略,实测结果发现应爆联襄证明题矮量不 稳定,露时出现三个证明鼹都是3 糨的难度,时间都楚s 7 分钟,甚至都是同一 章内容的情形。 | 瑟算法辩重点疼容翻嚣重点内褰在试卷审熬逮铡这一点没鸯考虑进去,结采 成卷中往往非重点内容过多。 另外为了符合难度曲线,i 日算法采用把蕊档难度的剩余辩间( 当难度到了 误差限内时) 转绘下一档难度裁余时闻( 销如6 档题剩余时闰为两分铈,已经蜀 了本次成卷的设爨的难度误差限内,将这两分钟转给5 档题剩余时间) ,实际成卷 发理平均分误差过大。 8 第三章从理论土确定难度分布曲线 j _ _ = 目_ 自e j 日- l _ 口e _ _ 目- _ l _ i e e = 日 _ _ _ _ _ ! = = j j e e e _ _ _ _ e = = = = j _ - _ _ _ _ # t e _ _ - _ j _ _ _ _ - - _ _ e _ _ 目_ _ 糙i i i i i 第三章从理论上确定难度分布曲线 第二章中我们已经讲过,现行试题库系统在难度分布曲线的确定上缺乏理论 基础,有待改进,因此在这一犟中我们将尝试解决这个问题。不同考试标准的试 卷应该骞攘应不翳豹难凄振壤,反浚在务耪难疫摆试鬈瓣结稳毙壤土。究竟怎榉 的难度挡比例才怒合理的昵? 嚣解决这个问题,我们首先需要从学生考试成绩分 布模型方面进行考虑。 3 , 建立学生戒绩分布模型 3 1 1 前言 一般来说,对试题难度豹要求我们通紫翅平均褥分与及携率表示,因此需要 将平均得分与不及格率转换为分布曲线( 朝各档难度f l 毫题目与考试辩闻的眈铡) , 而为了编制出难度适中,能够反映教学情况的试卷,就需要研究考试成绩的分布 曲线。一般使用所谓“常模”理论。但如何确定某种考试的常模昵? 理论上应该 蘩取察鳌褶当大势爨鸯鼹表惶戆徉零遂露察测,整这实嚣上是禳难徽到瓣。纛纛 学生的实际水平也在不断变化中,测得的结果也会随糟时间推移而失去意义。教 育学理论通常认为考试成绩的分布应该是正态分布,遮假设往往不够精确。蜜 骣上只骞在嚣秘臻滋下,第一季孛情强是,寒经薅选的大爨菜类久群,测查戆是基 本的心理特征;第二种情况是,参加考试的学生是完全随机抽取的绒者程度高度 一致。实际上,试题库面向的用户,是我阐的高等学棱的学生,他们经常是经过 入学考试选拔出来的,但每个学校,每个专业甚至每个班中,学生程度仍有明鼹 差异。在这种德滋下,学生酶考试成绩分鸯,实舔上还与正态分布衣缀大的差器。 通过分析,我们发现先把学生根据成绩好坏分成几类,假定每类学生的考 试成绩服从正态分布更加符合实际情况。试题的难易程度是决定学瞧考试成绩的 关键瓣素,试题篾攀,学生获褥蹇分静霹熊蠖藏大,试邋难,考试获褥德势豹可 能性就犬。在一份合理的试卷中,各种难度的试题应该以一定的比例出现,而番 类学生在各种难度的试题中所能取得的成绩的期望和方麓应该是不同的,对于同 一类够生,考试成绩的期望随潜难疫豹增大嚣减少,方麓则蓬着难发的增大嚣增 大。这说明,当我们把学生关予每一种难魔的成绩俸为一个交量的时候,一个学 生的成绩则是关于这几个变量的个多元变量,每一裳学生的考试成绩服从多元 正态分布。 9 牮南理工大学理学硕学位论文 3 1 。2 简要介绍多元分析理论 3 1 2 ,1 多元分析中的矩阵表示 在多元努嫒中,矩簿怒一个重要王其。鞋缒瓤变量必元紊鹣矩菸,或为瓣 机短阵。如果随机矩阵只有列或者一褥,通常称为随机向量。 一个随机矩阵的期望( 或称均值) 鼹由其每个元索的期望值所排成的矩降。 特别地,设x = ( x 。 是一个p n 的随机矩阵。我们用e ( x ) 表示x 的期望值,它 楚一个p x n 数穰矩陲( 螽粟期望僮存在豹话) : 露( x ) = e x l le x l 2 e x l 。 e x 2 le x 2 2 e x 2 h e x p le x p 2 e x ( 3 - 1 ) e 南矗( 嘞) 觑。,翼x # 是具寿壤攀密度丞妻( 妨粒连续疆鄱变量对; e ( x ) 2 “量麓南( 毛) ,警童# 是兵有概率函数( 抽离散随即交麓时( 3 - 2 ) 特别地,若x = i x :】是一个p 1 的随机矩阵( 即随机向量) 。x 的每个元素是 边缘分毒为正态分布兹夔枫变量。边缘筠壤鳆和方差四分澍兔热= e x ;, 研= 岳( x 。一,) 2 ,i = 1 , 2 ,p 。其中, l t 五( - ) 妣, 当x ;是具有概率密度函数 ( 气) 的连续随即变蹩时; 觳2 鼍热( t ) , 当x ,是具有摄零灏耋绉;瓯) 鲍襄数疆帮变囊对( 3 - 3 ) 当x ;是具有概率密度函裴赋镰) 鹩连续随即变量时: 当x ;燕其鸯概率函粪硌;魄) 躲离散隧帮变量时 对于任两个随机变量x ,和以,其协方嫠为 c r * = e ( x i e x i ) ( x 女一e x t ) = e ( x i 一芦1 ) ( x k 一女) e ( 一麒) 瓴一版) 矗瓴,) 哦呶, 当x ;,x 。都是连续随机变擞且有联合密度函数氏( 而,x d 时; 晦一忿) ( 一段) 尹。( 墨故) , 雌 当x ,以都是离教随机交量髓有联合概率密度函数欺瓴,) 对 ( 3 * 5 ) ( 3 一事) 其中熊,t 。( 武露= l ,乏,p ) 楚边缘均毽。如果i = k ,粼协方差如= 嚷羁为边缘 1 0 i 惦蛳溉双啭 沁 驴。 e ,tjl,il,f、iiitl l | 西 第三章从理论上确定难度分布曲线 e c x ,= f 鬟习= l 萋 = , c s s , + 盯1 d 仃2 。 : 。 盯刀 ( 3 7 ) 我们把和分别叫做总体均值( 向量) 和总体方差一协方差( 矩阵) 。 而总体相关系数p 。有协方差盯。,吒所确定,即 鲰= 了牟,l ,k = l 2 ,坤。 ( 3 8 ) 6 l i q o 总体的相关矩阵为: 口= 1 p 1 2 一p 1 。 p 1 2 l p 2 。 ( 3 9 ) 3 1 2 2 多元正态分布 基本理论 作为一元正态分布的高维推广,多元正态分布在多元分析中起着十分重要的 作用。有两个原因是正态分布在实际中有广泛的应用。首先,正态分布在许多情 况下确实能够作为真实总体的分布;其次,根据中心极限定理,不论总体分布如 何,许多多元统计量的分布是近似正态的。 一个多元正态分布完全由向量和方差一协方差矩阵所确定。随机向量 擘吼吒; ,。l = ) x ( 矿国 | i )芦 一y 弘 一x ( g = 窒z 丽童苫丽童警丽 华蔫理大学邂学硬圭学往逊文 x :函;,x 。,盖, 魏尹维溉态密度骚数骞鲡下鲍形式: ,( 习= 上p 专坤藩邓,蔟中一薯 扣,i 二i , 2 ,p , ( 3 。l o ) 扬) 船鹫i 与一元正态密度的记法相似,用。( 胁) 记多元正态的密度函数。 多元正态分布的性质 多弼芷态随机变量x 蒸宥下列性质: 1 。x 的分量的线性组合服从戚态分布,即若x 一。( 弘) ,则随机变鬣的任 意线缝缀合拉= 嚷x l + 8 2 x 2 + p x # 一辩p 国a 撑z a ) 。 2 。x 黪分璧的任一子袋,仍服从正态分穆; 3 。矮骞零谤方差匏分羹耀互独立 4 藩予分鼙鹣条箨分蠢傻黢钛菠态分蠢。 3 。1 。3 成绩分布模型酌蒸零瑕设及符号说蠲 3 ,1 。3 1 慧本假设 前面已经论述过,学擞实际考试成绩的分布与正态分布有较大的偏离。根据 多年来教学实黢墩及专家熬炙,我键试尧下列缀设毙较台乎实瓣。 1 据学校的生源情况不同,搬学校分成离一级、标准级和低级三个等级, 器等级的学校的掌生都分成1 、2 、3 、4 四类,其中第1 类学生表示学习成绩最好 鹣粪爨。跑镄分蠢鲡表3 2 掰示: 表3 2 嚣缀学校学生缝成表 t a b l e3 2t h et a b l eo fs t u d e n tc o n s t i t u t i o no fa l l 蛰l n 矗so fs c h o o l 离一缀 标准级 低一级 3 0 2 0 1 0 妫 3 5 3 0 3 0 3 3 5 3 5 5 孙 1 5 2 5 2 。簿类学生瓣各耱难发懿考鬻考试袋绩分枣是多元歪态分布。邃整我稻籁设 一共毒六档难度的考题,农我们静试鼷瘁中,第一档和第二档飕发的趱强数量较 多,缀掇实琢壤况,我镯怒褥搂综合考惑,羲袋一档。各参数麴下: ( 1 ) 务类学生对各秘难覆翡平均分( 分) : 第三章从理论上确定难度分布曲线 表3 3 各类学生对各档难度的平均分( 分) t a b l e3 - 3t h e a v e r a g es c o r ea b o u te a c hd i f f i c u l t yo f a l lk i n d so fs c h o o l 9 6 9 4 9 0 8 5 9 0 8 5 8 0 7 5 8 0 7 5 6 5 6 0 7 5 6 5 5 5 4 5 7 0 5 0 3 0 1 5 ( 2 ) 各类学生对各档难度的标准差( 分) : 表3 - 4 各类学生对各档难度的标准差( 分) t a b l e3 - 4t hes t a n d a r dd e v i a t i o no fe a c h d i f f i c u l yo f a nk i n d so fs t u d e n t s 5 8 l o 1 5 1 0 1 0 1 5 2 0 1 5 1 5 2 5 2 5 2 0 2 5 2 0 1 5 ( 3 ) 各难度档之间的相关矩阵 表3 5 各类学生对各档难度的相关矩阵 t a b l e3 - 5t h ec o r r e l a t em a t r i xa b o u te a c h d i f f i c u l t yo f a l lk i n d so fs t u d e n t s 1 3 华南理工大学理学硕士学位论文 对相关矩阵作一说明:实际测试说明,不同档次难度试题,测试结果有相关 性,特别难度相近的试题,相关程度更大。 ( 4 ) 5 档难度的分数权数比例为: 对于每档难度的题目,学生每得1 分所付出的时间会有所不同。对于低难度 的题目,学生得到1 分所付出的时间较高难度的题目要少,因此我们必须考虑各 难度档题目时间与分数的关系。 由专家经验得时间与分数的对应关系为权重向量( 0 8 5 ,o 8 5 ,0 9 ,l ,1 1 ,1 1 ) , 其中各分量表示学生在各难度档题目中每付出1 分钟所得到的分数。 因此由标准级,低一级以及高一级的“时间一一难度分布曲线”以及该权重 向量,我们可以得到分数权数比例为: 标准级:0 2 2 :0 2 3 :0 2 6 :0 1 7 :0 1 2 低一级:0 2 4 5 :0 2 3 6 :0 2 8 8 :0 1 4 4 :0 8 7 高一级:0 1 7 5 :0 2 5 5 :0 2 5 8 :0 1 7 :0 1 4 2 3 1 3 2 符号说明: ,:每一等级学校中第i 类学生所占的比例 t ,:第f 类学生的对各种难度的均值向量 z :各档难度分数权重向量 d 。:第f 类学生的对各种难度的标准差向量 m ,:第i 类学生成绩分布的均值 m :总体的学生成绩分布的均值 仉:第i 类学生成绩分布的标准差 仃:总体的学生成绩分布的标准差 :第i 类学生的不及格率 r :总体学生的不及格率 :各档难度的协方差矩阵 3 1 4 模型的建立 根据多元正态分布理论,第f 类学生成绩分布为正态分布, 均值为m ,= z 么,( 3 - 1 1 ) 标准差为q = l d ;z ,( 3 1 2 ) o 卅) 2 分布函数为:f a x ) = ,兰一r p “d t ( 3 - 1 3 ) 4 2 x c r , “ 1 4 繁兰耄从璎沦土确定难壤分布越线 总俸分布函数为:( 织为第f 类学奎黥磁铡) 4 f 茹= 旗曩国 l = i 因她,总体靛密渡丞数为 m = 粪州加毒去e 晋 m ) = ,( 搿) = q ( x ) = 一茬兰8 妍 2 l1 8 lv 鳓:壹旗鬈商:4 姣燃 ( 3 m 1 6 ) 慈髂方蓉瓷: 拶2 = v a r ( x ) = o 并一蝴2 ,( 枇= 丞善一哟2 溪魅磊曲卜= 要4 毽( 丞戈一秽五( 铷妁 = 啦鬈。一玳) 2 = 蛾懿缸一m ,十能- m ) 2 = 璐伍 珊,) 2 + ( 俄,m ) 2 ) = 皱扣蟹 习十( 憋一辨) 2 ) 怂体不及格率 3 。 。5 请冀羹鞠,国 r = 宝螺略。砉婊f 蠢渊出 1 。下嚣我稍先竣撂漆毅学校为裁逡孬诗箕, ( 1 ) 计算耽和坍 根据假设,有: 棚= ( 0 2 ,o 3 ,0 3 5 ,o 1 5 ) z = ( 2 2 璐,2 3 ,2 6 ,1 7 ,1 2 ) , 拜,= ( 9 6 ,9 0 t8 0 ,7 5 ,7 0 ) l s ( 3 - 1 7 ) ( 3 。t 8 ) 华南理工大学理学硕士学位论文 , # 2 = ( 9 4 ,8 5 ,7 5 ,6 5 ,5 0 ) , “,= ( 9 0 ,8 0 ,6 5 ,5 5 ,3 0 ) , “。= ( 8 5 ,7 5 ,6 0 ,4 5 ,1 5 ) 放由= z u ,得: 豫。8 1 7 2 ;m 2 = 7 6 7 8 ;m 3 = 6 8 。0 5 ; m 4 = 6 2 。4 5 ; 4 辨= 继强= 7 2 。5 6 3 捧l ( 2 ) 计算矾帮盯 由相关系数与协方差的关系: p 。= 1 q o i i 4 0 n 吼= p 。i d 4 s 2 - ( 3 1 9 ) 得到因类学生对各种难度的协方麓矩阵分别为: ,= ,= 43 3 2 5 51 5 61 8 7 5 42 0 5 64 1 51 8 。7 52 0 l 4 5 5 0 4 5 2 2 59 0 5 09 0 4 0 0 2 5 1 51 8 7 52 0 1 51 0 04 5 5 0 1 8 7 54 52 2 59 0 2 0 5 0 9 04 0 0 1 04 07 51 2 0 缀据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论