




已阅读5页,还剩92页未读, 继续免费阅读
(计算机应用技术专业论文)高等医学院校试卷分析系统的设计与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 考试作为当今高校评价学生的一种手段,在高等教育中的地位越来越重要。 要借助考试客观、准确地评价学生的成绩,绝不仅仅依赖于卷面分数,更重要 的是利用教育测量的理论对试卷进行分析。这就需要一个专业的分析系统,使 用专门的统计和分析机制来处理这些数据。但象s p s s 、s a s 等专业统计软件还 存在价格昂贵、使用复杂、普及性差、数据格式通用性低等缺点,无法大规模 应用。基于这些原因,我着手开发了这个试卷分析系统。 本文主要内容包括:( 1 ) 简要介绍了教育测量与评估的含义、背景和特点。 ( 2 ) 详细介绍了现有高等教育中有关评估评价的理论方法,并探讨了试卷的难 度、信度,试题难度、效度、区分度等统计指标以及s - p 表分析的计算机算法 实现。( 3 ) 采用优化的z 2 拟合优度检验法验证成绩数据是否呈正态分布。 ( 4 ) 以p o w e r b u ii d e r 9 和m ss q ls e r v e r2 0 0 0 数据库为工具,依据软件工程中原型 法的研发思想,采用面向对象的程序开发方法,设计与开发试卷分析系统。该 系统实现了考试成绩录入及校验、试卷质量分析、教学效果评价等多项功能。 ( 5 ) 随机抽取- f l 课程试卷的考试结果,使用该系统,对试卷质量以及该课程的 教学效果进行定性、定量分析,得出科学详实的信息,为分析教学活动中存在 的问题、为教学管理和组织提供科学的依据。 本系统主要应用教育测量学技术,结合高等医学院校专业课程考试的特点, 筛选出试卷分析指标及其统计方法,应用数据库技术、软件开发技术设计并开 发出“试卷分析系统 。该系统可对试卷及各题目是否有意义做出快速评价, 并迅速反馈于试卷的修正和对教学效果做出评价。 本系统最大设计特点是应用s o ls e r v e r2 0 0 0 存储过程实现各种测量指标 的计算并提供调用方法,使应用程序易维护,高扩展性、高安全性和高执行效 率;并通过更加完善的z 2 拟合检验构造统计量指标来检验实际成绩数据与理论 分布是否符合;同时利用p o w e r b u ii d e r 9 数据窗口的特点,完整实现s - p 表评 价分析方法中各种指标计算以及s 线、p 线绘制,对教学质量进行更全面准确评 价,深入了解考生群体和个体的学习质量和各试题质量,帮助教师实现优化教 学的目的。 摘要 关键词:p o w e r b u i l d e r ;m ss q l2 0 0 0 ;s - p 表;z 2 拟合优度检验;教育测量; 试卷分析 i i a b s t r a c t _ 。一,_ _ ,- - _ - ,- ,- _ - ,- - - - _ - _ _ _ _ 一 a b s t r a c t a sam e a n so fe v a l u a t i n gs t u d e n t s a b i l i t i e s ,e x a m i n a t i o np l a y sam o r ea n dm o r e i m p o r t a n t r o l ei nh i g h e re d u c a t i o nn o w a d a y s t oe v a l u a t es t u d e n t s l e a r n i n g p e r f o r m a n c eb ye x a m i n a t i o no b j e c t i v e l ya n dp r e c i s e l y , i ts h o u l dn o to n l yr e f e rt ot h e s c o r e so nt h et e s tp a p e r , b u tm o r ei m p o r t a n t l y , t oa n a l y z et h ep a p e r sb yt h et h e o r yo f e d u c a t i o n a lm e a s u r e m e n t t h e r e f o r e ,i ti sn e c e s s a r yt oe m p l o yap r o f e s s i o n a l a n a l y s i ss y s t e m ,t h a ti s ,ap r o f e s s i o n a ls t a t i s t i c sa n da n a l y s i ss y s t e mt od e a lw i t h t h e s e d a t u m h o w e v e r , d u et ot h e r ea r es om a n ys h o r t c o m i n g si nt h ep r o f e s s i o n a ls t a t i s t i c s s o f t w a r el i k es p s s ,s a sa r ee x p e n s i v ei np r i c e ,c o m p l i c a t e di nu s i n g ,p o o ri np o p u l a r i t y , l o wi nd a t af o r m a tc o m m o n ,t h e yc a n tb ee m p l o y e di nal a r g es c a l e f o rt h ea l l r e a s o n sm e n t i o n e da b o v e ,d e v e l o p e dt h i st e s t - p a p e ra n a l y s i ss y s t e m t h em a i nc o n t e n t so ft h i sp a p e ra r ea sf o l l o w i n g :( 1 ) ab r i e fi n t r o d u c t i o no ft h e m e a n i n g ,b a c k g r o u n di n f o r m a t i o na n df e a t u r e s o ft h ee v a l u a t i o na n dj u d g m e n to f e d u c a t i o n ( 2 ) ad e t a i l e di n t r o d u c t i o no ft h ee v a l u a t i o na n dj u d g m e n tt h e o r i e si nt h e p r e s e n th i g h e re d u c a t i o n ,a n dt o d i s c u s st h ed i f f i c u l t i e sa n dr e l i a b i l i t yo ft h et e s t p a p e r s ,t h es c r e e n i n go ft h ei n d e xc a l c u l a t i o nm e t h o ds u c ha st h ed i f f i c u l t i e s ,v a l i d i t y a n dd i s c r i m i n a t i o no ft h et e s ta n dt h er e a l i z a t i o no ft h ec o m p u t e r i z e da l g o r i t h m a n a l y z e db ys - p ( 3 ) u s i n gm o r ep e r f e c tg o o d n e s s o fzf i tt e s tr e s u l t sv e r i f y w h e t h e rt h ed a t as h o w e dn o r m a ld i s t r i b u t i o n ( 4 ) b a s e do np b 9a n dt h ed a t a b a s eo f m ss q ls e r v e r2 0 0 0 t od e s i g na n dd e v e l o pt h et e s t p a p e ra n a l y s i ss y s t e m ( 5 ) b y s e l e c t i n gt h er e s u l t so fo n e t e s ta t er a n d o m ,t oa n a l y z et h eq u a l i t yo ft h ep a p e r sa n d t h er e s u l t so ft h i sc o u r s eq u a l i t a t i v e l ya n dq u a n t i t a t i v e l y ,t of i n do u tas c i e n t i f i ca n d d e t a i l e di n f o r m a t i o n ,t h e nt os u p p l yt h es c i e n t i f i ce v i d e n c ef o rt h ee x i s t i n gp r o b l e m s i nt e a c h i n g ,t h et e a c h i n gm a n a g e m e n ta n do r g a n i z a t i o n t h i ss y s t e mm a i n l ye m p l o y st h et e c h n o l o g yo fe d u c a t i o n a lm e a s u r e m e n t , c o m b i n e st h ef e a t u r e so ft h ee x a n l so ft h ep r o f e s s i o n a lc o u r s e si nh i g h e rm e d i c a l h o s p i t a ls c h o o l s ,i d e n t i f yt h et e s t p a p e rs t a t i s t i ci n d e xa n di t ss t a t i s t i cm e a n s ,e m p l o y s t h ed a t a b a s et e c h n o l o g y ,s o f t w a r ed e v e l o p m e n tt e c h n o l o g yt od e s i g na n dd e v e l o pt h e i i i a b s t r a c t t e s t p a p e ra n a l y s i ss y s t e m t h i ss y s t e mc a ng i v eaq u i c kj u d g m e n to n w h e t h e rt h et e s t p a p e ra n di t sq u e s t i o n sh a v ea n ys i g n i f i c a n c e ,a n dd oap r o m p tf e e d b a c kt o t h e m o d i f i c a t i o no ft h et e s tp a p e ra n dg i v et h ej u d g m e n tt ot h et e a c h i n gr e s u l t s t h em o s to b v i o u sd e s i g nf e a t u r eo ft h i ss y s t e mi st oa p p l yt h es t o r i n gp r o c e s so f s q ls e r v e r2 0 0 0t or e a l i z et h ec a l c u l a t i o no f v a r i o u st e s t i n gi n d e xa n dt h e nt oo f f e r c a l l i n gm e t h o d ,w h i c hm a k e s t h ea p p l i c a n tp r o g r a m sa r em o r ee a s i l yt ob e m a i n t a i n e d ,a n dt oi m p r o v ei t se x p a n s i b i l i t y , s a f e t ya n dh i g h e re x e c u t i o ne f f i c i e n c y ; u s i n gm o r ep e r f e c tg o o d n e s so fz f i tt e s tr e s u l t sv e r i f yw h e t h e rt h ed a t as h o w e d n o r m a ld i s t r i b u t i o n ;m e a n w h i l et oe m p l o yt h ef e a t u r e so fp b 9d a t aw i n d o wt or e a l i z e v a r i o u si n d e xc a l c u l a t i o ni ns - pj u d g m e n ta n a l y s i sm e t h o d sc o m p l e t e l ya n dt h e d r a w i n go fl i n es ,l i n ep ,t oe v a l u a t et h et e a c h i n gq u a l i t ym o r ep r e c i s e l y , t ok n o w t h e t e s t t a k e r sa n di n d i v i d u a l sl e a r n i n gp e r f o r m a n c ea n dt h et e s tq u a l i t i e sm o r ed e e p l y ,t o h e l pt h et e a c h e r st or e a l i z et h eo b j e c to fm a k i n gt e a c h i n gm u c h b e t t e r k e yw 。r d s :p o w e r b u i l d e r ;m ss q l2 0 0 0 ;s p ;z 2 f i tt e s tr e s u i t sv e r i f y ; e d u c a t i o n a lm e a s u r e m e n t ;t e s t - p a p e ra n a l y s i s i v 学位论文独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得壶昌太堂或其他教育机构的学位或证书而使用过的材料。与 我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确 的说明并表示谢意。 学位论文作者签名( 手了:l 虱警拷签字日期:况哆年f z 月彳日 学位论文版权使用授权书 本学位论文作者完全了解直昌太堂有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权直昌太堂可以将学位论文的全 部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描 等复制手段保存、汇编本学位论文。同时授权中国科学技术信息研究 所将本学位论文收录到中国学位论文全文数据库,并通过网络向 社会公众提供信息服务。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:f 习眵茬 签字日期:9 年f 蜩6 日 | 必 包朋 多叩年砷 曼罗 名 卧 斟 瑚 磁 日 问勋 解 第l 章引言 1 1 概述 第1 章引言 考试是评价教学质量和教学效果的种有效方法。一份好的试卷既能反映 学生掌握所学知识的水平,又能反映教师的教学水平,而试卷的质量又直接影 响着考试质量。试卷分析是不断提高试卷质量的重要方式,也是批判性审视试 题的过程,其目的在于挑选最佳的试题,组成质量较高的试卷,从而提高试卷 质量、考试质量,充分发挥考试对教学过程进行调节控制和掌握教学平衡的作 用【2 】o 目前大多数高等院校试卷分析工作仍以手工方式进行为主,教师及分析人 员的工作强度大,且试卷分析涉及到教育评价和教育测量中的许多方法、技术 及教育统计学的知识,对于不同专业的教师,要完全掌握这些知识并在教学实 践中加以应用具有一定的难度。尽管高校教务部门极力提倡对试卷进行恰当合 理的分析,但由于缺乏相应的软件支持,试卷分析工作难以真正开展。在实际 教学过程中常常只注重应试者成绩的高低,忽略了对考试内容的科学性以及教 学效果的评判。如中国医科大学对1 0 9 所医学院校课程考试情况的调查显示: 1 0 的院校按教育目标分类学指导命题;2 6 6 的院校建立了各学科考试命 题大纲,许多院校课程考试命题完全由教研室负责,教研室则交由授课教师按 教学“讲什么,考什么”,考试质量得不到保证;对试题进行难度分析的院校 占5 7 ,区分度分析的仅占4 3 ;对试卷进行有效性分析的院校占3 3 ,可靠 性分析的占3 7 ;有3 0 的院校建立了试题库;运用电子计算机管理考试的 ( 如阅卷、题库、考试分析等) 的院校仅占2 2 ;大部分院校比较重视分数在 学生升、留级上的作用,忽视考试在教学反馈上的作用;一些院校考试分数 贬值,绝对分数偏高等。p j 基于以上描述可以看出,要评价试卷的科学性就要借助于试卷分析这一科 学的手段。只有反复不断地对试题和试卷进行校验,才有可能使教育测量的工 具趋于准确,只有测量工具符合科学性,测量结果才会有意义。试卷分析还可 反映出教学中存在的问题,并将它们及时地反馈给教师。只有科学的考试考核 内容,再加上应试者的成绩,两者相结合才能为教育决策者提供教育管理决策 第l 章引言 依据和对人才科学的选拔评价。 1 2 研究意义和作用 试卷分析软件,是应用教育测量学原理和数理统计方法对考试结果进行分 析。它不但要反映其对教学内容、教学效果和应掌握知识的分析、理解、吸收 和运用能力,更要反映教师对教学内容的把握和熟练程度。结合我校的实际情 况,对试卷进行科学、客观的评价分析,可对优化教学内容,改革教学方式, 把握教学重点,提高教学质量,加大对考试的管理力度,具有重要意义。( 1 ) 分析试卷可以发现教学工作中存在的问题与不足,进而促进教学工作的改革。 通过试卷分析,教师既可以找出教学工作中带有普遍性的问题,又可以发现学 生学习过程中出现的个别性问题,并及时地在教学中加以反馈与调节,以便更 有效地因材施教,从而不断地对教学工作进行改进。( 2 ) 分析试卷是为了评价 考试质量。通过对考试信度、效度等试卷分析项目指标的分析,进而评价考试 质量。只有有效而可靠的考试,其结果才能作为评价教学质量或衡量个人学习 情况的依据。( 3 ) 分析试卷是为了保证今后的考试工作加科学化。通过对试题 难度和区分度的分析,决定试题的取舍,从而为试卷设计、题库建设提供可靠 的依据,使试卷设计和题库建设更加科学化,进而发挥考试的导向作用。( 4 ) 将计算机技术应用于试卷分析中,可提高效率和精度【4 j 。 试卷分析涉及到的公式繁杂,数据繁多,计算量大,如果单纯采用手工计 算,既要花费大量的时间,又难以保证分析结果的准确。目前计算机技术已广 泛应用于教学的各个领域,因此运用根据教育测量学原理开发的试卷分析系统 是十分必要的,这样,不仅提高了工作效率,而且提高了计算的精度,为教育 教学工作提供有效的工具。 1 3 教育测量学国内外发展现状 1 3 1 国外教育测量学发展概述 教育测量于2 0 世纪3 0 年代在美国兴起,而实验心理学和心理测验的发展 推动了教育测量的发展。1 9 0 4 年,被誉为教育测量之鼻祖的美国心理学家桑代 2 第1 章引言 克,出版了心理与社会测量( m e n t a la n ds o c i a lm e a s u r e m e n t s ) ) ) 一书,该书首 次系统介绍了统计方法和编制测验的基本原理,教育测量由此走上科学化的道 路。随着系统工程学的发展,许多科学家用系统论、信息论的观点描述教育评 估。到了2 0 世纪4 0 年代,教育测量进入了发展的顶峰时期,5 0 年代以后转向 稳步发展阶段,此期称为经典教育测量理论发展时期。2 0 世纪中叶,项目反应 理论( i t e mr e s p o n s et h e o r y 简称i r t ) 由丹麦学者拉什( g e o r g er a s c h ) 提出 ( h e n n i n 9 1 9 8 7 :1 0 4 ) ,并建立了第一个项目反应模型,它以其完全不同于经典测量 理论的新概念、新策略,使人们能够测量潜在的心理特质并预测未来行为。到 6 0 7 0 年代,由于计算机的广泛运用与普及,相继出现了一些项目反应理论的研 究论文。系统而复杂的项目反应理论文献近几年才被列入教科书,使之成为当 前语言测试学领域内极为引人瞩目的理论。它的出现,打破了经典测试理论一 统测量领域的格局导致了语言测试领域的全新变化。p m j 1 3 2 国内教育测量学发展概述 辛亥革命后,教育测量学随着西方的科学技术被引进我国。1 9 1 8 年,俞子 夷根据桑代克书法量表的编制程序,编制了小学国文毛笔书法量表,开 创了我国教育测量编制的先河。1 9 1 9 年,廖世承和陈鹤琴在南京高等师范学校 讲授测验,为我国高校设置测验课程之始。1 9 3 1 年中国教育测验学会在南京成 立,抗日战争爆发后,中央大学西迁重庆。全国各高校教育学系和中等师范学 校开设了教育测量或心理与教育测量的课程。1 9 4 9 年到1 9 7 8 年之间的3 0 年, 由于受原苏联教育理论的影响,教育测量学遭到否定。自从1 9 7 8 年党的十一届 三中全会召开以后,教育和心理测量重新开始受到重视。随后,教育测量学被 列为高校教育系的必修课。1 4 5 j 1 9 8 8 年,经中国教育学会批准,中国教育学会教育统计与测量研究会正式 成立,由张厚粲任第一届理事长,叶佩华任名誉理事长。1 9 8 8 年,我国正式加 入国际教育成就评价协会( i n t e r n a t i o n a la s s o c i a t i o nf o re d u c a t i o n a la s s e s s m e n t , i a e a ) 。可以说,1 9 7 9 年以来的3 0 年中,我国的教育测量学的教学与研究工作 者以优良的成绩,使教育测量学在教育科学领域中占据了重要的一席。是教育 评价研究专业化和实践活动制度化发展时期。1 9 9 0 年1 1 月和1 9 9 1 年4 月,原 国家教委分别发布了普通高等学校教育评价暂行规定和教育督导暂行规 定,使中国教育评价理论研究和实践活动进入了个新的阶段,即逐步正规地 第1 章引言 开展教育评价工作,提高教育管理水平。在这个阶段,一是初步建立了教育评 价制度,为在全国正规开展教育评价工作提供7 n 度保证。 6 , 4 6 】 1 9 9 3 年2 月中国教育改革和发展纲要颁布,对教育评价的地位、作用 有了明确的规定,推动中国教育评价的理论研究走向深入;二是建立了全国性 的教育评价研究组织,为在全国进行教育评价研究和实践提供了组织保证;三 是国内外学术交流、研讨活动增多,教育评价研究成果层出不穷;四是国内部 分高等学校已开始培养教育评价研究方向的硕士生和博士生。1 9 9 4 年7 月2 9 日, “高等学校与科研院所学位与研究生教育评估所”成立,推动了教育评价理论 研究和实践的进一步结合,也促使教育评价理论研究不断深入。嗣后,我国教 育评价在反思历史、重建秩序、除旧布新的改革实践中,从引进和介绍海外的 教育评价理论成果开始,逐步进入创建中国特色教育评价理论的持续发展时期。 愈来愈多的教育工作者认识到教育测量的重要作用,积极参加标准化改革试验。 师范院校和教育学院也恢复开设教育测量学课程,而作为教育测量的最主要的 内容:试卷分析研究成为了关注的焦点。 从收集到的文献资料可以得出,我国教育测量学的研究目前处于实践应用 阶段,试卷分析实践的理论基础以经典教育测量理论为主,对测试进行两项研 究:试题的难度和区分度分析以及试卷的信度和效度分析。 1 3 3 医学教育测量学发展概述 目前为止,国内外的医学教育测量研究基本沿袭了普通教育测量的发展轨 迹,现代测量理论在医学教育测量中还鲜为应用。这与医学教育测量的发展滞 后不无关系,同时也与过分强调测量对象一医学知识与技能的独特性互为因果。 但各国医学教育测量工作者结合医学领域的特点,在如何科学、客观、公正地 测量医学生的知识与技能方面己进行了许多深入探索。 医学教育测量的主要对象是医学生,主要内容是医学基础与临床的知识和 技能。医学教育测量沿着传统教育测量运动所走过的历程,依靠以多选题为主 要特征的标准化考试提高了测量的效度和信度。5 0 年代初,医学教育测量领域 中出现了两种具有医学特色的测量技术标准化病人( s p ) 和客观结构临床考 试( o s c e ) 。这两种方法是标准化测量与医学领域特色相结合的产物。临床技能 考试正日益被重视,伴随而来的实施与统计问题成为关注焦点。现在,部分国 家的医学考试机构正在设计和实施将临床技能测量纳入医学生考试和医师执照 4 第1 章引言 考试。在美国纽约中华医学基金会( ( c m b ) 的资助下,华西医科大学、浙江医科 大学和九江医学专科学校,正在开展这方面的实验研究。此外,由于医师和护 士执业考试具有典型的标准参照特性,所以,国内外医学考试机构正在努力探 索标准参照的理论与方法。1 7 - 1 3 j 目前,我国的医学教育测量研究仍处于探索阶段,现代教育测量理论的应 用,也只是在国家级医学考试中有所涉及。我国引用教育测量理论于医学考试, 始于1 9 8 2 年的全国部属高等医学院校应届医学毕业生统一考试,这是我国医学 教育领域开展标准化测量的最早尝试。此后实施的多种全国性医学考试( 如医学 研究生入学综合考试、成人教育考试、全国卫生系统外语水平考试、全国护士 执业考试等) 均是以考试测量理论和医学统考实践为基础,参照国外医学教育测 量的模式和经验进行的。与此同时,各级医学院校和专业考试机构也进行了许 多卓有成效的研究。如中国医科大学的“认知领域评价研究”。国内十余所高等 医学院校参加了临床医学专业综合考试,该项研究引用美国医师执照考试的模 式与方法,在科学命题、程序管理、题库建设等方面进行了有益尝试;浙江医 大、华西医大和九江医专进行了临床技能考试的专项研究,他们利用多站考试、 标准化病人等方法,积极探索临床技能的标准化测量:国家医学考试中心依靠 其专业优势,针对全国护士执业考试的性质与特点,进行了标准参照的统计分 析模式、确定分界分数、考务管理程序化、国家医师执照考试的教育测量学基 础研究。这些研究为推动我国医学教育测量事业的发展做出了积极贡献。 1 4 医学院校试卷分析研究现状 目前,大多数学校的试卷分析工作仍以手工方式进行为主,当考生数量较 大时,试卷分析的工作量极大,加重了教师及分析人员的劳动强度;而且,试 卷分析涉及到教育评价和教育测量中的许多方法、技术及教育统计学的知识, 这对于不同专业的教师,要完全掌握这些知识并在教学实践中加以应用具有一 定的难度。尽管教务部门极力提倡对试卷进行恰当的分析,但由于缺乏相应的 软件支持,试卷分析工作难以真正开展【1 4 4 7 】。在试卷分析软件方面,国内已有的 一些考试分析软件由于多为其他系统所附加的功能,从而被集成在另外某一软 件内,如国家基础医学试题库附带的试卷分析软件,界面不够友好,原始数据 录入后更改困难。周洪建等人用d e l p h i 开发考试成绩管理系统和试卷分析系统, 第1 章引言 难度、区别度计算使用两端法,有人会丢失可利用的数据信息等缺点副。另外 再加上软件价格高昂等原因,这些软件未能为教研室所使用。如果利用s p s s 、 s a s 等权威统计软件,则需要教师有熟练的计算机应用基础和使用s p s s 或s a s 统计软件的能力,而且相当费时费力,这些都不是普通的教研室教师都能够做 到的【1 6 l 。其它如李盛瑜的用o f f i c e 9 7 设计试卷分析模板【2 6 】,史群伟等人 的考试分析9 9 在教育测量学中的应用,虽然可以借助于e x c e l 中的函数 ( 如s u m 、c o u n t 、c o u n t i f 、a v e r a g e 、m a x 、m i n 、s t d e v 、f r e q u e n c y 等) 或w o r d 等办公软件来改变统计计算和填写方式,但对教师的计算机应用水 平要求较高,功能不完善,未能将这些函数集成起来,需要使用者具有熟练使 用m i c r o s o f te x c e l 的能力,而且使用时较为繁琐【9 l m 。 试卷分析软件的缺乏或不够便捷成了试卷分析这项工作难以全面规范展开 的主要原因之一,因此有必要研制一个适合我校各教研室的、易学易用的试卷 分析软件。 1 5 研究内容 本文基于数据统计原理,结合教育测量与评价的有关理论方法,研究其在 计算机系统中的实现,同时根据高等医学院校的实际需求 4 引,选取相应测量指 标,开发试卷分析系统,主要内容包括: ( 1 ) 简单介绍教育测量统计的基本理论。 ( 2 ) 用教育测量学的理论和现代教育统计方法,通过对其他考试的成绩统 计分析方法对比和总结研究,确定本系统的结果统计分析方法,筛选出该考试 结果的统计分析项目和内容,并探讨其计算机算法的实现。 ( 3 ) 提出使用标准分、加权平均分、优化的z 2 拟合检验法和s - p 表评价分 析法对试卷和成绩数据进行更深入分析,并探讨其计算机算法的实现。 ( 4 ) 探讨以p o w e r b u i l d e r 9 和s q ls e r v e r 2 0 0 0 数据库为工具建立c s 结构 的试卷分析系统。并结合我校各教研室的实际使用状况,实现考试成绩的录入、 成绩批量导入、多班级课程合并分析、各班级考试成绩和试卷试题的科学分析、 教学效果评价、分析图表和数据表打印等多项功能。 ( 5 ) 随机抽取- - i - j 课程试卷,使用该系统对考核质量以及该课程的教学效 果进行定量分析,得出科学详实的信息,从而为分析教学活动中存在的问题、 6 第l 章引言 教学管理和组织提供科学的依据。 1 6 研究方法 本系统采用计算机软件开发技术中先进的异构构件实现,其中采用 c l i e n t s e r v e r 结构实现数据的管理和维护。前台开发工具使用p o w e r b u i l d e r 9 ,后 台数据库使用s q ls e r v e r 2 0 0 0 。采用原型法确定业务实现模型,软件经过分析设 计实现后要经过单元测试、系统测试、验收测试,在各项测试成功后,再应用 到学校各部门。 1 6 1 软硬件环境 ( 1 ) 开发工具 c s 结构开发工具:s y b a s ep o w e r b u i l d e r 9 ( 2 ) 开发及运行环境 网络环境: 运行于用t c p i p 协议组建的校园网:部分用户通过i n t e m e t 访问。 计算机硬件: 普通个人计算机( 推荐配置:c p u :p 4 以上,内存:5 1 2 m 以上) 操作系统:w i n d o w s x p w i n d o w s 2 0 0 0 w i n d o w s 2 0 0 3 数据库:s q ls e r v e r2 0 0 0 服务器:w i n d o w s 2 0 0 0s e r v e r 浏览器:i e 5 0 及以上 1 6 2 可行性论证 无论从理论技术等可行性方面分析,还是从经济和社会可行性方面进行分 析,开发本系统是切实可行的。 ( 1 ) 理论可行性 本系统开发主要基于发展至今相对比较成熟的教育测量学和统计学理论知 识,具有较强的理论支撑。 ( 2 ) 技术可行性 现在网络技术和计算机技术发展迅猛,目前学校己有各种硬件、开发工具 7 第1 章引言 和数据库作为技术支撑,使技术可行性大为增强。开发人员有开发分布式网络 系统的经验,有多个开发软件应用。应用己有的网络编程技术和本学院的开发 环境就可以开发出试卷分析系统。 ( 3 ) 经济可行性 利用本校现有的校园网、计算机及配套设备就可使用本系统开展多种形式 的成绩录入及考试分析,无需购买专门设备;对系统的使用都是简单的操作, 无需进行专门的培训;系统实现的功能可以大大提高试卷分析效率,而且能为 学校教育评估改革做出较大贡献;软件系统在导师的指导下自行开发,所需经 费很低。 ( 4 ) 社会可行性 社会可行性研究是对系统投入使用后对社会可能带来的影响进行分析。本 系统建成后,一是可以提高在校教师及教务管理人员的工作效率,二是可以对 学生进行更加客观公正的评价,三是可以为以后的教学提供决策支持。 1 6 3 资料来源 ( 1 ) 图书馆及书店的各种相关书籍。 ( 2 ) 我校图书馆远程安全访问系统中的论文库。 ( 3 ) i n t e r n e t 上国内外相关网站和论坛。 1 6 4 技术路线 本课题以试卷分析为主线,主要是对试卷进行定量分析。研究的技术路线 如图1 1 所示。 8 第1 章引言 图1 1 研究技术路线 9 第2 章试卷分析相关理论基础及核心技术 第2 章试卷分析相关理论基础及核心技术 2 1 经典测量理论 近代工业社会造就了经典测量理论,为“权、度”心理现象奠定了科学基 础。迄今为止,经典测量理论在我国心理计量和教育测量领域中仍被广泛应用, 目前我们对教育范畴中心理现象的认识,基本上都是建立在经典测量理论的基 础之上。本世纪中叶,项目反应理论( i t e mr e s p o n s et h e o r y 简称i r t ) 初露端 倪,并建立了第一个项目反应模型,它以其完全不同于经典测量理论的新概念、 新策略,使人们能够测量潜在的心理特质并预测未来行为。i r t 理论的应用,将 会对大规模教育测量的统计和评价带来深刻影响,并使我们能够比前人更准确 地描述和评估心理现象。 以上所说经典测量理论和项目反应理论都是指教育测量的统计理论,而任 何一种统计理论只有与测量内容相结合才有意义。实际上,测量内容和统计理 论是教育测量系统当中的两个子系统,它们相互依存又相互作用。通常情况下, 统计模式一经建立,其运作是相对稳定的,而测量内容则往往处于经常变化的 状态之中,这主要反映在测试目标与统计数据的关系上。因此,确定合理的测 量内容,建立科学的测试目标,是取得有效性、可信性统计的前提,也是充分 利用先进统计系统的基础。 经典测验理论的理论基础是真分数理论,其基本思想是把测验的得分( 通常 称为测验的观测分数) 看作真分数和误差分数的线性组合,可归结为如下简单的 数学模型:x = t + e 。其中x 是观测分数,t 是真分数, e 是误差分数。传统的 测验信度、效度、项目分析的原理与方法均建立在这一模型之上。经过了近百 年的发展,经典测试理论建立了一系列项目分析的指标,包括平均分( m e a n s c o r e ) 、标准差( s t a n d a r dd e v i a t i o n ) 、难度( d i f f i c u l t y ) 、区分度( d i s c r i m i n a t i o n ) 、信 度( r e l i a b i l i t y ) 和效度( v a l i d i t y ) 等。1 2 2 , 4 5 | 2 2 教学效果分析与评价指标 2 2 1 考生成绩总体特征分析 1 0 第2 章试卷分析相关理论基础及核心技术 2 2 1 1 初步分析 将学生成绩从高到低排序,并按分数段统计出各段的学生人数,并计算出 最高分、最低分、及格人数、不及格人数、优秀人数、优秀率、及格率、不及 格率等。同时给出各题的满分值。 2 2 1 2 总体水平与分布特征分析 ( 1 ) 算术平均数 算术平均数( a r i t h m e t i ca v e r a g e ) ,一般简称为平均数( a v e r a g e ) 或均值 ( m e a n ) ,是用得最多的一种集中量数。所谓集中量数是指反映分数集中位置这 个特征的数值,它代表一批分数,反映一批分数的典型情况,因此常用它进行 不同分数组之间的比较。集中量数的形式有多种,如算术平均数、中位数、众 数等,算术平均数则是最常用的一种。如果组分数分别用x l ,x 2 ,x n 表 示,则这组有n 个分数的分数组的平均分( x ) 为公式2 1 : i x , x = 刍卫 玎 ( 式2 。1 ) 算术平均数具备一个良好的集中量数应具备的一些条件。平均数能够反映 总体的综合特征。但在统计中,科学计算和运用平均数只有严格遵循以下原则, 才能正确发挥它的作用1 2 引。 ( a ) 同质性原则作为统计分析的重要手段,平均数只有在总体是由同类 数据所组成且有足够多的数据单位时,才具有科学价值和认识意义。不同质的 数据不能计算平均数。 ( b ) 平均数作为整个总体的综合特征,它能够用一个抽象的代表数值反映 客观事物的一般水平。但一个总体是由若干个千差万别的个别事物构成的。若 要全面而正确地认识这些客观事物,仅仅靠平均数是不够的。就整个总体来说, 差别会相互抵消,它往往会淹没个体之间的差异,但就个体说却不是这样。如 果过分看重平均数,就可能造成损失。 ( c ) 平均数与标准差、方差相结合原则平均数和标准差是用来描述数据 总体特征的一对相互联系的统计指标。平均数表现反映的是总体数据的集中趋 势。但平均数对于总体数据一般水平的代表性如何,要看各个数值之间差异的 大小。数据差异大;平均数的代表性就小;差异小,平均数的代表性就大,当 差异为零时,平均数就具有完全代表性。各个数值之间差异大小是通过标准差 第2 章试卷分析相关理论基础及核心技术 和方差来描述的。标准差和方差反映总体的离中趋势,标准差越大,平均数的 代表性就越小:反之,平均数的代表性就越大。1 2 3 - 2 4 , 4 5 1 ( 2 ) 中数 中数( m e d i a n ) ,又称中点数,中位数,中值,符号为m d 或m d n 。中数是 按顺序排列在一起的一组数据中居于中间位置的数,即在这组数据中,有一半 的数据比它大,有一半的数据比它小。中数是集中量数的一种,它能够描述一 组数据的典型情况。计算方法如下: 设有f m d ( 中数所在那一分组区间的数据个数) 个数据均匀地落在距离为i 的 上伴一凡 区间内,那么每个数据各占i f m d ,那么至n 2 这一段距离为知l 2 ,再 加上该区间的精确下限值,就得到了中数值,见公式2 2 : 型一凡 m d = l b + 兰_ 一f ( 式2 2 ) j m o 式中,l b 为中数所在分组区间的精确下限,f b 为该组以下各组次数的累加 次数,i 为组距。1 2 3 - 2 4 】 ( 3 ) 众数 众数( m o d e ) ,又称为范数,密集数,通常数等,常用符号m o 表示。众数 是指在次数分布中出现次数最多的那个数的数值。计算方法有直接观察法和公 式法。直接观察法很简单,就是只凭观察找出出现次数最多的那个数据就是众 数。用公式计算的众数称为数理众数。应用较多的是皮尔逊经验法和金氏 ( w i k i n g ) 插补法。 皮尔逊经验法 皮尔逊研究了平均数、中数、众数之间的关系,发现三者之间的经验关系 为:m 与m d 的距离,占m 与m o 之间的三分之一,而m d 与m o 占三分之二, 即: m - m d :一1( 式2 3 ) 一= 一 儿二j , m m o3 由上式可导出m o - - - 3 m d - 2 m 用皮尔逊经验法这个公式计算的众数,只能作为一个近似值,它不受次数 1 2 第2 章试卷分析相关理论基础及核心技术 分布的影响,也只能在分布接近正态的情况下应用。 金氏插补法 上f m 0 :l b + + 弘 ( 式2 4 ) 式中,l b 为含众数这一区间的精确下限;厶为高于众数所在组一个组距那 一分组区间的次数;矗为低于众数所在组一个级距那一分组区间的次数;i 为组 距。金氏插补法适合次数分布比较偏斜的情况,比较接近正态的分布也适用。 1 2 3 2 4 】 ( 4 ) 全距 全足f _ ( r a n g e ) s l 称两极差,它是说明数据离散程度的最简单的统计量。全距是 一群数据中最大值与最小值之差,它指的是两个极端值间的全部差距,常用符 号r 表示。它的计算公式为: r = x m a x x m i n ( 式2 5 ) 如果全距r 比较大,说明考生的考分差异较大,如果r 比较小,则说明考 生的考分比较集中,在这样的状况下,如果能够再就试题的平均得分进行对比, 就能很容易地了解全体考生该知识点掌握的水平高低。但很粗糙和不可靠。一 般情况下主要用于对数据作预备性检查,了解数据的大概散布范围,以便确定 如何进行统计分组。 2 3 - 2 4 , 4 5 】 ( 5 ) 组距与分组数 在分组整理统计量数时,组的大小可因系列内量数的全距及所要划分的组 数的不同而有所不同。每一组的最小限度叫做下限,最大限度叫做上限。下限 和上限之间的距离,即为组距。 要确定组距先要确定组数。一组数据分多少组合适一般与数据本身的特点 及数据的多少有关
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 模具设计总结规划
- 职业院校网络信息安全防护实施方案
- 客户满意度调查方案
- 企业人力资源招聘流程模板人才选拔支持版
- 田园风光美景的作文11篇
- 小学语文古诗词背诵与教学方案
- 民办小学招生宣传方案与执行标准
- 个人信用账户安全承诺函9篇
- 肿瘤学科建设与发展实践思考
- 小升初全真模拟测试卷
- 《数据库原理及应用(第二版)》课件 盛志伟 第1-5章 数据库概论-SQL语言
- 大米先生公司管理制度
- 2025年4月自考02204经济管理试题及答案
- 高考英语一轮专项复习:高考试题中的熟词生义(含解析)
- 吸痰护理课件
- 部编版四年级上册语文大单元教学设计范例
- 第三单元整体阅读之人物篇 统编版高中语文选择性必修上册
- 高二上学期第一次月考物理试卷(附答题卷和答案)
- 教育培训机构合作培训协议
- 2025年广东省春季高考学业水平考试数学试卷试题(含答案解析)
- 枫蓼肠胃康胶囊与其他肠胃药的协同作用研究
评论
0/150
提交评论