(教育技术学专业论文)基于bs架构的小学数学自适应测评系统研究.pdf_第1页
(教育技术学专业论文)基于bs架构的小学数学自适应测评系统研究.pdf_第2页
(教育技术学专业论文)基于bs架构的小学数学自适应测评系统研究.pdf_第3页
(教育技术学专业论文)基于bs架构的小学数学自适应测评系统研究.pdf_第4页
(教育技术学专业论文)基于bs架构的小学数学自适应测评系统研究.pdf_第5页
已阅读5页,还剩85页未读 继续免费阅读

(教育技术学专业论文)基于bs架构的小学数学自适应测评系统研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

山东师范大学硕士学位论文 ii 单 位代单 位代码码 10445 学学号号 2007020236 分 类分 类 号号 g434 硕 士 学 位 论 文 论 文 题 目 基于 b/s 架构的小学数学自适应 测评系统研究 学科专业名称 教育技术学 申 请 人 姓 名 姜艳 指 导 教 师 马池珠 教授 论文提交时间 2010 年 4 月 25 日 独独 创创 声声 明明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。 据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写 过的研究成果,也不包含为获得 (注:如没有其他需要特别声明的,本 栏可空)或其他教育机构的学位或证书使用过的材料。与我一同工作的同志对本研究所做 的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名: 导师签字: 学位论文版权使用授权书学位论文版权使用授权书 本学位论文作者完全了解 学校学校 有关保留、使用学位论文的规定,有权保留并向国 家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权 学校学校 可 以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等 复制手段保存、汇编学位论文。 (保密的学位论文在解密后适用本授权书) 学位论文作者签名: 导师签字: 签字日期: 年 月 日 签字日期: 年 月 日 山东师范大学硕士学位论文 - 1 - 目目 录录 摘要 . i abstract . iii 第一章 绪 论 . 1 1.1 问题提出 . 1 1.2 相关概念界定 . 2 1.2.1 c/s 与 b/s 架构 . 2 1.2.2 自适应测试 . 3 1.3 相关研究综述 . 3 1.3.1 学科教育测验项目的研究 . 3 1.3.2 自适应测试系统方面的研究 . 7 1.4 研究目标与意义 . 9 1.4.1 研究目标 . 9 1.4.2 研究意义 . 9 1.5 研究内容与方法 . 10 1.5.1 研究内容 . 10 1.5.2 研究方法 . 10 1.6 论文结构 . 11 第二章 基于 b/s 架构的小学数学自适应测评系统的研究基础 . 12 2.1 研究的理论基础 . 12 2.1.1 教育测量学概述 . 12 2.1.2 经典测量理论 . 13 2.1.3 现代测量理论项目反应理论 . 16 2.2 小学数学学科体系分析 . 24 2.2.1 课程标准 . 25 2.2.2 学科内容体系整理 . 26 第三章 基于 b/s 架构的小学数学自适应测评系统的流程原理 . 28 3.1 参数估计 . 29 3.1.1 条件极大似然估计 . 32 3.1.2 联合极大似然估计 . 34 3.1.3 贝叶斯估计 . 37 3.2 题库建设 . 38 3.2.1 试题收集 . 38 3.2.2 试题参数的获取 . 40 3.3 题目选择策略 . 45 山东师范大学硕士学位论文 - 2 - 3.3.1 近似选题法 . 45 3.3.2 最大信息量选题法 . 45 3.3.3 新型选题策略 . 45 3.4 测试终止条件 . 46 第四章 基于 b/s 架构的小学数学自适应测评系统的设计 . 47 4.1 系统的需求分析 . 47 4.1.1 需求获取 . 47 4.1.2 分析建模 . 47 4.2 系统的软件设计 . 54 4.2.1 系统的层次结构设计 . 54 4.2.2 系统的总体模块设计 . 55 4.3 系统的数据库设计 . 56 第五章 基于 b/s 架构的小学数学自适应测评系统的实现 . 59 5.1 开发技术简介 . 59 5.2 系统实现界面展示 . 59 第六章 研究总结 . 63 6.1 研究成果 . 63 6.2 存在问题 . 63 6.3 未来工作 . 64 附录一 . 65 附录二 . 71 附录三 . 75 注 释 . 77 参考文献 . 78 攻读硕士学位期间发表学术论文目录 . 80 致 谢 . 81 山东师范大学硕士学位论文 i 基于 b/s 架构的小学数学自适应测评系统研究 摘要 现代信息技术的发展日新月异, 极大地推动了教育现代化和教育改革进程。 小学学业测评作为基础教育的一个重要环节,已经成为教育改革的重中之重。 在课程改革的推动下,传统测验形式的局限性日益凸显,过于强调最终的成绩 分数,与全面推进素质教育的要求不相适应。基于此,山东省教育厅推出重点 科研项目“基于网络的小学学习智能化诊断与提升系统的开发与应用研究” ,目 的就在于设计实现一个集学业测试、 个性化诊断和能力提升于一体的测评系统, 并首先以语文和数学学科作为试点。本文作为该项目的一个分支,针对小学数 学学科,采用自适应测试的思路对学业测试模块的实现进行相关探索研究。 目前普遍实施的测试都主要以经典测量理论为基础,通过纸笔的方式对所 有的被试实施相同的题目,其中以中等难度的题目居多,没有考虑到学生能力 水平的差异。这种测试对于较高水平和较低水平的被试缺乏一定的区分度,不 能准确测出他们的能力水平。计算机自适应测试(computerized adaptive test, 简称 cat)则解决了这个问题,它在测试的过程中根据被试的表现动态抽取不 同的题目, 在相对较短的时间内掌握被试的学业掌握情况, 实现了 “因人施测” 。 目前 cat 在国外应用比较广泛, toefl 和 gre 都采用 cat 方式实施考试, 在 国内才 cat 还基本处于实验阶段, 应用规模较小, 相关研究还有待进一步加强。 本文在介绍 cat 发展现状的基础上,深入研究了 cat 的理论基础项 目反应理论,重点分析了 cat 实现的原理和流程,主要包括项目反应模型的选 择、参数估计、目标题库建设、题目选择策略和测试终止条件等环节。其中参 数估计是重点也是难点, 本文主要采用了极大似然估计法实现被试能力的估计, 相关的方法实现也是本文的研究重点。在此基础上,与学科教学专家进行了深 度交流, 深入研读义务教育 数学课程标准 , 分析并整理相应的数学知识体系, 同时收集了关于小学数学四年级上册第三单元三位数乘两位数的 22 道题目 作为实验题库。在所有前期工作完成之后,开始进行相关系统设计和数据库设 计,采用 asp.net 技术和面向对象的程序设计方法完成了系统原型的设计并初 步实现了自适应测试功能。文章最后总结了研究中出现的问题并指出未来的研 山东师范大学硕士学位论文 ii 究方向。 【关键词【关键词】b/s 架构;计算机自适应测试;项目反应理论;小学数学;参数估 计;信息函数 【分类号【分类号】g434 山东师范大学硕士学位论文 iii research on b/s frame-based computerized adaptive test system on mathematics of elementary school abstract the development of modern information technology has altered from day to day , which has promoted the process of education modernization and education reformation tremendously. being an important part of elementary education, elementary achievement evaluation has become very important in the process of education reformation. under the promotion of the course reform, the limitation of traditional test has become obvious.traditional test emphasizes the ultimate achievement fraction excessively, which is not adapted to the demand of pushing forward quality education comprehensively. owing to this basis, the shandong province department of education promote a scientific research item ” research on the exploitation and application of the web-based intellectualized diagnose and hoisting system on elementary school”,with the purpose of designing and realizing an evaluation system integrated with achievement test, personalized diagnosis and ability hoisting.the system will be an experimental unit first with chinese and mathmatics discipline.as a branch of this research item, this paper mainly focuses on the research of mathmatics achievement test module adopting the way of computerized adaptive test. at present, most kinds of test used in common is supported by classical testing theory,which using paper and pen as instruments.all examinees are tested by the same items, most of which are medium degree of difficulty without the consideration of the examinees ability difference.this conventional way of test lacks the differentiation degree towards examinees with high and low ability levels, and it is unable to accurately measure out their precise ability level. computerized adaptive test( being called cat for short) has resolved this problem.it automatically takes out different examination questions in the process of testing according to the 山东师范大学硕士学位论文 iv different behaviours of examinees. testing usually consumes less time but has more credible result.as a result , different examinee has different test content. nowdays cat is widely used in foreign countries, such as toefl, gre and so on, they all adopt the cat way to put the test into practice.but cat is only in the experiment stage in the homeland, and the application scale is very small.some related study remain to be reinforced further. on the basis of general introduction of the cats present situation, this paper goes deep into the item response theory,which is the basic of the cat system.the author mainly concentrate on studying the principle and technological process of cat, including the choice of the item response model, parameters estimation, item bank construction, item-selecting method, test-terminating conditions and so on.that the process of parameters estimation is the most important and difficult part. the paper has adopt maximum likelihood estimation to finish the estimation of examinees ability, which is also the most important research part of this paper.on the basis of the content studied above, the author has deeply communicated with the teaching expert, deeply researched “mathematics course standard” of compulsory education, analysed and arranged the corresponding mathematics knowledge hierarchy. then the author have collected 22 examination questions of unit 3 “three-digit number takes advantage of that two-digit number” of the elementary school mathematics four grades first volume.after all of these work been done, the author began the design of the system and database, then adopted the asp.net technology and object-oriented programming method to accomplish system prototype and realized the function of cat.in the end, the paper has summed up the the problem appearing in the research and pointed out the direction of future study. 【key words】 b/s frame; computerized adaptive test; item response theory; elementary school mathematics; parameter estimation; information function 【category code】g434 山东师范大学硕士学位论文 1 第一章 绪 论 1.1 问题提出 随着现代信息技术的发展,人类正步入一个以因特网为标志的网络化、信 息化的时代,信息已成为社会发展至关重要的资源,成为推动社会进步、经济 和科技变革的动力之一,信息技术在教育行业的应用成为教育现代化发展的基 本趋势。教育部颁发的基础教育课程改革实施纲要(试行) 指出: “大力推 进信息技术在教学过程中的普遍应用,促进信息技术与学科课程的整合,逐步 实现教学内容的呈现方式、学生的学习方式、教师的教学方式和师生互动方式 的变革,充分发挥信息技术的优势,为学生的学习和发展提供丰富多彩的教育 环境和有力的学习工具” 。 小学学业成就测评作为基础教育中的一个重要环节,也是基础教育测评改 革的重中之重,同样受到了信息技术发展的巨大冲击。在课程改革的推动下, 传统测验形式的局限性在新课程改革所倡导的多元化评估方式中日益凸显,现 行的评价制度与全面推进素质教育的要求不相适应,出现了诸如测验评价指标 单一,忽视学生的全面发展和个体差异,过于强调最终的成绩分数等传统应试 教育的极端化倾向。此外,目前基础教育领域普遍实施的测试都是通过纸笔的 方式对所有的学生都实施同样的题目,其中以中等难度的题目居多,没有考虑 到学生能力水平的差异,这样对能力较强和较弱的学生就缺乏测试的区分度, 不能准确的测出每个学生的真实水平。鉴于以上情况,教育工作者们开始重新 审视传统的教育测评方式,以期能寻找一种更科学、客观、公平的教育测评方 式,真正发挥考试的作用,注重考试的诊断和补救功能,从而促进学生全面发 展。因此,利用飞速发展的信息技术开发适用于新课程标准的测验形式已经成 为目前基础教育课程改革特别是评价改革的重要课题。 综合上述现状,山东省教育厅科研项目“基于网络的小学学习智能化诊断 与提升系统的开发与应用研究”旨在开发一个集自适应测试、个性化诊断、能 力提升于一体的测评系统。本研究作为此重点科研项目的一个分支,主要以小 学数学四年级上册的课程为突破口,根据小学数学的学科体系特点,对相应的 山东师范大学硕士学位论文 2 数学知识和认知能力结构进行整理,同时在现代教育测量理论的指导下进行测 试体系的设计,从而开发简易的数学自适应测评子系统,充分发挥其诊断、引 导及促进教学的功能。 本文在文献分析和案例分析的基础上,在充分研究现代教育测量理论尤其 是项目反应理论的基础上,对自适应测试系统进行初步的设计与实现。 1.2 相关概念界定 1.2.1 c/s 与 b/s 架构 c/s 结构即 client/server(客户机/服务器)结构,是大家熟知的软件系统体 系结构, 通过将任务合理分配到 client 端和 server 端, 降低了系统的通讯开销, 可以充分利用两端硬件环境的优势。c/s 模式是一种两层结构的系统,如下图: 图 1-1 c/s 模式结构图 c/s 结构经过多年的应用研究,已经是一种非常成熟的技术。但采用 c/s 结构的系统应用范围一般局限在局域网内,而且必须安装客户端软件,平台依 赖性强,升级维护复杂。 b/s 是指 browser/server(浏览器/服务器),也称为 b/w/d(browser/web sevrer/database sevrer),是一种三层体系结构,由浏览器、web 服务器和数库服 务器组成,它主要是利用了不断成熟的 www 浏览器技术,结合浏览器的多种 script 语言(vbscript、javascript)和 actviex 技术,用通用浏览器就实现了原 来需要复杂专用软件才能实现的强大功能,并节约了开发成本,是一种全新的 软件系统构造技术,是目前网络应用系统的首选体系结构,结构如下图: 图 1-2 b/s 模式结构图 山东师范大学硕士学位论文 3 1.2.2 自适应测试 所谓自适应测试,是指根据每个被试的不同水平,对不同的被试实施不同 的测试项目,并使这些项目难度和被试的水平相适应,被试不必完成所有的项 目也能达到同样的测试目的。运用计算机进行的适应性测试称为计算机自适应 测试(computerized adaptive test, 简称 cat), 在这里计算机并不只是纸笔测验 的呈现工具,而是逐步转变成为一种测试工具。 传统的测试大多以经典测试理论(classical test theory)为基础, 在一次考试 中提供给所有被试的题目是相同的,而且都要在统一的规定时间内完成。相比 较而言,这样的考试针对性不强,不利于得到被试的真实水平,而且效率不高。 以项目反应理论(item response theory)为基础的计算机自适应测试坚持“因人 施测” 的原则,这恰恰是传统测试所欠缺的特质。每个被试在测试期间所接受 的题目以及测试的终止处都是各不相同的,能力高的被试接受难度较大的项目 比较多,能力低的被试接受难度较小的项目比较多,从而在相对较短的时间内 较准确地测出被试的能力水平,大大提高了测试效率。除此之外,自适应测试 提供给被试的题目都是与其能力相适应的,能够充分调动被试的积极性,而不 至于在测试过程中因遇到难度过低或过高的题目而感到无趣乏味或丧失自信。 1.3 相关研究综述 近年来,国内外有许多教育专家、心理测量专家从理论和技术等不同的角 度对学业成就测评、自适应测试等方面进行了深入的研究,本小节将主要从学 科教育测验、自适应测试系统的构建与开发这两个方面分析总结国内外的相关 研究成果。 1.3.1 学科教育测验项目的研究 迄今为止,国内外对学科教育测验项目都进行了较为深入的研究,涌现出 了很多具有先进理念的教育测验评估项目,尤其是西方发达国家,在这方面的 研究走在了前列。 1国外研究进展 目前,多数发达国家都有不同等级的教育评估项目,如第三国际数学与科 山东师范大学硕士学位论文 4 学研究(timss),国际学生评估计划(plsa)等。针对数学单科而言,测验包括 更多的项目,涉及的内容也更具体,具有更高的测试信度和效度,应用比较广 泛的有美国数学渐进成就测验(mmut)、澳大利亚数学渐进成就测验等。 第三国际数学与科学研究 (the third international mathematics and science study,简称 timss)于 1995 年由国际教育成就评估协会 (international assoeiation for the evaluation of educational achievement,简称 iea)主持,美 国波士顿学院 timss 国际研究中心设计和实施的一项教育研究, 当时共有 41 个 国家和地区的 50 多万名学生参与其中, 考察不同年级数学和科学学科的学业水 平,包括 4 年级、8 年级和初中的最高年级。2003 年,timss 更名为“国际数 学和科学趋势研究” (the trend of international mathematics and science study,timss),测试 4 年级和 8 年级学生数学和科学学科成就的发展趋势, 逐渐 注重对学生能力的考察。1 国际学生评估项目(program for international student assessment, 简称 pisa) 是由经济合作和发展组织(oecd)通过其教育理事会和成员国共同发起,目的在 于评估学生在接受义务教育接近结束时获得了多少为今后他们进入社会所必需 的知识和技能。pisa 于 2000 年在 32 个国家首次进行,对象是 15 岁的学生。 pisa 并不仅仅局限于测试学生能够复述多少他们学过的东西, 主要是测试学生 将他们所学的知识和技能用于迎接现实生活挑战的能力,即他们提出、解决与 解释各种实际问题时的分析、推理与交流的能力。此外,pisa 通过对学生的问 卷调查,了解他们的学习动机、学习自信心以及学习方法等等与终身学习有关 的能力。pisa 主要调查学生在阅读、数学和科学三个领域中的素养,从 2000 年起每隔 3 年进行一次,每次侧重于调查其中一个领域。就数学这一学科而言, pisa 主要测试的数学素养包括数学情境(situation)和背景(context)、数学内容 (包括基本数学思想、数量空间与图形、变化与关系、不确定性四部分) 、数学 方法(主要指解决实际问题的数学化处理方法)三个方面。在 pisa 测试中,采 用传统的纸笔测验方式,每一页设置一个问题单元,每个单元围绕某个现实生 活中的主题提出一个或多个问题,题型主要有选择题、判断题、填空题、简答 题和问答题。在题目的选择上,pisa 样题注重贴近实际生活情境,重视对数学 各门课程的综合考查和图表类型问题的考查,强调问题答案的多样性而不拘泥 山东师范大学硕士学位论文 5 于统一标准。2 现代数学理解测验3 (modern mathematics understand test,mmut),由美 国科学研究协会出版发行。主要适用于 l 至 9 年级的学生,了解其数学知识的 掌握程度。测验内容包括数学基本知识、操作与几何、测量三个领域,每一个 领域进一步分为知识与计算、初步理解、问题解决等内容模块。 基本数学诊断量表4(keymath revised:a diagnostic inventory of essential mathematics)由 the psychological corporation 出版发行。测验分为数学概念、 运算和应用三大块,适用于幼儿园至 12 年级。数学概念块主要有 3 个分测验: 整数、分数、几何和符号,主要测量基本的数学概念和知识。运算块有 6 个分 测验:加法、减法、乘法、除法、心算和数字推理。应用块有 5 个分测验:文字 题、补充、金钱、测量和时间。 asttle(assessment tools for teaching and learning,教学评估工具)5: 由奥克兰大学为新西兰教育部开发的一种教学测评工具,它以课程为基础,由 教师管理,学生自愿使用,是一种比较成熟的测评软件。asttle 工具能够使老 师评估 4 到 12 岁的使用英语和毛利语的学生在语言能力和计算能力方面的发 展,这个工具既能分析学生小群组的整体成就,也能分析学生个体的成绩。 asttle 的结构维度设置主要按照新西兰的课程门类进行设计,包括阅读、写作、 数学等六个课程内容。其中在数学部分主要包括八个大的内容领域数字知 识、数字操作、代数学、几何学知识、几何学的操作、测量、统计学和概率。 所有的 asttle 资源都被广泛验证过,然后被教师座谈小组以不同的课程目标和 其它重要维度进行分类。除了分析并报告课程成就和程序成就以外,还采用表 面和深度的认知理解观念构成学生成就报告。 以上列出了几个有代表性的与数学相关的学科测验项目,此外还有现代数 学理解测验(modern mathematics understand test,mmut)、数学渐进成就测验 (the progressive achievement tests in mathematics)、斯坦福数学诊断测验 (stanford diagnostic mathematics test)、 加州数学诊断测验(california diagnostic mathematics tests)等,这些测验都是依据一定的课程标准编制而成,深度融合 了本国的数学教学特点,适用于多个年级的学生使用,考查多个方面的数学能 力。 山东师范大学硕士学位论文 6 2国内研究进展 通过在清华同方 cnki 中国期刊网上查阅相关资料以及阅读相关书籍对国 内的学科教育测验项目有了大致的了解,具有代表性的如下: 以赵裕春为首的小学数学能力研究协作组从 1980 年就开始设计和编制小 学生数学能力测验6。该测验共有 6 套测试题目,每套都包括数的概念、数的 推理、空间关系三方面的内容,题型有选择题、填空题。测验在选题上注重题 目的难度设计,一般都是需要学生深入思考后才能解决的问题。 初中平面几何学业成绩评定研究协作组早在 1983 年就编制了上海市初中 平面几何标准测验7。该测验的题型有选择、填空、作图、简答、连缀、改错 六种格式。在测验的编制过程中参照布鲁姆教育目标分类

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论