




已阅读5页,还剩66页未读, 继续免费阅读
(计算机应用技术专业论文)基于数据挖掘的成绩管理系统的设计与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浙江i :业人学硕+ 学位论文 基于数据挖掘的成绩管理系统的设计与实现 摘要 随着网络技术特别是i n t e r n e t 技术的普及和发展,资源的利用由 传统应用转向基于i n t e r n e t w e b 的服务模式,因而大部分学校都应用 基于网络技术和计算机信息技术的学生成绩管理系统来进行学生成绩 管理。但现有成绩管理系统中,8 0 学生成绩数据是简单的存储,蓄含 在成绩中的潜在信息尚未被利用。 本课题的研究蕾要归结为如下:通过对成绩管理系统现状分析, 开发了台州职业技术学院临海校区成绩管理系统,方便教师成绩数据 提交,简化学生成绩查询。通过分析现有成绩管理系统中成绩数据实 现的不足,提出采用类字段来进行成绩数据管理,采用本文所使f 钉的 方法可以大大减少数据库中表的数量和记录的数量,加速系统的执行 效率,提高系统的查询速度。通过对成绩分析的相关研究,捉出应用 数据挖掘技术来进行学生成绩数据分析,提高成绩分析水平,然后通 过对决策树。ps l i q 算法研究,结合学生成绩数据特点,将s l i q 算法 应用剑学生成绩分析,构建专业能力决策树模型,让教师和学校教育 决策者洞悉教学中存在的j 、u j 题,从而利用成绩所提供的信息优化教育 教学的计划与决策。最后,对本文的:i = 作进行了总结并对研究前景进 行了展望。 浙江l 业人学硕十学位论文 关键词:成绩管理,类字段,成绩分析,数据挖掘,s l i q 浙江l :业人学硕+ 学位论文 t h ed e s i g na n di m p l e m e n 科r 1 0 n0 f s c o r em a n a g e m e n ts y s t e mb a s e d0 n d a t am i n i n gt e c h n o l o g y a b s t r a c t w i t ht h e d e v e l o p m e n t a n d p o p u l a r i t y o fn e t w o r k t e c h n o l o g y , e s p e c i a l l yt h ed e v e l o p m e n to fi n t e r a c t ,t h eu t i l i z a t i o no fr e s o u r c e si s c o n v e r t e di n t oas e r v i c em o d e lb a s e do ni n t e m e t w e br a t h e rt h a na t r a d i t i o n a lo n e a l t h o u g hm o s ts c h o o l sh a v ea l r e a d yu s e dc o m p u t e r i n f o r m a t i o nt e c h n o l o g ya n dn e t w o r kt e c h n o l o g yt o m a n a g es t u d e n t s s c o r e s ,t h ep o t e n t i a li n f o r m a t i o no ft h ed a t ah a sn o tb e e ne x p l o r e db e c a u s e 8 0 o ft h ed a t ai ne x i s t i n gs c o r em a n a g e m e n ts y s t e m si ss t o r e dq u i t e s i m p l y t h i sp a p e rm a i n l ys t u d i e st h ef o l l o w i n ga s p e c t s f i r s t ,a f t e ra n a l y z i n g t h ec u r r e n ts i t u a t i o n so fs c o r em a n a g e m e n ts y s t e m s ,i td e v e l o p san e w s c o r em a n a g e m e n ts y s t e mf o rt a i z h o uv o c a t i o n a l & t e c h n i c a lc o l l e g e ( l i n h a id i s t r i c t ) ,w h i c hc a nm a k et h ep r o c e s so ft e a c h e r s u p l o a d i n g s t u d e n t s m a r k sc o n v e n i e n ta n ds i m p l i f ys t u d e n t s i n q u i r i e s s e c o n d l y , w i t h a n a l y z i n g t h es h o r t c o m i n g si nt h e i m p l e m e n t a t i o no fs c o r e si n 浙江1 业人学硕十学侮论文 e x i s t i n gs c o r em a n a g e m e n ts y s t e m s ,i ta p p l i e st h ec l a s sf i e l d t ot h e m a n a g e m e n to fs c o r e s ,w h i c h c a ng r e a t l yc u td o w nt h e q u a n t i t y o f d a t a b a s es h e e t sa n dr e c o r d si ne a c hs h e e ts ot h a ti tc a ni nt u r ni n c r e a s et h e e f f i c i e n c yo fp r o c e s s i n ga n ds h o r t e nt h et i m eo fi n q u i r y t h i r d l y ,a f t e ri t s t u d i e ss o m e s y s t e m s r e l a t e dt os c o r e m a n a g e m e n t ,d a t am i n i n g t e c h n o l o g y i sa p p l i e dt ot h ea n a l y s i so fs t u d e n t s s c o r e si no r d e rt o i m p r o v et h el e v e lo f s c o r ea n a l y s i s t h e n ,t h r o u g ht h er e s e a r c ho fs l i q i nd e c i s i o nt r e ea n dt h ei n v e s t i g a t i o no ff e a t u r e so fs t u d e n t s s c o r e s ,s l i q i su s e di ns c o r ea n a l y s i sa n dad e c i s i o nt r e em o d e lw i t h p r o f e s s i o n a l a b i l i t i e si sa l s os e tu p ,w h i c hc a nh e l pe d u c a t i o n a ld e c i s i o n m a k e r sa n d t e a c h e r sd i s c e r nt h ep r o b l e m si nt e a c h i n gs ot h a tt h ee d u c a t i o n a lp l a n sa n d d e c i s i o n sc a nb eo p t i m i z e db yt h em o s te f f e c t i v eu s eo fi n f o r m a t i o n t h e l a s tp a r to ft h ep a p e ri st h ec o n c l u s i o no ft h ew o r ka n di ta l s ol o o k s f o r w a r dt ot h ep r o m i s i n gf u t u r eo f t h i sr e s e a r c hf i e l d k e yw o r d s :s c o r em a n a g e m e n t ,c l a s sf i e l d ,s c o r ea n a l y s i s ,d a t am i n i n g , s l i q 浙江工业大学 学位论文原创性声明 本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研 究工作所取得的研究成果。除文中已经加以标注引用的内容外,本论文不 包含其他个人或集体已经发表或撰写过的研究成果,也不含为获得浙江工 业大学或其它教育机构的学位证书而使用过的材料。对本文的研究作出重 要贡献的个人和集体,均已在文中以明确方式标明。本人承担本声明的法 律责任。 作者签名: 日期:年月日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学 校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被 查阅和借阅。本人授权浙江工业大学可以将本学位论文的全部或部分内容 编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和 江:编本学位论文。 本学位论文属于 1 、保密口,在年解密后适用奉授权书。 2 、不保密口。 ( 请在以上相应方框内打“”) 作者签名: 导师签名: 日期:年月阻 口期:年月日 浙江i :业人学硕十学位论文 1 1 课题研究背景 第一章绪论 1 1 1 我国高等教育发展现状 2 0 0 3 年5 月1 6r ,教育部公布了“中国教育与人力资源问题报告”。1 报告中 指出。我国人力资源基本现状:整体国民素质偏低,中商层次人j 严重缺乏。2 0 0 0 年我图从业人员中受教育比例如表卜1 所示,远不能满足现代经济对劳动者知识、 技能的需要。 表l - l2 0 0 0 年我国从业人员中受敦育水平 教育水平所l i 比例 小学及小学以r 教育水平 3 3 初中以f 教育水平 4 2 高中和中等职业技术教育 1 27 高等教育47 基于我国目前人力资源的甚本状况,专家们提出了今后教育发胜的重要趋势: 大力发展高等教育,培养大批高层级创新人才。随着这股高等教育需求之风的来 临,相应的,我国的高职、专科、本科、研究生等教育的招生规模在这几年内也 出现了空前的发展。2 0 0 4 年,全国高校的毛入学率已基本达到了1 9 ,2 0 0 5 全 国高校的毛入学率已基本达剑了2 1 ,中国一跃成为世界第二大教育大国,这杯 志着我陶的高等教育事业已由“精英式教育”转变为“大众化教育”,这一转变足 可喜的也足必须的。纵观醐际高等教育发展的历史进程,我们可以清楚地看到, 英国、法国、德幽、f f 本和韩叫等发达、或新兴工业化国家,在二十世纪六十年 代剑八f 。年代之间,用了至少卜年以上的时| 日j ,实现了高等教育从精英化到大众 化的转变。, 然i 酊,在千万学子皆大砍喜地跨过高校的“门槛”后,教育教学质 量问题厅始浮出水面,成为牵动人心的热点f j 题。 浙江i 业人学硕十学何论文 1 1 2 教育信息化现状 每一个教育教学领域的研究者都早已对教育信息化。”一词烂熟于心,然而尴 尬的局面却是:一方面,教育信息化的热潮一浪高过一浪,网络课程、校园网、校 校通工程、教学资源库等硬件建设轰轰烈烈的展丌,另一方面,一线教师仍然沿 袭着陈旧的教学和评价模式,信息化系统中能体现学生学习水平的考试成绩数据 仍处于半浪费的状念,并没有完全得到充分合理的利用。 素质教育的丌展强凋了对学生评价的全面客观性,即小能仅以考试成绩的高 低作为唯一的评判标准,但迄今为止,暂时还无法将考试排除在教育领域之外, 因此,如何f 确有效且全面地评估考试成绩、不仅仅对学生的分数做简单的统计 工作,而是进一步深入地探究在成绩背后反映出的深层意义,从多方面、多层次 地将隐藏的一些关联和规则提取出来,从而更好的指导教育和教学。 考试,就其本质来况,是对教育教学成果作最直接的量化检验。对考试成绩 进行分析,既是针对考试本身进行的,也是针对考试所涉及的教学工作进行的。 可以通过对考试结果的深入、科学地分析,便学生从横向、纵向等多个方面来了 解自己在群体中的相对位置,明确自己学习的得失以及与他人的差异,从而最大 限度地利用成绩所提供的信息,柬促进自己的学习:同时,使得教师和学校教育 决策者洞悉教学中存在的问题,利用成绩所提供的信息优化敦育教学的计划与决 策。 1 1 3 成绩管理系统现状 e i 盼,已有的网络成绩管理系统,大多采用以下方式: c s ( e l i e n t s e r v e r ,客户机服务器) 方式的网络模式:工作分别由服务器 各客户机完成。服务器负责管理数扭j 库的访问,为多个客户管理数据,对数据库 进行检索和排序,此外还要对客户机服务器网络结构中的数据库安全层层加锁, 进行保扩,。客户机负责与用户的交u ,收集用,o 信息,通过嘲络向服务器请求睹 如数捌库、电子表格或文字处理文档等住处处理工作。在c s 模式中,资源明砬 不对等,是“一种“胖客户机( f a tc l i e n t ) ”或“瘦服务器( t h i ns e r v o y ) ”纪构。 c s 结构的优点足:通过严格的管理派发,安全件较岛。 浙江l :业人学硕十学何论文 缺点是:l 、c s 开发的维护成本较高,对不同的客户端要开发不同的程序, 有应用程序的安装,修改和升级,均要在所有的客户机上进行。2 、c s 的客户机 具有显示与处理数据的功能,负载重。应用系统的功能越来越复杂,客户端的应 用程序也变得越来越庞大。3 、c s 移植困难,不同的丌发工具丌发的应用程序, 一般来说瓦不兼容,难以移植到其它平台上运行。4 、c s 用户的界面是由客户端 所安装的软件决定的,用户的界面各不相同,培训的时j 日j 与费用较高“”1 。 榭应的产品和参考文献有: 1 浙江容博教育科技有限公司浙江省中小学学籍管理系统 2 淮海工学院学籍管理系统 3 基fc s 网络考试系统贵州师范大学学报2 0 0 5 ,2 3 ( 0 3 ) b s ( b r o w s e s e r v e r ,浏览器服务器) 模式:在客户端不需要丌发任何用户 界面,而统一采用w e b 浏览器,通过w e b 浏览器向w e b 服务器提出请求,由w e b 服务器对数铡库进行操作,并将结果逐级传回客户端。 在8 s 体系结构系统中,用户通过浏览器向分布在网络上的许多服务器发出 请求,服务器对浏览器的请求进行处理,将用户所需信息返刚到浏览器,b s 结构 简化了客户机的工作,客户机上只需配霄少量的客户端软件,服务器将担负更多 的工作,对数掘库的访问各应用程序的执行在服务器上完成。而其余如数据请求、 加工,结果返回以及动态网页的生成等工作全部出w e b 服务器完成。 b s 结构的缺点:系统的安全性不高。但可以通过相关的设置可以提高系统 的安全性。b s 结构的优点: l 、客户端j l 需i 通过浏览器,所有的维护与升级工作都是在服务器上执行,无需对 客户端进fj 二任何改变,因而大大降低了丌发和维护成本。 2 、b s 的客 l j 端把簧务处理逻辑部分给了功能服务器,客户端只须要进行显示, 俗称为“瘦”客户机。 3 、b s 客,1 端使圳的是w e b 浏览器,是w i n d o w s 系统平台自带的,不存在移植性 问题,目浏览器界面大家部熟悉,不需培训”“。3 。 相应的参考文献和产品: 3 浙江l 。业人学硕十学 ) = 论文 1 基于b s 结构的医学院学生成绩管理系统的设计与实现。 2 中国石油大学教务管理系统 3 台州学院正方现代教务系统 现有成绩管理系统在成绩数据的管理和实现上存在不足:成绩表中数据记录 众多,系统韵查询速度不快,效率不高;或成绩数据表个数众多,系统管理复杂; 另较多的成绩管理系统,成绩数扼只是简嗨存储,潜藏在成绩中的信息未被利用, 当前成绩管理系统的发展趋势:更高效,更方便、更快捷的为学校的相关人员, 如教师、学生、管理者等提供成绩数掘的查询和使用;充分利用现存的信息、现 代技术和手段,不仅发现其表面的信息,更可以发掘表面信息上潜在的信息;充 分利用成绩管理系统的数掘,揭示“敦”与“学”之h j 联系与规律,更好的为教 学服务。在大力提倡素质教育的今天,发现更多的教与学的规律,从而改进教学 的方法与手段,提高教学效果,提商学生的号业能力。 1 2 问题的提出 近年束,随着网络技术特别是i n t e r n e t 技术的酱及和发展,信息化程度越来 越高,极大的促进了备种资源向数字化,网络化方向发展,资源的利用也由传统 应用转向基于i n t e r n e t w e b 的服务模式转化,现代化的校园,需要现代化的管理 手段,学生成绩管理足整个学校教务管理工作中的关键环节之,采用计算机信息 技术和网络技术来管理学生成绩是大势所趋,因而大部分学校都应用基于网络技 术和计算机信息技术的学生成绩管理系统来进行学生成绩的管理,但现有的成绩 管理系统中,8 0 学生成绩数掘是简单的存储,蓄含成绩中的潜在信息未被利用。 当酊,人类进入了信息化时代,数字信息技术和列络技术高度发达,人类借 助各种计算帆,对各类信息进行处理。通过对考试成绩进行量化分析,揭示“教” 与“学”巾的规i 铲,有助于改进教学和提高教学质量、深化教学改革,有着重要的 意义,教学是一个“知行情”综合治理的问题。不同的教! i | | j 。受教育程度不 同,人乍的绎历不同,对教学理解不同,采用的教学方法不同,敦学效果自然不 同。应该采取综合的办法,为教师创造丰富的工作经历,同时舯教师、学生有恰 当的考核办法,督促教师更新知识提岛和改进教学方法,及时检查学生的学习效 果。对不足的问题及时补救。通过时学生成绩采用数据挖掘的订关知识与算法的 4 浙江f :业人学硕十学何论文 有关分析,将学生成绩数据所隐含的价值挖掘利用( 例如:找出那些考试未通过及 成绩优秀的学生在哪些方面有些什么不同的特征,以及怎样合理建议考试未通过 的学生提高成绩) 。为管理决策( 包括人事管理、学生管理) 提供科学依掘,从而 做出更适应学生个性和能力发展的决策,为国家的经济建设培养更多有用的人才。 1 3 本文主要的工作 本文所做的工作如下: 教务成绩管理系统的实现 应台州职业技术学院f 临海校区教务部门要求而设计丌发学生成绩管理系统, 实现教务管理的f 1 常教学常规管理功能:学生管理、学生成绩管理、学生成绩查 询、班级课程管理、教师学期未成绩网络提交、班主任班级成绩查询、班级课程 等,同时也为本论文中数掘挖掘的实现,提供原始的数据; 数掘的常舰分析 基于只常教学常规管理功能中所得的学生成绩数掘为研究对象,对学生成绩 数据运用教育统计与测量方法进行数据常舰的分析; 数掘的深度分析 通过对决策树中s l i q 算法的研究,结合学生成绩数据的特点,将数掘挖掘技 术s l i q 算法应用到学! 成绩分析,构建专业漾程成绩专业能力的决策树模型,分 析专业课程对专业能力的影响度,让教师和学校教育决策者涮悉教学中存在的问 题,从而利用成绩所提供的信息优化教育教学的计划与决策。 1 4 本论文的研究意义 通过对成绩进行统计分析,学校相关人员能从统计分析的数据得到一定的提 示,对“教”与“学”采取相应的措施,提高“教”与“学”的效果。 教痔评价“”在当今世界教育领域中,同教宵基础理论年【i 教行发展一起,被誉 为三大研究课题,教育评价对丁二教育发展和改革,对于教育的管理和决策,都有 至关重要的作用,劂而备受各国教育界和政府部门的重视,其中教学评价尤为藿 要,教学评价不仪对教学起着调节,控制、指导和推动作用,而且何很强的导向 性,是学校教学管理工作的重要组成部分,是评价教学工作成绩的置要手段,影 浙江f :业入学硕十学位论文 响教学评价成功或失败的因素很多,这不仅取决于评价方案的合理性,评价工具 的有效性,评价方法的科学性,评价活动组织的严密性,还取决于获取的评价数 据的可靠性,评价所采集的数掘是否可靠,是保证评价结果科学、客观、公j 下的 关键。 盖奇( g a g e ) 指出1 ,教学科学基础的本质是“教与学的变量之间的确定的 关系”。通过其中某些关系,可以做出从一个变量到另一个变量的预测。这些关系 愈是表示吲果的,是通过实验研究而不足通过相关研究而确定的,教学的科学基 础则愈一轻实;而教学的科学基础愈“墨实,则愈有可能改进教学。 应用数据挖掘技术来提高成绩管理系统的分析水平,可以对考试结果的深入、 科学的分析,可使学生从横向、纵向等多个方面束了解个人任群体中的相舯位置, 明确个人学习的得失以及与他人的差异,来促进个人的学习;吲时,可使得教师 和学校教育决策者洞悉教学中存在的j 口j 题,对教育教学质量进行反思。如:检查我 们的课程体系是否合理,相关课程之- 日j 的衔接与安排是否恰当,从而最大限度地利 用成绩所提供的信息优化教育教学的;p 划与决策。 通过对现有成绩管理系统的分析,提出了类字段及字段加权实现成绩管理的 方法,具体成绩管理实现中,不是采用很多现有成绩管理系统在成绩表的处理上 是采用:学号,课程名,学期,分数或者采用一个班级学尘的成绩采用一个表来保 存形式,提出采用类字段名来进行成绩管理,将成绩表中某一字段定义个类, 如:假定成绩表的第5 个字段足用来保存第一学期第一门课程成绩的,那么将所 有学生的第一学期第- - i 课程的戏续鄙保存在此。在显示数据时采用相应有字段 名加权法束实现( 本人觉得本人观点对管理信息系统是有用的,如医院给病人记 录时,可能有些项的病因不能确定,但町以先身:= 入数掘,在以后确定病因后,给 出确定的病斟字段名加权) 在本人所开发的b s 的成绩管理系统中,不同年级、 不同班级、不同学期、不同专业、f i 川系别的学生成绩数掘的保存只需一个成绩 表,且成绩表中记求是相当少,学生有多少,成绩表记采j 。多少,当然还有一个 班级课程名的加权表,但班级课程的加权表也不会超过成绩衷的记录数。因而数 据库记录数量不会很大,就可以人人提高系统的查询速度,加速系统的执行效率。 1 ,5 本论文的组织结构 第一章绪论。本学阐述了课题的相关背景:我幽高等敏疗发展现状,教育信 6 浙江i :业人学硕十学位论文 息化现状,问题的提出以及本论文所完成的一些工作。提出将数据挖掘技术应用 成绩管理系统中,引出本课题研究内容。 第二章课题相关知识背景。本章主要阐述本课题的相关背景知识,教育学 方面:从教育评价、教育统计、教育测量、考试统计作了基本的讲述;讲述了数 掘挖掘技术的基本概念、数据挖掘技术的研究内容、任务和功能、数掘挖掘的一 般过程。 第三章较为详细的介绍及讲述了决策树方法的一般过程,并介绍了几种常 用的决策树算法,对s l i q 算法作了较详细的阐述。 第四章成绩管理系统的相关分析。主要对可行性分析、系统功能需求分析、 系统逻辑分析,介绍了系统的体系结构,丌发和运行环境,系统的功能划分,以及 数据库,数据表的没计。 第五章成绩管理系统的实现。根掘前面章节提出的设计方案,阐述了成绩 管理系统的具体实现,具体讲述系统管理员模块、教师进行成绩相关操作模块, 成绩统计分析模块、学生成绩查询模块的实现,对学,成绩采用s l i q 算法构遴 专业能力的决策树。 第六章总结与展望。总结本文及个人在该课题所做的一些工作,并就数据 挖掘知以在成绩分析上的应用提出一些展望。 浙江i :业人学硕十学何论文 第二章课题的相关知识背景 2 1 教育学相关知识 2 1 1 教育评价学 教育评价学是现代世界上教育科学研究的三大重要领域之一。教育学家格兰 朗德( n e g r o n l u n d ) 对“评价”一词在教育教学活动情境下的典型解释为:评价是 为了确定学生达到教学目标的程度,收集、分析和解释信息的系统过程:评价包括 对学生的定量描述和定性描述两方面。根掘格兰朗德的观点,评价总是包括对测 量结果需求程度的价值判断。一个完整的评价计划用公式表达为:“4 评价= 测量( 定量描述) + 非测量( 定性描述) + 价值判断( 2 一1 ) 1 9 8 1 年,美叫教育评价标准联合委员会综合了各种评价观点,给教育评价下 了一个综合性的定义:教育评价是对教育目标和它的优缺点与价值判断的系统调 查,为教育决策提供依据的过程。 2 ,1 1 1 教育评价学的地位 1 、是教育科研三大领域之一。 作为一门学科,教育评价在科学研究中具有重要的地位。随着科技和教育 事业的发展,教育科学出现了多种分支( 交叉科学) ,如教育( 经济学、哲学、管 理学、社会学、心理学、统计学、未束学、工艺学、决策学、比较教育学) 等等。 但综合起来,在教直- 科学研究大体町分为三大领域:基础理论研究、教育发展研 究、教育评价研究。可见教育评价在当今世界教育科学研究中的地位。 2 、世界的教育发达因家郜非常重视教育评价的研究。教育评价的地位与作用,已 由专家的研究课题转为政府的敦育措施。 3 、国际上已成也了“幽际教育成就评价协会( i n t e r n a t i o n a la s s o c i a t i o nf o r e d u c a t i o n a la s s e s s m e n t 。 i e a ) ”组织经过世界范幽几十年的探索与实践,联 合国教科文组织已把实现敦疗评价的范围、程度、及其采用的技术水平,作为衡 r 浙江i :业人学硕十学位论文 量一个国家或地区教育管理水平的标志,把掌握教育评价理论知识与方法技术的 程度,作为判定各国教育行政管理人员与教学人员管理能力的主要标准 2 1 1 2 教育评价的目的 所溜教育评价的目的,就是人们在开展教育评价之前设想或规定的教育评价 活动所欲达到的效果或结果。“目的作为行动的直接动机指引和调整着各种行为, 并作为支配人的意志的内在舰律贯穿在人的实践中。川“。教育评价的目的,指导和 支配着整个教育评价过程,决定了教育评价的发展方向。 从教育评价的发展历程来唇,在不同的时代,教台评价的目的不尽相同。早 期的教仃评价研究和实践,主要是为了测量教育目标的达成度或为了比较与鉴别; 现代教育评价则更注重通过评价促进工作的改进,为教白决策服务。研究教育评 价的目的及其变化趋势,有助了把握教育评价作为一种专业化活动的发展规律及 其本质属性。 教育评价的最终目的是达到教育价值增值,即提高教育质量与效益,促进教 育有效地满足社会与个体的需要,增进教育的社会价值或个体价值。“” 2 1 1 3 教育评价的一般过程与方法 尽管具体的评价活动会由于解决的问题不同,评价的目的和对象不同而呈现 出不同的形态,但从本质上说,所有的教育评价活动是按照同样的程序迸行的。 教育评价的一般逻辑过程图“示如下: 浙江i :业人学硕十学位论文 确评价的问题 定计价的目的 定评价对象和 定采集哪些信 集与分析信息 出结论( 包括 适当的方式向 照评价结论采 评价 图2 - i 教育评价的一股逻辑过程幽“4 2 1 1 4 教育评价相关概念与教育评价的关系 教育评价与教育测验的关系”:教育测验是对人的知识、技能和能力以及其 他某些心理特征的检测,是教育评价的一种手段,确切地晚它是教育评价获得评 价信息的工具之一。教育评价获取信息的测验法就足来自于教育测验。教育评价 与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数 量关系,通过数捌的分析和处理确切地掌握教育情况,也是教育评价的一种手段 和工具。教育评价中获取信息的统计法就来自于教育统计。教育评价与教育测量 的关系:教育测量通过对学生知识的掌握、智能的发展、思想5 德的变化、体质 的状况以及教育活动的各个方面的测定,为教育评价提供依捌,足教育评价信息 的主要来源如求没有教育测量提供的资料,教育评价将成为尤源之水,失去了 价值削断的依抛,其科学性、准确性便无从淡起。另外,教疗测毽的结果只有通 过教育评价爿能获得实际意义,成为改进教育工作有参考价值的信息。 2 1 2 教育统计学 教育统汁学是运用数理统计学的原理和方法研究教育现象中的数量关系的一 o l 2 3 4 5 6 7 8 9 浙江l :业人学硕十学何论文 门应用学科。它通过数据的分析和处理,准确地掌握教育情况,为制定教育方针、 政策提供科学依掘,为丌展教育科学研究,探索教育规律,制定教育方案,检查 教育效率提供科学方法,也为教育管理和教育评价提供有效的工具。它分为两大 类:一是描述统计学;二是推断统计学,用数据进行统计检验,统计分析和非参 数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的 一个样本,并以此样本为根据来分析母体的特点。它是在教育问题的研究中,描 述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理 和方法。其研究方法般有:大量观察法、统计分组法、综合指标计算法、统计 资料检验法、统计资料图示等”“。 2 1 3 教育测量学 教育测量学”“:研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想 品德以及教育效益等问题的一门教育学科。它运用各种测量手段和数理统计方法 等数学工具,根掘教育目标或教学计划的要求,研究如何测量和评价教育效果, 如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量 指标,如何进行测验结果的统计分析,测验分数的解释和评价等其主要内容包 括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验 的常模、测验的实施和评分、测验结果的解释等。 2 1 4 考试统计学 考试“是人类社会一种特有的测量、评定人的知识、技能、能力、性格等个 体差异特征的社会活动。考试结果往往以直接或问接的方式用数字呈现出柬。这 类数字之中蕴含着大量能反映人的个体差异特征和考试活动规律的信息。由f 考 试研究对象的个体筹异很大,起作用的条件和不町控制的偶然因素很多,人的内 外各种闪素的相互作川及其复杂。因此,采用数理统计方法,系统地、综合地、 整体地研究人的知识、技能、能力、性格等差异特征及其考试活动的规律性,进 而指导考试工作实践,便成为考试科学发展的必然需求。 考试统计学f 是为研究如何收集、整理、分析考试信息资料,如何锹捌己知 的局部信息对未知的总体特征进行科学推断,以揭示考试活动舰律而产生和发展 浙江i 业人学硕十学伉论文 起来的。考试统计学主要的的研究特点为:学科研究的实证性;数量关系的总体性: 性质区分的规定性;现象测量的复杂性。其主要的研究方法为:大量观察法、统计 分组法和综合指标法。 考试统计学作为研究大量考试现象的数量表现和数量关系的一门科学,继承 了教育统计学的主要统计手段,是统计学方法在教育考试背景下的实践应用。j 下 如我国著名的统计学家陈希孺院士所说的:“数理统计学的生命在于应用,实用统 计应是统计学发展的主流”,由于考试统计学同时兼具很强的学科理论基础以及应 用基础,斟而发展前景广阔。 考试研究本身涉及的内容范围很广,除了以上提到的教育评价学,教育统计 学,加上心理学,教育学、教育测量学、信息科学等,都是考试学汲取养料的学 科,近年来,考试技术不断革新,这给考试统计学提出了更高的发展要求。在教 育信息化的大背景下,有必要结合当前突飞猛进的信息科技手段,来实现其应用 的最优化和效益的最大化。 2 2 数据挖掘技术 2 0 0 3 年1 月麻省理工学院的科技评论 ( t e c h n o l o g yr e v i e w ) 杂志提出未 来5 年对人类产生重大影响的1 0 大新兴技术,“数掘挖掘”位居第j i ”】。一份最 近的g a r t n e r 报告中列举了在今后3 5 年内对工业将产生重要影响的盘项关键技 术,k d d 和人工智i i i i 名第一。同时,这份报告将并行计算机体系结构研究和 k d d ( k n o w l e d g ed i s c o v e r yi nd a t a b a s e ) 列入今后5 年内公司应该投资的1 0 个 新技术领域。由此可以看出,数铡挖掘的研究和应用受到了学术界和实业界越来 越多的重视,因而成为信息产业最有的途的交叉学科。其发绳方f i j 肯:数据库数 掘仓库系统集成,与颅测模型系统集成,挖掘各种复杂类型的数掘弓应用相结合, 研制和丌发数扳! :挖掘丰,j i 准,支持移动环境等。 2 2 1 数据挖掘的基本概念 1 9 8 9 年8 月,在第1 1 届刚际人上智能联合会议的专题研讨会上,首次提出 基于数掘库的知谚:发现( k d d ,k n o w l e d g ed is c o v e r yi nd a t a b a s e ) 技术。该技术 涉及机器学习、模式以刖,统计学、智能数捌库、知 : 获取、专家系统、数掘呵 浙江:业人学硕十学t i 7 :论文 视化和高性能计算等领域技术难度较大,一时难以应付信息爆炸的实际需要。到 了1 9 9 5 年,在美国计算机年会( a c m ) 上,提出了数据挖掘( d m ,d a t am i n g ) 的概 念,即通过从数据库中抽取隐含的、未知的、具有潜在使用价值信息的过程。由 于数据挖掘足k d d 过程中最为关键的步骤,在实际应用中对数掘挖掘和k d d 两个 术语的应用往往不加区别”“。 数据挖掘( d a t am i n i n g ) 就是从大量的、不完全的、有噪声的、模糊的、随 机的实际应 j 数掘中,提取隐含在其中的、人们事先不知道的、但又是潜在有用 的信息和知u 的过程”“。也有一些文献把数据挖掘称为知识抽取( k n o w l e d g e e x t r a c t i o n ) 、数掘考古学( d a t aa r c h a e o o g y ) 、数据捕捞( d a t ad r e d g i n g ) 。2 1 等 等。 2 2 2 数据挖掘系统的组成 数掘挖掘是一个交叉学科领域,受多个学科影响,包括数掘库系统、统计学、 机器学习、可视化和信息科学等( 如图2 - 2 ) 。 数据阼技术( d a m b a s et e c h n o l o g y ) 统计学s t a t i s t i c s 一 信息科学 叫麓淼悸剀m a c h n e l e 枷吲a i ) i n f o r m a t i o ns c i e n c e , 【可视化v i s u a i i z a t i 。ny 、 其它学科o t h e r d i s c i p l i n e s 幽2 - 2 数据挖捌系统的组成” 采用k d d 的j ”义观点:k d d 是从存放在数掘库、数艟:仓库或其他信息库中的大 量数掘中挖掘有趣有意义的知识的过程。基于此观点典型的k d d 系统主要山以下 几部分组成“: ( 1 ) 数掘库、数掘仓库或其他信息库:他们是进行数掘挖掘的数据源,是一 个或一组数据库、数艏i :仓库、电产表格或其他类型的信息库存。可以在他们的数 掘上进行数掘清理和集成。 ( 2 ) 数据库或数据仓库服务器:根捌用户的数据挖掘要求,数掘库或数掘仓库服务 f3 浙江i :业人导:硕十学佛论文 器负责提取相关的数据。 ( 3 ) 知识库:这是特定的领域知识,用于指导搜索或评估结果模式的兴趣 度。这种知识可能包括概念分层,用于将属性或属性值组织成不同的抽象层。其 中用户确信方面的知识也可以包含在内。 ( 4 ) 根掘非期望性评估模式的兴趣。领域知识的其他例子有兴趣限制或阐值和元数 据( 例如,描述来自多个异种数据源的数据) 。 ( 5 ) 数据挖掘引擎:这是数据挖掘的最重要的摹本部分。由一组功能模块组 成,用于特征化、关联、分类、聚类分析以及演变和偏差分析。 ( 6 ) 模式评估模块:通常此成分使用兴趣度度量,并与数据挖掘模块交互,以便将 搜索聚集任有趣的模式上。可能使用兴趣度阐值过滤发现的模式。模式评估模块 也可以与挖掘模块集成在一起,这依赖于所用的数掘挖掘方法的实现。对于有效 数掘挖掘,建议尽可能深的将模式评估推进到挖掘过程中,以便将搜索限制在有 兴趣的模式上。 ( 7 ) 图形_ j 户界面:此模块在用户和数据挖掘系统之1 日j 通信,允许用户与系统交互, 指定数据挖掘查询或任务,提供信息、帮助搜索聚焦,根掘数掘挖掘的中i 日j 结果 进行探索式数掘挖掘。此外,此成分还允许用户浏览数掘和数据仓库模式或数据 结构,评估挖掘的模式,以不回的形式对模式可视化。 典型的数据挖掘系统结构如下图( 图2 3 ) 所示,清晰的表示出了数掘挖掘 系统中各个功能模块之间的相互作用和依赖关系: 幽2 3 典删的数据挖捌系统结构1 浙江i :业人学硕十学位论文 2 2 3 数据挖掘的研究内容 数据挖掘和知识发现的研究是在三个强大的技术支柱:数据库、机器学习和数 理统计的基础上进行的。其主要研究内容包括数据仓库、各种挖掘算法和挖掘语 言、半结构化和非结构化数据中的数据挖掘、w e b 数据挖掘、智能计算和软计算 在数捌挖掘中的应用、知识表示方法、可视化技术以及对己有知识的维护和再利 用等。 数据挖掘所发现的知识最常见的有以下几类”“: ( 1 ) 广义知识( g e n e r a l i z a t i o n ) 广义知识指类别特征的概括性描述知识。根据数据的微观特性发现其表征的、 带有普遍性的、较高层次概念的、中观和宏观的知识,反映同类事物共同性质, 是对数扼的概括、精炼和抽象。广义知识的发现方法和实现技术有很多,如数掘 立方体、面向属性的归约等。数据立方体还有其他一些别名,如多维数据库、实 现视图、o l a p ”等。陔方法的基本思想是实现某些常用的代价较商的聚集函数的 计算,诸如计数、求和、平均、最大值等,并将这些实现视图储存在多维数掘库 中。既然很多聚集函数需经常重复计算,那么在多维数掘立方体中存放预先计算 好的结果将能保证快速响应,并可灵活地提供不同角度和不同抽象层次上的数掘 视图。另一种广义知识发现方法是加拿大s i m o nf r a s e r 大学提出的面向属性的归 约方法。这种方法以类s q l 语言表示数掘挖掘查询,收集数捌库中的相关数掘集, 然后在相关数据集上应用一系列数掘推,。技术进行数据推广,包括属性删除、概 念树提升、属性阀值控制、计数及其他聚集函数传播等。 ( 2 ) 关联知识( a s s o c i a t i o n ) 它反映一个事件和其他事件之1 日j 依赖或关联的知识如果婀项或多项属性之 i 甘j 存在关联,郧么其中一项的属性值就叮以依掘其他属性值进行颅测。最为著名 的关联规则发现方法足r a g r a w a l 提 - :的a p r i o r i 算法。关联规则的发现可分为两 步。第一步足迭代识别所有的频繁项目集,要求频繁项目集的支持率不低于用户 设定的最低值:第一步足从频繁项目集中构造可信度不低f 片j 户设定的最低值的 规则。识别或发现所有频繁项目集是关联规则发现算法的核心,也是计算量最大 的部分。 ( 3 ) 分类知识( c l a s s i f i c a t i o n & c l u s t e r i n g ) 它反映同类事物共问性质的特征型知以和不同事物之间的差肄型特征知识。 l5 浙江l :业人宁硕十学位论文 最为典型的分类方法是基于决策树的分类方法。它是从实例集中构造决策树,是 一种有指导的学习方法。该方法先根掘训练子集( 又称为窗口) 形成决策树。如果 该树不能对所有对象给出正确的分类,那么选择一些例外加入剑窗口中,重复该 过程一直到形成正确的决策集。最终结果足一棵树,其叶结点是类名,中间结点 是带有分枝的属性,该分枝对应该属性的某一可能值。最为典型的决策树学习系 统是i d 3 ,它采用自顶向f 不回溯策略,能保证找到个简单的树。算法c 4 5 和 c 5 0 都是i d 3 的扩展,它们将分类领域从类别属性扩展到数值型属性。数据分类 还有统计、粗糙集( r o u g h s e t ) 等方法。线性回归和线性辨别分析是舆型的统计模 型。为降低决策树生成代价,人们还提出了一种区问分类器。最近也有人研究使 用神经网络方法在数据库中进行分类和规则提取。 ( 4 ) 预测型知识( p r e d i c t i o n ) 它根据时问序列型数掘,由历史的和当前的数据去推测未来的数据,也可以 认为是以时i h j 为关键属性的关联知识。目前,时日j 序列预测方法有经典的统计方 法,神经网络和机器学习等。1 9 6 8 年b o x 和j e n k i n s 提出了一套比较完善的时l 丑j 序列建模理论和分析方法,这些经典的数学方法通过建立随机模型,如自回归模 型、自回归滑动平均模型、求和自 u 1 归滑动平均模型和季节调整模型等,进行时 问序列的预测。出于大量的时i n j 序列是非平稳的,其特征参数和数掘分锫随着时 日j 的推移而发生变化。因此,仅仅通过对某段历史数据的训练,建立单一的神经 网络预测模型,还无法完成准确的预测任务。为此,人们提出了基于统计学和基 于精确性的再训练方法,当发现现存预测模型不再适用于当莳数掘时,对模型重 新训练,获得新的权重参数,建立新的模型。也有许多系统借助并行算法的计算 优势进行时间序列预测。 ( 5 ) 偏差型知识( d e v i a t i o n ) 它是对差异和极端特例的描述,揭示事物偏离常规的异常现象,如标准类外 的特例,数掘聚类外的离群值等。所自这些知识鄙“j 以在小的概念层次上被发 现,并随着概念层次的提升
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- led工程安装合同范本
- 蒲庙租房合同范本
- 涉外投资经营合同范本
- 建筑装饰合同范本
- 小型叉车租赁合同范本
- 红酒销售供货合同范本
- 出土方合同范本
- 社区实验基础知识培训课件
- 小区外管网合同范本
- 生产工人的合同范本
- 2025年矿山开采项目社会稳定风险评估及应对策略报告
- 2025至2030年中国硅烷交联剂行业投资前景及策略咨询报告
- 蔬菜购买包地合同协议
- 公益岗考试试题及答案
- 叉车基本技能培训课件
- 2024初级注册安全工程师笔试真题解析
- 工贸企业重大事故隐患判定标准解读
- 2025年语文考试大纲
- 高三数学教学经验交流发言稿
- TCESE 3-2024 青少年人工智能技术水平测试技术技能标准
- 包装行业产品物料报废处理流程
评论
0/150
提交评论