


全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据挖掘在教育信息化中的潜在价值The Latent Value of Data Mining in Education in for Matization本文介绍了数据挖掘技术,阐述了其在教育信息化中的应用前景和开发难点,指出数据挖掘在这一领域尚有很大潜力可挖。关键词:数据挖掘 教育信息化1 数据挖掘的应用前景数据挖掘技术的出现有其必然性和可能性:首先,信息社会的到来对数据的筛选和利用提出了更高要求,而海量数据的出现又使得基于传统数据处理方法的人们面对大量数据无从下手,此时必然要求有更为先进的数据处理技术;其次,计算机性价比的提升和磁盘存储器价格的大幅度降低,使得人们借助计算机来完成数据的分析和处理成为可能。所谓数据挖掘(data mining)就是从大量、不完全、有噪声、模糊、随机的数据中发现隐含数据中的关系,建立模型,提取具有潜在价值、可信、新颖、有效并能被人所理解的信息和知识的过程,它又被称为数据库中的知识发现(KDD:knowledge discovery in database)、数据分析、数据融合(data fusion)、决策支持等。数据挖掘的一般过程是:选择数据源;采集数据;计算统计变量,利用图表对数据进行直观描述,从中发现数据间的关系;选定算法,建立预言模型;验证模型的合理性、准确性,对模型加以完善;通过模型指导决策。从1989年第11届国际联合人工智能学术会议上首次提出KDD这一概念以来,数据挖掘日益受到人们的关注,并已成为当前计算机领域的一大热点,其研究重点也逐渐从发现方法转移到系统应用,并且注重多种发现策略和技术的集成,以及多学科之间的相互渗透。数据挖掘最先是应用于金融和工商业领域。例如,超市发现由于畅销商品摆放过于集中而影响到其他货物的销售,于是分散畅销商品的摆放,让消费者不得不在选购畅销商品的同时去留意其他商品,从而增加超市整体销售额。又如,银行获取某未婚男子开立了联合账户,于是判定他不久就会结婚,再根据其以往的信贷记录有针对性地向该用户提高房产、家具、保险等方面的咨询,挖掘其消费潜力。美国运通公司(American express)“关联结算(relationship billing)优惠”策略促进客户消费,英国第三大连锁超市Safeway发放折扣信用卡预测顾客长期购买行为,美国读者文摘(Readers digest)出版公司利用积累了40年、容纳遍及世界一亿多个订户的业务数据库扩展业务,这些都是数据挖掘的具体应用。一方面,信息社会的变化速度太快,以至于人们不得不从关心现在转向关心未来,从重视信息的收集转向重视信息的处理。这表现在人们不仅能够迅速接收新生事物,更希望能用所掌握的信息去“预测不可预测的未来”,去更加准确地把握自己的命运。对信息社会中的任何组织或个人来说,其最大的资本就是所掌握的“有用”信息,要想不被信息的海洋所淹没,并在激烈的竞争中拔得头筹,就必须武装自身信息处理能力。另一方面,随着计算机计算能力的发展和数据挖掘理论研究的深入,数据挖掘将发挥出越来越大的作用。可以说,数据挖掘代表未来数据处理的一个很有前途的方向,同时它也将成为人们驾驭信息的有力武器。2 数据挖掘在教育信息化中的应用教育同信息是密不可分的,因为教育从本质上来说就是信息的传递、接收和加工。人们也绝非近些年才认识到教育与信息水乳交融的关系,只是随着科技进步、社会发展,以电脑多媒体和网络通讯为基础的现代化信息技术在教育中的应用越发广泛,“三论”思想逐步深入人心,教育信息化的提法才终于浮出水面。所以,当前人们所说的教育信息化概念有别于传统教育中信息技术的使用,而是强调其现代化信息技术的基础。从教育层面考察,教育信息化的特点是教材多媒化、资源全球化、教学个性化、活动合作化、管理自动化和环境虚拟化。(祝智庭,2001)笔者针对教育信息化这六个特点对数据挖掘在教育信息化中的潜在价值加以讨论。(1)教材多媒化。就是利用多媒体,特别是超媒体技术,建立教学内容的结构化、动态化、形象化表示。越来越多的教材和工具书变成多媒体化,它们不但包含文字和图形,还能呈现声音、动画、录像以及模拟的三维景象。一方面,多媒体教材都是以二进制形式制作、传递和处理,可在其主体上附加相关信息,这就为我们挖掘其中数据提供了可能;另一方面,多媒体教材与传统书本教材相比,涉及媒体形式多样、信息量大,其中不乏海量数据,这就要求对其进行合理归类、检索。数据挖掘技术的出现迎合了这一需求。(2)资源全球化。Internet是全球最大的教育资源库。其教育资源类型多样,包括教育网站、电子书刊、虚拟图书馆、虚拟软件库、新闻组等,为我们采集所需教育资源提供了可能,但也仅仅是可能。Internet信息的无序组织造成目前人们对其利用率很低。另外,还有两个问题值得注意:nternet海量数据的产生。因特网每天新添150万个文件,8个月增长一倍,其网页遍及全球300万个服务器,预计总数将由1997年2月的3.2亿猛增至2002年的80亿。利用现有的检索技术要在这以指数形式不断增长的资源数据库中提取所需如同大海捞针。非结构化数据大量涌现。Internet中存在大量视频、音频、动画等非结构化数据,利用现有的检索方法对这类数据的搜索难以奏效。数据挖掘是实现海量数据结构化或非结构化数据的有力手段。(3)教学个性化。智能导师系统能够根据学生的不同个性特点和需求进行教学和提供帮助。其核心是对学生个性的测定,特别是认知方式的检测。在传统教学活动中,教师与学生直接面对面交流,教师耳听眼观,凭借自己多年经验做出对学生的判断。教育信息化使学生信息的采集由人工转向自动。但是,机器反馈给教师的仅仅是诸如“学生甲在20分钟内完成10道题,错了3道“这样的信息,究竟是学生粗心造成的,还是因为其知识掌握不够牢固呢,教师很难做出判断。解决这一问题就需要数据挖掘技术,通过对学生大量反馈信息的提取建立学生模型。(4)活动合作化。协作学习是当前国际教育的发展潮流,包括通过计算机合作(网上合作学习),在计算机面前合作(如小组作业),与计算机合作(计算机扮演学生同伴角色)。但无论形式怎样,协作学习系统的教师或学生都要面对大量的信息接收与反馈。若对之处理不善,“信息泛滥”反而造成“信息匮乏”,因此协作学习环境开发必然涉及如何利用数据挖掘进行有效的数据传输和整合问题。(5)管理自动化。CMI(计算机管理教学)系统发展的最新趋势是在网络上建立电子学档(learning portfolio),其中包含学习者的身份信息、活动记录、评价信息、电子作品等。利用电子学档可以支持教学评价的改革,实现面向学习过程的评价。但在实际开发中我们发现这其实是有相当的难度。表现在:学习者的事务处理和系统的分析处理的特性不同。学习者行为的特点是信息反馈频率高而时间短;相对而言,一个大型CMI系统要花费更长的时间进行数据的存取、归档、检索、分析、整合等操作,这就需要一个数据挖掘组件来协调身处同一环境中两种不同的应用。一般电子学档中的数据较分散,不利于信息的采集,应利用数据挖掘将这些数据集成,并根据学生反映进行动态更新,将结果及时反馈给教师。现有CMI系统未能充分利用历史数据,期望教师在大量历史记录中寻找教学线索以应对学习者的各种反应是不现实的。而当前数据的分析也必须以大量的历史数据为依托,历史数据与当前数据的对比最能说明学习者的变化。(6)环境虚拟化。虚拟教室、虚拟实验室、虚拟校园、虚拟学社、虚拟图书馆,它们的共同特点是教学活动在很大程度上突破了时空的限制。虚拟教育可分为基于局域网的校内模式和基于城域网或广域网的校外模式。未来信息化学校的发展方向是实现虚拟教育与传统教育的结合,校内教育和校外教育的贯通。这就要求实现网络计算,具体包含两个方面:一是广度计算,即把计算机的应用范围尽量扩大,实现广泛的数据交流,典型的例子就是Internet;二是深度计算,人们不满足于以往计算机的简单数据操作,希望计算机能够参与数据分析与决策的制定等领域,这其中就包括数据挖掘的应用。教育信息化强调学的技术,关注学习者的个体差异,重视学习资源的采集和利用,超越传统教育的时空局限,所以我们面对的将是更为繁杂多样的信息交流。如何把无以计数、若隐若现的教育信息碎片组合成具有决策价值的信息拼图,数据挖掘为我们提供了一种新的思路。3 目前数据挖掘在教育信息化中应用的难点首先,数据挖掘仅仅是一种工具,其目标是通过历史数据预测学习者的未来行为,但实际上连学习者自己有时都不清楚下一步要做什么。所以,这种预测准确地说是一种概率。其次,即使通过数据挖掘你获知学习者将来可能的行为,但你并没有从中得知学习者为什么会产生这样的行为,譬如一个上课认真听讲的学生为什么考试成绩却很差等等。问题的根源在哪里,而这正是教师所需要的。第三,数据挖掘在教育信息化中的应用正处于发展阶段。数据挖掘包涵数理统计、模糊理论、神经网络和人工智能等诸多技术,此外学习者的特征、学习过程及学习结果有时是难以用数量方式进行描述,所以开发的难度较大。第四,数据挖掘在教育信息化中的应用涉及对学习者特征的提取,这就牵扯到社会环境、文化背景、价值理念等多方面,国情不同、地域不同,知识发现的算法就不同。因此,国外的经验只能借鉴,不能简单照搬。虽然当前数据挖掘技术在教育信息化中的使用还存在不足,但是某些问题并非不能攻克。譬如,针对学习者行为的根源这一课题,我们仅仅依靠现有数据挖掘技术难以解决,但我们完全有可能借助教育测评技术、学习者模型和教育心理学等理论寻求突破口。 目前国外许多行业,如通信、信用卡公司、商店等已广泛利用数据挖掘工具来辅助其业务活动,而国内在这方面的应用,特别是在教育中的应用尚处于起步阶段,因此,对数据挖掘技术和工具的研究人员及开发来说,我国是一个有巨大潜力可挖的市场。2000年7月IDC关于信息存取工具市场的报告指出,估计1999年的数据挖掘的市场大概是7.5亿美元,估计在下个5年内市场的年增长率(compound annual growth rate)为32.4%,其中亚太地区为26.6%,并且预测此市场在2002年时会达到22亿美元。而国外专家预测,在今后的5到10年内,数据挖掘将在中国形成一个产业。应该指出的是,进行数据挖掘的开发并非高不可攀,国内软件厂家如果进入该领域,将和国外公司实力处于相差不多的起跑线上,国外多年的研究和实践成果为我所用,可以大大加快我们前进的步伐。总之,教育信息化带来的是信息量的急剧增长和对信息提取的更高要求,现在我们很难再依照传统方法在海量数据中寻找决策的依据,这就必须借助数据挖掘去发掘数据中隐藏的规律或模式,为决策提供更有效的支持。虽然数据挖掘作为一种工具,它永远也不能替代教师的地位,但是它可以为教师的决策提供了科学的依据,数据挖掘技术本身就是人们大量实践的结晶,它为建立传统教学中很难获取或不可能获取的模型提供了捷径。参考文献1 祝智庭. 教育信息化:教育技术的新高地. 中国电化教育. 2001.(3).2 Jiawei Han. 数据挖掘概念与技术.北京:机械工业出版社,2001.3 刘同明. 数据挖掘技术及其应用. 北京:国防
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 老旧小区改造屋顶绿化设计方案
- 大专思修课件
- xx片区污水管网改造工程建设工程方案
- 给水工程质量管理方案
- 项目建设计划与进度管理方案
- 高效厂房建设施工方案与管理策略
- 绿电综合开发利用项目技术方案
- 2025年华莱士晋升助理试卷及答案
- 多重耐药知识培训记录课件
- 房屋建筑施工质量控制方案
- DB2301∕T 178-2024 地下市政基础设施普查及信息化管理平台建设技术规程
- 《人工智能与社会》高职人工智能通识课程全套教学课件
- 龋齿的治疗讲课件
- 中医肠道健康课件
- 妊娠期高血压疾病诊治指南(2025版)解读
- 巡回护士的职责及流程
- 中石油2025年招聘笔试真押题
- 医药行业中医药现代化研发方案
- 2024年江苏南通中考满分作文《前进我有我的姿态》13
- 行前说明会流程
- 《中央空调系统维护与故障排查》课件
评论
0/150
提交评论