




已阅读5页,还剩75页未读, 继续免费阅读
(计算机软件与理论专业论文)高校教学质量评估数据的分析挖掘系统.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
太原理工大学硕士研究生学位论文 高校教学质量评估数据的分析挖掘系统 摘要 在我国高等教育走向大众化的今天,教学评估作为教育评估的一个重 要方面,不仅是构成教育评估的主体部分与基础,而且已成为教学过程中 不可或缺的重要环节。 实施教学评估可以引导学校明确办学指导思想,转变教育观念;督促 学校各级领导高度重视教学工作,加大教学投入,改善办学条件;推动学 校人才培养模式、教学内容和课程体系的改革;加强学校教师队伍建设, 推动高校教学管理制度的创新。 然而,现在的教学质量评估系统中尚存在着一些问题。多年来的教学 和管理工作积累了大量的数据,但目前对这些数据的处理还停留在初级的 : 数据备份、查询及简单统计阶段,使这些数据还不能发挥其应有的价值。 如何更有效地利用大量的数据理性分析并指导教师教学已变得十分重要。 本文根据高校教学的需求,把数据挖掘技术应用到教学评估系统中。 在深入研究数据挖掘理论和系统体系结构的基础上,设计了数据分析挖掘 系统的总体框架。提出一个适于教学相关数据分析与挖掘的管理平台:在 w i n d o w s 环境下,把分析数据软件( s p s s ) 、数据挖掘软件( w e k a ) 与教学评估 管理系统( d e l p h i ) 集成到一起,形成了信息管理、数据分析与数据挖掘一 体的教学质量评估管理信息系统。 太原理工大学硕士研究生学位论文 本文探讨了教学质量评估数据挖掘系统的实现方法,提出一种分析挖 掘教学质量评估数据的新模式:用偏相关分析方法和囡子分析法对影响教 师教学质量的各种指标进行分析,再采用多元线性回归技术从分析结果中 发现有价值的指标模式,从而得到影响教师教学质量的主要指标。 。 根据所提出的实施方案,本文以太原理工大学计算机学院近两年的教 学评估数据为实例,完整的实现了数据挖掘的全过程,包括:确定数据挖 掘对象及目标;以网上在线调查的方式为主采集数据;采用数据清理、数 据转换等数据预处理技术;使用s p s s 的偏相关分析方法和因子分析法对教 师教学质量的各种指标进行分析;使用w e k a 的多元线性回归技术发现有价 值的指标模式;最后以j s p + w e b l o g i c + o r a c l e 来实现信息交互。实验结果 表明,该模式效果良好,有利于教学质量的提高。 关键词:教学质量评估,数据挖掘,偏相关分析法,因子分析法,多 元线性回归技术 太原理工大学硕士研究生学位论文 t h es y s t e mo fa n a 【y s i sa n dd a r a m 扑n g i nt e a c h i n gq u a l i t ye v a l u a t i o nd a t a a b s t r a c t t o d a yh i g h e re d u c a t i o ni sm o r ep o p u l a ri nc h i n a , a n dt h e t e a c h i n g e v a l u a t i o nb e c o m e sm o r ei m p o r t a n ti ne d u c a t i o ne v a l u a t i o n i ti sn o to n l yt h e m a i nb o d ya n db a s i so fe d u c a t i o ne v a l u a t i o n , b u ta l s ot h ee s s e n t i a ll i n kd u r i n g t h et e a c h i n g i m p l e m e n t i n gt h et e a c h i n ge v a l u a t i o nc a nm a k et h eg u i d i n gi d e o l o g yo n t e a c h i n gd e a r , c h a n g ee d u c a t i o nc o n c e p t i tp r o m p t sa l lo fl e v e l sl e a d e ro f s c h o o lt op a ya t t e n t i o nt ot e a c h i n gw o r k , e n l a r g et h ei n v e s to ft e a c h i n g , a n d i m p r o v et h ec o n d i t i o no fr u n n i n gas c h 0 0 1 i ti m p e l st h er e f o r m o ft h e c u r r i c u l u m ,t h ep e r s o n n e lt r a i n i n gp a t t e r n ,a n dt h ec o n t e n to fc o u r s e s i tm a k e s t h es c h o o lt or e i n f o r c et e a c h i n gs t a f fb u i l d i n g ,i n n o v a t et h ec o l l e g et e a c h i n g m a n a g e m e n ts y s t e m b u tn o wt h et e a c h i n gq u a l i t ye v a l u a t i o ns y s t e mh a ss o m ep r o b l e m s w e h a v ea c c u m u l a t e d l a r g ea m o u n to f d a t a , b u td a t ah a n d l i n gs t a y si na j u n i o rs t a g e , 1 1 太原理工大学硕士研究生学位论文 t h ed a t ac a n tt a k et h ee f f e c tt h a ti ts h o u l dt a k e h o wt oa s c e r t a i nt h eo b j e c t i v i t y o ft h er e s u l t s ,e f f e c t i v e l yu s et h ed a t a ,a n di n s t r u c tt e a c h i n gh a v eb e c a m em o r e t h i sp a p e ra p p l i e sd a t am i n i n gt ot e a c h i n ge v a l u a t i o ns y s t e mb a s e do n h i g h e re d u c a t i o n sd e m a n d ,i ta p p l i e sd a t am i n i n gt ot e a c h i n ge v a l u a t i o ns y s t e m i tr e s e a r c h e st h es y s t e mf r a m e w o r ka n df u n c t i o no ft h ee x i s t e ds y s t e m ;a tt h e s a m et i m ei td e s i g n st h ef r a m e w o r ko fe v a l u a t i o ns y s t e m , w h i c hu s e sd a t a m i n i n g ad a t a b a s ed e s i g n i n gf r a m ef o rt e a c h i n ga n da n a l y z i n gb a s e do nt h e t e a c h i n gq u a l i t ye v a l u a t i o n i sr a i s e di nt h ep a p e r b a s e do nw i n d o w s ,i t i n t e g r a t e st e a c h i n ge v a l u a t i o ns y s t e m ( d e l p h i ) a n ds e t t i n go fa n a l y z i n gs o f t w a r e ( s p s s ) a n dm i n i n gd a t as o f t w a r e ( w e k a ) ,b u i l d sat e a c h i n gq u a l i t ye v a l u a t i o n i n t e g r a ls y s t e mo f m a n a g e m e n t , a n a l y s e sa n dm i n i n g 。 t h i sp a p e rs t u d i e sa n da n a l y z e st h e r e a l i z i n gp r o g r e s s o fd a t am i n i n g s y s t e mi nt e a c h i n gq u a l i t ya p p r e c i a t i o n i ta d v i s e s an e wm o d e lo f a n a l y z i n ga n d m i n i n gi nt e a c h i n gq u a l i t ya p p r e c i a t i o n i tc a r r i e so u ta n a l y s i so nt h ei n d e x a f f e c t i n gt e a c h i n gq u a l 埘b yp a r t i a lc o r r e l a t i o na n df a c t o ra n a l y s i s t h e nu s i n g l i n e a rr e g r e s s i o nt e c h n o l o g yi tf i n d sv a l u ei n d e xp a t t e r nf r o mt h er e s u l t s ,a n d g e t st h em a i ni n d e x a c c o r d i n gt ot h ep r o j e c t ,w ea c c o m p l i s ht h ed a t am i n i n gp r o c e s st o a n a l y z et h ed a t ao ft h ec o m p u t e ri n s t i t u t eo ft a i y u a nu n i v e r s i t yo fs c i e n c ea n d t e c h n o l o g y t h ep r o c e s si n c l u d e sm a k i n gs u r et h e d a t am i n i n gt a r g e t , c o l l e c t i n gt h ed a t a ,p r e p r o c e s s i n gd a t a ,a n a l y z i n go nt h ei n d e xa f f e c t i n gt e a c h i n g i v 太原理工大学硕士研究生学位论文 q u a l i t yb yp a a i a lc o e l a t i o na n d f a c t o ra n a l y s i so fs p s s ,u s i n gl i n e a rr e g r e s s i o n t e c h n o l o g yo fw e k af i n d sv a l u ei n d e xp a t t e mf r o mt h er e s u l t s ,a n dg e t st h e m a i ni n d e x , l a s tu s i n gt h es y s t e mo fj s p + w e b l o g i c + o r a c l et oc a r r yo u tt h e i n f o r m a t i o nf e e d b a c k t e a c h e r sc a nv e r i t yi m p e r s o n a l l y 协e i re v a l u a t i o nr e s u l t s o ft e a c h i n gq u a l i t yb a s e do nt h ei n d e xp a t t e r n ,a n dt h e ym a yg e t st e a c h i n g s u g g e s t i o n , s oi m p r o v et h et e a c h i n gq u a l i t y t h ee x p e r i m e n ts h o w st h a tt h e m o d e lc a ns u c c e s s f u l l yb u i l dt h em a i ni n d e x , a n dh a sa9 0 0 dp e r f o r m a n c e , b e n e f i c i a lf o rt h et e a c h i n gq u a l i t y k e y w o r d s :t e a c h i n gq u a l i t ye v a l u a t i o n ,d a t am i n i n g , p a r t i a lc o r r e l a t i o n , f a c t o ra n a l y s i s ,l i n e a rr e g r e s s i o n v 声明 本人郑重声明:所呈交的学位论文。是本人在指导教师的指导下。 独立进行研究所取得的成果。除文中已经注明引用的内容外。本论文 不包含其他个人或集体已经发表或撰写过的科研成果。对本文的研究 做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的 法律责任由本人承担。 论文作者签名:塑窒 e t l t l l : 狸z :蕴 关于学位论文使用权的说明 本人完全了解太原理工大学有关保管、使用学位论文的规定。其 中包括:学校有权保管、并向有关部门送交学位论文的原件与复印 件;学校可以采用影印、缩印或其它复制手段复制并保存学位论文; 学校可允许学位论文被查阅或借阅;学校可以学术交流为目的, 复制赠送和交换学位论文;学校可以公布学位论文的全部或部分内 容( 保密学位论文在解密后遵守此规定) o 签名: 导师签名: 移驾日期: 型z 兰:生 太原理工大学硕士研究生学位论文 第一章绪论 1 1 高校教学质量评佶的内涵和意义 高校教学质量评估是指依据一定的教学目标和教学规范标准,通过对学校教与学等 教学情况的系统检测与考核,评定其教学效果与教学目标的实现程度,并做出相应的价 值判断及其改进的过程。具体体现在五个落点上: 第一、评价学校办学指导思想和教学改革思路的效益。学校办学指导思想和教学改 革的思路是统率学校本科教学工作的纲领,其高度和深度如何,将决定学校教学各方面 改革的方向是否正确。 第二、评价学校办学条件和办学设备的效用。必要的办学条件和设备,是保证教学 水平和质量的物质条件,对其迸行考评,目的在于促迸学校和主管部门加大投入,改善 和提高办学条件和设备,使其投入产出比不断优化,进而充分发挥办学条件和设备的可 能性效用和现实性效用。 第三、评价学校教学运行机制的效率。教学运行机制是学校教学实施过程的依托, 包括教学管理的机构体系、职能体系、人员体系和制度体系。对教学运行机制进行评价, 最根本就是要评价其效率,即教学计趔l 对教学改革措施的运作效率,教学管理制度对促 进教学发展的效率。 第四、评价学校人才培养模式的效果。人才培养模式是教学资源配置的方式、教学 条件组合的形式和教学手段运用的范式的总和,是一个学校教育教学思想和观念最为集 中、最为典型的一种表征。同样的教师,同样的学生,同样的教材,同样的教室和实验 室,同样的条件和环境,通过不同的培养模式造就的人才,在质量上会有很大的差别, 甚至相反的效果。评价学校的人才培养模式,主要是评价这种模式在实践中实施的效果。 第五、评价学校办学传统与特色的效应。学校办学传统和特色是学校教育教学的灵 魂和基石,决定学校办学的品位和层次,是学校的优势所在。所谓传统和特色,意味着 人无我有、有且甚优,人有我优、优且甚强。学校的办学传统和特色有理念型和项目型 两种,前者是学校长期办学过程中形成、升华和积淀的精神底蕴和文化品位,后者是学 1 太原理工大学硕士研究生学位论文 校办学和教学运作中创立的行之有效的管理方法和模式。学校的办学传统和特色本来就 是验证式范畴,以效应的形态让人们感受和意识,对它的评价,同时就是对它的效应的 评价。 教学评估作为教育评估的一个重要方面,不仅是构成教育评估的主体部分与基础, 而且已成为教学过程中不可或缺的重要环节 1 。 1 、教学评估是改革、发展现代教育事业的需要。 教育要发展,要真正实现现代化的战略要求,必须牢牢把握教育发展的时代脉搏, 时时掌握教育发展的时代走向,及时发现、调整并纠正地区或部门在当前教育、教学中 存在的某些流弊与不足,真正走上提高全民族素质、多出人才、出好人才的现代教育发 展战略轨道。这不仅要求教育工作者具有高瞻远瞩、高屋建瓴的慧识和胆略,更关键是 要对教育、教学实际情况进行深入地分析、把握、处理与决策。对学校的教育情况,特 别是教育工作的中心环节教学情况进行实际有效地监督检查。教学评估作为检测教 学目标和效果实现程度的一种重要手段,已成为探讨、研究现代教育发展战略的基础性 工作之。重视并研究教学评估,已成为世界各国教育管理的普遍要求。发达国家如美 国、日本、英国等,都非常重视评估工作,积极探讨、研究各种适应评估的可行方法, 以期对学校教育、教学、教师、课程、教材、教法以及学生的技能、水平、品行、素质 等情况做出恰如其分的检测与评估,并力图以此为手段,促进教育、教学目标的实现, 推动教育事业的进步与发展。教学评估体现了现代教育发展与进步的世界性趋势,体现 了现代教育走向未来的必然方向,已成为改革、发展现代教育事业的切实需要。 2 、教学评估为教育、教学的发展提供了决策的依据。 根本上讲,教学评估的目的主要有以下几点:第一,通过教学评估,诊断并改进教 学;第二,通过教学评估,帮助有关部门做出有关教师教学等情况的相应决定;第三, 通过教学评估,帮助学生选择课程、制定学习计划;第四,通过教学评估,向有关各方 ( 如学校、社会、家长) 提供学生学习情况的信息;第五,通过教学评估,检验教学效果 与预期教学目标的实现情况,为教育和教学本身提供资料与决策依据。其中,最后一个 的是教学评估最主要的目的,是教学评估的实质。由于教学评估是检验教学情况的重要 途径,也是有关部门了解教师情况、学生情况、学校教学情况的重要途径,因此,通过 认真组织开展教学评估,可以发现教育、教学过程中存在的问题,找到不足或差距,便 于及时采取相应的对策与措施,加以适当的控制与调节,纠正偏离教学目标的不适部分, 2 太原理工大学硕士研究生学位论文 使其全面、持续地保持良性循环,促进教学质量的不断提高。同时,教学评估资料与评 估结果的获得,为以后教育、教学的科学决策提供了可靠的依据。 3 、教学评估有利于促进教学、科研、教改与教学管理水平的进步与提高。 教育的发展,教学质量的提高,离不开教学水平、科研水平以及教学管理水平的提 高。而教学、科研、教改及教学管理水平的进步与提高,除了有赖于教育工作者自觉地 不懈努力外,也依赖于外在的督促与检测。教学评估作为教学过程必不可少的一种检测 与监督手段,其深入开展,必然会有利于促进教学、科研、教改及教学管理的不断提高。 教学评估不但能起到对照标准找差距的自我认识作用,而且也具有唤起被评估者之间、 后进者与先进者之间比、学、赶、帮、超的激励作用。教学评估信息的及时反馈,教学 过程中的优劣得失的及时总结,不仅使被评估者明确了自己以后需要学习提高的方向, 有利于被评估者适时调整自己的教学活动,同时也促进他们把客观评估的标准能动地转 化为自己内在的奋发动力,促使他们注意不断地吸取对方的长处,提高自己的素质与素 养,并改进教学、深入教研,以完善自己的实际工作,从而从根本上促进了整个教学, 科研、教改及教学管理水平的提高。 4 、通过教学评估可以促进学校内部建立起教学质量保障体系。 建立起一套保证和提高教学质量的体制,可以逐步建立起定期向社会提供高校有关 信息的机制,来满足学生或家长选择学校的需要;可以使学校在接受社会监督的同时也 会获得社会的理解和支持;可以在激烈的人才市场竞争和教育市场竞争中增强适应环境 变化的能力,提高生存发展的能力;可以保证学校教育教学质量的可信度,有利于保障 学校的教学质量,适应世界高等教育的迅速发展趋势。 可以说,教学评估能引导学校明确办学指导思想,转变教育观念,促进学校各级领 导高度重视教学工作,加大教学投入,改善办学条件,推动学校人才培养模式、教学内 容和课程体系的改革,使学校加强教师队伍建设,推动高校教学管理制度的创新、学校 的管理水平和教学管理效益的提高。所以加强教学评估的建设有重要的意义。 3 太原理工大学硕士研究生学位论文 1 2 高校教学质量评估系统研究及使用情况 1 2 1 高校教学质量评估系统的现状与目标 现行的教学质量评估大多采用由学生考评的方法,通常由教务管理部门在期中或期 末将教师教学质量评估卡发给学生,根据评估卡中的评估项目对教师进行打分,经教务 管理部门统计后根据评分结果确定该教师教学质量考核的等级 2 。 高校教学质量评估的目标:对国家来讲,通过评估对高等教育教学进行宏观调控, 掌握各学校的办学水平和办学质量状况,用评估指标体系指明高校今后办学的努力方 向,切实提高高等教育办学水平和质量。对各高校来讲,通过评估,对照指标体系 肯定自身已有成绩,找出存在的差距,制定相应整改措施,从而促进本校的建设与提高, 使教育教学的水平更上一层楼。综合起来讲,评估只是一种手段,其真正的目的在于“以 评促建,以评促改,评建结合,评建结合、重在建设” 3 。 1 2 2 高校教学质量评估系统目前存在的问题 加强高校教学工作,除了要在观念上、政策导向上转变“重科研轻教学”的现象, 充分认识教师在教学过程中的主导作用,客观地认识教学在高校中不可替代的地位与作 用外,还要探索并逐步健全科学的教学质量评估方法。把教学业绩和教学成果合理量化, 并将评估结果与教师的追求相挂钩,从根本上改变高校长期存在的“科研运作自动型, 教育工作推着走”的局面,把教学工作是高校的中心工作真正落实到教师的行动中去。 现行的教学质量评估大多采用由学生考评的方法,通常由教务管理部门在期中或期 末将教师教学质量评估表发布在网上,根据评估表中的评估项目对教师进行打分,经教 务管理部门统计后根据评分结果确定该教师教学质量考核等级。在这种评价方法下,只 能取得单纯的评估结果,不能对评估数据进行分析,不能充分发挥教学评估对教学的指 导作用,没有充分利用现有的数据。 1 2 3 评估系统引进数据挖掘 随着我国高校内部教学质量评估活动的深入开展,以学生评估教师为主的教学评 4 太原理工大学硕士研究生学位论文 估,对教学改革和教学质量的提高的确起到了一定的作用。但是究竟如何表达、分析、 解释、公布和使用教学评估结果,才能充分利用这些数据,提高教学水平和质量。调动 广大教师和学生的积极性。注重和参与教学评估,使评估发挥出更大的作用,正是面临 的一个值得研究的新课题。 数据挖掘技术在近几年刚刚出现,在实际领域得到广泛的应用,产生了良好效果。 其优点是利用己有信息系统存储的数据进行挖掘计算,通过计算机应用程序,把复杂的 统计技术、挖掘算法封装起来,即使不用掌握这些技术也能完成同样的功能,从而更专 注于所要解决的问题。正是基于上述原因,本文旨在将数据挖掘技术引入到教学评估领 域中,研究并开发一个基本的高校教学评估数据挖掘系统。 数据挖掘在教育领域的应用相对较少,高校中师生的信息、成绩等数据的处理还停 留在简单的数据备份和查询阶段,随着高校的不断扩招,学生、教师的大幅增加,给高 校的信息管理和教学工作带来严峻的考验,传统的教学管理手段已经逐渐不能满足实际 的需要。随着数据挖掘技术的成熟和应用的不断推广,数据挖掘技术已经逐步应用于高 校教学和管理的多个方面,如学习成绩预测评价、教师的年终考核和网络教学服务 4 。 1 、学习成绩预测与评价 利用线性回归分析和时间序列来预测学生的学习成绩,从而采取对应的措施来避免 学习成绩下滑,进一步提高教学质量。 2 、教炳的年终考核 从教师的年度管理数据库中挖掘相关数据,评价全年的教学成绩。:如根据教师的教 学成绩、政治思想品德、进修情况、学历教育,学生工作情况等进行决策分析,评定当 年的工作成绩。 3 、利用网络进行教学服务 利用每个学校现有的局域网络,挖掘后台数据库中的数据,有针对性地设置网络页 面。如:通过挖掘数据库中保存的上网者信息,针对教师的需求设置相关页面,针对的 学生设置另一个页面,也可以根据上网者的需要设置流量大小或个性化的网页。通过w e b 挖掘,得出教师、学生对网络的需求是什么,从而制定相关的项目,引导学生进行相关 的学习与娱乐。 本文主要研究的是利用数据挖掘技术对太原理工大学计算机学院近两年的教学评 估数据进行分析挖掘,得到影响计算机学院教师教学的主要指标,给出教师相关建议。 5 太原理工大学硕士研究生学位论文 1 3 数据挖掘技术 1 3 1 数据挖掘技术简介 数据挖掘( d a t a m i n i n g ,简称d m ) 可以说是数据库中的知识发现。它是指从大量的、 不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的, 但又是潜在的、有用的信息和知识的过程。它综合利用了统计学方法、模糊识别技术、 人工智能方法、人工神经网络技术等相关技术,并对各行各业的生产数据、管理数据和 经营数据进行处理、组织、分析、综合和解释,以期望从这些数据中挖掘并揭示出客观 规律,反映内在联系和预测发展趋势的知识。例如医学研究人员希望从已有的成千上万 份病历中找出患某种疾病的病人的共同特征,从而为治愈这种疾病提供一些帮助。 从数据库中发现知识( i ( d d ) 一词首次出现在1 9 8 9 年举行的第一届国际联合人工智能 学术会议上 5 。到目前为止,由美国人工智能协会主办的k d d 国际研讨会己经召开了 多次,规模由原来的专题讨论会发展到国际学术大会,研究重点也逐渐从发现方法转向 系统应用,注重多种发现策略和技术的集成,以及多种学科之间的相互渗透 6 。 i e e e ( i n s t i t u t ef o re l e c t r i c a la n de l e c t r o n i ce n g i n e e r s ) ,a c m ( a s s o c i a t i o nf o r c o m p u t i n gm a c h i n e r y ) 等其它学会、学刊也纷纷把数据挖掘与知识发现( d a t am i n i n ga n d k n o w l e d g ed i s c o v e r y ,d m k d ) 列为会议议题或出版专刊,成为当前国际上的一个研究热 点。 到目前为止,对关系数据库和事务数据库进行数据挖掘和知识发现的研究已经取得 了一定的进展,最有影响的发现算法有:加拿大s i m o nf r a s e 大学j h a n 教授的概念树 提升算法、i b m 的r a g r a w a l 的关联算法、澳大利亚的j r o u i n l a n 教授的分类算法、 密西根州立大学e r i c kg o o d m a n 的遗传算法等。i b m 、g t e 、s a s 、m i c r o s o f t 等公司,相 继开发出一些实用的k d d 商业系统和原型系统,如市场分析用 8 的b e h a v i o rs c a n 、 e x p l o r e r ,金融投资 9 领域的s t o c ks e l e c t o r 、a i ( a u t o m a t e di n v e s t o r ) ,欺诈预警 用的f a l c o n 、f a i s 等。 与国外相比,国内对数据挖掘的研究起步稍晚,且没有形成整体力量。1 9 9 3 年国家 自然科学基金首次支持对该领域的研究项目。目前,国内从事数据挖掘研究的人员主要 在大学,也有部分在研究所或公司。国内许多科研单位和高等院校竞相开展数据挖掘的 6 太原理工大学硕士研究生学位论文 基础理论及其应用研究,这些单位包括清华大学、中科院计算技术研究所、空军第三研 究所等。其中,北京系统工程研究所对模糊方法在知识发现中的应用进行了较深入的研 究;北京大学也在开展对数据立方体代数的研究;华中理工大学、复旦大学、浙江大学 等单位开展了对关联规则开采算法的优化和改造:南京大学、四川联合大学和上海交通 大学等单位探讨、研究了非结构化数据的知识发现以及w e b 数据挖掘。所涉及的研究领 域很多,一般集中于学习算法的研究、数据挖掘的实际应用以及有关数据挖掘理论方面 的研究。目前进行的大多数研究项目是由政府资助进行的,如国家自然科学基金、8 6 3 计划等,但至今还没有关于国内数据挖掘产品的报道。一份最近的报告中列举了在今后 3 5 年内对工业将产生重要影响的五项关键技术,其中k d d 和人工智能排名第一。 知识发现( k d d ) 被认为是从数据中发现有用知识的整个过程。数据挖掘只是数据库 中知识发现的一个步骤,但又是最重要的一步,它用专门算法从数据中抽取模式 1 0 。 原始数据可以是结构化的,如关系型数据库中的数据,也可以是半结构化的,如文本、 图形、图像数据,甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的, 也可以是非数学的;可以是演绎的,也可以是归纳的。发现了的知识可以被用于信息管 理、查询优化、决策支持、过程控制等,还可以用于数据自身的维护。因此,数据挖掘 是一门广义的交叉学科,汇聚了不同领域的研究者,尤其是数据库、人工智能、数理统 计、可视化、并行计算等方面的学者和工程技术人员。 1 3 2 数据挖掘的意义 数据挖掘与传统的数据分析( 如查询、报表、联机应用分析) 的本质区别是数据挖掘 是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先未 知,有效和实用三个特征。 先前未知韵信息是指该信息是预先未曾预料到的,即数据挖掘是要发现那些不能靠 直觉发现的信息或知识,甚至是违背直觉的信息或知识。数据挖掘通过预测未来趋势及 行为,做出前摄的、基于知识的决策。数据挖掘的目标是从数据库中发现隐含的、有意 义的知识,主要有以下五类功鲥“1 。 1 、自动预狈0 趋势和行为 数据挖掘自动在大型数据库中寻找预测性信息,以往需要进行大量手工分析的问题 如今可以迅速直接由数据本身得出结论。 7 太原理工大学硕士研究生学位论文 2 、关联分析 7 数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值 之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联 分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即 使知道也是不确定的,因此关联分析生成的规则带有可信度。 。 3 、聚类 数据库中的记录可被化分为一系列有意义的子集,即聚类。聚类增强了人们对客观 现实的认识,是概念描述和偏差分析的先决条件。聚类技术主要包括传统的模式识别方 法和数学分类学。8 0 年代初,m c h a l s k i 提出了概念聚类技术,其要点是,在划分对象 时不仅考虑对象之间的距离,还要求划分出的类具有某种内涵描述,从而避免了传统技 术的某些片面性。 4 、概念描述 - 概念描述就是对某类对象的内涵进行描述,并概括这类对象的有关特征。概念描述 分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述的是不同类对 象之间的区别。生成一个类的特征性描述只涉及该类对象中所有对象的共性。生成区别 性描述的方法很多,如决策树方法、遗传算法等。 5 、偏差检测 数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。偏差包括 很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的 偏差、量值随时间的变化等。偏差检测的基本方法是,寻找观测结果与参照值之间有意 义的差别。 1 3 3 数据挖掘的工作流程 那么如何进行数据挖掘呢? 数据挖掘来源于知识发现( k d d ) ,是数据库发展和人工 智能技术相结合的产物,因而通常所说的数据挖掘往往包括k d d 的全过程,类似于通常 的一个开采过程,整个过程可以分成三个阶段来完成 1 2 :数据准备阶段、数据挖掘阶 段和结果的显示阶段。 8 太原理工大学硕士研究生学位论文 数据挖掘环境可示意如下图: 困1 1 数据挖掘环境框图 v i g l 一1d a t am i n i n ge n v i r o n m e n t , 按工作流程包括以下几个个步骤e 1 4 : 1 、问题定义:对应用领域知识进行充分的理解和分析,明确挖掘对象和目标。例 如在企业应用中,对企业的业务流和数据流进行分析,获得对数据挖掘过程有帮助的专 业知识,加入到数据挖掘工具的知识库中,由此确定数据挖掘的最终目标。 2 、数据准备: ( 1 ) 搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖 掘应用的数据。 ( 2 ) 数据净化和预处理包括去噪声,填补丢失的域,删除无效数据等。 , ( 3 ) 判断数据挖掘的功能类型数据挖掘的功能类型分为验证型和发现型。验证型是 指由用户首先提出假设;发现型是指用数据挖掘工具从数据中发现用户未知的事实、趋 势、分类等,或是回归模型、数据库记录之间的关联和数据偏差等。 ( 4 ) 选择适宜的数据挖掘的算法。根据数据功能的类型和数据的特点选择相应的算 法。常用的算法有人工神经元网络、决策树算法、集合论算法和遗传学算法等。可以通 过伸缩性、精确性、可解释性来评价所选择的算法和性能。 ( 5 ) 进行数据转换。根据数据挖掘的目标、功能及数据挖掘算法,按指定方法组织 数据,根据已了解的知识得出限定变量,转换数据类型并且映射数据到易于找到解的特 征空间。 3 、数据挖掘。在净化和转换过的数据集上进行数据挖掘。 4 、结果韵分析和同化。输出挖掘结果对数据挖掘出的结果进行解释和评价,转换 成为能够最终被用户理解的知识。综合分析把已得到的知识和已有的知识进行综合,检 查和处理它们之间的冲突,通过简明直观的方法把最终结果报告给用户,并且评价整个 处理流程的性能。 9 太原理工大学硕士研究生学位论文 数据挖掘过程如下图: 不满意 定义问题 i 建立数据挖掘库 j l 有效数据 准备数据 l 建立模型 净 数据挖掘 1 结果的分析同化 无效数据 图卜2 数据挖掘的基本过程和主要步骤 f i g l - 2 p r o c e s s a n ds t e p s o f d a t a m i n i n g 数据挖掘中被研究的业务对象是整个过程的基础,它驱动了整个数据挖掘的过程, 也是检验最后结果和指引分析人员完成数据挖掘的依据和顾问。图1 - 2 中各个步骤是按 一定顺序完成的,当然整个过程中还会存在步骤间的反馈。数据挖掘的过程并不是自动 的,绝大多数的工作需要人工完成。图卜3 给出了各步骤在整个过程中的工作量之比。 可以看到,6 0 的时间用在数据准备上,这说明了数据挖掘对数据的严格要求,而后的 挖掘工作仅占总工作量的1 0 。 1 0 太原理工大学硕士研究生学位论文 图卜3 数据挖掘步骤工作量比例 v i g l - sw o r ko f d a t am i n n g 当前,d m k d 研究与开发的总体水平相当于数据库技术在7 0 年代所处的地位,迫切 需要类似于关系模式、d b m s 系统和s q l 查询语言等理论和方法的指导,才能使d m k d 的 应用得以普遍推广。预计在本世纪,啪的研究还会形成更大的高潮,研究焦点可能会 集中到以下几个方面: 1 、发现语言的形式化描述,即研究专门用于知识发现的数据挖掘语言,也许会像s q l 语言一样走向形式化和标准化。 2 、寻求数据挖掘过程中的可视化方法,使知识发现的过程能够被用户理解,也便于在 知识发现的过程中进行人机交互。 3 、研究在网络环境下的数据挖掘技术( w e bm i n i n g ) ,特别是在因特网上建立啪服务 器,并且与数据库服务器配合,实现w e bm i n i n g 1 5 3 。 4 、加强对各种非结构化数据的开采( d a t am i n i n gf o ra u d i o v i d e o ) ,如对文本数 据、图形数据、视频图像数据、声音数据乃至综合多媒体数据的开采;处理的数据将会 涉及到更多的数据类型,这些数据类型或者比较复杂,或者是结构比较独特。为了处理 这些复杂的数据,就需要一些新的和更好的分析和建立模型的方法,同时还会涉及到为 处理这些复杂或独特数据所做的费时和复杂数据准备的一些工具和软件。 5 、交互式发现。 6 、知识的维护更新。 只有从数据中有效地提取信息,从信息中及时地发现知识,才能为人类的思维决策 和战略发展服务。也只有到那时,数据才能够真正成为与物质、能源相媲美的资源,信 1 1 太原理工大学硕士研究生学位论文 息时代才会真正到来。 1 4 论文的主要内容及论文结构 如何更有效的利用大量的数据理性地分析、指导教师教学是本文的主要内容。根据 目前高校教学的需求,本文把数据挖掘技术应用到教学评估系统中,把分析数据、挖掘 数据的环境通过接口与教学评估管理系统集成到一起,生成了管理、分析与挖掘一体的 管理系统;并提出一种分析挖掘教学质量评估数据的新模式:用偏相关分析方法和因子 分析法对影响教师教学质量的各种指标进行分析,然后采用多元线性回归技术从分析的 结果中发现有价值的指标模式,从而得到影响教师教学质量的主要指标。在此指标模式 的基础上,教师可以通过自己主要指标的得分情况进行改进,同时也可以得到教学的相 关建议,从而提高教学质量。 第一章,首先介绍教学评估的意义及其发展概况,并分析了教学评估的特点。第二 章,在深入研究数据挖掘理论和系统体系结构的基础上,对数据分析挖掘系统的总体框 架进行了设计。第三章,对太原理工大学计算机学院近两年的评估数据进行分析挖掘, 是分析挖掘教学质量评估数据的新模式在评估系统中的实施,具体内容包括:在提出问 题的基础上建立数据挖掘库,采用偏相关分析法和因子分析法分析数据,并用多元线性 回归技术得到较好的指标模式。在得到指标模式的基础上,设计了信息交互,让教师可 以查询自己主要指标的得分情况,同时也可以得到教学的相关建议,从而提高教学质量。 第四章是总结与展望。 1 2 太原理工大学硕士研究生学位论文 第二章系统的总体设计 太原理工大学已初步建立起教学评估管理系统和网上教学评估系统。本章在对已有 系统分析的基础上,对数据分析挖掘系统的总体框架进行了设计。根据总体设计把分析 数据、挖掘数据的环境通过接口与教学评估管理系统集成到一起,生成了管理、分析与 挖掘一体的管理系统;对已有系统进行了指标完善;并提出一种分析挖掘教学质量评估 数据的新模式。 2 1 系统现状的分析研究 完善教学质量评估和监控体系是保障高校教学内容与系列课程综合改革的重要手 段。目前已初步形成了较为完整的学院教学质量评估和监控体系,包括网上教学评估系 统和教学评估管理系统。 该系统采用b s 与c s 结构相结合的方式。在b s 方面,以j s p 这一较为成熟的w e b 网页技术为根本出发点,通过d r e a m w e a v e r 2 0 0 4 开发网页主体框架结构,用 j g u i l d e r 2 0 0 5 做j s p 开发工具,并将j a v a s c r i p t 脚本语言嵌入网页中,采用o r a c l e g i 建立w e b 数据库;在c s 方面,用d e l p h i 7 0 开发后台管理程序。 2 1 1 网上教学评估系统 网上教学评估系统包含如下几个模块( b s 结构) 如图2 1 : 用户登录修改密码评估教师查询评估结果 ( 1 ) 用户登录。登录时,输入用户名和密码,选择相应的身份( 学生、教师、专家) 就可以进入网上评估系统。在用户输入用户名和密码后,点击【提交】按钮,系统将自 动从数据库中的登录表中判断是否存在相同的用户名和密码,如果有则顺利进入网上选 课系统,如果没有就会显示出错信息。 1 3 太原理工大学硕士研究生学位论文 图2 - i 网上教学评估系统模块图 f i 9 2 一lm o d u l eo f b ss y s t e m ( 2 ) 修改密码。用户登录后可进行密码修改。用户必须输入旧密码和新密码,并进 行新密码的二次确认后才可以修改成功。 ( 3 ) 评估。评估时,首先要输入有关信息,然后系统根据输入的信息从数据库中查 找能评估的课程信息,并显示出来提供给用户评估。用户在评估时必须填写完所有评估 项目才能提交。已经评估过的教师不能重新评估。用户在评估表最后可填写对被评教师 的意见,一并提交给数据库,数据库储存信息。 ( 4 ) 评估结果查询。只有教师和专家才可以进行查询,教师只能查询到教师本
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年安全生产GMP认证模拟练习题及答案
- 2025年健康管理顾问资格认证考试试题及答案解析
- 2025年建筑施工现场监理员专业能力测评试题及答案解析
- 2025年家政服务员职业技能考试试题及答案解析
- 机电行业外贸知识培训班课件
- 2025年宠物音乐疗愈师初级面试模拟题及答案
- 2025年广告文案策划师职业水平评定试题及答案解析
- 中学语文教学通讯课件
- 如何写好讲解课件教学
- 课件上的秘密
- 中建动臂塔吊爬升方案
- 2024年成人高考成考(专升本)艺术概论试卷与参考答案
- 个人信访材料模板范文
- 解读国有企业管理人员处分条例(2024)课件(全文)
- DL∕T 1870-2018 电力系统网源协调技术规范
- AQ 1083-2011 煤矿建设安全规范 (正式版)
- 创新创业基础-理论、案例与训练(大学生创新创业教育课程)全套教学课件
- 小学语文四年级下册语文修改病句60题练习及答案
- 肺部体格检查
- 《信息检索与处理(修订版)》课件上 第1单元 检索信息-第2单元第一课 评价和选择信息
- 人工智能在铸造领域的应用
评论
0/150
提交评论