开题报告(数据挖掘)_第1页
开题报告(数据挖掘)_第2页
开题报告(数据挖掘)_第3页
开题报告(数据挖掘)_第4页
开题报告(数据挖掘)_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、附表三:高校教师在职攻读硕士学位研究生论文选题计划表研究生姓名:指导教师:专业:计算机应用技术所属院(所):计算机科学与技术学院2010 年 4 月 2 日研究生姓名专业计算机应用技术导师姓名研究方向数据挖掘毕业论文题目数据挖掘在高职教学中的应用论文类型理论研究应用研究用于生产其它选题目的和意义:由于我国大众化高等教育的普及,高校学生数量的激增,给高校教学工作带来了 诸多新的问题。尤其是高职学生,他们的主体是普通高中应届毕业生高考最后一批录 取的学生。这些学生在学习意识、学习方法、学习能力及学习动力上比较欠缺,并可 能有较多常见的心理问题。大部分学生没有养成良好的学习习惯。他们中的大部分学 习

2、基础比较差.自制力也比较弱,学习目标不够明确,缺之刻苦钻研精神。很多学生 就读离职并不是因为自身渴望学习。而是无可奈何或出于应付家长的要求。他们对所 学的专业并没有太多了解,因此学习目标不够明确冋时,他们还对社会对其的容纳有 一种怀疑,这种怀疑直接导致了自信心的不足,由此也影响到学生学习的动力。此外, 由于这批学生普遍没有养成良好的学习习惯,叉影响了良好学习氛围的营造,不良的 学习氛围又反过束影响学生的学习动力。教师迫切地需要科学地研究高职教学各个环 节中的大量的数据信息。从中获取知识,继而科学地指导教学。二十世纪,数据库技术取得了决定性的成果并且得到广泛应用.大量信息在给人 们带来方便的冋时

3、也带来了一大堆难题;第一是信息过量,难以消化;第二是信息真 假难以辨识:第三是信息安全难以保证;第四是信息形式不一致,难以统一处理。人 们开始提出一个新的口号:“要学会抛弃信息”,并开始考虑:“如何才能不被信息淹没,而是从中及时发现有用的知识、提高信息利用率?”如何从含有海量信息的数据库中提取潜在、有价值的信息来辅助决策,预测未来成为信息处理的更新更咼的要求, 知识发现和数据挖掘技术应运而生,共显示出强大的生命力。数据挖掘使数据库技术 进入了一个更高级的发展阶段。80年数据挖掘技术(Data Mining)被称为未来信息处理的骨干技术之一,是一个多学科 交叉研究领域,融合了数据库,人工智能、机

4、器学习,统计学,知识工程、面向对象 方法、信息检索,高性能计算以及数据可视化等多项最新技术数据挖掘技术从 代末开始出现。短短二十多年它的发展速度很快。目前数据挖掘技术在零售业的购物 篮分析、金融风险预测、产品质量分析、通讯及医疗服务、基因工程研究等许多领域 得到了成功的应用很多专题会议也把数据挖掘和知识发现列为议题之一。把数据挖 掘技术应用于高等学校的教学与管理中,是数据挖掘技术在又一个领域的应用高等 学校多年来的教学和管理工作积累了大量的数据,目前,鉴于社会对高等学校发展的 需求和高校数据管理的现状,利用这些数据理性的分析学校各方面工作的成效以及教 师发展状况,对高校教学管理决策支持系统的影

5、响变得十分重要。数据挖掘技术能从 大量数据中发现有用的知识,这些知识对高等学校教学管理的决策支持是十分有意义 的。利用数据挖掘技术从数据仓库中获取高质量的信息,可以检验教学效果,调节课 程设置。合理安持师资,正确评价教师的年度工作,及辅助调整招生计划、分析预测 就业趋势等等。虽然目前数据挖掘技术主要在商业领域中得到广泛发展,但它面向应 用的本质决定了在任何需要的领域都会发挥它的价值在高校教育教学及管理中有大量直接或间接的数据,关系到教师评价、人才管理及学生选课指导、学生成绩分析等 内容。这些数据具有复杂性、多因素性和模糊性等特点,是一类带有大量不确定因素 的半结构化问题或非结构化问题而大量的数

6、据主要是以各级管理部门提供的统计报表 和简单信息查询方式存在,对这些数据所隐含的价值没有充分挖掘利用。通过数据挖 掘技术,找出有价值的信息,客观、科学、全面地供教学管理部门参考。以学生成绩为例,教师对学生成绩的分析处理一般仅仅是统计成绩处在优、一般、 差级别的人数,对于学生取得这些成绩的原因往往无法了解。如果教师能够找到有关 影响学生学习成绩的因素,必然对教学质量的提高起到积极的作用。2国内外研究动态:自1989年第11届国际联合人工智能学术会议上首次提出KDD这一概念以来,数据挖掘日益受到人们的关注。并已经成为当前计算机领域的一大热点,其研究的重点 也逐渐从发现方法转移到系统应用,并且注重多

7、种发现策略和技术的集成,以及多学 科之间的相互渗透。从总体上,国外在数据挖掘领域中的研究内容十分广泛,从挖掘知识的种类看, 己经取得了明显的成果。1、关联规则的研究。近几年对关联规则的研究内容较多。现在,关联规则的挖掘 已经从单一概念层次关联规则的发现发展到多概念层次关联规则的发现,并把研究的 重点放在提高算法的效率和规模可收缩性上。目前,人们对于定量关联规则以及其他 种类的关联规则的发现研究较为深入,提出了关联规则的兴趣性的概念。与此同时,在提高挖掘过程的效率方面也作了不少的研究。比较著名的算法有Apfiori , Charm,FP-Growth , Mag num OPUSS Gen Ma

8、x2、数据分类技术研究。 基于决策树的分类方法在大规模数据库条件下的应用研究;在较高的抽象层次分类中,M Mehte .等人针对大型数据库提出了种快速分类算法,称为QUEST中的超级学习算法,SLIQ :分类与回归的管状领域研究、最近邻分类方法的改进等等。3、 聚类规则研究。近年,聚类开始在大型数据库中得到研究,R. Ng和1. Han基于随机搜索以及统计学中的两个聚类算法PAM和CLARA给出了一个适用于大型应用的聚类算法:CLARANSM. Este等人针对 CLARANS算法的缺点,提出了改进技术。T. Zhang 等人则提出了另一种聚类算法:BIRCH。4、泛化、简约和特征提取研究。利

9、用数据可视化大大扩展了数据的表达和理解能 力,这是数据简约的一种非常重要的技术,它正受到广泛的重视。与国外相比,国内对数据挖掘与知识发现(MDKD)的研究稍晚,1993年国家自然科学基金首次支持对该领域的研究项目。目前,清华大学、中科院计算技术研究所、空 军第三研究所、海军装备论证中心等竞相开展数据挖掘的基本理论及其应用研究。其 中,北京系统工程研究所对模糊方法在知识发现中的应用进行了较深入的研究,北京大学也在开展对数据立方体代数的研究;华中理工大学、复旦大学、浙江大学、中国 科技大学、中科院数学研究所、吉林大学等单位开展了对关联规则开采算法的优化和 改造:南京大学、四川联合大学山东师范大学硕

10、士学位论文上海交通大学等单位探讨, 研究了非结构化数据的知识发现以及Web数据挖掘。现在尽管与国际上的进展相差并不远,一些研究成果例如:总参六十一所李德毅教授在云模型方面的研究、复旦大学 的施伯乐教授在关系数据库中知发现方面取得很大的成果,南京大学开发的 KNIGHT系统等但在实际应用方面却鲜有所闻,成功的例子很少,没有形成整体力量。总的说 来国内在数据挖掘方面的开发还停留在实验的阶段,没有能够真正的投入到实际生 产应用中去。数据挖掘最先应用于金融和商业领域,在教育层面上还只能算是新生事物,处于发 展的初级阶段。国内高校目前在校园信息网中开展数据挖掘的研究并不广泛。浙江大 学使用关联规则发现技

11、术对高校的人事信息库进行挖掘,试图找到影响学科发展的因 素,发现如何评价一个学科,以及影响学科发展的各个要素之间的关系。另外。曲阜 师范大学体育系与上海市体委就体育人才的选拔探讨了数据挖掘的可行性。在每年对 中小学生的体质调查中,积累了大量的数据,利用数据挖掘技术,他们试图从数据中 深入寻找各种因素的相互联系,发现一些随机因素动态变化而产生的新的指导学校体 育科研和教学训练的规律,进而发现运动人才。数据挖掘在教育层面上的研究还只能 算是新生事物,处于发展的初级阶段。在教育信息化的大趋势下,将数据挖掘技术应 用于教育领域内的学生招募、市场细分、学生来源分析、课程相关性、学习评价度量、 学生生涯规

12、划、远程开放教育的个性化服务等方面,必然有十分广阔的前景。数据挖掘是一种技术,和其他技术一样,数据挖掘也需要时间和精力来研究、开发 和逐步成熟,最终被人们接受。目前己经有很多通用的数据挖掘系统,但是还不能达 到期望的智能系统那样。在近来的数据挖掘研究和开发中,一些挑战也已受到一定程 度的关注,并考虑到了各种需求,而另一些处于研究阶段。然而,这些问题将继续刺 激进一步的研究和改进。我们相信,随着数据挖掘任务和方法的发展,一定能带给我 们更多的利益,可以节约我们的时间和金钱,并发现新的知识。主要内容:高等学校多年来的教学和管理工作积累了大量的数据,目前这些数据还未能得到有效利用,只是一个待开发的“

13、宝藏”。鉴于社会对高等学校发展的需求和目前高校数据管理现状,利用这些数据理性地分析学校各方面工作的成效以及学生培养过程中的得 失变得十分重要。本文主要研究在高校扩招、师生比过大的教学条件下,教师如何利用丰富的信息资 源,采用数据挖掘技术,获得辅助决策知识,指导教学,从而进一步提高教学质量。数据挖掘技术主要介绍数据挖掘的基本知识,包括数掘挖掘的过程、数据挖掘的任 务、数掘挖掘的分类以及数据挖掘的常用技术和方法。探索数据挖掘技术在高校教学 中的应用,提出数据挖掘技术在高校教学应用中的实施方案。实验设计方案:第一步,确定挖掘对象、目标。清晰地定义出问题,认清数据挖掘的目的是数据挖 掘的重要一步。挖掘

14、的最后结果是不可预测的,但要探索的问题应是有预见的。第二步,数据采集。这是一个工作量较大,占据时问较多的一个阶段。教师需要在 以往的教学实践中,注意收集数据信息,有些数据的产生可以直接获得,有些数据需 要对学生进行调查获得。第三步,数据转换。这一步是将教师收集到的不同的数据信息集成并转换为一个分 析数据模型,这一数掘模型是针对算法而准备的不同的算法可能需要不同的分析数 据模型。第四步,数据分类挖掘。分类挖掘的目的是为了建立一个分类模型。首先要选择合 适的挖掘算法,并使用合适的程序设计软件实现这一算法:接着对所得到的经过转换 的数据进行挖掘。第五步,分类规则结果分析。这一步主要解释和评估分类结果

15、。第六步。知识的应用。这一步是将分析所得到的知识集成到教师的教学环节中去, 教师可利用所得知识改进教学策略指导进一步教学。准备工作情况和主要工作措施:利用学院的教务管理系统,获得学生的成绩信息。设计学生信息调查表,由学生填写,内容包括学生对计算机公共基础课程的感兴趣程度、课堂学习效果、对本课程的认识和教师的教学方法等。利用数据挖掘算法对数据进行处理,建立决策树,得出推动计算机课程教学的规则。论文进度安排及预期达到研究结果:201042010.9资料查询、确定论文主题2010.9-2010.10数据挖掘的理论研究2010.10-2010.11数据挖掘常用技术研究2010.11-2010.12数据挖掘的应用研究2010.12-2011.1数据挖掘的新技术研究2011.1-2011.2数据挖掘的发展方向2011.2-2011.4撰写论文2011.4-2011.5论文修改6文献综述:(4000字以上,参考文献30篇以上,其中至少10篇外文参考文献)7考核小组对报告人查阅专业技术文献情况的评价1 查阅与本专业相关的专业技术文献数量是否达到30篇(其中外文10篇)?2查阅的文献是否全面,是否反映本学科专

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论