数据挖掘课程设计_第1页
数据挖掘课程设计_第2页
免费预览已结束,剩余19页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、枣庄学院信息科学与工程学院课程设计任务书题目数据挖掘在期末成绩评估中的应用小组成员:赵尊强、桂文学成员学号:201212110136、201212110106专业班级:计算机科学与技术、2012级本1班课程:数据挖掘指导教师:迟庆云职称:副教授完成时间:2015年5月-2015年6月枣庄学院信息科学与工程学院制2015年5月20日1 / 18开发小组成员分工及职责赵尊强:设计规划、文献搜集桂文学:挖掘资料、数据整合2 / 18课程设计任务书及成绩评定课程设计的任务和具体要求任务:1.确定挖掘主题和方法:根据挖掘的主题和目标,确定合适的挖掘方法。2.数据选择和预处理:根据所收集数据,填充缺失值,

2、平滑噪声数据,消除 异常值,解决数据不一致等问题。3挖掘方法实现:规划挖掘过程,界面设计,挖掘方法实现。4挖掘数据:对预处理后的数据进行挖掘4模式的可视化表达与解释:根据应用领域的信息和知识需求,以直观有效 的形式,如图表等显示数据挖掘出的模式,用特定领域的知识加以解释,使 得用户能够理解和接受。要求:撰写出符合要求的软件项目综合实践报告。指导教师签字:_迟庆云_日期:_指导教师评语成绩: _指导教师签字: _ 日期: _3 / 18课程设计所需软件、硬件等硬件环境:Iterl(R) Core(TM)2 Duo CPU,主频2.31GHz;内存3G硬盘320G以上;1024X768显示分辨率软

3、件环境:Delphi ,SQL Server2008,WEKA课程设计进度计划起至日期工作内容备注5月01日一06日5月07日一20日搜集资料课程设计分析6月05日一08日6月09日一18日系统设计、测试设计写报告书参考文献、资料索引序号文献、资料名称编著者出版单位4 / 181Jamie MacLe nnan , ZhaoHui Ta ng , Bogdan Crivat 著.数据挖掘原理与应用(第2版)一一 SQL Server 2008 数据库.北京:清华大学出版社2 王丽珍、周丽华、陈红梅、肖清,数据仓库与数据挖掘原来及应用,北京:科学出版 社3张兴会数据仓库与数据挖掘技术清华大学出版

4、社5 / 18目录1概述.51.1应用背景和问题的提出 .51.2设计内容的介绍.52数据仓库设计.2.1概念模型设计.2.2逻辑模型设计.2.3物理模型设计 .2.4 OLAP前端展示设计.3数据挖掘分析.3.1期末成绩评估系统应用挖掘概述3.2数据挖掘实验.9,3.2.1实验环境.9,3.2.2数据准备及预处理.9,3.2.3实验内容(输入数据集,选择算法,输出结果,比较分析 )113.2.4算法选择.14556684小结.176 / 181概述1.1 应用背景和问题的提出在大学生活中,我们大学生在某种程度上还是比较重视自己的课程成绩的。 而有一个期末最终成绩的评估系统,无疑对同学们而言是

5、很有用的。在这个系 统中,只需输入你估计的平时成绩以及表现和期末考试的得分,就可以预测出 最终的成绩。而这个课程成绩的组成以及得出是怎么样的呢。这个最终的得分 是受到什么影响呢?本论文就以上问题进行了探讨和挖掘。1.2 设计内容的介绍本课程设计主要是探讨和研究在老师给定成绩时考虑的因素,以及这些因 素所占的比例。数据仓库为一份记录着600个同学的得分情况的数据,数据挖掘则采用决策树探究出影响结婚年龄的因素。2数据仓库设计2.1 概念模型设计数据仓库里 面有一个 实体,也就 是成绩score。成绩的决定因 素有performanee也就平时表现情况, 即根据其在课堂上的活跃程度以及认真听课 的情

6、况来给的分, 还有averseore就是同学平时的作业得分以及平时测试或者 期中测试的平均成绩,以及期末考试的成绩lasttest。7 / 182.2 逻辑模型设计本数据仓库只有一个表,逻辑模型设计如下:口吗idaverscore perhermence lasttestsocre2.3 物理模型设计在数据仓库的物理设计中,主要解决数据的存储结构、数据的索引策略、数据的存储策略、存储分配优化等问题。物理设计的主要目的有两个,一是提 高性能,二是更好地管理存储的数据。访问的频率、数据容量、选择的RDBM支持的特性和存储介质的配置都会影响物理设计的最终结果。在本数据挖掘中,数据的索引策略采取的并不

7、是位图索引而是按列索引8 / 182.4 OLAP 模型设计在本设计中由于案例考虑的并不复杂,所以OLAP模型设计也就比较的简单。F面的数据是保存在Excel中的。大概的模型设计也就如下图所示ft. xls t X土D600- 毁抿94ABcDE1idaverscoreperfeririancelasttestsocre2146296257326656435843769934575446985068651003154627630495054872888747398694557641091003485801110264753571211722951601312578488921413398224

8、42151495655475161575542650171627769582181749517067191830319074201939304343212035618672222191259186232263316267242374509885252433372431262541658984272625538670C 尸- -9 / 182.5 OLAP 前端展示设计3数据挖掘分析3.1 期末成绩评估系统应用挖掘概述在本系统中,数据仓库采用一个二维表来存储和表示同学们的平时成绩, 平时表现得分,以及期末成绩等属性。数据挖掘则采用关联分析来将二维表中 的实例分开,并探究这些数据所蕴含的规律。10

9、 / 183.2 数据挖掘实验3.2.1实验环境Win dows XPMicrosoft SQL Server 2008Microsoft Visual Studio 2008Microsoft Office 2003 Excel Access3.2.2数据准备及预处理首先选择数据源,以下几个截图是在做实验时的几个步骤11 / 1812 / 18 SOL Server Import ond Export Wizard-The execuiition was siuccessful111 Total11 Succe=s=sD Enrar0 Weir iinoInkilj日liwitnjgFlow

10、 T$kInitializing匚onne-匚tiorhSUCCftSuccessSeUina SQL CommandSucc&5=sSelttinqi SoLirce- ConnectionSuccessSiettino Destiniai.ion CortnectiwiSuccessVklidatinqSuQCe-55Ki wpdrw lui E wCul.Pre-ewecuteGueeeis:SuccowCopying to dboj tt$PoTt-eKecuteSUCCHEAotiori| 吁ifcdtus;MessageGUM壬IT3C金FrirwdHwuuitClfan323实验

11、内容(输入数据集,选择算法,输出结果,比较分析 )13 / 18建立一个Analysis Services Project的项目,在数据源中输入数据集:14 / 18 Back说明:以上实验室在实验室做的,由于时间不够,回到宿舍自己安装了Data Source Wizard匚1回completing the Wizard*Provide a nme snd then click Finish to create the new data source Data source name::Preview:Connection string:ProviderSQLNCL10HScurceSEL=口

12、2呷】Integrated SecurityS5PI; InitialCatalogTSdbPi厂ZrTFigIl Infi:15 / 18中文版的SQL SERVE工具,并完成接下来的实验步骤。324算法选择分类的任务是通过分析由已知类别数据对象组成的训练数据集,建立描述 并区分数据对象类别的分类函数或分类模型(也常常称作分类器)。分类算法有多种,例如,决策树分类算法、神经网络分类算法、贝叶斯分 类算法等。这里需要用的是决策树分类算法。在本挖掘中选择是关联分析,分析过程和结果如以下图所示: 下面是挖掘模型:Wicrosoft_Associaticn_Rd.esAver seereLastte

13、stFerf ermuiceFredictKeyPredictPredictPredict16 / 1817 / 18关联规则:a 10:V-o怡i曷奉痛哇乌稀应厦*集:陸 A示快名临说明(项集是比较准确的)分类矩阵:依赖关系网络图:18 / 18it.w LisiTi.dsv Lmrj刖a贝* R篡榭側.籐鯉石竝灘查詐窗更挹删i廉 呼隘灘剤色能矩斟诙应伽此市对S田蒯便Averscare上Tt的计製HS1 35.世44MM师35.- S3.卄06前96M. 53 6T0624册-69.6OT190CT.69.6M719O2T2 -St35.T68W0M询T5135惱的88 53.8TM249E642213更53.8TO62496别-馭6M71N272Q00220- 87.0133E49S3E$JiqK8T0B3M5362647提升图:挖畑SS构的败特挖捉恨升町:Tt19 / 18通过整合做出散点图如下图:平时成绩和平时表现的权重差不多, 在这个结论中,期末考试的成绩的重要性, 不言而喻,增加期末考试的成绩,最能提高最终成绩,平时成绩和表现的得分 也很重要,但相对权重没有期末成绩大。一个分数高的学生,他的所有成绩都 应该是很高的。4小结由于团队技术水平有限,在开发过程中遇到了很多技术问题

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论