




已阅读5页,还剩37页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目目 录录 摘摘 要要 .3 3 ABSTRACTABSTRACT .4 4 1.1.课题的研究背景与介绍课题的研究背景与介绍 .5 5 1.1.课题来源.5 1.2.开发研究背景.5 1.3.课题研究目的.6 2.2.软件开发环境介绍软件开发环境介绍 .7 7 2.1.ASP.NET 简介 .7 2.2.C#简介 .8 2.3.VS.NET 2005 简介.9 2.4.设计思想.10 2.5.聚类分析.10 3.3.系统功能设计系统功能设计 .1212 3.1.系统设计思想.12 3.2.功能结构图.12 3.3.详细功能设计.14 3.3.1. 学生成绩录入.15 3.3.2. 学生信息查询.16 3.3.3. 学生成绩查询.17 3.3.4. 聚类分析处理.18 3.3.5. 聚类分析结果的打印和导出.20 4.4.数据设计数据设计 .2121 4.1.数据定义规范.21 4.2.数据字典.21 4.2.1. 班级表:Class_Information.21 4.2.2. 学生信息表:Stu_Information.22 4.2.3. 教师信息表:Tea_Information.22 4.2.4. 试卷一表:Teatpaper_One.22 4.2.5. 试卷二表:TestPaper_Two.23 4.2.6. 试卷三表 TestPaper_Three .23 4.2.7. 试卷四表 TestPaper_Four .23 4.2.8. 考试类型表:Test.23 5.5.界面设计界面设计 .2525 5.1.学生成绩录入模块.25 5.2.学生信息查询.27 5.2.1. 按学号查询学生信息.27 5.2.2. 按班级查询学生信息.27 5.3.成绩查询.28 5.3.1. 学生具体成绩查询.28 5.3.2. 试卷成绩查询.29 5.4.聚类分析处理.30 5.4.1. 进入聚类分析.30 5.4.2. 聚类分析.31 6 6 界面设计界面设计 .3333 致致 谢谢 .3434 参考文献参考文献 .3535 附附 录录 .3636 摘摘 要要 聚类分析是一种应用广泛的数学方法,可广泛应用于各个领域。在数据挖掘理论基 础上,研究了聚类分析的方法及在学生成绩评测中的应用,选取了小学 4 个班学生的成 绩作为统计指标,利用 Minkowski 距离公式,判断簇中心与样本数据间的距离,用迭代 法做出聚类分析,并做出详细分析。结果表明聚类分析法对学生评价科学合理,符合实 际,对掌握学生学习情况有很大帮助。 随着现代科学技术的发展,传统的教学管理已不能满足时代发展的要求,为了改变 这种状况,现开发了一套先进的、便于管理的学生成绩分析与管理的系统。本系统包括 学生信息管理、学生成绩管理、学生成绩分析三大模块。本系统使用微软最先进的 Visual Studio.Net 2005 开发环境作为平台,采用 SQL Server 2000 进行数据库设计。系统的适用 性较强,具有一定的推广价值。 本系统主要针对学生成绩分析模块的开发,整个系统运用面向对象的思想,并在页 面中内置浏览器。主要实现了学生信息查询、学生成绩录入、学生成绩查询和学生成绩 分析处理等功能。首先,分析了系统的背景和意义,重点分析了系统实现的主要功能。 其次,是系统采用的主要技术和实现方法。最后,结合系统开发阶段和调试阶段发现的 问题,提出了系统需要完善的地方,总结了开发此系统所取得的经验和体会。 关键词:聚类分析,数据挖掘,C#语言,水晶报表 Abstract Clustering analysish has found extensive applications in many fields.Based on the data dig set theory,the thesis eatablishes a clustering analysis method and dedigning procedures for studying studentsmanagement.In this clustering analysis taking basic course scores of the students in four classes ,who come from a elementary school, as the counting index, In order to judge the distance between clustering center and samples of data, the distance formulary of Minkowski has used. There is using iterative follow to do clustering analysis.Detailed clustering analysis results are given by Boole and Transmit closure methode.The results indicates that the proposed clusters analysis approach is scientific, rational and suitable for reality ,and it has a very great help in grasping students situation of studying. With the development of the modem science and technology, traditional teaching managerment cant satisfy the demand of ages development. To improve the condition, we specially develop a set of advanced and convenient student score analysis and management system. The system consists of student inomation management module, student score management module, and student score analysis module. The system adopts the most advanced development tool Visual Studio.Net 2005 of Microsoft as the developing platform, which carry out database design with SQL Server 2000, This System has strong applicability and covers broad scope that suits the management of adult education in each college, and have certain extending value. In this article , I mostly develop Student score analysis module .The system use OOP and The whole module design adopts built-in browser .The system have realized the function of the student information search, the students score coming in, the student score search management, and analysis of students marks. This writing have first narrated the goal of the teaching management system of adult education that background and characteristic; Secondly, have elaborated the research technique, technical route etc. Finally, at the end of this thesis , consider to the problems in system design period and in system debug period I indicate some aspects that need to be improved, and sum up some experience in system design. Keywords: Clustering Analysis, Data Dig, C# Language, Crystal Report 1. 课题的研究背景与介绍课题的研究背景与介绍 本章主要介绍课题的来源和意义,开发基于聚类分析的学生成绩知识点预测模型的 研究与实现,完成针对学生成绩的分析与展示。 1.1. 课题来源课题来源 本课题来源于我的实习公司。本课题主要分为共分为了 4 个子模块,分别是学生成 绩的录入模块、学生信息查询模块、学生成绩查询模块、成绩分析和展示模块。 本课题是基于聚类分析的学生成绩知识点预测模型的研究与实现,它将用于教学管 理的工作中,以实现教学管理方面的规范化和数字化管理,本系统将主要根据现当代学 生教育的现状,设计和开发的系统,实现对学生成绩的管理和分析,促使教学管理的计 算机化和自动化。 1.2. 开发研究背景开发研究背景 随着时代日新月异的长足发展,教育体制在不断的发展和完善,教育受到了国家和 政府的大力支持和重视。近年来,我国提倡和发出了要形成全民学习、终身学习的学习 型社会,促进人的全面发展的号召。 现代社会是一个创新的时代,网络的发展起到了很大的作用。通过网络可以完成各 种不同的需求,学生也可以上网查阅资料,进行学习,达到扩展知识面的目的。本课题 针对小学生每次的考试成绩进行了录入和汇总,也可以根据不同的情况对学生的信息进 行查询。为了能够适时掌握学生的学习情况,能够为学生不同阶段的学习提供一个合理 的指导,因此,将现代的先进技术和分析方法应用于教育行业是很有必要的,对学生成 绩知识点预测模型的研究是很有意义的。 目前的一些教学管理软件主要是已经不再满足现当代教育教学的需要,主要由于使 用的应用软件比较落后,或采用原始的手工记录的方式管理,管理人员的工作量相当大, 管理的难度高,因此学生的信息和学生的学习成绩等的管理都比较混乱,而且由于学生 之间也存在着很大的差异,有很多的特殊情况在其中。因此平时交流不方便,导致学生 成绩的管理和针对学生成绩的分析和研究做的并不是很到位。管理不能照搬普通在校生 的管理,因此建立一套界面友好,易于学习,非计算机专业人员经过短时间培训即可掌 握基本操作,符合成人教育的特点的信息化管理系统是非常有必要的。建立一套界面友 好,易于学习、非计算机专业人员也可以掌握基本操作,符合教学特点的学生成绩知识 点预测模型的研究与实现是很有必要的。 1.3. 课题研究目的课题研究目的 为了提高教学管理的工作效率,减轻管理人员的负担,在系统调查及分析阶段能够 得到管理人员的支持,能够适时掌握学生的学习情况,并对其进行聚类分析,将学生划 分到不同的范围中,以便给教师调整教学重点和进度提供依据,因此设计了本课题。 新系统的实现在很大程度上完善,对学习的分析基本上做到全面,一定程度上提高 了教学管理的效率,减轻了工作人员的压力。本设计方案重点在数据挖掘中聚类分析算 法的实现,其中重点实现了 k_mean 算法。根据学生的考试成绩,对学生掌握知识点的情 况进行分析与研究,把不同的情况进行辨析和聚类,并对不同情况做出合理的解释,以 便对学生的学习提供指导。用聚类的思想分析学生的成绩,查看学生成绩所处的位置, 计时的给学生以反馈和鼓励,也可以帮助老师整体上把握班级的情况。 2. 软件开发环境介绍软件开发环境介绍 2.1. ASP.NET 简介简介 ASP.net 是一种建立在通用语言上的程序构架,能被用于一台 Web 服务器来建立强 大的 Web 应用程序。ASP.net 提供许多比现在的 Web 开发模式强大的优势。 ASP.net 构架是可以用 Microsoft 公司最新的产品 Visual S 开发环境进行开发, ASP.net 是基于通用语言编译运行的程序,所以它的强大性和适应性,可以使它运行在 Web 应用软件开发者的几乎全部的平台上。ASP.net 是运行一些很平常的任务让表单的提 交、客户端的身份验证、分布系统和网站配置变得非常简单。 ASP.net 已经被刻意设计成为一种可以用于多处理器的开发工具,它在多处理器的环 境下用特殊的无缝连接技术,将很大的提高运行速度。即使你现在的 ASP.net 应用软件是 为一个处理器开发的,将来多处理器运行时不需要任何改变都能提高他们的效能,但现 在的 ASP 确做不到这一点。 ASP.NET 技术就是由微软的.NET 技术细化而来的,它跟 ASP 技术有些关系,然而 又不是仅仅是一个继承,可以讲,ASP.NET 跟 ASP 想比较的话,已经是变得面目全非了, 当然好得至少是一个量级以上。 ASP.NET 完全基于模块与组件,具有更好的可扩展性与可定制性,数据处理方面更 是引入了许多激动人心的新技术,正是这些具有革新意义的新特性,让 ASP.NET 远远超 越了 ASP,同时也提供给 web 开发人员更好的灵活性,有效缩短了 web 应用程序的开发 周期。ASP.NET 与 Windows 2000 Server/Advanced Server 的完美组合,为中小型乃至企业 级的 web 商业模型提供了一个更为稳定,高效,安全的运行环境。微软公司的 ASP.NET 技术在全球推广短短几年的时间,取得了飞速发展。国内外越来越多的软件公司,开始 应用 ASP.NET 技术进行项目开发。这不仅要归功与微软公司.NET 发展战略的成功实施, 更重要的是 ASP.NET 技术本身具有的无限魅力。 ASP.NET 是微软提供的新一代的 Web 开发平台,它为开发人员提供了生成企业级 Web 应用程序所需要的服务、编程模型和软件基础结构,同其他 Web 开发平台相比, ASP.NET 具有下面三大优势。 1. 支持编译型语言 目前流行的几种脚本语言比如 VBScript、JavaScript 和 ASP 等都有两个主要的缺点。 第一,不支持强数据类型。在 JavaScript 中定义变量只有一个关键字 var,使用 var 关键 字定义的变量,如果赋值是字符串,该变量就是字符串变量;如果赋值是整数,则该变 量就是整型变量。在 VBScript 和 ASP 中,定义变量只通过一个关键字 DIM,该变量也没 有具体的类型。第二,脚本语言是解释型的。通常情况下,解释型的脚本语言在性能上 抵不上编译型的语言。自推出.NET 开发平台以来,微软在 Web 服务器端开发语言方面, 主推 VB.NET 和 C#.NET 这两种编译型语言。通过这两种开发语言,程序员可以像开发 普通的 Windows 程序一样来开发 Web 程序,只不过在 Windows 程序中用于开发 GUI 界 面的各种控件,在 Web 程序开发中也有它们相应的 Web 版本。程序员通过 C#语言,利 用 VS.NET 提供的各种 Web 控件,可以非常容易地开发 ASP.NET Web 程序。开发的 ASP.NET 程序被编译成 MSIL 语言,这种中间语言具有平台无关性,而且,由于 ASP.NET 页面在执行前会被编译,所以 ASP.NET 的性能得到了很大的提高。 2程序代码与页面内容的成功分离 通常的动态网页开发,往往是在一个网页上混合多种脚本语言。比如在 HTML 脚本 语言上可以嵌入 JavaScript 或 VBScript 等客户端脚本语言,也可以同时嵌入 ASP 或 JSP 等服务器端脚本语言。这种多语言混合的 Web 开发模式通行已久,但是它的代码可读性 很差,程序代码同页面内容混合在一起,程序员要在多种语言的思维上频繁切换,如果 程序很复杂的话,这种开发模式非常不利于程序的开发,而且日后的维护也将成为大问 题。ASP.NET Web 开发技术为程序员提供了一种非常好的开发模式,即 Code Behind 技 术,它通过 Web 控件将程序代码与页面内容成功分离,从而使 ASP.NET 的程序结构异常 清晰,开发和维护的效率也得到了很大的提高。另外可以利用 Visual Studio.NET 集成环 境下开发 ASP.NET 应用程序,该环境不仅提供了强大的调试能力,而且还集成了“所见 即所得”的 HTML 编辑器,为开发人员开发 Web 页提供了方便的图形化支持。 3引入服务器端控件 在 ASP 中,可以给页面手动添加 HTML 控件,对这些控件的响应有两种办法。一种 是在客户端的脚本语言中响应用户对这些控件的输入,另一种是把该页面提交给服务器。 这两种办法都存在问题,第一种办法产生的问题是不同的浏览器以不同的方式执行客户 端脚本语言,我们很难编写在多种浏览器上都能良好运行的复杂的 Web 页面。第二种办 法存在的问题是,如果我们把 Web 页面重新提交给服务器,那么 Internet 的无状态特性 就会导致页面上存储在变量中的信息丢失,除非我们编写了复杂的代码,把它们存储在 HTML 元素或 URL 查询字符串中。ASP.NET 通过服务器控件解决了上述问题。服务器端 控件会生成发送给浏览器的 HTML 代码,显示控件,它们还能生成隐藏的 HTML 元素来 存储它们当前的状态。在提交页面时,这些信息就会传送回服务器,控件将自动处理这 些信息,改变 HTML,显示控件。 2.2. C#简介简介 C#是一种简单、现代、面向对象和类型安全的跨平台编程语言,它将作为 Visual Studio 中的一部分推出。C#(发音为“C-Sharp” )既保持了 C+中熟悉的语法,并且还包 含了大量的高效代码和面向对象特性。据微软产品经理透露,C#语言将在保持 C/C+灵 活性的基础上为程序员带来更高效的 RAD 开发方式。它不仅能用于 WEB 服务程序的开 发,并且还能开发强大的系统级程序。由 C 和 C+发展而来。C#吸取了 C 和 Java 语言中 的优点,弥补了它们的不足,并且很快被 C 和 C+程序员所熟悉。C#的目标在于把 Java 的高生产力和 C+本身的能力结合起来。 C#包含使 XML 编程更为轻松的技术。微软将使它的下一代工具软件、操作系统和应 用支持 XML 技术。#是由 C 和 C+派生而来的一种“简单、流行、面向对象、类型安全” 的程序设计语言,C#意在综合 Visual Basic 的高效率和 C+的强大功能。 事实上,C#将是完全依靠 Windows 的最完美的产物。那些困绕 Java SDK, MFC 和 SET 的数据库已成为过去。你想放入 C#的任何东西(无论何种语言) ,只要在 Windows 的.NET 子系统下建立和包装的都可以使用 Windows 的运行库。 C#语言的优点包括:语法简单、完全的面向对象、消除大量程序错误、与 Web 开发 紧密结合。C#也并非字节码(bytecode) 。微软一位员工罗伯特.舒密特详细描述道:“C# 编译程序产生的是微软中间语言 (MSIL)但虚拟机或其他类似的技术则不能用于 解释这种中间语言(IL) 。相反地,每当应用程序载入或 JIT 编译程序需要编译它时,IL 就会被转换成本地代码。一旦这种转换完成,可以执行的代码实际上是本地代码。 ”实质 上,虽然这种方案有点像 Java 程序通过一个 JIL 编译程序,但这里最终的 JIT 编译是 100%的 本地代码,而 Java 的 JIT 产生的结果是不同的。 2.3. VS.NET 2005 简介简介 Visual Studio.NET 2005 是 Visual Studio.NET 2003 的升级版本,它提供了更好的集成 开发环境,可高效创建任何类型的.NET 应用程序或者组件,Visual Studio.NET 2005 默认 支持多种编程语言,例如,C#、Visual C+、Visual Basic.NET、Visual J#和 Visual Jscript 等。Visual Studio.NET 2005 还提供了许多新特性,这些新特性能够帮助不同类型的开发 人员,快速创建各类应用程序。 支持.NET 技术应用程序的开发工具越来越多,从简单的记事本,到复杂的 Borland C#、Builder、Delphi,甚至于开源工具 SharpDevelop,当然还有微软公司的 Visual Studio 系 列等。虽然开发工具很多,但是开发人员都选择了 Visual Studio。这主要是由于 Visual Studio 能够与.NET 技术紧密结合,同时,该系列工具提供了很多提高开发效率的功能。 尽管.NET 是微软一手缔造的,它并不是只能在 Windows 上使用。微软准备尽力为那 些 COM 对象提供传统帮助(所有的 OLE, ActiveX 等等在下一代 Viual Studio 推出后, 都将成为一个 legacy 平台) 。但.NET 不会围绕 COM 建造。新平台无疑将补充 COM,并 与它几乎天衣无缝地配合,但一点也不会依靠 COM。这表明这种结构本身能够 Macintosh, UNIX. BeOX 展开。这样命名,是因为除了 CLS 构架是平台独立的,C#将用 到的和所有遵从 CLS 的数据库也是平台独立的。也就是说,它们都是遵从 CLS 的,如果 一个本机 MSIL 编译程序在平台上有效,那么它们能在运行时刻为任何结构进行编译。微 软也积极争取被 ECMA 标准接纳,他们先前的 Javascript 已被接纳。 当 Visual Studio. NET 推出时,开发团体肯定会有不同的反应。微软又开发了一个新平台,这已吓倒那 些本来对微软平台统治忧心忡忡的人了。然而更重要的是 C#或.NET 战略不会对原始 C+ 构成太大威胁,那么有理由推论 C#和.NET 将是 Java 的有力竞争者。考虑相反方面:Java VM 靠翻译字节码来运行应用程序。CLS 在运行时刻本机编译。Java 平台只支持 Java 语 言。.NET 只支持 MSIL,但一些无限制的高级语言如 C#,Visual Basic,甚至 Eiffel 和 COBOL 都能启动 MSIL。Java 运用执行转接提供真正的 OOP 技术。MSIL,C#也是如此。 在 Java 平台,简单地移动平级文件,项目就可以展开为产品目录。据说,.NET 平台的项 目也可轻松展开而不像以 registry-happy Com 为基础的项目。或许 Java 平台真正的优势只 在于政治上的正确性-它不是微软搞出来的,且目前有成千上万的执着的宗教追随者。 2.4. 设计思想设计思想 本系统采用 C#语言,利用面向对象的思想。面向对象的概念和应用已超越了程序设 计和软件开发,扩展到很宽的范围。如数据库系统、交互式界面、应用结构、应用平台、 分布式系统、网络管理结构、CAD 技术、人工智能等领域。所有面向对象编程语言都支 持三个概念:封装、多态性和继承。现实世界中的对象均有属性和行为,映射到计算机 程序上,属性则表示对象的数据,行为表示对象的方法。 2.5. 聚类分析聚类分析 聚类分析源于许多研究领域,包括数据挖掘、统计学、机器学、模式识别等。它是 数据挖掘中的一个功能,但也能作为一个独立的工具来获得数据分析的情况,概括出每 个簇的特点,或者集中注意力对特定的某些簇做进一步的分析。 “物以类聚,人以群分” , 聚类是人类一项最基本的认识活动。聚类的用途非常广泛。在生物学中,聚类可以辅助 动、植物分类方面的研究,以及通过对基因数据的聚类,找出功能相似的基因;在地理 信息系统中,聚类可以找出具有相似用途的区域,辅助石油开采;在商业上,聚类可以 帮助市场分析人员对消费者的消费记录进行分析,从而概括出每一类消费者的消费模式, 实现消费群体的划分。 聚类就是将数据对象分组成多个类或簇,划分的原则是在同一个簇中的对象之间具 有较高的相似度,而不同簇中的对象差别较大。与分类不同的是,聚类操作中要划分的 类是事先未知的样本,类的形成完全是数据驱动的,属于一种无指导的学习方法。相异 度是根据描述对象的属性值来计算的。距离是经常采用的度量方式。聚类分析源于许多 研究领域,包括数据挖掘,统计学,生物学,以及机器学习。作为统计学的一个分支, 聚类分析已经被广泛的研究了许多年,主要集中在基于距离的聚类分析。基于 k- means(k-平均值) ,k-medoids(k-中心点)和其他一些方法的聚类分析工具已经被加入 到许多统计分析软件包或系统中,例如 S-Plus,SPSS,以及 SAS。 取样算法:这种算法只需扫描一遍被取样数据库,而且使用恒定的内存空间,便可 以从 N 个记录中随机取出 n 个取样记录。其基本思想是:从第 N-n+1 条记录开始,做下列 操作。设当前处理的是第 t 个记录(n+1tN),u 是产生的一个随机数(u0,t-1), 若 un,则把第 u 个记录替换成第 t 个记录。可以证明该算法能够得到均匀的取样结果。 确定取样率很重要。为保证聚类质量,取样数据库应该能够有效地代表原数据库。若取 样率太低,取样数据库必然会丢失原数据库的某些特质,导致聚类效果失真。 在对大规模数据库进行聚类分析时,数据取样是一种常用的提高聚类效率的方法, 即对整个数据库进行数据取样,然后对取样数据库进行聚类分析,而对未被取样的数据 进行聚类标注。这样,对大规模数据库的聚类分析就转化为对较小规模的取样数据库的 聚类分析。由于没有考虑到整个数据库的数据,聚类质量必然会受到影响。但是,只要 取样均匀且取样率适当,则取样数据库也可以较好地反映整个数据库状况,从而在保证 聚类质量的同时提高聚类效率。与以前的基于取样的聚类算法相比。 3. 系统功能设计系统功能设计 3.1. 系统设计思想系统设计思想 本系统实现教师录入学生的成绩,并且可以查看学生的成绩,也可查看某次考试的 班级的学生成绩,并对其中的一部分学生的成绩进行分析,从而得到学生成绩的分布, 学生对知识的掌握情况。对学生的成绩进行分析后,可以将经分析后的图打印、输出。 具体的模块图如下所示: 学生成绩 录入模块 聚类分 析模块 分析结果 展示模块 基于聚类分析的学 生成绩知识点预测 模型的研究与实现 图 3-1 基于聚类分析的学生成绩知识点预测模型的研究与实现的总体模块图 学生成绩录入模块是输入模块,主要实现学生成绩的录入。教师选择相应的试卷、 学生的学号、班级,逐条录入。聚类分析模块是主要的处理模块,主要是从数据库提取 学生的成绩,根据后台已经编辑好的聚类分析算法进行聚类分析,实现对学生成绩的处 理。其中针对不同的对象,进行不同的处理,主要是纵向处理和横向的处理。学生成绩 的展示模块主要利用水晶报表将学生成绩的浮动用图表的形式展现出来。 利用先进的技术、模块化的软件结构,勾画出了系统的逻辑模型。以此为基础,采 用结构化设计方法对系统进行设计,在系统的功能结构图的基础上,对各功能模块和数 据库进行了详细的设计,为系统的实现打下了坚实的基础。下面主要是对基于聚类分析 的学生成绩预测模型的研究与实现进行的详细设计。 3.2. 功能结构图功能结构图 本课题分学生成绩录入、聚类分析和学生成绩展示 3 部分。基于聚类分析的学生成 绩预测模型的研究与实现主要完成以下功能: 学生成绩的查询和录入 学生成绩的查询 聚类分析算法;K_means 聚类分析的结果用水晶报表的形式展现 学生基本信息的管理是基于聚类分析的学生成绩知识点预测模型研究与实现的一个 重要的部分。学生基本信息的管理主要是实现学生基本信息的查询,其中主要提供了两 种重要的查询,其一是按照学生的学号进行,其二是按照学生的班级进行查询。 学生学习成绩的管理,主要实现了两种方式的查询,一种是按照试卷查看学生的考 试成绩,另一种是按照学号和试卷,查看相应的某次考试学生的成绩。这两中查询,一 定程度上实现了学生成绩的具体查询和对某次考试成绩的整体查询。查询的结果可以反 馈给教师,供教师参考,在教学中做出相应的调整。 聚类分析模块,主要是利用数据挖掘中聚类的思想,进行算法的设定和实现。其中 重点实现了 K_means 算法,该算法以 K 为参数,把 n 个对象分为 K 个簇,以使簇内具有 较高的相似度,而簇间的相似度较低。相似度的计算根据一个簇中对象的平均值来进行。 算法首先随机地选择 K 个对象,每个对象初始地代表了一个簇的平均值或者中心。对剩 余的每个对象根据其与各个簇中心的距离,将它付给最近的簇。然后重新计算每个簇的 平均值。这个过程不断重复,知道准则函数收敛。 学生成绩的展示模块,主要是实现把聚类分析的结果显示出来,其中主要用到了水 晶报表,通过自定义数据集,手动的绑定数据集,让分析的结果以柱状图的形式显示出 来。其中还重点的实现了分析结果的打印和导出。导出提供了两种方式的导出一种是 Word 方式,另一种是 Excel 方式。 系统功能图: 基于聚类分析的学 生成绩知识点预测 模型的研究与实现 学生成绩管理 分析结果展示 聚类分析算法 学生成绩录入 柱状图表现 打印 导出 学生成绩查询 K 平 均 算 法 图 3-2 基于聚类分析的学生成绩知识点预测模型的研究与实现的模块图 3.3. 详细功能设计详细功能设计 基于聚类分析的学生成绩知识点预测模型的研究与实现主要包括以下功能:学生成 绩的录入、按学号查询学生信息、按班级查询学生信息、学生成绩查询、试卷成绩查询 及成绩展示、聚类分析处理等方面的功能。系统的数据流程图如下: 学生成绩录入学生信息查询 学生成绩查询 成绩展示 学生成绩分析 处理 按学号查询学 生信息 按班级查询学 生信息 试卷成绩查询 与成绩展示 退出 图 3-3 基于聚类分析的学生成绩知识点预测模型的研究与实现的流程图 3.3.1. 学生成绩录入学生成绩录入 成绩录入的条件限定 成绩录入的参数限定主要是对学生成绩的录入进行管理,避免出现成绩的重复录入 和成绩为空的情况。当用户选择正确相应学生的学号,班级,则可以进行录入,录入时 考虑是第几次考试,实际的语文成绩和数学成绩各是多少。 其中每次考试,我定为数据表 TestPaper_One、TestPaper_Two、TestPaper_Four 等。 数据库中的相应的数据表中记录着每次学生的考试情况。本课题做的是对小学的语文和 数学成绩的分析和管理,其中重点记录下每次的考试成绩。 在录入成绩的过程中,若不选择“第几次考试” ,则弹出提示,提示用户选择;若学 生的学号不符合规格,则提示输入正确的学号;若班级的选择和学生的学号对应不起来, 则提示选择正确的班级;其中的语文和数学的成绩不能为空,为空的话,则成绩的录入 出错,提示录入学生的相应的语文和数学成绩。当此学生的成绩已经成功的录入后,若 再词录入学生的成绩,则提示此学生的成绩已经成功的录入. 更新程序管理 当有成绩录入数据库后,数据库中的数据信息进行更新,再一次的查询将是最新的 结果,管理员更新了学生的基本信息和成绩后,可以进行相应的查看和对部分信息的管 理。在录入的过程中,客户端更新程序的描述。当客户端程序运行时,可以进行学生成 绩的录入和校验。 3.3.2. 学生信息查询学生信息查询 学生信息的查询主要是按学号查询学生信息和按班级查询学生信息。学生的信息主 要包括:学号、姓名、所在班级、出生年月日、年龄和家庭住址。学生的信息是从小学 校的学生中随机的获取的一部分数据样本,主要是针对小学一年级和二年级的学生,将 部分的样本进行入库的处理。 按学号查询学生信息 学生信息成功的录入以后,可以对学生的信息进行相应的查询和改动。按学号查询 学生的信息,实现了对数据库中的学生信息的提取,通过与数据库进行手动的连接,定 义查询语句,通过 DataSet 数据集的中间存储,后用 GridView 控件,将查询的结果显示 出来。重点实现了学生信息的查看。 按班级查询学生的信息 选择班级,查询本班级中的学生的基本信息。 这一部分的学生信息,其提取的方式和按学号查询学生信息基本一样,主要是为教 师提供一些具体的学生的情况,有助于教师掌握班级的整体的学生的基本信息,可以为 教师做一些有利于教学的改动提供相应的参考和帮助。 学生信息入库 学生信息库 信息查询 学生信息显示 学生信息库导入 图 3-4 学生信息查询流程图 3.3.3. 学生成绩查询学生成绩查询 学生的成绩成功的录入以后,就可以对学生的成绩进行查询。学生成绩的查询也可 以分为许多种,其中重点实现了两种,一种是通过学号和第几次测试查询学生的成绩, 另一种是选择试卷查询参加考试的所有的学生的成绩。 通过学号和第几次测试查询学生成绩 其中通过学号和第几次测试查询学生的成绩,主要实现了具体的某位学生的成绩的 查询。实现这种查询的前提是要知道该学生的学号和查询的是第几次测试,只有这样才 能查询具体的某位学生的某次的考试成绩。 通过选择试卷查询学生成绩 整体的把握学生的考试成绩是通过选择第几次测试查询学生的成绩。这种查询中只 需要知道是第几次测试,选择相应的测试就可以查询学生的成绩。这种查询的方式有利 于教师整体上把握学生的成绩,尤其是某次测试的学生的考试成绩 一旦学生的成绩录入,即学生的成绩在学生数据库中存在以后,就可以对学生的成 绩进行必要的查询,其中查询的方式根据需要选择。学生成绩管理主要是对学生的成绩 进行管理,为了规范其管理,使其查询更有效。在代码中实现了代码,有效的实现了查 询功能,其中灵活地实现了对数据库的操作,对数据集的访问和 GridView 的数据显示。 学生成绩查询流程图: 学生成绩查询 学生成绩显示 学生成绩库 学生成绩管理 具体个人成绩查询 试卷成绩查询 图 3-5 学生成绩查询流程图 3.3.4. 聚类分析处理聚类分析处理 这个功能的设计主要是对学生的成绩进行聚类的分析和研究,其中重点应用了数据 挖掘中聚类分析的思想,根据客户端提供的不同的参数,选择 K_means 算法完成对学生 成绩的分析。 K_means 算法,也被称为 K-均值,是一种得到最广泛使用的聚类算法,K-平均算法 以 K 为参数,把 n 个对象分为 k 个簇,以使簇内具有较高的相似度,而簇间的相似度较 低。相似度的计算根据一个簇中对象的平均值来进行。 算法首先随机的选择 k 个对象,每个对象初始的代表了一个簇的平均值或者中心。 对剩余的每个对象根据其与各个簇中心的距离,将它赋给最近的簇。然后重新计算每个 簇的平均值。这个过程不断重复,知道准则函数收敛。准则如下: = = 1 | |2 这里的 E 是数据库所有对象的平均误差的总和,x 是空间中的点,表示给定的数据对 象, 是簇 Ci的平均值。这个准则试图使生成的结果簇尽可能的紧凑和独立。 算法描述 输入:簇的数目 k 和包含 n 个对象的数据库 输出:k 个簇,使平方误差准则最小 (1)Assign initial value for means; /任意选择 k 个对象作为初始的簇中心 (2)Repeat; (3)For j=0 to n do assign each xj to the cluster
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 吸氧技术操作试题及答案
- 乐理民族调式试题及答案
- 2025江苏省建筑市场工程合同管理系统用户指南
- Msoffice重点考核试题及答案分析
- 如何提升多媒体设计学生的创新能力试题及答案
- 《2025建筑项目融资合同》
- 如何提升实践能力软件评测师试题及答案
- 参与考试的2025年网络规划设计师试题及答案
- 辅导班调查面试题及答案
- 2025年铁路运输服务项目规划申请报告
- 2025年继续教育公需课必修课考试题库附含参考答案
- 公共知识法律试题及答案
- 2025中国广电山东网络有限公司市县公司招聘145人笔试参考题库附带答案详解
- 天津市公安局为留置看护总队招聘警务辅助人员笔试真题2024
- 2025-2030中国光稳定剂行业市场现状供需分析及投资评估规划分析研究报告
- 浙江省强基联盟2024-2025学年高一下学期5月月考地理试题(含答案)
- 职业技术学校2025年国际交流计划
- 2025年土木工程专业知识测试试卷及答案
- (高清版)DG∕TJ 08-15-2020 绿地设计标准 附条文说明
- 《肥胖症诊疗指南(2024年版)》权威解读
- 合肥市2025届高三年级5月教学质量检测(合肥三模)物理试题+答案
评论
0/150
提交评论