大学生在校信息提取与分析系统建模研究_第1页
大学生在校信息提取与分析系统建模研究_第2页
大学生在校信息提取与分析系统建模研究_第3页
大学生在校信息提取与分析系统建模研究_第4页
大学生在校信息提取与分析系统建模研究_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、大学生在校信息提取与分析系统研究【摘 要】业务系统的整合使校园数据的统一共享成为了可能,而通过共享的数据平台,有所侧重的抽取我们需要的信息,也使我们能够更全面更客观的了解和评价学生在大学校园内的生活、学习情况。本文就此以教育管理理论、信息管理理论以及数据仓库技术理论为基础,提出并构筑了一套大学生在校学习、生活信息提取与分析系统模型,为信息化大环境下高校更加智慧的管理学生提供了一种可行的技术方案。【关键词】数据仓库技术;OLAP联机分析;学生评价【中图分类号】G443 文献标识码A一、 引言众所周知,高校最为重要的一个主体就是学生。大部分学生至少都要在高校待上四年,四年里学习生活只是完整的校园生

2、活的一部分,其它还有吃用消费、休闲娱乐、社团活动等等很多方面。如何客观的了解和评价一名大学生在学校的德、能、绩等情况,一直都是高校管理者研究的热点问题。事实上,高校管理人员也想了很多现代化的办法,比如开发学生管理系统、建立学生电子档案袋、建设大学生实践就业系统等等。可是,由于这些系统都是独立运行,因而通过它们所获得的数据也是断裂的、片面的,缺少连续性和完整性,更重要的是这些系统的管理人员并没有数据分析的意识,而只是单纯的获取和存储数据,却不知道如何深度去挖掘这些数据的潜在信息。随着教育信息化的深入发展,目前,数字化校园的建设已步入“集中与整合”阶段,其最显著的一个特征是所有数字资源的共享共用。

3、而共享共用数字资源则为有主题的信息挖掘和抽取提供了必要的前提条件。基于此,本文提出并构筑了一套大学生在校学习、生活信息提取与分析系统模型,为信息化大环境下高校更加智慧的管理学生提供了一种可行的技术方案。二、 理论基础(一) 教育管理理论所谓教育管理是指教育管理者运用一定的理论与方法,在特定的条件下合理配置教育资源,引导组织教育人员完成教育任务实现教育目标的一种活动。教育管理属于公共事业管理的一种。它一般分为宏观教育管理(教育行政)和微观教育管理(学校管理)两方面。教育行政就是国家对教育的管理,是以(国家一级教育行政机构)的产生作为标志。而学校管理是指学校管理者采用一定措施手段,充分利用学校有限

4、资源引导和组织师生员工实现学校育人目标的一种活动1。现代教育管理的发展主要呈现三大趋势,分别是民主化、科学化和效率化。现代教育管理特别强调了民主参与和现代科技手段的合理应用。当然,教育管理包涵的概念很多,本文中主要涉及两个:一个是教育预测,就是指依据教育发展的规律,利用科学预测的原理和方法,对未来教育发展的前景作出推测的活动;另一个是教育评价,指依据教育目标和教育理念在系统收集的基础上对教育过程能结果进行价值判断的教育活动。(二) 信息管理理论信息管理是人类综合采用技术的、经济的、政策的、法律的和人文的方法和手段对信息流(包括非正规信息流和正规信息流)进行控制,以提高信息利用效率、最大限度地实

5、现信息效用价值为目的的一种活动。现代信息系统对信息管理要求做到及时和准确。所谓及时是所谓及时就是信息管理系统要灵敏、迅速地发现和提供管理活动所需要的信息。这里包括两个方面:一方面,要及时地发现和收集信息。现代社会的信息纷繁复杂,瞬息万变,有些信息稍纵即逝,无法追忆。因此信息的管理必须最迅速、最敏捷地反映出工作的进程和动态,并适时地记录下已发生的情况和问题。另一方面要及时传递信息。信息只有传输到需要者手中才能发挥作用,并且具有强烈的时效性。因此,要以最迅速、最有效的手段将有用信息提供给有关部门和人员,使其成为决策、指挥和控制的依据。利用效率、最大限度地实现信息效用价值为目的的一种活动。信息不仅要

6、求及时,而且必须准确。只有准确的信息,才能使决策者做出正确的判断。失真以至错误的信息,不但不能对管理工作起到指导作用,相反还会导致管理工作的失误。为保证信息准确,首先要求原始信息可靠。只有可靠的原始信息才能加工出准确的信息。信息工作者在收集和整理原始材料的时候必须坚持实事求是的态度,克服主观随意性,对原始材料认真加以核实,使其能够准确反映实际情况。其次是保持信息的统一性和唯一性。一个管理系统的各个环节,既相互联系又相互制约,反映这些环节活动的信息有着严密的相关性。所以,系统中许多信息能够在不同的管理活动中共同享用,这就要求系统内的信息应具有统一性和唯一性。因此,在加工整理信息时,要注意信息的统

7、一,也要做到计量单位相同,以免在信息使用时造成混乱现象2。(三) 数据仓库技术理论 W.H.Inmon在其专著Building the Data Warehouse中定义了数据仓库的主要特征:数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程3。数据仓库技术的最新研究进展是制定了DW2.0架构标准。DW2.0改进了第一代数据仓库在技术和架构上的缺陷,确立了数据仓库中数据的生命周期概念,认识到元数据的重要性,同时对于非结构化数据有了更好的处理方式。与数据仓库紧密相关的一个概念是OLAP(联机分析)技术。所谓OLAP(联机分析)是一种在数据仓库中使用的数据分析技术与

8、工具,它能够快速分析共享多维信息,能在数据分析和决策方面为用户或管理层提供服务。三、 大学生在校信息提取与分析系统的关键要素设计(一) 系统方案设计1.系统概述大学生在校信息提取与分析系统的设计是为教育管理服务,其最终目的是为了使高校管理者更好的掌握学生的学习情况、生活状态、情绪变化等信息,以便及时而有针对性的变更管理步骤和方法,更加智慧的管理高校学生。系统实现的理论基础是信息管理论,具体模型设计是基于数据仓库技术和联机分析技术。本系统设计原则主要包括以下四条:(1)数据标准的统一性。这是本系统能正常运行的前提条件,只有统一了数据标准,才能灵活自由的提取和分析来自不同系统的数据。(2)数据来源

9、的广泛性。大学生在校信息提取与分析系统是一个数据汇集的大平台,这里的数据不是单一的学生学习数据而是包括了生活消费、校外实践、QQ空间、微博互动等等所有与大学生个体相关的信息掘取。(3)是系统的可扩展性。无论外部数据源如何变化,可扩展性保证了系统能够稳定持续的从外部获取所需的新鲜数据。(4)是系统的高效实用性。本系统是高校管理服务,它的一切研究都是从高校实际情况出发,基于实用性原则。2.平台构架本系统主体平台采用SOA(面向服务的架构)概念。SOA的核心是服务,如下图所示:图1 SOA概念示意图服务提供者、服务代理者以及服务请求者通过3个基本操作,即发布、查找、绑定相互作用。服务提供者向服务代理

10、者发布服务。服务请求者通过服务代理者查找所需的服务,并绑定到这些服务上。服务提供者和服务请求者之间可以交互。SOA主要是建立在如下的技术标准:XML:可扩展标记语言;SOAP:简单对象访问协议;JMS:Java消息服务;WSDL:Web服务描述语言;UDDI:统一描述、发现和集成;ESB:企业服务总线;MQ:消息中间件4。基于SOA架构的系统平台解决方案,使得不同系统或不同厂家的系统都基于一定的技术标准之上,可以实现相互调用服务,提高软件的重复使用,大大降低学校对IT资源的投资。3.主要模块本系统主要应用到的模块包括:(1)权限管理模块。权限管理主要是用户组、用户管理以及用户组、用户的功能授权

11、;(2)信息标准及元数据管理模块。建立统一的校园系统信息标准和数据仓库元数据规范;(3)数据交换配置模块。包括数据抽取、清洗、订阅等功能;(4)综合信息服务模块。这是本系统中最为重要的功能模块之一,它为用户提供全方位灵活的查询功能,报表、图表、打印,数据挖掘,决策分析等等;(5)系统资源监控模块。对系统服务器上的资源进行监控,包括数据库的表空间使用情况、用户访问情况等。(二) 系统模型设计1.总体架构演示模型大学生在校信息提取与分析系统的总体架构演示模型如下图所示:图2 系统总体架构演示模型系统的数据来源主要有两部分:一是高校内部应用系统,如教务系统、教学系统、学工系统等等;二是非高校内部应用

12、系统,如学生个性应用系统(包括QQ空间、博客、微博等等)、社会监督系统(包括宾馆住宿数据、网吧上网数据等等)以及其它可能的相关系统。所有外部数据经过有目的有步骤的抽取、清洗和转换后进入数据仓库,等待进一步的处理。2.数据仓库模型大学生在校信息提取与分析系统的数据仓库按照数据访问概率设置数据生命周期“分区”,主要包括整合区和归档区。整合区所存储的是经过按主题抽取、清洗后的数据,通常情况下,整合区的有效访问数据被控制在3至4年内,此后,随着访问概率的下降,自动存储到归档区进行长期保存。要完成数据仓库的结构设计,首先我们要做好概念模型设计。概念设计的很重要一步是确定主题,它决定了未来数据仓库中的事实

13、表。本系统考虑设计三大主题,分别是:(1)身心状况。这个主题的确立是针对当前强大的社会就业压力之下,各大高校学生频繁出现身心健康问题而设。围绕身心健康主题,系统设计采用星型辅助雪花型结构设立六个维度,分别为学生、时间、表现、成绩、体检、文字。度量维是学生和时间;(2)综合能力。综合能力是对一个学生各方面能力全面的评价,围绕这个主题,系统设立四个维度,分别是学生、类别、成绩、表现。学生和类别是度量维。(3)道德评价。要客观公正的评价一个学生,除了学习成绩和实践能力之外,还有一个重要的标准就是道德涵养。高度发达的现代文明之下,我们的社会需要的不仅仅是高学历、高能力的人才,更为重要的是要有高尚的品行

14、。只有品行高尚的大学生,才能做出有益于社会,有益于人民的贡献,才是我们国家真正需要的人才。系统围绕此主题设立四个相关主题,分别是学生、关系、表现、文字。度量维是学生和关系。以此概念模型为基础,我们分别设计出对应于三大主题的逻辑模型,如下图所示:图3 大学生身心状况主题逻辑模型 图3是以大学生身心状况为主题的数据仓库逻辑模型设计。考虑到篇幅问题,此处对主题完整的逻辑模型做了部分的省略。仅以表现维为例,围绕此表,另有多个依附于它的深层次的表,每一个表格都通过关键字段与维表联系,形成雪花状结构。比如校外联系表,这里校外联系是从校外监督系统中所获取的数据,包括学生在校外住宿频率、上网游戏频率等等,通过

15、这些数据,管理者能够及时发现学生某些不良的倾向,从而有针对性的予以关心和帮助。身心状况主题的主度量维分别是学生和时间。其中学生维的粒度划分到个人,时间维划分到日。图4 综合能力逻辑模型综合能力主题是以学生信息维和能力类别维作为主度量维,其中能力分类方面做了很细致的粒度划分。在数据仓库设计的各个主题中,很多时候需要共享共用同一个或多个表格数据,比如综合能力主题中就用到了与上一个主题一样的学生信息维表和在校表现维表。不过在实际的数据抽取时侧重点有所区别,分析决策时所占分数比值也有所不同。图5 道德评价逻辑模型道德评价主体是以学生和人事关系作为主度量维。之所以如此设立,是因为道德产生于人事关系的处理

16、之中。单一的关系,我们无法判别出一个人真实的道德素养,只有综合了方方面面的人事关系,我们才可能得出比较客观正确的结论。而关于本主题最终结论的得出主要依靠三方面的数据:一是以事评分。根据学生平时发生的某些客观事件,由相关部门评测得分。比如奖惩情况、校外联系情况等等;二是师生打分。最熟悉的莫过与朝夕相处的老师朋友,他们的评价打分还是相对比较客观和准确的;三是文字分析。所谓文字分析,是指在学生平时发布于网上的心情文章中,有目地的提取预设好的关键字段,通过观察它们出现的频率,从而辅助性的帮助系统管理人员判断学生的心理状况和道德倾向。系统数据仓库中设立的三大主题并不是孤立的,它们之间通过某些共同的维表建

17、立关系。有了详细的概念模型和逻辑模型,物理模型的建立就顺理成章了。数据仓库模型的设计是大学生在校信息提取与分析系统设计中非常核心的一步,但不是最终的一步。它只是帮助我们完成了数据的排布和存储设计,优化了各类数据的结构和相互关联,而要实现我们设计本系统的最终目标则还需要建立联机分析模型。3.联机分析模型联机分析是建立在多维数据模型的基础之上。以本系统中身心状况主题为例,围绕主题,可建某一多维数据模型示意图如下:图6 多维数据模型示例系统通过从所分析问题的“多维业务空间”中提取和构建“多维数据立方体”和“概念分层”,再经过“切片”、“上卷”、“下钻”或“旋转”等操作,可以为用户提供各种“粒度”的统

18、计分析结果,并用表格和图形表示出来5。如此,我们可设计出本系统中联机分析结构模型,如下图所示:图7 系统联机分析结构模型用户根据自己需求,通过综合信息服务模块,首先科学的设定好多维空间中每一个维度上的取值指标,再通过合理的分析方法,最终得出所需要的分析结果。同样,我们以大学生身心状况主题为例。我们设定事实表中,表现所占比值15%,成绩5%,体检50%,文字30%。设定在校成绩表中文化所占比值为10%,体育70%,实践20%,其它表格依此类推进行设计。当然不会所有表格都是如此简单的百分比值运算,其中一些表格中指标的设计可能还需要用到复杂的计算机公式,我们需要根据实际情况进行科学合理的设计。四、 系统正常运行的几条保障措施通过以上系统模型的设计过程,我们可以发现,大学

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论