(计算机科学与技术专业论文)高校教学基本状态数据库系统的研究与实现.pdf_第1页
(计算机科学与技术专业论文)高校教学基本状态数据库系统的研究与实现.pdf_第2页
(计算机科学与技术专业论文)高校教学基本状态数据库系统的研究与实现.pdf_第3页
(计算机科学与技术专业论文)高校教学基本状态数据库系统的研究与实现.pdf_第4页
(计算机科学与技术专业论文)高校教学基本状态数据库系统的研究与实现.pdf_第5页
已阅读5页,还剩61页未读 继续免费阅读

(计算机科学与技术专业论文)高校教学基本状态数据库系统的研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 随着我国经济和社会的快速发展,我国高校的数量和招生规模在不断扩大, 高等教育的教学质量成为人们关注和讨论的热点问题。为了在招生规模扩大的同 时保证教学质量,就必须加强国家对高等学校教学基本状态的监控和指导。 本文研究并实现了高校教学基本状态数据库系统,该系统是基于n e t 框架采 用b s 结构开发的,主要涉及到决策支持的相关技术。该系统包括指标维护、数 据采集、决策支持和信息发布四个子系统,本文重点对指标维护、数据采集和决 策支持子系统的设计与实现进行详细地阐述。 一、指标维护子系统主要用于维护本科教学评估中的基本评估指标和综合评 估指标,本文介绍了现有的高校教学基本状态评估指标体系,分析了其基本结构, 提出了一种维护指标间层次和包含关系的方法,设计并实现了指标维护系统。 二、数据采集子系统分为高校基本信息数据的采集和高校评估指标数据的采 集,本文重点分析了高校评估指标数据的数据类型,设计了评估指标数据的采集 流程,并应用a c t i v e x 和x m l 技术实现了评估指标数据的采集。 三、决策支持子系统包括趋势分析、o l a p 分析和聚类分析,本文将数据挖掘 的结果和o l a p 操作过程进行可视化表示,为高校教学基本状态评估提供有效的 辅助工具。 关键词:决策支持;数据挖掘;o l a p ;状态评估;b s 结构 分类号:t p 3 9 a b s t r a c t a bs t r a c t w i t ht h er a p i dd e v e l o p m e n to fo u rc o u n t r y se c o n o m i ca n ds o c i e t y , t h en u m b e ro f c o l l e g e sa n de n r o l l m e n ta lee x p a n d i n g t h eq u a l i t yo fh i g h e re d u c a t i o nh a st u r n e di n t o t h eh o tt o p i ct h a tg r a d u a l l ya t t r a c t e dt h ep e o p l e sa t t e n t i o na n dd i s c u s s i o n i no r d e rt o g u a r a n t e et h eq u a l i t yo ft e a c h i n gw i t ht h ee n r o l l m e n te x p a n d i n g ,o u rc o u n t r ym u s t s t r e n g t h e nt h em o n i t o r i n ga n dg u i d a n c eo nt h et e a c h i n gs t a t e so fc o l l e g e s t h i sp a p e rp r e s e n t st h er e s e a r c ha n di m p l e m e n t a t i o no ft h et e a c h i n gb a s i cs t a t e d a t a b a s es y s t e mo fc o l l e g e s ,w h i c hb a s e do n n e tf r a m e w o r ka n dw a sd e v e l o p e db y b ss t r u c t u r e t h et e c h n o l o g i e sh a v eb e e nu s e di n t h i ss y s t e mm a i n l yr e l a t e dt o d e c i s i o ns u p p o r t t h es y s t e mi n c l u d e sf o u rs u b s y s t e m si nt e r m so fi n d e xm a i n t e n a n c e , d a t aa c q u i s i t i o n ,d e c i s i o ns u p p o r ta n di n f o r m a t i o np u b l i s h i n gs u b s y s t e m i tw i l lf o c u s o nad e t a i l e de x p o s i t i o no fi n d e xm a i n t e n a n c e ,d a t aa c q u i s i t i o na n dd e c i s i o ns u p p o r t s u b s y s t e md e s i g na n di m p l e m e n t a t i o n f i r s t ,t h ei n d e xm a i n t e n a n c es u b s y s t e mu s e df o rm a i n t e n a n c eo fb a s i ca s s e s s m e n t i n d e xa n dc o m p r e h e n s i v ea s s e s s m e n ti n d e x t h i sp a p e ri n t r o d u c e d t h ee x i s t i n g e v a l u a t i o ni n d e xs y s t e mo fc o l l e g et e a c h i n gb a s i cs t a t e ,a n a l y s i si t sb a s i cs t r u c t u r e , p r o p o s e dm e t h o dt h a tc a nb eu s e dt om a i n t e n a n c et h el e v e la n di n c l u d i n gr e l a t i o n s h i p b e t w e e ni n d e x e s ,d e s i g n e da n di m p l e m e n t e dt h ei n d e xm a i n t e n a n c es y s t e mi nt h ee n d s e c o n d ,d a t aa c q u i s i t i o ns u b s y s t e mi n c l u d i n gc o l l e g eb a s i ci n f o r m a t i o nd a t a a c q u i s i t i o na n da s s e s si n d e xd a t aa c q u i s i t i o n t h i sp a p e ra n a l y s i sf o c u s e do nt h et y p eo f a s s e s s m e n ti n d e xd a t a ,d e s i g n e dt h ea c q u i s i t i o np r o c e s so fa s s e s s m e n ti n d e xd a t a ,a n d i m p l e m e n t e dt h ed a t aa c q u i s i t i o ns u b s y s t e mt h r o u g ht h eu s eo fa c t i v e xa n dx m l t e c h n o l o g y t h i r d ,d e c i s i o ns u p p o r ts u b s y s t e mi n c l u d e st r e n da n a l y s i s ,o l a pa n a l y s i sa n d c l u s t e ra n a l y s i s i nt h i sp a p e r , t h ev i s u a l i z a t i o no ft h er e s u l t so fd a t am i n i n ga n do l a p o p e r a t i o np r o c e s s p r o v i d e sa ne f f e c t i v ea s s e s s m e n tt o o l f o rt e a c h i n gb a s i cs t a t e a s s e s s m e n to fc o l l e g e s k e y w o r d s :d e c i s i o ns u p p o r t ;d a t am i n g ;o l a p ;s t a t ea s s e s s m e n t ;b ss t r u c t u r e c 1 a s s n 0 :t p 3 9 v 1 1 独创性声明 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研 究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或 撰写过的研究成果,也不包含为获得北京交通大学或其他教育机构的学位或证书 而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作 了明确的说明并表示了谢意。 学位论文作者签名:防恒召芋字同期:加秒7 年月肜日 6 7 学位论文版权使用授权书 本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特 授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国 家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名: 傍恒忍, 导师签名: 翎俊 j 签字日期:础叼年月日 致谢 本论文的工作是在我的导师胡俊教授的悉心指导下完成的,导师胡俊教授严 谨的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢两年来 胡俊老师对我的关心和指导。 胡俊教授悉心指导我完成了实验室的科研工作,在学习上和生活上都给予了 我很大的关心和帮助,在此向胡俊老师表示衷心的谢意。 王志海教授和瞿友利教授对于我的科研工作和论文都提出了许多的宝贵意 见,在此表示衷心的感谢。 另外也感谢我的父母,他们的理解和支持使我能够在学校专心完成我的学业。 前言 1 1 研究背景 1 前言 从2 0 世纪9 0 年代未丌始,我国的高等教育发生了巨大变化,高等教育已经 进入大众化阶段。根据教育部提供的数据,在2 0 0 5 年我国共有各类高等院校1 7 9 2 所,其中本科高校7 0 1 所,高等院校的招生规模和在校生数量都在持续增加。在 扩大招生规模的同时,面对日益激烈的市场竞争和全社会对高等教育质量的关注, 为了提高我国高等教育人才培养质量,确保高等教育的持续健康发展,教育部启 动了高校本科教学水平评估工作,希望通过本科教学评估进一步加强国家对高等 学校教学工作的宏观管理和指导,促使各级教育主管部门重视和支持高等学校的 教学工作。 从近几年的本科教学水平评估来看,开展教学工作水平评估是政府管理职能 和管理方式的重大举措,是规范高等学校办学和管理的要求,是学校建立内部质 量监控体系,进一步提高办学质量、办人民满意的高等教育而采用的有效措施。 随着数据仓库技术、数据挖掘技术、o l a p 技术等与决策支持相关的技术的快 速发展,这些技术已经应用到社会生成和生活的各个方面。为了提高本科教学水 平评估的效率,让评估工作做到公平、公正、公开,方便国家加强对高等学校教 学基本状态的宏观指导,建立具有权威性、客观性、全面性的能充分反映高等学 校教学基本状态和基本特征的高校教学基本状态数据库系统已经变的同趋重要。 2 0 0 8 年2 月2 0 日,全国高校教学基本状态数据库系统项目建设方案研讨会在 广州召开,教育部、财政部为保障高等教育教学质量,推动“高等学校本科教学 质量与教学改革工程”设立了全国高校教学基本状态数据库系统项目。该项目是 教育部实现高校教学水平监控、教学质量提高、科学决策管理和开展高等教育质 量研究的重要信息化平台,对我国高等教育研究具有重要的支撑作用。 高校教学基本状态数据库系统存放能够反映学校整体的和综合情况的数据, 这些数据能反映学校的办学条件、办学能力、办学效果等多个方面,有利于国家 的宏观管理规划及高校自身的自检、自评。 1 2 研究现状 近年来,随着信息技术的飞速发展,信息系统的优势和互联网的灵活性在教 北京交通大学硕+ 学位论文 育行业中已广泛应用,研究人员已将计算机技术应用于高校教学评估中,开发了 一些软件系统,代替了部分手工处理方式的工作,并取得了一些成果。 目前,国内对教育评估系统的开发越来越多,但总体来看,都是针对高校评 估的某一个方面进行的。然而,高校教学基本状态的评估需要对高校的办学思想、 办学条件、管理水平、层次和类型、学科专业结构、人才培养质量、科研水平等 多方面数据进行细致的筛选和深入的分析,因此国内现有的已开发的教育评估系 统尚不能完全满足高校教学评估的需要。 决策支持系统和专家系统的应用,提出了计算机决策支持系统应用于高等教 育的主要结构和功能,以及在教育中的重要作用,为教育评价提出了一些教育决 策支持系统的初步模型和一些相关算法。目前计算机决策支持系统在数据管理方 面处于比较先进的层次,但在应用方面,由于高校教学评估决策不同于一般的教 育评估,如何在高校教学评估决策领域中应用决策支持系统仍需要研究人员进一 步实践【3 1 1 。 1 3 论文研究内容 本文是以高校教学基本状态数据系统项目为背景,介绍了决策支持的相关理 论和技术,从总体上设计了高校教学基本状态数据系统的框架结构、数据流程、 数据库和功能结构。整个系统可以划分为以下几个部分:指标维护子系统、数据 采集子系统、决策支持子系统和信息发布子系统。本文重点研究实现了指标的维 护、高校评估数据采集和决策支持三个部分。 1 4 论文组织安排 论文共分为七章,组织结构如下: 第一章前言。前言部分阐述了论文的研究背景及研究现状,并说明了论文研 究的内容和论文的篇章结构。 第二章相关技术概述。介绍了决策支持相关概念、数据挖掘技术、o l a p 技 术,重点介绍了聚类分析和k 均值聚类算法的思想。 第三章高校教学基本状态数据库系统总体设计。阐述了系统的总体设计目 标,确定了系统的总体框架并设计了系统数据流程,设计了数据库及其表结构, 最后设计了系统功能结构。 第四章指标维护子系统的设计与实现。首先介绍了目前我国指标体系的现 况,分析了我国指标体系的结构。然后,设计并实现了指标的维护系统。 2 前言 第五章数据采集子系统的设计与实现。首先对系统的功能、用户和采集的数 据进行分析,然后设计了该子系统的功能、数据采集流程和数据模型,最后实现 了高校基本信息数据的采集和高校评估指标数据的采集。 第六章决策支持子系统的设计与实现。首先,分析了该子系统的基本需求, 设计了子系统的基本功能。介绍了系统功能的实现,包括趋势分析、o l a p 分析和 高校聚类结果的可视化分析,最后进行了实验分析。 第七章结论。总结了系统的不足之处及将来进行改进的方向。 3 相关技术概述 2 1 决策支持技术 2 1 1 什么是决策支持 2 相关技术概述 决策支持是从数据库中找出必要的数据,并利用数学模型,为用户生成所需 要的辅助决策信息。决策支持主要是为了解决由计算机自动组织和协作多模型的 运行及数据库中大量数据的存取和处理,达到更高层次的辅助决策能力,本文采 用了决策支持相关技术为高校教育决策人员提供辅助支持。 2 1 2 决策支持技术现状 目前随着数据仓库、联机分析处理、数据挖掘技术的研究逐渐进入高潮,国 外决策支持技术的研究进入崭新阶段,数据的组织方式从传统的二维平面结构形 式扩展为空间的多维结构形式,也就是数据仓库。数据仓库中集中了更多的数据, 并且是按主题的方式组织,便于用户从大量的数据中提取各自的辅助决策数据和 信息。数据仓库本身有很强的决策支持能力,有强大的查询分析工具,能产生用 户所需的综合信息、时间趋势分析信息等辅助决策信息。联机分析处理提供了很 强的多维分析方法,它提取多维数据,扩大辅助决策能力。数据挖掘技术作为一 个独立的研究领域,主要是从大量数据中提取有用信息提供辅助决策。 而在国内,决策支持技术的研究起步较晚,理论与实践结合的能力还有待提 高。目前,国内的决策支持系统多为智能决策支持系统,另外,将专家系统与数 据挖掘相结合,数据挖掘从数据库中挖掘知识放入专家系统的知识库中,由知识 推理的专家系统达到定性分析辅助决策。 2 2 数据挖掘技术 2 2 1 数据挖掘的概念 数据挖掘( d a t am i n i n g ) ,又称为数据库中的知识发现( k n o w l e d g ed i s c o v e r yi n d a t a b a s e ,k d d ) ,就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理 解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘” 北京交通大学硕十学位论文 知识【5 1 。 2 2 2 聚类分析 聚类分析是数据挖掘中的一项重要的分析方法,我国有近2 0 0 0 所高校,这些 高校在办学规模、办学层次等各方面处于不同的层次,所以为了实现对这些高校 的分类指导,提高教育管理部门的管理效率和效果,可以采用聚类分析方法对所 有学校进行聚类分析。 聚类就是将数据对象分组成为多个类或簇,使得结果簇内的相似度高而簇问 的相似度低。 很多聚类算法是基于内存的,它们包括两种有代表性的数据结构【2 0 】: ( 1 ) 数据矩阵( d a t am a t r i x ) :它用p 个变量( 也称为度量或属性) 来表现n 个对 象,这种数据结构是关系表的形式,或看成万p 的矩阵。 五1 而, l 吩 ih ( 2 - 1 ) ( 2 ) 相异度矩阵( d i s s i m i l a r i t ym a t r i x ) :存储n 个对象两两之间的近似性,表现 形式是一个n 咒维的矩阵。 0 d ( 2 ,1 ) 0 d ( 3 ,1 ) d ( 3 ,2 ) 0 d ( n ,1 ) d ( n ,2 ) 0 ( 2 2 ) 在这里d ( i ,j ) 是对象f 和对象之间相异性的量化表示,当对象f 和对象越相似或 “接近”,其值越接近o ;两个对象越不同,其值越大。 对象之间的相异度( 或相似度) 是基于对象间的距离计算的,常用的距离度 量方法是欧几旱得距离,其定义如下: d ( i ,) = i 薯l x j lj 2 + l 2 一21 2 + + i 一1 2 ( 2 - 3 ) 这里的净( x i l ,葺2 ,) 和= ( x j l ,x ,2 ,x 加) 是两个p 维的数据对象。 另一个著名的度量方法是曼哈坦距离,其定义如下: 6 p p p 加;砌;咖 ; 一; 相关技术概述 d ( f ,_ ,) = i x j l x j ii + l 墨2 一一2l + + 1 一 ( 2 4 ) 上面的两种距离度量方法都满足对距离函数的如下数学要求: 1 ) d ( i ,j ) 0 :距离是一个非负的数值。 2 ) d ( i ,j ) = 0 :一个对象与自身的距离是0 。 3 ) d ( i ,j ) = d ( j ,f ) :距离函数具有对称性。 4 ) d ( i ,j ) d ( i ,h ) + d ( h ,j ) :从对象f 到对象的直接距离不会大于途经任何其 他对象h 的距离。 明考斯基距离是欧几里得距离和曼哈坦距离的概化,其定义形式如下: d ( i ,) = ( i i 一li q + i x i 2 一2i q + + i 一f 加1 9 ) 1 9 ( 2 5 ) 这罩的g 是一个正整数。当g = 1 时,它表示曼哈坦距离,当q = 2 时表示欧几里得 距离。 如果对每个变量根据其重要性赋予一个权重,加权的欧几里得距离可以计算 如下: 蚓) = 而i 可面i 哥石而 ( 2 6 ) 2 2 3k 均值聚类算法 k 均值聚类算法的基本思想是以k 为输入参数,把n 个对象的集合分为k 个簇 集,使得结果簇内的相似度高而簇间的相似度低。 该算法的核心思想是把,z 个向量z ,( = 1 , 2 ,刀) 分为k 个组墨( f - 1 , 2 ,k ) ,并 求每组的聚类中心,使得非相似性( 或距离) 指标的价值函数( 或目标函数) 达 到最小【l6 1 。本文将本科教学评估的指标作为向量,通过计算高校间各指标的相似 性实现对高校的聚类分析。 k 均值聚类算法的实现如下【1 。7 】 ( 1 ) 要聚成k 个聚类。初始k 个聚类中心z 。( 1 ) ,z :( 1 ) ,z 。( 1 ) ; ( 2 ) 在第k 次迭代中,将样本集 z ) 的分类方法为对所有i = 1 ,2 ,k ,f j 。若 i i z z ,( 七) l i z - z f ( 尼) ,贝0 z s j ( 尼) ; ( 3 ) 令由式( 2 ) 得到的s ,( 后) 的新的类中心为z j ( 七十1 ) 。 令 = l iz z ( k + 1 ) 1 1 2 最小,j = l 2 k ,则乙( 尼+ 1 ) = z 也,m 为s j ( k ) 中 z s s ,( t )z e s ( ) 的样本数; ( 4 ) 对于所有的j = 1 , 2 ,丘,若z ,( j | + 1 ) = z f ( 七) ,则终止,否则转到( 2 ) 。 类可以用来将不同的目标分割开来,在各个类中目标尽可能地聚合在一起, 7 北京交通人学硕士学位论文 同时,类和类之间尽可能远离,k 均值算法明确了分类的数量,量化了目标之间 各类的聚合程度。 2 3o l a p 技术 本科教学评估指标数据可以分为不同的粒度层次,为了方便教学研究人员从 各个侧面、各个粒度层次观察数据,本文选择采用o l a p 技术。 2 3 1o l a p 的定义 根据o l a p 委员会的定义,o l a p 是一种软件技术,它使分析人员能够迅速、 一致、交互地从各个方面观察信息,以达到深入理解数据的目的,这些信息是从 原始数据直接转换过来的,他们以用户容易理解的方式反映数据真实情况【2 1 1 。 2 3 2o l a p 的基本数据模式 o l a p 中主要有三种结构模式:星型模式、雪花型模式和星座模式【2 8 】。 ( 1 ) 星型模式:星型模式是一种多维的数据关系,它由一个事实数据表和一组 维表构成,事实表的主键的每个元素都是维表的外键。 ( 2 ) 雪花模式:雪花型模式是对星型模式的扩展,它对星型模式的维表进一步 层次化,原有的各个维表可以扩展为小的事实表,形成一些局部的“层次区域。 ( 3 ) 星座模式:它是对星型模式的直接扩充,为了表示多个事实表之间的关系, 可以通过共享维将多个星型模式连接在一起形成一个新的星型模式,即星座模式。 2 3 3o l a p 的基本操作 o l a p 的基本多维分析操作包括钻取、切片、切块等【2 9 1 。 ( 1 ) 钻取:是改变维的层次,变换分析的粒度,它包括向上钻取和向下钻取。 ( 2 ) 切片:在多维数据集的某一维上选择某一维成员的动作称为切片,切片的 结果一定是一个二维平面。 ( 3 ) 切块:在多维数据集的某一维上选定某一区间的维的成员的动作称为切块, 实际上,切块也可以看作进行多次切片后,将切片结果叠加在一起的结果。 高校教学基本状态数据库系统总体设计 3 高校教学基本状态数据库系统总体设计 3 1 系统设计目标 本课题的目的和宗旨是通过建立高校教学基本状态数据库系统来加强国家教 育部门对高校教学基本状态的监控,为教育决策人员提供辅助决策支持,从而促 进教育改革和教学质量提高。据此目标和宗旨,系统设计目标如下: 1 建立高校教学基本状态数据库 高校教学基本状念数据库是用来管理和存放反映高等学校在办学条件和办学 效果等方面状态数据的数据库。 2 高校自我监测 为高校提供了解我国高等教育发展情况以及自身发展情况的数据,并提供可 靠的数据可视化分析平台。 3 数据采集 为各高校提供统一的数据采集平台,包括学校基本信息数据的采集和评估指 标数据的采集。提供灵活的报表制作工具,使用户可以按照自己的需要设计报表 格式,同时提供数据审核和汇总功能。 4 决策支持 对本科教学评估指标数据提供趋势分析的功能。存放在数据库中的数据是多 维数据,要提供一个多维数据的可视化分析工具,使用户可以从多个角度分析数 据,进行旋转、切片等o l a p 操作,此外,对高校进行聚类分析,为教育管理人 员做出决策提供辅助支持。 3 2 系统框架与数据流设计 3 2 1 系统框架选择 3 2 1 1c s 和b s 结构介绍 c s 模式是2 0 世纪8 0 年代随着网络数据库和桌面图形交互窗口及开发技术的 发展而逐渐成长起来的一种模式,在这种结构中,网络中的计算机分为两个有机 地联系在一起的部分,即客户机和服务器【6 1 。 在c s 结构中,所有客户机与数据库服务器相连,服务器负责数据处理,客 9 北京交通大学硕士学位论文 户端负责与用户交互,向后台服务器发出请求。对于客户请求,如果客户机能够 满足就直接给出结果,否则就交给服务器来处理。因此,这种模式可以合理均衡 事务处理,充分保证数据的完整性和一致性,其结构如图3 1 所示。 客户端服务器端 请求卜 y 显示 1 客户 势据 4卜 数 逻辑 、n 事务 处理 、矿 据 逻辑 1 逻辑 库 响应 图3 - 1c s 结构图 f i g u r e3 - 1c sa r c h i t e c t u r e b s 模式将传统c s 模式中的服务器部分细分为数据库服务器和w e b 服务器, 从而变成由浏览器、w e b 服务器、数据库服务器构成的三层体系结构。b s 模式的 客户端简化为只讲单一的h t m l 语言的浏览器。 在这种模式下,客户端使用一个通用的浏览器来代替各种应用软件,用户的 所有操作都是通过浏览器进行的。w e b 服务器负责接受请求,然后根据请求条件 到数据库服务器获取相关数据,再将结果翻译成h t m l 和各种页面描述语言并传 回浏览器,其结构如图3 2 所示。 浏览器服务器 客尸端请求卜 数据请求 数据输 提交数据 y 数 据 库 服 务 1 服务器响应1 数据响应 器 显示数据 获得数据 v 图3 - 2b s 结构图 f i g u r e3 - 2b sa r c h i t e c t u r e 3 2 1 2c s 和b s 结构对比 虽然c s 结构模式可以合理均衡事务处理,充分保证数据的完整性和一致性, 但是随着i n t e r n e t 技术的发展,以及企业对信息系统的总体开发、维护、升级和硬 件成本的考虑,这种模式逐渐暴露出很多问题。 1 0 高校教学基本状态数据库系统总体设计 随着i n t e m e t 的快速发展,以w e b 技术为基础的b s 模式逐渐显示出其先进性 当今很多基于大型数据库的信息系统都是采用了这种全新的技术模式。 c s 和b s 模式的优缺点如表3 - 1 所示【7 】: 表3 - 1 c s 和b s 模式的比较 c s 模式b s 模式 存户端 任务埘人人人降低了任务坫 系统的开发卡维护编程1 柞培人人人减少了i 作量 用户操作 复杂 统一、友好、简单 灵活性爰活性筹灵活性好 移植性难以移植不存在移植性问题 扩展性方便扩展有良盘的扩展性 及时性和交互性 盘f 一般 通过c s 和b s 结构模式的对比,b s 在开发维护、灵活性、易操作性、可移 植性等方面相对于b s 模式具有明显的优势。因此,结合本项目的实际情况,本 系统采用b s 模式丌发。 3 22 系统总体结构 在系统框架l 我们选择了b s 模式,系统的总体结构如图3 - 3 所示 客户端 幽3 - 3 系统总体结构 f i g u r e 3 3o v e r a l l $ t r l l c t u f eo f t h es y s t e m 本系统总共包括四个模块:指标维护子系统、数据采集子系统、决策支持子 系统和信息发布于系统。 北京交通大学硕士学位论文 3 2 3 系统数据流程 系统数据分为三个层次,即高校基础状态数据、高校综合状态数据和高校教 学基本状态数据,数据采取从低级到高级的顺序采集。 高校基础状态数据是反映学校教学、管理、科研等各个方面的细节数据。高 校综合状态数据是由高校基础状态数据通过统计和汇总生成的反映学校整体情况 的数据。高校教学基本状态数据是以高校综合状态数据为主的反映高校教学各个 方面的数据,它为整个系统的各功能模块提供数据,系统的数据流程图如图3 4 所示【2 7 1 。 l 指标维护子系统ll 决策支持子系统l 数据采集子系统ll 信息发布子系统l 彳 高校教学基本状态数据库 p 彳一 高校综合状态数据报表 、i 口口口口 彳卜彳卜 高校基础状态数据( 局部和细节) rr r 一 3 3 系统数据库的设计 3 3 1 概念模型设计 图3 _ 4 系统数据流程 f i g u r e 3 - 4d a t as t r e a mo ft h es y s t e m 数据库是整个系统的数据源,为数据挖掘、多维分析、高校间的纵向横向对 比提供数据支持,因此,该数据库又不同于普通的操作型数据库,而是采用了数 据仓库的一些技术。 对一个学校进行评估涉及到这七个方面,结合教育部的评估指标体系和项目 研究的实际,确定主题域如下:办学条件主题、师资队伍主题、师资水平主题、 学生信息主题、人才培养主题、校园文化主题、教学管理主题。 1 2 高校教学基本状态数据库系统总体设计 在确定了上述七个分析主题之后,可以设计e r 模式对每个分析主题涉及 到的实体进行描述。以办学条件主题为例,该主题由一个事实数据表和多个维表 构成,事实数据表存放评估指标对应的数据,而用维表存放数据分析的角度,可 以将数据和维度看作实体,上述的每个主题都包含如下几个实体: ( 1 ) 评估数据实体,该实体由指标序号、指标值、数据日期和学校代码几个 属性构成,如图3 5 所示。 图3 5 评估数据实体 f i g u r e 3 5d a t ae n t i t i e so fa s s e s s m e n t ( 2 ) 基本指标实体,基本指标是高校上报数据时可直接获取数据的指标,它 包括指标序号、指标名称、指标单位、指标说明等属性,如图3 - 6 所示。 图3 - 6 指标实体 f i g u r e 3 - 6e n t i t i e so fg u i d e l i n e s ( 3 ) 一级指标实体,我们确定了七个一级指标,它包括一级指标序号、一级 指标名称两个属性,如图3 7 所示。 图3 - 7 一级指标实体 f i g u r e 3 - 7e n t i t i e so ff i r s tl e v e lg u i d e l i n e s ( 4 ) 一- - 级指标实体,它包括二级指标序号、二级指标名称和一级指标序号三 个属性,如图3 8 所示。 北京交通人学硕十学位论文 图3 - 8 二级指标实体 f i g u r e 3 - 8e n t i t i e so f s e c o n dl e v e lg u i d e l i n e s ( 5 ) 高校实体包含一些描述高校基本信息的属性,例如学校代码、学校名称、 建校时间、学校层次等等,如图3 - 9 所示。 图3 - 9 学校实体 f i g u r e 3 9e n t i t i e so fc o l l e g e s ( 6 ) 数据年份实体,本科教学评估所需的数据都是按年份存储的,每年由高 校提交一次,该实体只有数据日期一个属性,如图3 一1 0 所示。 图3 1 0 数据年份实体 f i g u r e 3 10e n t i t i e so fd a t ad a t e 定义了实体集和属性并使用e r 模型描述后,还要确定实体集之间的联系 及其属性。基本指标实体、高校实体和数据年份实体与评估数据实体之间都是功 能性联系,而一级指标实体与二级指标实体之间、二级指标实体与基本指标实体 是存在性联系,因此这些实体之间的联系用e r 模式表示如图3 1 1 所示。 图3 1 l 办学条件分析概念模型 f i g u r e 3 - 11c o n c e p t i o nm o d e lo f t e a c h i n gf a c i l i t ya n a l y s i s 1 4 高校教学基本状态数据库系统总体设计 3 3 2 逻辑模型设计 高校教学基本状态数据库中的数据都是关系型数据,此外,我们使用的s q l s e r v e r 2 0 0 0 的分析服务器也是基于关系型数据的,所以我们创建的数据库采用 r o l a p 方式。由于本科教学水平评估的指标体系采用多级指标的形式,这里我 们通过雪花型模型映像出数据间的多维关系。 我们确定的每个主题都是由多个表共同实现的,这些表通过公共键码联系起 来形成一个完整的主题。在概念模型中我们确定了七个主题,这里我们以办学条 件主题为例进行模式划分,并确定各个表的关系模式。 在实现办学条件这个主题时划分为以下几个表来实施: ( 1 ) 学校基本信息表 学校信息表存放学校的基本信息数据,对应的关系模式可以如下表示: 学校基本信息( 学校代码,学校名称,学校类型,行政辖区) ; ( 2 ) 一级指标表 一级指标表存放七个一级指标,其对应的关系模式可以如下表示: 一级指标( 一级指标序号,一级指标名称) ; ( 3 ) 二级指标表 二级指标存放七个一级指标的下级指标,其对应的关系模式可以如下表示: 二级指标( 二级指标序号,二级指标名称,一级指标序号) ; ( 4 ) 办学条件指标表 该表中存放评估学校办学条件的基本指标,例如学校占地面积,教室面积, 实验室数量等,其对应的关系模式可以如下表示: 办学条件指标( 指标序号,指标名称,指标单位,指标说明,四级指标,三 级指标,二级指标序号) ; ( 5 ) 数据年份表 数据年份表中存放了数据库中所有数据的年份,其对应的关系模式可以如下 表示:数据年份( 数据日期) ; ( 6 ) 办学条件数据表 办学条件数据表是办学条件主题的事实数据表,其中存放了各个办学条件指 标对应的数据,其对应的关系模式可以如下表示: 办学条件数据( 指标序号,指标值,学校代码,数据日期) 。 3 3 3 物理模型设计 1 5 北京交通大学硕士学位论文 物理模型设计阶段要做的工作主要是逻辑建模所生成的模型如何具体实现, 例如确定数据的存储结构、索引策略、存放位置、存储分配等。影响物理建模的 主要因素包括:i o 存取效率、空间效率和维护代价。 3 3 4 数据库表结构设计 由于我们确定的七个主题的维度数据表和事实数据表的数量与结构是相同 的,只是指标维度表中的内容不同,所以这罩无需将所有主题的维度数据表和事 实数据表都罗列出来,只以办学条件这个主题为例进行说明。 ( 1 ) 学校信息表 学校信息表存放各个学校的基本描述信息,具体结构如表3 2 所示。 表3 - 2 学校基本信息表结构 t a b 3 2s t r u c t u r eo fs c h o o li n f o r m a t i o nt a b l e 字段名称数据类型长度是否允许为空是否主键 学校代码i n t4否是 学校名称n v a r c h a r2 0否否 主管部门n v a r c h a r2 0否否 行政辖区n v a r c h a r2 0否否 填表人姓名n v a r c h a r2 0否否 填表人邮箱 n v a r c h a r2 0否否 异地校区数 i n t4否否 校区数 i n t4否 否 电话号码n v a r c h a r2 0否否 传真号码 n v a r c h a r2 0 否否 单位信箱 n v a r c h a r2 0 否否 校区数 i n t4 否否 学校类型 n v a r c h a r2 0 否否 学校类别n v a r c h a r 2 0 否否 学校层次n v a r c h a r 2 0 否否 招生批次n v a r c h a r2 0否否 该表的学校类型、学校类别、学校层次、招生批次、对口支援类型和主管部 f - j 7 段存放的是代码,代码的值存放在另外六个表中,如表3 3 所示。 1 6 高校教学基本状态数据库系统总体设计 表3 - 3 代码表结构 t a b 3 3s t r u c t u r eo fc o d et a b l e 字段名称数据类型长度是否允许为空是否主键 代码 n v a r c h a r 2 0否是 代码值 n v a r c h a r2 0 否否 ( 2 ) 办学条件指标表 在指标体系的实现中,我们将基本数据采集指标定为第五级指标,由于这些 指标都是量化指标,并且是详细具体的,所以对这些基本指标进行归类和抽象形 成了其上的四级、三级指标。由于一级和二级指标存放在另外两个表中,所以必 修设置一个字段来标记每个指标对应的二级指标,具体结构如表3 4 所示。 表3 4 办学条件指标表结构 t a b 3 - 4s t r u c t u r ei n d e xt a b l eo ff a c i l i t yo ft e a c h i n g 指标名称数据类型 长度是否允许为空是否主键 指标序号h a t4否是 指标名称n v a r c h a r5 0否否 指标单位n v a r c h a r2 0否否 四级指标 n v a r c h a r5 0 否否 三级指标 n v a r c h a r5 0 否否 二级指标序号 i n t4 否 否 ( 3 ) 一级指标表 一级指标表用于存放指标体系的七个一级指标,在概念模型阶段确定的七个 主题共用该表,该表由两个字段构成,如表3 5 所示。 表3 5 一级指标表结构 t a b 3 5s t r u c t u r eo ff i r s tl e v e li n d e xt a b l e 字段名称数据类型长度是否允许为空是否主键 一级指标序号 i n t4 否是 一级指标名称n v a r c h a r 5 0 否否 ( 4 ) 数据年份表 数据年份表中存放指标数据采集的年份,由数据日期一个字段构成,如表 3 - 6 所示。 1 7 北京交通人学硕士学位论文 表3 6 数据年份表结构 t a b 3 6s 仃u c t u r eo fd a t et a b l e 字段名称数据类型长度是否允许为空是否主键 数据日期 i n t4否 是 ( 5 ) 二级指标表 与一级指标表不同的是二级指标表中还用字段束标记每个二级指标所属的 一级指标的序号。该表由三个字段构成,如表3 7 所示。 表3 7 一二级指标表结构 t a b 3 7s t r u c t u r eo f s e c o n dl e v e li n d e xt a b l e 字段名称数据类型长度是否允许为空是否主键 二级指标序号i n t4否是 二级指标名称n v a r c h a r5 0否否 一级指标序号 i n t4否否 ( 6 ) 办学条件数据表 办学条件数据表也就是该主题的事实数据表,存放着基本采集指标的所有数 据。在该主题中有学校、数据同期和指标三个维度,如表3 8 所示。 表3 8 办学条件数据表结构 t a b 3 8s t r u c t l l r eo ft e a c h i n gf a c i l i t yv a l u et a b l e 字段名称数据类型长度是否允许为空是否主键 数据日期 i n t4 否否 学校代码 i n t4否 否 指标序号i n t 4 否否 指标值f l o a t 4 否否 在该数据表中存放了各个学校的历年来所有与该主题有关的指标数据,数据 的年份、指标的序号以及学校代码必然会重复出现,所以在该表中没有设置主键。 3 4 系统功能结构设计 系统的功能包括四个部分:指标维护子系统、数据采集子系统、决策支持子 系统和信息发布子系统。系统的功能结构如图3 1 2 所示。 高校教学基本状态数据库系统总体设计 图3 1 2 系统功能结构 f i g u r e 3 12f u n c t i o n a ls t r u c t u r eo ft h es y s t e m 3 4 1 指标维护子系统 指标的维护不仅包括基本评估指标的维护,还包括综合评估指标的维护。 对基本评估指标的维护包括指标的添加、修改和删除操作,由于教学评估指 标体系中的指标存在包含和层次关系,因此,在进行以上各项操作时要保证维持 这种关系。为了满足动态评估的要求,系统提供对综合评估指标的维护功能。 3 4 2 数据采集子系统 数据采集包括高校基本信息数据的采集和教学评估指标数据的采集。对于高 校的基本信息数据,学校填写表单提交之后可以进行修改。数据采集主要是对评 估指标数据的采集,用户可以通过报表制作工具制定各种格式的报表,并将报表 下发给各分校供其填报数据。填报后的报表可以导出成e x c e l 文件备份,也可以由 系统汇总各分校的报表数据上报教育部。 3 4 3 决策支持子系统 由于反映一个学校本科教学状态的数据是多维的,因此可以从不同的数据视 图进行分析。使用数据可视化,在各个数据粒度层次上对学校历年的数据利用曲 线图或柱状图等方式进行可视化展示,这样可以清楚地得到

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论