(计算机科学与技术专业论文)高考志愿决策支持系统的设计与实现.pdf_第1页
(计算机科学与技术专业论文)高考志愿决策支持系统的设计与实现.pdf_第2页
(计算机科学与技术专业论文)高考志愿决策支持系统的设计与实现.pdf_第3页
(计算机科学与技术专业论文)高考志愿决策支持系统的设计与实现.pdf_第4页
(计算机科学与技术专业论文)高考志愿决策支持系统的设计与实现.pdf_第5页
已阅读5页,还剩100页未读 继续免费阅读

(计算机科学与技术专业论文)高考志愿决策支持系统的设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

f j 一 - 学位论文版权使用授权书 本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特 授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 提供阅览服务,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。 同意学校向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名:导师签名: 签字日期:) 9 知年月娟 签字日期:- 。年6 月【诣 中图分类号:t p 3 9 ;t p l 8 u d c :5 2 0 6 0 8 0 学校代码:1 0 0 0 4 密级:公开 1 1 1 1 1 1 1 1 1 1 1i ii1 1 1 1 1i iii i i i i il l 1 1 1 1 1 11 1 1 1 1 y 17 8 0 3 7 0 北京交通大学 硕士学位论文 高考志愿决策支持系统的设计与实现 d e s i g na n di m p l e m e n t a t i o no fc o l l e g ee n t r a n c ee x a m i n a t i o n a p p l i c a t i o nd e c i s i o ns u p p o r ts y s t e m 作者姓名:史贞军 导师姓名:韩臻 学位类别:工学 学科专业:计算机科学与技术 学号:0 7 1 2 0 5 2 2 职称:教授 学位级别:硕士 研究方向:计算机应用 北京交通大学 2 0 1 0 年6 月 文中 工作 指导 的道 心的 讨论 军军 在此 贵意 中文摘要 中文摘要 摘要:本文设计并实现的高考志愿决策支持系统是为北京交通大学招生人员以及 准备报考北京交通大学的考生提供关于高考招生、志愿填报等环节的辅助决策系 统。论文首先对学校招生人员和考生两类用户的需求进行分析,在研究高考志愿 填报的规律以及学校历年高考录取的历史数据的基础上,设计结合了数据仓库、 数据挖掘和联机分析处理等技术的新型决策支持系统。在系统实现过程中,重点 探讨了系统数据仓库的建立过程,数据源的准备,数据仓库的结构设计与创建, 数据抽取、转换与载入。进而研究如何利用数据挖掘、联机分析处理和统计报表 等技术实现辅助决策功能,在联机分析处理和数据挖掘技术的实现过程中,重点 对各种辅助决策方法的应用进行了探索,并将不同决策方法提供的不同层次的决 策信息组合应用于高考志愿的决策辅助。该系统采用m i c r o s o f ts q ls e r v e r 2 0 0 5 + w e bs e r v i c e 的解决方案,具体采用了s q ls e r v e r2 0 0 5 提供的联机分析处理 和报表服务向用户展示数据之间的内在联系,采用在j a v a 环境下朴素贝叶斯、关 联规则、多元线性回归等数据挖掘算法对大量历史数据进行分类、关联和预测, 最终在n e t 平台中实现了不同决策方法的集成,为用户提供辅助决策信息。为保 证决策信息的可用性,各个决策方法所用到的数据和结果都进行了反复的测试和 调校。研究的实际成果是形成了一个与北京交通大学招生网站整合的w e b 系统, 即将提供给广大考生和学校招生人员使用。 关键词:高考志愿:决策支持系统;数据仓库;联机分析处理;数据挖掘 分类号:t p 3 9 ;t p l 8 北京交通大学硕士学位论文 a b s t r a c t a bs t r a c t a b s t r a c t :c o l l e g ee n t r a n c ee x a m i n a t i o na p p l i c a t i o nd e c i s i o ns u p p o r ts y s t e m w h i c hi sd e s i g n e da n di m p l e m e n t e di nt h i sd i s s e r t a t i o ni su s e dt op r o v i d ea s s i s t a n t d e c i s i o na b o u tc o l l e g ee n t r a n c ee x a m i n a t i o na n dm a k i n ga p p l i c a t i o n sf o ra d m i s s i o n s s t a f f so fb e i j i n gj i a o t o n gu n i v e r s i t ya n ds t u d e n t sw h ow i l la p p l yf o rt h ea d m i s s i o no f b e i j i n gj i a o t o n gu n i v e r s i t y f i r s t l y , t h en e e d so ft w ot y p e so fu s e rw h i c ha r es e p a r a t e l y f o rt h ea d m i s s i o n ss t a f f sa n dt h ec a n d i d a t e sa r ea n a l y z e d ,a f t e rc o n s i d e r i n gt h er u l e so f c o l l e g ee n t r a n c ee x a m i n a t i o na p p l i c a t i o na n dt h eh i s t o r i c a ld a t ao fc o l l e g ea d m i s s i o n s i ns e v e r a ly e a r s ,t h en e wd e c i s i o ns u p p o r ts y s t e mh a sb e e nd e s i g n e dc o m b i n i n gt h ed a t a w a r e h o u s e ,d a t am i n i n ga n do n - l i n ea n a l y t i c a lp r o c e s s i n gt e c h n o l o g y i nt h ep r o c e s s o ft h ei m p l e m e n t a t i o no ft h es y s t e m ,t h ep r o c e s so fb u i l d i n gd a t aw a r e h o u s ei nt h e s y s t e m , t h ep r e p a r a t i o no f t h ed a t as o u r c e ,t h es t r u c t u r a ld e s i g na n dc r e a t i o no ft h ed a t a w a r e h o u s e ,t h ee x t r a c t i o n , t r a n s f o r m a t i o na n dl o a d i n go ft h ed a t aa r ed i s c u s s e di nt h e f o c u sd i s c u s s i o n b a s e do i lt h ea b o v e ,w h a th a sb e e ns t u d i e di st h a th o wt oi m p l e m e n t d e c i s i o ns u p p o r tf u n c t i o nu s i n gd a t am i n i n g ,o n l i n ea n a l y t i c a lp r o c e s s i n ga n d s t a t i s t i c a lr e p o r t i n gt e c h n o l o g i e s i nt h ei m p l e m e n t a t i o np r o c e s so fo n - l i n ea n a l y t i c a l p r o c e s s i n ga n dd a t am i n i n g ,s o m ee x p l o r a t i o nh a v eb e e nd o n ef o c u so nt h ea p p l i c a t i o n o fv a r i o u sd e c i s i o ns u p p o r tm e t h o d s ,a n dd i f f e r e n tc o m b i n a t i o n so fd e c i s i o n - m a k i n g i n f o r m a t i o ni nd i f f e r e n tl e v e l sp r o v i d e db yd i f f e r e n td e c i s i o n m a k i n gm e t h o d sh a v e b e e nu s e dt os u p p o r tt h ed e c i s i o n - m a k i n go fc o l l e g ee n t r a n c ee x a m i n a t i o n m i c r o s o f t s q ls e r v e r2 0 0 5 + w e bs e r v i c es o l u t i o ni su s e di nt h es y s t e m w h i c hi se m b o d i e di n t h eu s eo fs q ls e r v e r2 0 0 5t op r o v i d eo n - l i n ea n a l y t i c a lp r o c e s s i n ga n dr e p o r t i n g s e r v i c e st os h o wu s e r st h ei n t r i n s i cl i n kb e t w e e nt h ed a t a , a n ds o m ed a t am i n i n g a l g o r i t h m ss u c ha st h en a i v eb a y e s ,a s s o c i a t i o nr u l e sa n dm u l t i p l el i n e a rr e g r e s s i o n h a v eb e e nu s e dt oc l a s s i f y , a s s o c i a t ea n dp r e d i c tal a r g en u m b e ro fh i s t o r i c a ld a t ai n j a v ae n v i r o n m e n t f i n a l l y , t h ei n t e g r a t i o no fd i f f e r e n td e c i s i o n - m a k i n gm e t h o d sh a s b e e na c h i e v e do n n e tp l a t f o r mt op r o v i d eu s e r sw i t hd e c i s i o ns u p p o r ti n f o r m a t i o n t o e n s u r et h ea v a i l a b i l i t yo fd e c i s i o n - m a k i n gi n f o r m a t i o n , a l ld a t au s e di nd e c i s i o n - m a k i n g m e t h o d sa n dr e s u l t sh a v eb e e nr e p e a t e d l yt e s t e da n da d j u s t e d a na c t u a lr e s u l to ft h e s t u d yi s t h ew e bs y s t e mi n t e g r a t e d 诵mb e i j i n g j i a o t o n gu n i v e r s i t ya d m i s s i o n s w e b s i t e ,w h i c hw i l lb ep r o v i d e df o rt h eg e n e r a lc a n d i d a t e sa n ds c h o o la d m i s s i o n ss t a f f s k e y w o r d s :c o l l e g ee n t r a n c ee x a m i n a t i o na p p l i c a t i o n ;d e c i s i o ns u p p o r ts y s t e m s ; 6 北京交通大学硕士学位论文 d a t aw a r e h o u s e ;o n l i n ea n a l y t i c a lp r o c e s s i n g ;d a t am i n i n g c l a s s n o :t p 3 9 ;t p 18 v 1 1 1 目录 目录 中文摘要。v a b s t r a c t v i i 1 绪论1 1 1研究背景及研究意义1 1 2国内外研究现状2 1 2 1 决策支持系统的研究现状2 1 2 2 高考志愿决策系统的发展现状4 1 3论文主要工作5 1 4 论文结构安排一6 2 高考志愿概述及需求分析9 2 1 高考志愿与录取9 2 2 影响高考志愿的关键因素1 0 2 3高考志愿的分数分析1 2 2 4需求分析1 4 3 高考志愿决策支持系统的设计1 7 3 1决策支持系统的概念1 7 3 1 1 决策支持系统基本功能1 7 3 1 2 传统体系结构分析1 7 3 2系统设计方案1 8 3 2 1 系统结构设计1 8 3 2 2 系统功能模块设计2 0 3 2 3 系统解决方案。2 2 3 2 4 决策方法构建方案2 4 3 3本章小结2 5 4数据仓库的设计和构建2 7 4 1数据仓库概述2 7 4 1 i 数据仓库的定义2 7 4 1 2 数据仓库的特点2 7 4 1 3 数据库与数据仓库的对比2 8 4 2数据仓库的设计2 9 4 2 1 数据仓库中主题与粒度2 9 北京交通大学硕士学位论文 4 2 2 数据仓库中物理设计3 0 4 2 3 数据仓库中逻辑设计3 3 4 3数据仓库的构建3 5 4 3 1 数据源准备。3 5 4 3 2 数据的抽取与转换。3 7 4 3 3 数据仓库的创建与数据载入一3 9 4 4本章小结4 1 5联机分析处理及数据挖掘系统设计4 3 5 1o l a p 和数据挖掘概述4 3 5 1 1o l a p 的产生和定义4 3 5 1 2o l a p 的数据模型4 4 5 1 3o l a p 中的多维数据分析4 5 5 1 4 数据挖掘的产生和定义4 6 5 1 5 数据挖掘任务4 7 5 2 用s q ls e r v e r2 0 0 5 进行分析4 8 5 2 1 多维数据集联机分析处理。4 9 5 2 2 用s s a s 进行数据挖掘51 5 2 3 用s s r s 预定义报表5 3 5 3数据挖掘在决策过程中的应用5 4 5 3 1 利用线性回归模型预测录取线5 4 5 3 2 用朴素贝叶斯分类器预测专业录取5 7 5 3 - 3 发现专业志愿中的关联规则。5 8 5 4本章小结6 1 6高考志愿决策支持系统的实现6 3 6 1基于w e b 的业务流程实现6 3 6 1 1 人机交互系统设计6 3 6 1 2 面向考生类型用户的业务流程一6 3 6 1 3 面向高校招生人员的业务流程。6 7 6 2系统实现中的关键技术7 1 6 2 1 挖掘算法d l l 组件设计7 l 6 - 2 2 用o w c 组件展示图表7 3 6 2 - 3 数据透视表组件的应用7 3 6 3系统测试结果7 4 6 3 1 录取分数线预测结果。7 4 目录 6 3 2 专业志愿填报录取概率7 5 6 3 3 专业间关联度分析结果7 6 6 3 4 专业志愿o l a p 分析结果7 7 6 4本章小结。7 9 7总结与展望8 l 参考文献8 3 作者简历8 5 独创性声明。8 7 学位论文数据集8 9 北京交通大学硕士学位论文 绪论 1 绪论 1 1研究背景及研究意义 普通高等学校全国统一考试( 简称高考) 至今已成为当代中国最成熟和最权威 的人才选拔机制。高考不仅对考生整个的人生发展起到了举足轻重的作用,同时 也牵连着家庭和社会。填报高考志愿起到了连接考生和高校的桥梁作用,成为整 个社会关注的焦点。 一方面,对于考生和家长来说,一年一度的高考使无数学子圆了大学梦,却 也有许多落榜者被挡在大学殿堂之外。尤为可惜的是有很多超过了分数线很多的 学生无法进入理想大学学习,这些学生大部分是由于志愿填报“失误”造成的。 考生及家长在高考志愿填报过程中,对专业的选择也至关重要。俗语有云: 三百六十行,行行出状元。一个人之所以在他所从事的行业中出类拔萃、脱颖而 出,非常关键的一点在于这一行业与他自身的兴趣、特质相符。因此,对于每一 个人而言,各种行业其实并无高低贵贱之分,关键在于找到并从事于一个适合自 己的行业。 然而,长期以来,高中生及家长一般都很关注“薪酬水平最高的几大行业、 “最有发展前景的几大行业 ,希望自己的孩子挤进这些人人艳羡、竞相争夺的行 业中。事实上导致了学生对所学专业的内在兴趣度的降低。近日,北京大学“首 都高等教育 学科群项目组对北京高校在校学生和教师进行问卷调查并颁布“首 都高等教育质量的调查报告”i l 】。报告显示,北京有三分之一大学生对所学专业 不感兴趣,重点高校、一般本科、高职院校分别为3 2 3 、3 9 1 、3 6 9 。报告 认为,如此高比例的学生“学非所好”,而在他们身上寄托着家庭和国家的希望, 确实是应该引起社会整体关注的重要问题。 用科学系统的方法研究高考志愿填报中决策的过程,是本课题研究的主要内 容,高考志愿的选择其实和股票投资一样,即有规律可循,又有很多无法把握无 法说清楚的情况主导着一些规律的改变,股票市场上由于涉及大量的经济利益, 因此研究者层出不穷,市面上的股票分析决策软件系统各有千秋,但是对于千家 万户子女升学问题的研究却很少。 另一方面,对于高校招生主管部门来说,随着我国高校招生工作的不断发展, 网上招生录取工作的普及,招生录取工作的信息化、招生数据的格式统一化为招 生数据的统计和处理、信息资源的汇总比较等方面提供了良好的环境。多年的招 北京交通大学硕士学位论文 生工作中积累了大量的历史数据,在数百万条考生志愿数据中,蕴藏着丰富的决 策信息和知识,开发这些宝贵的信息资源,是服务高考录取工作,指导考生科学 地填报志愿的一项重要任务。一个科学的决策支持系统能够将这些数据科学化的 利用到实际招生咨询和计划工作中,从而能够更加准确充分地为考生和家长提供 咨询服务,并且在高考招生的生源计划投放、专业设置、历史数据对比和趋势分 析、招生宣传等方面做出正确的决策。 同时,随着招生规模的逐年扩大,各大高校之间的生源竞争愈加激烈,高校 招生主管部门需要利用一个科学化的决策支持系统通过已经积累的数据信息为招 生管理提供决策支持,从而合理的把握生源动态,制定正确的招生策略,这样有 利于在高考招生中获得良好的生源质量。 基于这样的背景,建立一个科学的高考志愿决策支持系统( d s s ) 是非常有现实 意义的。 1 2国内外研究现状 策支持系 于提高决 识工程的 算机与通 织和编程 能决策支 系统智能 和决策需 改进,才 统中,使 理和数据 系结构, 据仓库、 合决策支 深化,决 单一的本 绪论 地服务上升为网络上的远程服务,而且能对远程多个用户的不同客户机同时并发 地提供服务。如此,便形成了网络环境的综合决策支持系统。 在国外,决策支持系统的研究越来越受到人们的重视,相关学术活动十分活 跃,新的学术团体、学术刊物不断涌现,研究和应用都取得了很大的进展。ad s s f o rs u s t a i n a b l ed e v e l o p m e n ta n de n v i r o n m e n t a lp r o t e c t i o no fa g r i c u l t u r a lr e g i o n s ) ) 一文 中 4 1 ,m a n o s 、b a s i ld 等在名为w a t e r m a p 的项目的框架下提出了一种可持续发展的 d s s 系统,该系统目的是在综合考虑可用资源、环境因子和环境脆弱性等基础上, 尽可能优化该地区的农业产出。该d s s 系统是一个基于多目标的优化模型,该模型 还可进一步用来仿真在不同社会、经济和环境因素下应作出的对策。d a w o o di 和 a l s h a w im 在( ( d e c i s i o ns u p p o r ts y s t e m s ( d s s ) m o d e lf o rt h eh o u s i n gi n d u s t r y ) ) 【5 】中 通过设立价值评价指标体系,从而建立一个房产决策支持系统,来辅助政府部门 和相关决策者制定行之有效的房地产政策。该决策支持系统所考虑的主要变量因 素包括:资金来源、劳动力、建筑材料、土地等。 在国内对决策支持系统的研究和应用最早始于2 0 世纪8 0 年代,经过了2 0 多 年的发展,目前处于发展阶段。全国首届决策支持系统学术交流会于1 9 9 1 年4 月 召开,会上成立了首届全国决策支持系统专业委员会,这标志着我国决策支持系 统研究和应用走向正规化的道路。虽然起步比较晚,但是决策支持系统在国内的 发展速度是非常快的。越来越多的学者专家投入到这个领域,很多关于决策支持 系统的专著和论文都大量的发表,此外众多成功的决策支持系统被成功部署应用。 由国家发改委所属的中国宏观经济学会、中国经济学奖管理委员会、中国宏 观经济信息网等权威机构联合研制的中宏“领导决策支持系统” 6 1 ,该系统包含了专 家智囊及课题研究、统计分析、国际经验、兄弟省市经验、国家相关政策法规、 相关产业分布、相关外资外贸情况、相关的金融税收政策、宏观形势和政策以及 本地区的相关内容,可谓相关经济决策提供辅助功能;西安交通大学战略与决策 研究所设计开发的三峡工程决策支持原型系统r 7 1 ,集数据处理、模型处理、人工智 能技术于一体,能够自动调度数据管理、模型管理或者决策专家子系统等模块为 用户提供多方面的信息。荆平等【8 】设计的污水回用决策支持系统采用地理信息系统 ( g i s ) 组件开发实现城市污水回用信息综合管理,运用m a t l a b 工具进行多目标优 化模型的求解,通过系统集成完成空间管理和模型分析的系统开发,实现污水回 用的决策分析。最后结合天津市的实例研究,在v b 平台上开发出能够自动实现模 型分析计算的系统软件,实现了城市污水回用的优化分析计算和结果的图形化显 示。目前,关于决策支持系统的研究已经成为我国信息系统领域的热点,受到人 们的普遍关注。 3 北京交通大学硕士学位论文 1 2 2高考志愿决策系统的发展现状 自2 0 0 2 年以来,普通高校招生工作普遍采用计算机远程网上录取方式。网上 录取系统由教育部组织统一开发,省级招生管理部门采集考生信息建立招生录取 数据库,通过录取系统服务器向来自全国各省在本省招生的院校发布数据,院校 通过客户端接收投档考生的信息,在计算机上阅档并按照招生工作的规定决定是 否录取,再将数据上传回生源省份的服务器,由省级招生管理部门审核通过后打 印录取名册备案。借助于这套系统,将考生的纸介质档案改成了在网上传递的电 子档案,录取工作由原来的手工现场作业变成计算机信息化管理,节约了人力物 力,也提高了工作效率,确保了招生录取工作的公平公正。网上录取从1 9 9 8 年在 部分省市试点到2 0 0 2 年在全国所有省市全面实施,标志着我国招生考试信息管理 手段的现代化又进入了一个新的历史时期,是一次重大的飞跃。普通高校招生网 上录取系统提供了统一的数据库模式,各省依据教育部下发的信息标准开发配套 信息采集系统,从2 0 0 2 年至今形成了模式和标准统一的历史数据,这为建立招生 考试数据仓库提供了良好的条件。 教育部全国高校学生信息咨询与就业指导中心在2 0 0 1 年开发的“高考填报志 愿综合参考系统 【9 】。该系统只从往年录取分数和位次角度为考生填报志愿、选 择报考院校提供参考。随后还推出近几年各专业毕业生就业去向查询,为考生选 择专业提供参考,开辟了招生章程、高考资讯等栏目供考生免费使用,为考生了 解院校情况和招生政策提供了方便。同时,教育部阳光高考信息平台、中国教育 科研网以及新浪、搜狐等门户网站教育频道都建立有高考志愿填报的辅助系统或 者信息指南系统,但是都是提供一般化综合信息的形式,没有针对学生的个性提 供智能决策支持的功能。这样的系统虽然信息很全面,但是对于大多数考生和家 长来说,要在很有限的时间里去全面了解这么多的信息是不现实的。 此外,国内有很多学者都在研究并开发相关辅助高考决策的系统。张乾燕在 高校招生决策支持系统的设计和实现【lo 】将f p g r o w t h 挖掘算法结合到高校招生 决策支持系统中去,最终形成了对招生决策有指导意义的关联规则,并运用了朴 素贝叶斯分类算法建立了考生填报志愿预测模型,完成了对未知样本数据集的分 类预测,对招生决策的制定具有一定的价值;李旭亮在高校招生决策支持系统 的研究与实现【l l 】中以某高校的招生数据为例,以数据仓库技术为基础,利用联 机分析处理和数据挖掘技术为数据分析手段,通过对高考历史数据的全面分析来 构建新型的招生决策支持系统,从而在为社会提供高效、准确的高考决策支持方 面做一些有意义的尝试和探索;黄曙林在数据仓库技术在成人高校招生中应用 的研究【1 2 】中设计开发了华北电力大学成人教育学院招生信息多维数据分析系统, 4 绪论 该系统以成人高考网上招生系统的事务级数据作为数据源,并对招生历史数据进 行集成、转换、清理和抽取,将其按照分析主题重新组织成面向分析评价的数据 仓库。然后在o l a p 服务器中构建了基于数据仓库的多维数据模型;潘逸伦在基 于数据仓库的招生考试决策支持系统i l3 】中对一个招生考试决策支持系统的具体 规划、设计、开发和建设实践,该系统面向不同的主题实现了联机分析处理,在 为社会提供高效、准确的高考决策支持方面做了一些有意义的尝试和探索。 经过调研发现,虽然目前有一些关于高考招生方面的研究,但是主要是面向 高校用户,为考生及家长提供的信息决策支持很少,同时在系统实现及应用方面 的实际案例也风毛麟角,因此设计并实现面向高校招生人员和考生及家长两类用 户的高考志愿决策支持系统是非常有必要的。 1 3 论文主要工作 本论文的研究重点,一是如何设计基于数据仓库的高考志愿决策支持系统, 二是研究如何通过数据仓库、o l a p 和数据挖掘等技术进行辅助决策,三是如何按 照用户的需求实现高考志愿决策支持系统。 论文从我国当前的高考招生体制出发,根据学生的高考志愿以及录取信息, 分析和挖掘出一些高考志愿填报中有规律有价值的信息,为高校在招生政策制定、 招生计划分布设置等决策过程提供支持。对于广大考生及家长,也可以根据这些 信息在作出高考志愿填报这一重大决策的过程中更加有的放矢,减少失误。具体 工作如下: 1 决策支持系统的设计 在目前较为成熟的新型决策支持系统中,采用基于以数据仓库为基础,o l a p 和数据挖掘相辅相成的分析模式。数据仓库将来自于各种数据源的数据,根据不 同的主题进行存储,并对原始数据进行抽取、转换和加载等一系列筛选和清理工 作。o l a p 则将数据通过多维视角和多种层次向用户进行多方式的呈现;数据挖掘 则应用不同的算法,向用户揭示数据间的规律性,从而辅助决策。 2 决策支持的数据获取及分析过程 数据仓库面向“决策者 的决策主题需求集成多个数据库,并进行数据筛选 和重新组织,是集成化的、随时间变化的、稳定的数据集中场所,数据仓库为更 深入对数据进行分析提供了条件。 实时多维分析和报表的o l a p 负责分析决策者提供的考生基本信息、高考成 绩信息、考生志愿、录取结果等,以动态分析报表、直方图、折线图、饼图等形 式展现给决策者,让他们从多方面了解和掌握高考志愿的动态,从而发现适合决 5 北京交通大学硕士学位论文 策者的决策依据。 数据挖掘则可以通过历史数据建立模型,在拟合以往录取结果的基础上,分 析趋势,判断哪些因素的改变将很可能影响分数线变化的趋势,从而避免风险, 分析专业之间、专业与分数之间存在的潜在联系。 数据分析并应用于决策是一个不断循环推进的过程: 数据预处理、抽取、分析; 挖掘关联性,发掘数据和信息关联; 预测,把握分析对象发展的规律,对未来的趋势做出预见; 偏差的检n - 对报考中的少数的、极端的特例的描述,揭示内在的原因: 结果分析:依据要解决的问题,对挖掘出的模式进行确认或者解释,将发 现的知识以用户能够理解的方式提供给用户。 3 决策支持系统的实现 系统选择s q ls e r v e r2 0 0 5 作为数据存储和管理平台,并利用其提供的商务智 能解决方案完成系统数据仓库的构建和多维数据集的设计,进行统计分析、o l a p 、 数据挖掘等处理,同时对用户的某些需求,为了便于综合多种算法的实验,多数 数据挖掘算法是在j a v a 环境下实现,在此基础上构建基于m i c r o s o f t n e t 体系结 构的w e b 服务,完成决策支持系统的人机交互系统。 1 4 论文结构安排 本文主要基于“北京交通大学高考志愿填报智能决策支持系统”项目,研究 了基于系统的决策支持部分的开发与实现。首先对决策行为和决策支持系统进行 了简要的介绍,然后对决策支持系统以及数据仓库、数据挖掘、o l a p 的概念、分 析、实现和应用作了较详尽的阐述,最后结合高考志愿填报的概况和相关政策, 给出了该系统的决策支持部分的结构设计、数据仓库设计、o l a p 设计、数据挖掘 算法设计和w e b 用户界面设计。 论文共分为七个部分,分别为: 第一章“绪论”部分,介绍论文的研究背景和研究意义,与本课题相关领域 的国内外研究现状,以及论文的主要工作和结构安排。 第二章“高考志愿概述及需求分析部分,介绍了高考志愿和高考录取的关 系,两类用户在高考志愿填报及录取过程中需要重点考虑的关键政策以及高考志 愿的分析方法,进而完成了高考志愿决策支持系统的需求分析。 第三章“高考志愿决策支持系统的设计部分,介绍了决策支持系统的基本 功能与常见体系结构,同时结合本课题的特点重点研究了高考志愿决策支持系统 6 绪论 的设计方案,其中包括系统结构设计、系统解决方案、功能模块设计以及决策方 法构建方案。 第四章“数据仓库的设计和构建 部分,阐述了数据仓库的相关技术知识, 进而研究了适用于高考志愿决策的数据仓库的设计,描述用s q ls e r v e r 创建数据 仓库以及数据装载的过程。 第五章“联机分析处理及数据挖掘系统设计 部分,介绍了联机分析处理技 术和数据挖掘技术的相关理论知识,并进一步研究了用s q ls e r v e r 进行的联机分 析、数据挖掘、数据统计报表的设计以及用基于j a v a 的数据挖掘算法解决系统的 重点功能。 第六章“高考志愿决策支持系统的实现 部分,研究了本课题中整个系统的 具体实现设计的人机交互系统以及系统中决策判断的过程,并记录测试及应用结 果部分, 第七章“总结与展望”部分,阐述本课题的结论并做出展望。 7 北京交通大学硕士学位论文 8 高考志愿概述及需求分析 2 高考志愿概述及需求分析 高考的结果是通过高考录取选拔学生。高考录取是考生报考志愿的目的,考 生高考志愿填报是一件认真、细致、严肃的事,能否录取是由高考招生政策、招 生计划、考生志愿以及考生成绩等综合因素决定的。 对于高校来说政策制定和招生计划制定是一个需要经过研究分析和最终决 策的过程。对于考生和家长来说,成绩是通过学习和努力得来,而高考志愿填报 也是一个需要大量的研究分析和最终决策的过程。无论是高校还是考生都必须准 确的把握招生政策、招生计划、考生志愿、考生分数等相互的关联才能做出相对 正确的决策。 高考招生最终的目的是考生选择理想的高校,高校选拔优秀的生源,高考志 愿是考生与高校之间的桥梁。 2 1高考志愿与录取 在当前的高考录取情况下,国家、各省以及高校相关政策和数据越来越透明, 国家有统一的政策,但各省以及各个高校招生政策和招生计划有各自的特点,考 生需要详细的清楚各省高考录取的政策,志愿填报的程序,以及各高校自己的招 生政策,对于高校同样也要研究各省的政策和考生的志愿以及分数等,以便于今 后制定高校招生政策和招生计划,并做好录取工作。 高考招生要素包括当年招生改革的一些重大举措、管理办法、考生所在省各 科类报考人数、各批次各科类招生计划数、录取比例、各高校招生政策和计划情 况等。重点有如下几个需要明确的问题: 1 招生计划与录取的关系 录取的前提是建立在各高校在各省确定的招生计划,对应一个计划就可录取 一个考生。学生在报志愿的时候,就是根据高校的招生计划情况进行报考。录取 时,高校根据学生的志愿、招生计划,学生的分数三个主要因素,加上各学校对 专业的政策进行录取。高校在各省招生计划的分配,具体体现在学校的专业设置 和专业招生人数,录取的同时就会确定专业。 高考常见的录取类型包括公布计划部分的统招、定向、自主招生、特长生、 民族班、预科班等等,由于其他特殊类型都有提前的考试和单独的录取政策或者 要参考公布的统招计划的分数,并且占绝大多数的是公布计划的部分,因此也是 高校和多数考生最为关注的。 9 北京交通大学硕士学位论文 2 投档与录取 高考录取的过程可以归纳为:在当前网上录取的模式下,录取的过程是省招 办根据规则向高校投档,高校查看投档学生信息、高考志愿、高考成绩,并按高 校录取规则分配专业,对于超出高校将结果提交省级招办审核,确认录取结束。 3 省级各批次控制分数线 在各省录取前,省级招办会公布各批次的控制线,如一本线,二本线。这些 控制线都是在学生分数确定之后,根据一本或二本在当地招生的计划数适当扩大 一定比例得到的分数线。比如:某省一本招生计划总数为1 0 0 0 0 ,扩大比例为1 2 0 , 则排名1 2 0 0 0 名的学生的分数就应该是一本线。各批次控制线的作用是在本批次 投档时最低分必须控制在本批次控制分数线。 4 高校分数线 高校的分数线细分起来也会有两类:一个是提档分数线,是上述在省级招办 投档之后最低分数。另一个高校分数线是学校录取线,录取线应该是学校在录取 高考志愿概述及需求分析 各省填报志愿方式是分省政策的重要特点,目前主要有四种形式,按时间先 后次序,一是北京、上海采用的考前报志愿的形式,就是在尚未高考的时候,依 照自己的平日成绩和历次模拟考试的成绩对志愿进行填报,填报结束之后再参加 考试。二是少部分省区采用的考后估分报志愿的形式,考生在参加完高考之后, 高考成绩出来之前,对照标准答案给自己的高考成绩做出估计,依照自己所估的 成绩进行志愿的填报。三是绝大多数省区采用的出分报志愿的形式,就是高考成 绩出来后考生依照自己的成绩、分数线和相关的招考信息进行志愿填报。第四是 内蒙古采用的录取前一天网上动态排名精确填报形式。 3 分批录取 各省的分批录取主要体现在录取时间的先后。主要的分类包括:提前批次、 本科一批( 部分省区分为a 、b 段) 、本科二批、本科三批、专科高职批次( 部分省区 分专一批和专二批) 。每个批次会细分按原计划录取和空余计划征集志愿录取。以 上各批次都是在前一个批次完成录取之后,未被录取考生才能参与的。 4 分科类录取 绝大多数省区目前是按照文史类和理工类进行区分,部分省区单独设置有艺 术、体育、的文理科分类。这些分类在录取时都是按照单独的投档单位进行录取 的。部分省区文理科是通过选课形式加以区分。 5 志愿次序分类 在每个录取批次中还要设置院校志愿,志愿次序起到决定作用。在传统的顺 序志愿中,通常分为第一志愿、第二志愿、第三志愿,在录取过程中,是具有时 间先后的。在投档时,首先只针对学生所填报的第一志愿院校进行投档,所有高 校完成了第一志愿录取结束后,如部分高校尚有空余名额,将在有上述高校第二 志愿选项的考生中进行顺次投档,以此类推。在最新的平行志愿方式中,第一志 愿为多个院校,省级招办在投档时,是按照平行志愿的投档规则进行一次性投档, 所有学校在调档后同时录取,不存在先后。 6 专业志愿 考生除了院校志愿之外,还要对应在该院校的专业志愿,专业志愿都是顺序 志愿,第一专业优先于第二专业,以此类推。高校在进行专业录取时,通常有三 种形式,即分数清,按分数由高到低,依次根据学生所报专业进行分配。志愿清, 按照所有学生第一专业在同专业内分数由高到低进行分配,没有分配满的专业继 续在第二专业志愿中按分数由高到低进行分配,以此类推。第三种是专业级差式 录取,该录取方式为学校对学生的每个相邻志愿之间设定一个极差值,学生从高 分到低分排序,按照第一专业测试是否能够录取,如该专业已满,则减去相应的 级差分,后一个专业前提一位,插入分数排队之中,继续参与专业分配。对于调 北京交通大学硕士学位论文 剂般有两种理解:一是高分优先安排调剂到相关专业,二是在所有考生分派完 所报专业和志愿之后,余下考生针对剩余专业计划进行专业调剂。 7 分数原则 考生分数是高考录取的重要依据,对于部分考生,会享受到政策性加分,高 考实际分数加上政策性加分等于投档分,在上述省招办投档过程中,都是按照投 档分进行排序的。但在高校提档后安排录取专业过程中,部分院校以高考实际分 数为依据,部分院校以投档分为依据。目前除了部分港澳院校外,高校公布的录 取分数都是指提档分。 8 其他因素 除了上述基本因素之外,还可能出现一些临时性的影响因素,比如2 0 0 3 年非 典和2 0 0 8 年汶川地震等重大事件、高考成绩计分方式变化,都可能影响到考生志 愿的填报。 综上,本系统的研究首先在分类上是按照分省、分文、理科类进行研究,同 时,只考虑我校所在本科一批的录取,在志愿形式上,兼顾顺序志愿和平行志愿 等政策变化。我校采取的专业录取方式为志愿级差,在分专业时承认政策性加分, 也就是说,按照投档分进行录取。 在高考志愿研究时上述这些关系到高考志愿的关键政策都需要一一重点考 虑,特别是政策发生调整,都将直接影响到高校的录取,针对上述政策,各个高 校有的也会采用稍有区别的对待方式,也会对录取产生影响。 2 3 高考志愿的分数分析 考生填报高考

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论