




已阅读5页,还剩75页未读, 继续免费阅读
(机械电子工程专业论文)基于net框架下决策支持系统的模型研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
北京邮电大学2 0 0 5 届硕士研究生学位论文 基于n e t 框架下决策支持系统的模型研究 摘要 决策支持系统( d e c i s i o ns u p p o r ts y s t e m ,简称d s s ) 是以现代信息技术为手 段,为管理者做出正确决策提供帮助的系统。本文研究基于n e t 框架下决策支持 系统的实现模型,在讨论g i s 与辅助决策技术的基础上,进一步探讨了数据挖掘 和知识发现( d m k d ) 的基本理论。在理论上,提出了决策a g e n t 树的数据挖掘模 型,研究了基于决策a g e n t 树的数据挖掘构想和方法,具有一定的创新性。在实 践上,作者参与了一个与之相关的决策支持系统的项目研究,开发实现了一个基 于n e t 框架的决策支持软件系统;并且结合理论研究,提出了一个完整的决策支 持系统的解决方案,对其实现的关键技术进行了探讨。 论文在传统决策支持系统模型的基础上,分析了以地理信息为基础的决策支 持系统的理论模型,并由此详细探讨了基于n e t 框架实现该决策支持系统的关键 技术,这些技术包括辅助决策技术( d s s ) 、地理信息技术( g i s ) 、数据挖掘技 术( k d d ) 、数据库技术、w e bs e r v i c e 技术、x m l 技术,以及n e t 相关技术。为 了实现该模型,本文运用了面向对象和分层的软件工程方法,分析了该系统的逻 辑方案和技术方案,并进一步探讨了实现该模型的各个软件模块,包括数据传输 模块、g i s 服务模块、统计分析模块、相关的业务模块以及系统的发布与实施。 此外,作者还结合实际项目,参与了一个与之相关的某政府部门决策支持 系统的开发与实施。通过参与需求调研、系统分析和系统设计,完成数据服务模 块( 动态调度数据以1 6 进制的形式通过h t t p 协议传输) ,并进一步封装0 r a c l e 与 s q ls e r v e r 底层统一数据库接口,完成动态业务模块和系统维护模块,包括一部 分与之相关的数据挖掘算法。在实践上证明了该决策支持系统解决方案的可行 性,表明以地理信息为基础的决策支持系统模型可以为决策者的决策提供科学的 依据和辅助作用。 关键词:决策支持地理信息决策因子树n e t 框架网络服务 i i 北京邮电大学2 0 0 5 届硕士研究生学位论文 r e s e a r c ho nt h em o d e lo fd s s i nm j c r o s o f t n e t a b s t r a c t d s s ( d e c i s i o ns u p p o r ts y s t e m ) ,w h i c h i sb a s e do nm o d e mi n f o r m a t i o n t e c h n o l o g y c a nh e l pg o v e r n o rm a k ec o r r e c t d e c i s i o n t h i st h e s i sr e s e a r c h e st h e m o d e lo fd s si nm i c r o s o r n e 工w 曲t h ea n a l y s i so fg i s ( o e o g r a p h yi n f o n - n a t i o n s y s t e m ) a n dd s s ,t h e b a s i ct h e o r i e so fk d d ( k n o w l e d g e d i s c o v e r yf r o md a t a b a s e s ) a n dd m f d a t a m i n i n g ) i sf u r t h e rd i s c u s s e d i nt h e o r y ,t h ed m m o d e lb a s e do n a g e n t t r e ei sp u tf o r w a r d ,a n dt h e n ,t h e p r i n c i f l l e sa n d m e t h o do f a g e n t t r e ea r es t u d i e d t o s o m ed e g r e ei ti sc r e a t i v e i np r a c t i c e ,ap r o j e c tr e l a t e dt od s sh a sb e e nr e s e a r c h e d b a s e do na b o v et h e o r yas o f t w a r es y s t e mi nm i c r o s o f r n e ti si m p l e m e n t e d t h e n t h es c h e m eo fd s si n n e tf r a m e w o r ki s p r e s e n t e da n dt h ek e yp o i n t sa n dt h e m e t h o d so f t h er e s o l u t i o na r ed i s c u s s e d w i t ht r a d i t i o n a lm o d e lo fd s s t h i st 1 1 e s i sa n a l y s e st h et h e o r yo fp o l i c y m a k i n g b a s e do ng i s 西u si tr e s e a r c h e st h ek e yt e c h n o l o g yt oc a r r yo u t 曲es y s t e mi n m i c r o s o f t n e t i n c l u d i n gd s s 、g i s 、k d d 、d a t a b a s e 、w 曲s e r v i c ea n dx m l i n o r d e rt or e a l i z et h o s em o d e i s ,t h i sp a p e l b r i n g su pa no b j e c t o r i e n t e da n dl a y e r e d s o f i w a me n g i n e e r i n gm e t h o d i ta n a l y s e st h e l o g i c s c h e m ea n dt h e t e c h n o l o g y s o l u t i o na sw e l la se v e r ym o d u l eo ft h i ss o f t w a r es y s t e mi sf z u t h e rs t u d i e d ,i n c l u d i n g d a t at r a n s f e r r i n g 、g i ss e r v i c e 、s t a t i s t i ca n a l y z i n g 、s o m eo p e r a t i o na n dt h er e l e a s e m o d u l e i na d d i t i o n t om e e tt h en e e do ft h ec u r r e n tr e s e a r c h ad s sp r o j e c to fs o m e g o v e r n m e n ta r ec a r r i e do u t b ym e a n so ft a k i n gp a r ti nr e q u i r e m e n ta n a l y z i n ga n d s v s t e md e s i g nd a t at r a n s f e r r i n gm o d u l ei sa c c o m p l i s h e da sw e l la st h ee n v e l o po f u n i f o r md a t a b a s ei n t e f f a c e w i t ht h ea d d i t i o no fs o m ea r i t h m e t i c 恤eb u s i n e s sm o d u l e a n dt h em a i n t e n a n c em o d u l ea r ec a r r i e di n t oe x e c u t i o n i ti n d i c a t e st h ef e a s i b i l i t vo f t h ea b o r es o l u t i o na n dt h a tt h ed s sr o o d u l eb a s e do ng i sm a ys e i n eg o v e r n m e n t a g e n c i e sa st l l es c i e n t i f i ca n dp o w e r f u lp o l i c y - m a k i n g t o o l s k e yw o r d s :d s sg i s a g e n t t r e en e tf r a m e w o r kw e bs e r v i c e i i i 北京邮电大学2 0 0 5 届硕士研究生学位论文 独创性( 或创新性) 声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名: 莲垒 日期:2 1 1 兰:;:! 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保 留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借 阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它 复制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论 文注释:本学位论文不属于保密范围, 本人签名:趄圭 导师签名:璃争型乒蕴江 适用本授权书。 日期 日期 1 0 p ;6 知臣上! 呈,: 北京邮电大学2 0 0 5 届硕士研究生学位论文 第一章绪论 本章通过对决策支持系统发展中数据发掘和知识发现问题的提出,说明了建 立以g i s 为基础的决策支持系统的概念基础,并介绍了本文研究的主要内容。 1 1 引言 近几年来,人e l i n 用信息技术生产和收集数据的能力大幅度提高,千千万 万个数据库被用于商业管理、政府办公、科学研究和工程开发等领域,这一势头 仍将持续发展下去。于是,一个新的挑战被提了出来,在这个所谓的信息爆炸的 时代,“信息过量”几乎成为人人需要面对的问题。如何才能不被信息的汪洋大 海所淹没,从中发现所需要的知识,改变“人们被数据淹没,同时却仍然感到知 识饥渴”的馗尬局面【l l ;面对浩如烟海的数据而手足无措,如何消除“入宝山而 空手还”的遗憾? 随着高科技的迅猛发展、各类竞争的增加,需要在较短的时间之内做出决策。 因此,在较短的时间内能够尽可能多地获得相关信息就变得越来越关键。另一方 面,任何好的决策( 不管是商业决策还是政府决策) 都需要事实和数据的支持, 而一个决策的正确程度取决于所使用的事实和数据的正确程度。所以,为了使决 策具有较好的丑三确度,需要跨越的决策分支也变得越来越大;为了跨越较大的分 支,就需要有更长的时间;而为了更好的节约时间,在较短的时间内做出好的决 策,就需要一项专门技术去处理数据、挖掘信息,于是,“数据挖掘技术”应运 而生【2 】。 从数据库中发现知识( k n o w l e d g e d i s c o v e r y f r o m d a t a b a s e s ,k d d ) ,也称 为数据发掘( d a t a m i n i n g ,d m ) ,是从数据库中提取隐含的、先前不知道的和 潜在有用的知识的过程。现在,人们一般将d m 和k d d 合称为数据发掘和知识发 现,简称d m k d 3 1 。d m k d 是在数据和数据库急剧膨胀的强烈需求下应运而生 的,也是数据库、人工智能、数理统计、可视化等技术发展和结合的结果,其目 的是为数据库的理解和应用提供自动化、智能化的手段。同时,通过专家系统的 应用,可以构建决策支持系统,支持知识驱动的决策支持过程。 决策支持系统( d e c i s i o n s u p p o r ts y s t e m ,简称d s s ) 是以现代信息技术为手 段,针对某一类型的非结构化或半结构化的决策问题,通过提供相应资料,协助 决策者明确决策问题,修改完善模型,列举可能的方案,采用分析比较等方式, 为管理者作出正确决策提供帮助的系统 4 】。 北京帅【匕大学2 0 0 5 届硕士研究生学位论文 从海量数据提取出知识,最终为正确决策提供科学依据的过程可表述如图1 - 1 所示。 圄当囝当圄 另一方面,这些海量数据库中往往含有大量的地理信息,利用地理信息进 行空间查询分析,为决策提供空间依据成了海量数据挖掘中的一个重要方面。根 据信息科学专家统计分析,用于政府机关进行检索查询和分析决策的政务信息 8 5 以上与空间定位信息有关。1 9 6 3 年加拿大测量学家r f t o m l i n s o n 首先提 出了“地理信息系统”这一术语,并建立了世界上第一个g i s 加拿大地理信 息系统( c o m ) 。从此,g i s 蓬勃发展起来。进入7 0 年代以后,以遥感为数据源的 g i s 受到了重视,地图扫描输入技术有了一定的发展,人机交互技术曰渐成熟, 属性数据和空间数据的分别管理也有了进展,g i s 的发展进入了巩固时期。到 了8 0 年代,空间数据库和属性数据库的无缝结合逐渐提到了议事日程,空间分 析和应用能力大大提高,数据的输入效率也得到了一定的发展,g i s 的发展进 入了突破时期。尤其是进入9 0 年代后,随着g i s 理论的日臻完善,g i s 的模块 化和数据共享以及g i s 和g p s 、r s 的结合,使g i s 向集成化和智能化方向发展。 目前,g i s 已经在地学、交通、农业、环境监测、市政管理等许多领域得到实 际应用 5 】。 当前,g i s 正经历着由“以技术为中心”向“以数据为中心”的方向转变【6 i 这是因为随着g i s 功能的日渐强大,以及和其他学科的有力结合发展,g i s 已 经渗透到国民经济和社会发展的很多方面,g i s 强有力的支柱各种类型的 数据库容量不断增大,所包含的信息更为丰富,而许多信息是隐含的、不为人们 所知的,而这些信息却是有着非常大的潜在价值的。这些潜在的信息一旦被发现, 势必在预测、决策等方面发挥巨大的作用。在国外,政府g i s 已经成为各级政 府机关加载各种专业信息和政务信息的通用平台,并将成为政府机关管理业务信 息和进行分析决策的辅助决策工具【”。因此,g i s 的功能不能仅仅局限于空间数 北京| | | i u 火学2 0 0 5 届坝删f 筑生学位论文 据库和计算机制图方面,而是要进行实时的空剧信息管到、辅助决策。将以g s 为基础的“从数掘库中发现知识( k d d ) ”的技术用于决策支持,特别是政府 决策,是k d d 技术应用的更为广阔的领域。 l ,2 基于n e t 框架的决策支持系统模型的提出 1 2 i 课题来源及意义 本课题来源于中国测绘科学研究院9 2 0 2 课题组承建的科搜部”固k 经济辅 助决策地理信息系统的研究”课题。 2 0 世纪9 0 年代,中国测绘科学研究院和大连理工大学分别与政府首脑机关 合作建成了”综合国情管理信息系统”( 简称9 2 0 2 - i - 程) 和”国民经济综合发展决策 支持系统”。对以g i s 为基础的决策支持系统模型的研究,方面可以使“决策支 持系统”构架在空间定位信息平台之上,使面向行政区划单元的国民经济辅助决 策分析扩展至面向任意空间地域的辅助决策分析,从而充分发挥地理信息系统的 空间分析功能和专业统计信息的巨大潜在价值,另一方面,“地理信息系统”与 经济模型库、方法库相结合,可以为决策支持系统提供有力的空间信息和空自j 分 析功能的支持【7 】。因此,对该系统的研究,不仅适应了社会信息化发展的大趋势, 而且可以提高政府机关科学决策的本平,促进其工作方式的转变,大幅度提离其 工作效率。 1 ,2 ,2 n e t 框架+ fb s 结构模型f 勺提出 有了上述理论基础之后,如何提出这样一个决策支持系统的实施模型就显 得非常重要,这是本文研究的主要内容之一。 随着分布式计算机技术的发展,出现了客户服务器系统( c l i e n t s e r v e r ) ,主 要具有如下特点:( 1 ) 负载均衡。通过将任务合理地分配到端和端,降低了系统 的c l i e n ts e r v e r 通信开销。并可充分利用两端硬件环境的优势:( 2 ) 数据安全及 宛攘性。具有强壮的数掘操纵和事务处理能力,保证数据的安全性和完整性约束。 但随着企业规模的同益扩大,应用程序的复杂程度不断提高,c s 系统逐渐 暴露出以下不足:( 1 ) 系统难以部署和维护,特别是在客户端数量巨大的隋况下, 安装及升缀成本急剧上升;( 2 ) 兼容性差,不同的开发工具及系统运行平台相互 之间很难兼容。 于是,随着i n t e r n e t 技术的兴起,出现浏览器t l 务器( b r o w s e r s e r v e r ) 系 统,在这种结构下,用户界面完全通过浏览器实现,只处理少量事务逻辑;主要 事务逻辑w w w 在服务器端实现,并且根据服务器处理业务的层次划分,形成所 i 胃3 - f i e r 或n 4 i e r 结构,具有以下的特点:( 1 ) 具有分布性特点,可以随时随地进 行业务处理:( 2 ) 业务扩展维护简单方便,只需要改变服务器,即实观所有j | _ | 1 。 的确步更新:始) ) 1 :发简革,共事性强。 北京l i c i t l u 人学2 0 0 5 厢坝+ l j i ) d t 生学位论奠 因此,采用基于n e t 框架部署该b i s 结构的决策支持系统是个不错的选择 ( 将在币文中详细讨论) 。 1 3 本文研究的主要内容 本文主要是基于数据发掘和知识发现的基本理论,结合科技部”圈民经济辅 助决策地理信息系统的研究,课题的需要,研究了以o l s j 罐础的决策支持系统 的构想l u 万池,并探讨了该辅助决策系统的核心技术及其实现模姒,爿:以此为丝 础用软件实现了该模型,进一步完善了相应理论。 在理论方法研究方面,为了实现决策支持信息与地理信息的集成和互操作, 研究了地理信息以何种形式向决策系统提供空间数据操作支持,决策系统如何应 用经济预测的各种模型、方法库,如何解决各种异构的空削数据与异构属性数据 的一致性问题等。 另外,以数据发掘和知识发现为理论基础,采用了数据仓库技术与文本数掘 挖掘技术,通过对元数据的管理,实现了数据融合与数据挖掘, 在软件系统丌发方面,采用n e t 框架部署该该b s 结构的决策支持系统,并 搛讨了w e bs e r v i c e 、x m l 等新型i n t e r n e t 技术。而且,在数掘库方衡,通过对数撕聊 底层接口的封装,完成了对o r a c l e * 口s q ls e r v e r 2 0 0 0 大型数据库的支持,从而实现 了以地理信息为基础的决策支持系统的软件集成。 具体的研究内容涉及如下几个方面: ( 1 ) 耥助决繁技术( d s s ) ( 2 ) 地理信息技术( g i s ) ( 3 ) 数据挖掘技术( k d d ) ( 4 ) 数据库技术( o r a c l e ,s q l s e r v e r ) ( 5 ) n e t 框架及相关技术( c 撑,a s p n e t ,a d o n e t ) ( 6 ) w e bs e r v i c e 平t l x m l 技术 本人曾在中国测绘科学研究院实习,此期问参与了个与之相关的某政府 部门决策支持系统的r 丌发与实施,主要做了以下工作: ( 1 ) 参与需求调研、系统分析和系统设计 ( 2 ) 完成数掘服务模块( 动念调度数据并通过h t t p 协议传给前台) ( :”进步封裟o r a c l e 与8 q ls e r v e r 底层统一数据席接i - q ( 4 ) 完成一部分与之相关的数据挖掘算法 ( 5 ) 完成动态业务模块 ( 6 ) 完成系统维护功能模块 另外,在完成论文期问,对以下理论做了进一步的探讨: 4 北京邮电大学2 0 0 5 届硕:匕研究生学位论文 ( 1 ) 将地理信息引入决策支持系统的必要及意义 ( 2 ) 提出将智能因子( a g e n t ) 的概念引入决策树 ( 3 ) 决策a g e n t 树的设计与建立 ( 4 ) 完整的决策支持系统的实现模型 北京邮电火学2 0 0 5 届硕士研究生学位论文 第二章g i s 与辅助决策 决策支持系统( d s s ) 的概念起源于s i m o n 的研究工作,并与1 9 7 0 年和1 9 8 0 年 正式形成固定的研究、开发以及应用领域。i b m 公司的g e o d a t a a n a l y s i sa n d d i s p l a y ( g a d s ) 是最早开发的大型决策支持系统。空间决策支持系统的概念是伴 随d s s 而产生的。空间决策支持系统的开发与地理信息系统( g i s ) 功能的扩展紧 密相关,尤其在处理复杂的、病态的空间决策问题过程时显得更为重要。在过去 的1 0 年里,空间决策支持系统的研究、开发和应用取得了长足发展,较为严密的空 间决策支持系统的概念已建立,对空间决策支持的特点和决策支持过程的分析已 比较深入。目前空间决策支持系统已向协同空间决策支持系统、工作组空间决策 支持系统、环境决策支持系统、空间知识库及专家系统等多个分支发展【8 1 。 一般情况下,没有政府g i s 空间数据的参与的统计型管理信息决策系统,一 般只能用于事务处理、综合业务管理和非空间分析决策,从而制约了社会经济数 据的使用层次和使用效率。而g i s 与决策支持系统的融合,能实现对非空间数据的 空间定位、空间分析和空间辅助决策。即不仅能确定客观实体( 事物、现象、物 质等) 是什么,还能确定空间实体的地理位置和空间分布规律,通过空间数据挖掘 可以获得新的信息和知识,从而有助于提高决策的科学性和实效性。 2 1 地理信息系统( g i s ) 2 1 1g i s 的定义 以计算机科学、信息科学、测绘科学、地理科学、地球科学和网络通信技 术等为支持的地理信息系统是一门崭新的交叉学科,它是有关空间数据管理和空 间信息分析的计算机系统。g i s 至今尚没有国际上统一认可的定义,不同学科和 不同应用领域对g i s 的理解和定义不尽相同。美国联邦数字地图协调委员会 ( f i c c d s ) 对g i s 的定义是:“g i s 是由计算机硬件、软件和不同方法组成的系统, 该系统具有支持空间数据的获取、管理、分析、建模和显示的功能,并可能解决 复杂的规划和管理问题”。不难看出,g i s 具有以下特征唧: ( 1 ) g i s 是计算机化的技术系统,它有良好的硬件环境、多功能的软件模块、 描述地理实体的空间数据和良好的用户界面组成,g i s 具有结构、功能和应用效 益的高度统一的特征。 ( 2 ) g i s 的处理对象主要是具有地理坐标的空间数据,所谓空间数据系指点、 线、面或三维要素等地理实体的地理坐标及相关属性数据和拓扑数据,这是g i s 区别于其他统计信息系统的根本标志,也是它的技术难点。 ( 3 ) g i s 的特点在于它的数据综合、地理模拟和空间分析能力,它能集空间数 北京邮电大学2 0 0 5 屈硕士研究生学位论文 据的获取、管理、处理、分析、建模和显示为一体,这既是o i s 的核心,也是g i s 的优势所在。 2 ,1 2g i s 的组成及功能 典型的g i s 一般由计算机系统、地理数据库系统、规范标准与政策法规系统、 技术支持系统和人才保障与组织协调系统五部分组成。g i s 的建设和成功应用。 需要高新技术的支持。在现阶段,需要计算机技术、信息技术、数据库技术、网 络和通信技术、3 s 技术( 全球定位系统、遥感、地理信息系统) 、虚拟现实、数据 挖掘等新技术的支持。 g i s 具有以下基本功能【l 0 j : 数据采集 数据采集是按统一的参照坐标系、统一的编码、统一的标准和结构将模拟或 数字式的地理信息( 地形图、专题图、野外测量数据、遥感影像数据、统计数据 等) 组织到数据库中的数据处理过程,其核心是保证数据库数据的科学性、完整 性、现实性和逻辑上的一致性。g i s 数据按表现形式和性质可分为空间数据和非 空间数据( 属性数据) 两类。其中空间数据用于描述空间实体,非空间数据用于描 述地理实体的社会或经济属性。空间数据是g i s 的基础,使关联地理实体与各种 非空间数据的载体和纽带。空间数据一般又几何数据和关系数据组成。几何数据 用于描述地理实体的位置、形状和大小,其表达方式是坐标串;关系实体用于描 述地理实体之间的空间关系,如邻接关系、关联关系、包含关系、连通关系等, 其表达方式是建立实体间的联接信息。非空间数据是描述地理实体的社会经济和 其他专题信息,用于对地理实体的详细描述,其表达方式是字符串、各类代码或 统计值等。非空间信息是g i s 中不可缺少的内容,是g i s 用于规划、管理、空间分 析与辅助决策的重要信息资源。在数据采集工作中,自动化扫描输入和扫描数据 的自动化编辑与处理是当前亟待解决的技术难点。 数据编辑 数据编辑是指对g 1 s 的空间数据和属性数据进行的数据组织和修改等,其中 空间数据的编辑工作量较大。按空问数据的结构,可分为矢量数据编辑和栅格数 据编辑两类。矢量数据以点、线、面、注记等为基本元素,通过建立拓扑关系和 属性连接表示空间要素。矢量数据的编辑包括图形检查与编辑、拓扑关系检查与 编辑、属性关系检查与编辑、地名注记检查与编辑等。栅格数据编辑用于处理栅 格结构表示的数据( d e m 数据、卫星影像、航空影像、数字栅格地图等) ,处理 内容包括:剪切、拷贝、粘贴、旋转、移动,区域填充和添加几何图形等。 数据存储与管理 编辑后的数据需要存储,常用的存储介质有磁介质和光介质。数据存储器有 移动式和非移动式两种,前者受外界影响比磁盘小,且有较好的性能价格比。非 北京邮电大学2 0 0 5 届硕士研究生学位论文 移动式存储器( 如自动磁带库等) 是一种具有海量数据的存储能力的存储设备,单 库容量可达t b 级,是有效的数据存储和备份系统。数据的存储方式有在线( o n l i n e ) 、离线( o f f l i n e ) 和归档3 种方式。加工处理过程中的数据一般采用在线模式, 使用频率不高的数据一般采用离线模式,经过加工整理后的数据一般采用归档存 储模式。 数据组织管理是建立地理信息数据库的关键环节,数据组织大体经历了从初 级数据文件、独立文件管理、初期数据库系统到数据库系统等发展阶段。栅格模 型、矢量模型或栅格矢量混合模型是常用的空间数据组织和管理方法。空间数 据结构的选择会直接制约g i s 数据的分析功能。由于混合数据结构具有矢量与栅 格数据结构的各自优势,因此,广泛应用于g i s 的软件设计与开发。属性数据的 组织方式有层次结构、网络结构与关系数据库管理系统等,其中,关系数据库系 统是目前广泛采用的数据库系统。在数据组织与管理环节中,关键的问题是如何 将空间数据与属性数据融为一体。 数据查询与空间分析 与其他非空间信息系统相比,g i s 的空间数据查询、检索和分析等是g i s 的 基本功能,也是它的主要优势。就数据查询而言,g i s 具有双向查询功能,既可 以根据图形信息查询相应的属性信息,也可以按照属性数据的特点查询相对应的 地理目标。此外,还可以通过对地理目标的空间分析获得新的派生信息和知识。 g i s 的空间分析主要包括缓冲区分析、叠置分析、网格分析和栅格数据分析 等。 可视化表现与制图 g i s 的可视化表现,就是将数据库中的各种地理空间数据通过空间可视化模 型的处理后,转化成可以被视觉感知的计算机二维或三维图形图像,其中既包括 图形、图像和属性数据,也包括与地理信息有关的音频、视频、动画等多媒体信 息。另外,设计和制作各种地图也是实现o l s 信息可视化的有效手段。 2 2 辅助决策技术 2 2 1 空间决策 空间决策支持系统可以定义为一个交互式的计算机系统,主要用于支持用 户或用户群在解决半结构化空间决策问题时获得较高的决策能力【吼。空间决策问 题可以分为结构化决策、半结构化决策和非结构化决策三类问题。结构化决策是 程序化的,可以通过计算机解决;非结构化决策是非程序化的,决策者不能通过 计算机获得解决问题的任何帮助;现实世界中的大部分决策问题介于两者之间, 称为半结构化决策,这是空间决策支持系统的主要应用领域。空间决策支持系统 通过将决策者的判断与计算机程序紧密结合起来获得较高的支持能力,因此系统 北京邮电大学2 0 0 5 届硕士研究生学位论文 的方便易用于高效的决策紧密相关,系统往往通过利用交互和递归的应用方式支 持分析决策,如下图示。 图2 1 2 2 2 决策的理论基础 决策具有多种选择,决策结果具有空间变化,每一项选择都是根据多重判别 标准评估的,判别标准既有定性的,也有定量的,通常多个决策者参与决策,决 策者们对评价标准的重要程度和决策结论会有不同的偏爱,决策时常伴随不确定 的。 。 决策支持系统的基本理论主要包括效用理论、决策树和贝叶斯决策1 1 1 1 。 效用理论 事物的不确定性可以看作许多简单随机事件的复合,每个简单随机事件由两 个互斥事件组成。效用理论在随机事件中引入“优先”或“偏好”概念,并在随 机事件集合基础上建立评价规则,包括( 1 ) 相对偏好顺序;( 2 ) 偏好关系具有传递 性;( 3 ) 简单随机事件的可比性:( 4 ) 偏好关系可以量化:( 5 ) 不确定性可以量化; ( 6 ) 随机事件可以互换 在上述条件下,可以用数值描述简单随机事件的效用,进而确定一般不确定 事件的效用。 决策树 决策树的方法是顺着树的各个分枝进行分析,计算各种可能情况的概率大 小,最后计算在这些条件下最终出现的后果效用,并对各种效用加以比较,从中 选择最佳效用所对应的实验与决策作为最终选择。 贝叶斯决策 事件的发生具有不确定性,可以利用统计学中的贝叶斯公式对事件发生的概 率做先验估计。 北京邮电大学2 0 0 5 届硕士研究生学位论文 2 3 将g i s 用于决策支持的必要性 当前,g i s 正经历着由“以技术为中心”向“以数据为中心”的方向转变, 这是因为随着g i s 功能的日渐强大,以及和其他学科的有力结合发展,g i s 已经 渗透到国民经济和社会发展的很多方面,g i s 强有力的支柱各种类型的数据 库容量不断增大,所包含的信息更为丰富,而许多信息是隐含的,不为人们所知 的,但这些信息却是有着非常大的潜在价值的。这些潜在的信息一旦被发现,势 必在预测,决策等方面发挥巨大的作用。根据信息科学专家统计分析,用于政府 机关进行检索查询和分析决策的政务信息8 5 以上与空间定位信息有关。在国外, 政府g i s 已经成为各级政府机关加载各种专业信息和政务信息的通用平台,并将 成为政府机关管理业务信息和进行分析决策的辅助决策工具。 s i m o n 在1 9 6 0 年就曾建议将决策过程分为三个阶段:知识提炼、设计、选优。 如下图示唑 图2 - 2 知识提炼阶段涉及到决策条件环境的搜索和扫描,这一阶段需要对决策情况 进行探索性分析。在决策的初级阶段,g i s 扮演着非常重要的作用,通过广泛集 成和开发不同渠道的数据源,系统可以支持协调决策情况分析。此外,g i s 可以 为决策者提供有效的展现数据。针对知识提炼阶段确立的问题,在设计阶段要提 出、开发和分析各种可能的选择。在优选阶段,用户要从多个选项中选择一个决 策,每个决策选择需要根据预先规定的规则进行评价和分析。决策规则主要用于 对可选决策项进行排序,排序主要由依据评估标准的重要程度参数决定。 因此,g i s 的功能不能仅仅局限于空间数据库和计算机图形方面,而是要进 北京邮电大学2 0 0 5 届硕士研究生学位论文 行信息管理和辅助决策。将g i s 技术用于d s s ,即以地理信息为基础的决策支持 系统,特别是政府决策,是d s s 技术应用的更为广阔的领域。 以地理信息为基础的决策支持系统与g i s 的区别主要体现在最终目标用户 方面,g 1 s 更侧重于复杂的空间数据库管理与功能的定义。地理信息决策支持系 统d a g i s 为基础,其用户往往是对决策感兴趣的分析者,他们往往不愿意陷入复 杂的g i s 命令的复杂选择,而倾向于是用快速简洁的操作。地理信息决策支持系 统通过将决策者的判断与计算机程序紧密结合起来获得较高的决策能力,其优势 是显而易见的。 2 4 以g i s 为基础的决策支持系统的组成 一般隋况下,地理信息决策支持系统应由支持对话( d i a l o g ) ,数据( d a t a ) 和建 模( m o d e l i n g ) - - - 部分基本功能( d d m 范式) 组成【8 】。具体说来,地理信息决策支持 系统由数据库管理系统( 含空间数据的管理) ,模型库管理系统,模型生成与管理 系统组成,如下图示。 其主要就是在g i s 的基础上增加了模型库及管理,也可以称为决策支持的 核心技术,包括以下几个方面: 分析 目标搜索。优化和模拟等。 统计与预测 探索性空间分析。确认的空间数据分析,时序分析,地理统计等。 决策者优选建模 数值结构建模,目的、评价标准、目标和属性的层次结构建模,双重对 比,多属性值建模,一致意见建模等。 建模不确定性分析 数据不确定性,决策规则不确定性,灵敏性分析,误差传播分析等。 譬如说对某省历年国民经济数据,可以利用模型库建模,结合偏最小二乘回 归,频数分布、倍率、绝对差值等算法对其数据进行统计和预测。 北京邮电大学2 0 0 5 届硕士研究生学位论文 图2 3 l2 北京邮电大学2 0 0 5 届硕士研究生学位论文 能够独立、自动代替用户执行某一特定任务的程序,具有自治、协作、学习、归 纳、推理等功能,能支持各阶段的决策制定和问题求解。 由于智能a g e n t 具有独立性、智能性、可移动性,并表现出很强的协作能力, 所以特别适合在网络环境下的群体决策中对整个决策过程进行管理,以及促进群 体成员的交流与合作。通常来讲,在决策支持系统中设计和开发出的a g e n t 部件 能从多个不同的数据源中搜集、复制、组织各种数据流、信息流和知识流,存储 于数据仓库中:反过来,又从中检索数据,对其进行鉴别和评价,并根据用户的需 要传递、显示和公布相关信息。总之,它能帮助决策者减少花费的时间,做出更高 质量的决策。 3 2 决策树 决策树方法的起源是概念学习系统c l s ,是建立在信息论的基础上的,然后 发展出了多种算法,例如c a r t 、a s s i s t a n t 、t d 3 系列等,其中以q u i n l a n 提 出的i d 3 系列发展尤为迅速,应用也较广。q u i n l a n 于1 9 7 9 年提出i d 3 算法,极 大的推动了决策树算法的应用,但由于i d 3 算法所固有的一些缺点,q u i n l a n 于 1 9 9 3 年在i d 3 算法的基础上又提出了能处理连续属性的c 4 ,5 算法,从而成为决 策树算法的主流。1 9 9 9 年q u i n l a n 又将b o o s t i n g 方法引入决策树的学习,从而推 出了具有b o o s t i n g 功能的c 4 5 ,q u i n l a n 将其起名为c 5 0 。 决策树把客观世界或对象世界抽象为一个信息系统,也成为属性一值系统。 一个信息系统s 是一个四元组【1 4 1 : s = 其中,u 是一组对象( 或事例) 的有限集合,称论域。设有n 个对象,则u 可 表示为:u = x l ,x 2 ,x n ) 。a 是有限个属性的有限集合,设有m 个属性,则其 可以表示为:a = a 1 ,a 2 ,j 。v 是属性的值域集,v = v 、,v :, v 。) ,其中v ,是属性a 。的值域。a 又可以进一步分为两个不相交的集合:描述属 性集c 和决策属性集d ,c 和d 满足:a = c u d 且c n d = 空,d 一般只有 一个属性。f 是信息函数( i n f o r m a t i o nf u n c t i o n ) ,f r u a 寸v ,f ( x i ,a j ) v j 。 信息系统又称信息表,表列是属性,共有1 1 1 列;表行是对象,共有n 行。 第i 行和第j 列上的表项内容是f ( x ,a j ) 。表中的一行内容表示了信息系统中该 对象的所有信息。例如:设信息系统s 的论域是为: u = e 。,e 。,e ;) ,属性集为a = a , b ,e ,d ) ,其中描述属性集为 c = a , b ,c ) ,决策属性集为d = d ) ,各属性的值均为: v 。v h ,v 。;v “( 0 ,1 ,2 ) 。 一般情况下,构造一个决策树的分类器,它的输入是一组带有类别标志的例 子,构造的结果是一颗二叉树或多叉树。二叉树的内部节点( 非叶子节点) 一般表 14 :l l 康| | | | 5 i i z 凡半2 0 0 5j 币坝i :研究生学位论史 示为一个逻辑判断,如形式为( a ;v ,) 的逻辑判断,其中a 是属性,v i 是该属性 的某个属性值。树的边是逻辑判断的分支结果。多叉树的内部节点是属性,边悬 浚属性的所有取值,有几个属性值,就有几个边。树的叶予节点都是炎州面i 己。 直观的i 皂,决策树由连线连接的节点组成,决策树中存在两种类型的付点: 决策节点和叶子节点。决策节点指定在该节点被检验的属性,叶子节点指定一个 类别。构造决策树的方法是采用自上而下的递归构造。它的构造思路是,如渠训 练例子集合中的所有例子是同类的,则将其作为叶子节点,节点的内容即是陔类 标记。否则,根据某种策略选择一个属性,按照属性的各个赋值,把例子集合 划分为若干属性集合,使得每个子集上所有的例子在该属性上具有例样的属性 值。然后再依次递归处理各个子集,直到符合某种停止条件。 3 3 将a g e n t 用于决策树的提出 前面已提到过,对海量数据的处理是决策支持系统的核心。而处理复杂的海 量数据的一个很好的方法就是分类。在分类技术的发展过程中,流行的几种技术 是贝叶斯分类、神经网络、遗传算法、粗糙集模型和决策树等。与神经网络和贝 叶斯分类比较,决策树更易被人理解,而且训练一个神经网络将花费大量的时间 和上千次迭代,生成一个决策树则更有效率,因此它适用于大的训练集。另外, 决策树的算法除了包含在训练数据中的信息外不需要其他的信息( 例如领域知识 或数据类的概念分布的预知信息) 。最后,与其他技术相比,决策树还表现出很 好的分类精确度,以此我倾向于在决策支持系统中选用决策树作为数据处理的手 段。 另一方面,分布式决策支持系统是一个复杂的系统,a g e n t 技术可以为决策 支持提供了一种新的有效的数据挖掘模型。在分布式决策支持系统罩引进a g e n t 技术,一方面a g e n t 技术提供了一种概念清晰、条理清楚的分布式系统建设思想 另一方面,a g e n t 技术也带来软件系统能力的提高,这包括两个方面:个是能力 的增加,比如合作;另一个是能力的增强,比如并行和移动所带来的敬率的提t 岛 锋。 因此,基于上述的分析和理论基础,本人提出决策a g e n t 树的概念,即将 a g e n t 技术引入决策树,在决策树构建的过程中,代表各种因子的a g e n t 作为树 的叶子存在于决策树中,多个a g e n c 可以组成一个合作的小组以完成特定的复 杂任务,堆个a g e n t 或组a g e n t 可以单独进行开发,并且可以以增赣方式动态 地加入到一个基于a g e n t 的决策树模型中。从而增强该决策模型的能力。决策 a g e n t 树的提出是针对各种影响决策的要素,运用合理的指标体系和置化方法, 对数据挖掘方法进行“定量化描述”。进而通过其对海量数掘的分析,可以对各 种决策导向提供科学、定量的依据,从而对决镱者提供有力的支持依据。 北京州也人学2 0 0 5 届坝i ? 砌j :纯生学位论文 3 4 决策a g e n t 树的设计与建立 : 4 ,1 智能a g e n t 冈子的提取 在这罩,我暂时将a g e n t 因子描述为某种类型决策的影响因素,有点类似 :权蘑,但绝对不是权重,它可能包括权重。举个例子,譬如浇婴考察某地医的 经济发展情况,那么我们对所有能够影响经济发展的因素进行考虑,而这种情况 下a g e n t 因子库的内容除水系、交通、居民地、地形等基础地理a g e n t 因予外, 还包括土地资源、森林资源、矿产资源、旅游资源等资源a g e n t 因子,也包括气 候、降水分布等生态环境a g e n t 因子,人才a g e n t 因
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 IEC 63522-33:2025 EN Electrical relays - Tests and measurements - Part 33: Continuity of protective earthing connection
- JJF(石化)060-2023自动苯结晶点测定仪校准规范
- 重庆红十字会师资课件
- 新解读《GB-T 30699-2014道路交通标志编码》
- 人教版八年级物理下册 第七章《力》单元检测(含解析)
- 人教版八年级物理上册 第三章《物态变化》单元检测卷及答案
- 人教版八年级物理第一次月考卷02(全解全析)
- 重大公卫知识培训计划课件
- 老年人课件教学课件
- 老年人误吸护理课件
- 2025-2026学年新交际英语(2024)小学英语一年级上册教学计划及进度表
- 河北省廊坊市2024-2025学年高一下学期期末考试 数学试卷
- 2025年卫生高级职称考试(超声医学)历年参考题库含答案详解(5卷)
- 2025年福建省高考真题卷历史试题
- 客户评级管理办法煤炭
- 航空礼仪培训课件
- 《跨境电子商务》课件 第一章 跨境电子商务概述
- 《肉毒中毒诊治急诊专家共识(2025)》解读
- 2025新能源光伏发电工程移交生产验收表
- 服装表演专业教学标准(中等职业教育)2025修订
- 营造林工程监理规范(试行)
评论
0/150
提交评论