(计算机软件与理论专业论文)基于gis网格服务的空间数据挖掘研究.pdf_第1页
(计算机软件与理论专业论文)基于gis网格服务的空间数据挖掘研究.pdf_第2页
(计算机软件与理论专业论文)基于gis网格服务的空间数据挖掘研究.pdf_第3页
(计算机软件与理论专业论文)基于gis网格服务的空间数据挖掘研究.pdf_第4页
(计算机软件与理论专业论文)基于gis网格服务的空间数据挖掘研究.pdf_第5页
已阅读5页,还剩84页未读 继续免费阅读

(计算机软件与理论专业论文)基于gis网格服务的空间数据挖掘研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

山大学硕+ 学位硷文 牡丁g i s 嗍格服务的空问数据挖掘研究 摘要 g i s ( g e o g r a p h i c a li n f o r m a ti o i ls y s t e m ,地理信息系统) 网格服务是中山 大学计算机系软件工程实验室提出并负责实施的广东省科技计划工业攻关项目, 本文工作是浚项目的一个重要组成部分。 ( ;t s 网格服务是g i sw e b 服务的自然延伸,它结合网格计算整合异构资源的 优势和w e b 服务把一切应用都抽象为服务的统一表示方法这两种优势,有效地 集成各类分布式的、异构的、动态的g i s 空间数据资源。 空间数据是人们藉以认识自然和改造自然的重要数据,可是这蝗数据资源中 蕴涵的知识远远没有得到充分的挖掘和利用。因此从海量的空间数据中自动地挖 掘知识,寻找隐藏其中的不明确的、隐含的知识、空间关系或其他模式,即空间 数据挖掘( s p a t i a ld a t am i n i n g ,s d m ) ,也变得越来越重要。 本文的主要研究工作如f : 1 提出了基于6 i s 网格服务的空问数据挖掘总体框架,并设计了基于浚 框架的空间数据挖掘具体流程。该流程中利用6 i s 网格服务本身特 点,满足空间数据挖掘集成g i s 系统中分布的、异构的、动态的空问 数据这类需求,从而提高空间数据挖掘的整体质量。 2 提出了一种空间数据的分类方法,并综合参考空间数据挖掘现有的算 法和策略,针对不同类别的空间数据进行相应处理,从而提高空间数 据挖掘的整体效率。 本文采用网格服务中问件领域事实标准g l o b u s 工具包( g t 3 ) 实现了个基 于空1 1 日j 分类决策树方法的商铺决策流程模拟实验,在定应用背景f ,验证基于 g i s 网格j j 艮务空问数据挖掘流程设计方案在功能层面上的可行性和实效性。 关键词:6 i s 网格服务,空删数掘挖掘,临近点分析服务,服务数掘,空间分类 挖掘方法,决策树算法 巾夫学硕士“学位硷变 萆丁g i s 嗍格服务的空问数据挖掘研究 a b s t r a c t g i s ( g e o g r a p h i ci n f o r m a t i o ns y s t e m s ) g r i ds e r v i c e si sp r o p o s e da n dp u ti n p r a c t i c eb ys o f t w a r ee n g i n e e r i n gl a b o r a t o r y o fc o m p u t e rs c i e n c ed e p t o fs u n y a t s e nu n i v e r s i t y t h i sp r o j e c ti ss u p p o r t e db yt h ei n d u s t r i a lr e s e a r c hp r o j e c t so f t h es c i e n c ea n dt e c h n o l o g yp l a no fg u a n g d o n gp r o v i n c e ,p r c h i n a t h er e s e a r c h s h o w ni nt h i sp a p e ri sa l li m p o r t a n tp a r to f t h ep r o j e c t a san a t u r a le v o l u t i o no fg i sw e bs e r v i c e s ,g i sg r i ds e r v i c e sg e ti n v o l v e do f t h ea d v a n t a g e so fg r i dc o m p u t i n ga n ds e r v i c e o r i e n t e da r c h i t e c t u r e ,w h i c ha r e c o n s i d e r e da se f f e c t i v ew a y st oe n a b l ea l lk i n d so fd i s t r i b u t e d ,h e t e r o g e n e o u s , d y n a m i cg i ss p a t i a lr e s o u r c e st ob es h a r e da n di n t e g r a t e d s p a t i a ld a t am i n i n g ( s d m ) ,w h i c hd i s c o v e r si m p l i c i tk n o w l e d g ei ns p a t i a l d a t a b a s e sa n dg i s ,i sah i g h l yd e m a n d i n gf i e l db e c a u s ev e r yl a r g ea m o u n t so f s p a t i a l d a t ah a v eb e e nc o l l e c t e di nv a r i o u sa p p l i c a t i o n s t h e r ea r et w oc o n t r i b u t i o na n di n n o v a t i o np o i n t si nt h i sp a p e r : 1 t h eg i sg r i ds e r v i c e s b a s e ds p a t i a ld a t am i n i n gf r a m e w o r ka n dp r o c e s s a r e p r o p o s e d a n d d e s i g n e d ,w h i c hc a ni n t e g r a t e t h e d i s t r i b u t e d , h e t e r o g e n e o u s ,d y n a m i cg i ss p a t i a ld a t ai ns d mp r o c e s sw i t ht h eh e l p o fg i sg r i ds e r v i c e s s u c hd e s i g nw i l la d v a n c et h eq u a l i t yo fs d mo n t h ew h o l e 2 a s p a t i a ld a t ac l a s s i f i c a t i o nv i e wi sp r o p o s e d w i t ht h eu s eo ft h i sv i e w , s o m ee f f i c i e n ts d ma l g o r i t h m sa n dt e c h n i q u e sh a v eb e e nt a k e ne f f e c ti n s u c hs d m p r o c e s sa c c o r d i n gt ot h er e l a t e dc l a s s i f i e ds p a t i a ld a t a ,w h i c h w i l li m p r o v et h ee f f i c i e n c yo fs d mo nt h ew h o l e a b o v ef r a m e w o r ka n d p r o c e s s a r et e s t e di nas i m u l a t i v e e x p e r i m e n t a l e n v i r o n m e n to fs t o r el o c a t i o nd e c i s i o n - m a k i n ga n di tt u r n so u tt oh ef e a s i b l ea n d p r a c t i c a lc o n c e r n e da b o u tt h ef u n c t i o n a l i t y k e y w o r d s :g i sg r i ds e r v i c e s ,s p a t i a ld a t am i n i n g ,p r o x i m i t ys e r v i c e ,s e r v i c ed a t a , s p a t i a lc l a s s i f i c a t i o nm e t h o d ,d e c i s i o nt r e ea l g o r i t h m l j 中山人学硕j 崞j 位论文 基于g i s 网格服务的空间数据挖掘研究 第1 章综述 1 1 项目背景 g i s 网格服务项目由中山大学计算机科学系软件工程实验室提出动议并负 责实施,旨在研究与丌发一种基于网格服务的地理信息系统应用集成解决方案, 实现企业、政府部门、社区、甚至个人等组织之间的g i s 信息共享,消除g i g 领域普遍存在的信息孤岛现象川。 g i s 网格服务项目的研究工作主要分为三部分:g i g 网格服务的设计与实现、 基于g i s 网格服务的网格门户以及基于g i s 网格服务的创新型应用。本人在项目 中参与了“基于g i s 网格服务的创新性应用”这个子任务的工作,从g i s 网格 服务共享各类分布、异构、动态空间数据的能力出发,提出基于g i s 网格服务的 空间数据挖掘框架,并负责基于g i s 网格服务的空间数据挖掘流程设计与模拟实 验工作。 g i s 与数据挖掘以前一直以来都只作为两类独立的技术,但随着空间数据挖 掘概念的提出,人们意识到除了普通的空间数据库外,g i s 中存储的海量空间数 据罩面同样蕴藏着大量隐含的、未知的空间知识,因此现在的研究工作和应用开 发工作都开始朝着g i s 和空间数据挖掘两者相结合的方向发展【2 1 。 1 2 研究背景 网格与空间数据挖掘均是国内外计算机科学界研究的热点问题,针对这两个 研究领域,国内外丌展了不少相关的研究工作。 中山入学坝i 学蚀论文 皋十g i s 硝格服务魄空间数据控抵 i j 宽 1 2 1 网格与g i s 结合的相关研究工作 网格与g i s 是为了解决以下日益迫切的应用问题而结合在起的,这些问题 的主要表现为: ( 1 ) 分布在不同空间数据提供者中的空间数据资源不能共享,空划数 据资源的整体利用率较低; ( 2 ) 空削数据资源支撑环境的异构性,导致不同系统无法进行有效利 用不同类型的空问数据来进行协同工作: ( 3 ) 空问信愚技术的标准化工作,其辱r 数据标准化工作和服务标准化 工作是现在研究的重点。 国内相关研究:f 作 针对空间信息刚格( s p a t i a li n f o r m a t i o ng r i d ,s j g ) 的发展趋势,“十f , 困家8 6 3 计划提出了信息获取与处理技术丰题,现包括了空b l j 信息同揍总体技 术、高分辨力空间信息获取技术、空间信息处理技术、空间信息应用与产业促进 以及空间信息获取与处理前沿技术等五个专题。2 0 0 2 年,与空间信息网格有关 的国家8 6 3 计划课题包括空间信息网格框架体系和关键支撑技术以及基于空间 信息网格框架的城市空问信息应用服务系统h 1 。 在国家8 6 3 计划的推动和支持下,国内围绕着空间信息网格提出了不少创新 的概念和方案。 沈占锋、骆剑承等4 】与方金云、何建邦【5 】分别提出了关于网格g i s 的体系架 构设想及其关键的实现技术。同时,骆剑承、周成虎等6 】提出了基于中间件技术 的网格g i s 的体系结构,探索如何利用中间件技术来实现联邦空i - 自j 数据库、空 间计算环境和虚拟地理环境等网格g i s 中的前沿关键应用。肖侬、付伟针对网 格计算跟空间数据处理相结合问题,提出了空问数据处理网格( s p a t i a ld a t a p r o c e s s i n gg r i d ,s d p g ) 结构叽s d p g 利用虚拟数据对象和o p e n g i s 规范对各 种空间数据存储系统以及g s 系统进行统一的访问,另外它把标准c i m 模型扩展 为种新的空间信息模型,除此它还提出了基于集群的g i s 系统方案以提高空间 数据处理的性能。 国外相关研究工作 欧洲数据网格项目( e u r o p e a nd a t ag r i d ,e d g ) 【8 1 的丌发和实施让科研工 2 中山人学硬= i := 学位论文 摹于g i s 网格服务的字间数据挖掘研究 作者们认识到网格这一种有效的大范围分布式计算方案,而空间数据本身具有数 据巨大以及计算复杂的特点,这正是网格技术本身的特长,所以国外已经有不少 研究项目着眼于集成网格计算与空间数据处理以作为一项新的应用技术。 地理系统网格项目( e a r t hs y s t e mg r i d ,e s 6 ) 州利用g l o b u st o o l k i t 和 其他一些计算网格软件构造出一个地理信息网格的原型。它通过相关地理数掘集 副本复制和共享计算资源这两个网格计算的特点实现了气候数据的远程交互式 分析。基于e s g 的地理观察系统( e a r t ho b s e r v a t i o ns y s t e m ,e o s ) 【9 j 定义了 一系列地理监测的基本操作,并实现了一个网格环境下的地理监测应用系统。这 个系统能够广泛应用到气候学、海洋学等各类地理监测相关的学科当中。 除了以上一些基于计算网格的地理信息项目外,最近由n s f 赞助的 g e o s c i e n c e sn e t w o r k ( g e o n ) i lo j 项目提出了利用网格服务概念来集成异构的网 格地图图像资源,并针对a r c l b l s 服务器和删s 服务器【l i l 设计出类实现地图集 成处理的网格服务。 1 2 2 空间数据挖掘的相关研究工作 空间数据挖掘现今的主要研究方向包括以下方面: ( 1 ) 算法的效率。空间数据挖掘较之传统数据挖掘面向更为海量的数 据库系统,因此在空间数据挖掘过程中出现不确定性、错误模式 的可能性也就更大了,由此,提高算法的效率成为空间挖掘算法 在实际应用中不可避免的巨大挑战。 ( 2 ) 复杂空间数据库的处理。数据库技术不断发展完善,像面向对象 空间数据库和时空数据库这样复杂的空间数据库也不断地涌现和 发展,所以,将空间挖掘技术应用到这类数掘库中是至关重要的。 ( 3 ) 网络环境下的空问数据挖掘。空间数据挖掘应用现在f 向着大规 模分靠式计算资源和数据资源的方向发展,因此,研究适应于网 络乃至网格环境下的空间数据挖掘技术、工具和系统是大势所趋。 空问数据挖掘各类算法的研究工作 空自j 分类挖掘算法方面。e s t e r u 2 等人在邻接图理论的基础之上提出了一仓 基于1 0 3 算法的空间分类算法。该算法不 义考虑了要分类对象的菲空间属性,同 中山人学坝。卜学位论文 基于g i s 刚格服务的空间数据挖掘研究 时也考虑了其邻接对象的非空闯属性,只要是满足任何种邻接关系的对象都会 被看成是邻接对象。k o p e r s k j 提出了一个高效的两步分类算法:第一步,通 过较少的代价的空间计算获得一个近似的空间谓词,在这个阶段同时进行相关分 析;第二步,对模型进行进一步的精化计算,从而获得一个更小、更精确的决策 树。 空间聚类挖掘算法方面。国外的学者提出了c l a r a n s 算法”,c l a r a n s 是一 个k - m e d o 【d 算法,它采用随机、受限的搜索策略对初始簇分区进行优化。虽然 该算法具有比较高的效率,但对大型数据库而言,其效率依然是i j 分有限的。因 此,义l l 的作者提出了将c l a r a n s 算法应用到空洲数掘库的技术:基于r * - 树的 取样和相关法。最近,a n t h o n yk h t u n g 等提出了基于阻碍距离的空间聚类算 法c o d c l a r a n s ”“,比较好地解决了实际情况中由于物理阻碍的存在可能影响聚 类结果的情况,从而极大地提高了空间聚类算法的可应用性和精确性。 空间关联规则挖掘算法方面。k o p e r s k i 提出了逐步求精的优化思想i m l ,即 首先用一种快速的算法粗略地对初始空间数据库进行一次挖掘,然后再在裁剪过 的数掘库上采用代价高的算法进行进一步精化挖掘。 空间趋势分析算法方面。文献l 1 中介绍了g l o b a l t r e n d 和l o c a l t r e n d 两 种算法来发现空间趋势。算法的不同之处在于回归的对象有所不同:前者是对相 同长度的邻接路径进行回归分析,而后者分析的对象则有明显趋势的邻接路径。 空涮数据挖掘原型系统的研究工作 在空问数据挖掘系统的开发方面,国际上有代表性的通用s d m 系统包括了 g e o m i n e r 1 8 i ,d e s c a r t e s u 9 】、a r c v i e wg i s 的s p l u s 接口【2 0 1 等。 g e o m i n e r 是由加拿大s i m o nf r a s e r 大学、计算科学学校和数据库系统研究 实验摩联合丌发的个空问数据库知识发现系统。该系统包含有空间数据立方体 构造模型、空间联机分析处理模型和空间数据挖掘模型,同时支持空间数据查询 语言g m q l ,是一个交互式、可视化的空间挖掘系统。它主要挖掘地理空间数据 库中的特征规则、对比规则、关联规则、分类规则和聚类规则。g e o m i n e r 的详 细介绍以及相关技术文献可参考g e o m i n e r 网站资料f j 8 j 。 d e s c a r t e s 支持可视化的分析空间数据。它与丌发此软件的公司丌发的数据 挖掘工具k e p l e r 结合使用,把传统的数据挖掘与自动作图可视化和图形化表现 中山人学硕j ,学位论文 基于g i s 网格服务的窄问数据挖掘研究 操作结合起来,实现了c 4 5 决策树算法、聚类和关联规则的挖掘。d e s c a r t e s 的详细介绍以及相关技术文献可参考d e s c a r t e s 网站资料。 a r c v i e w g i s 的sp l u s 是著名的e s r 公司川开发的,它提供工具分析空间 数据中指定类。 1 3 本文研究工作v s 现有研究_ 7 - 作 1 3 1 现有研究工作所存在的不足 现有大多数空间数据挖掘研究工作中,它们都要求参与挖掘的空问数据存储 在一个相对集中的和静念的环境当中。但在实际应用背景中,往往需要综合 考虑其他一些分布、异构环境下的动态空间数据,这罩便涉及到该类数据能 否方便集成的问题。现在通常的解决策略是在挖掘过程中额外构造其它一些 较为复杂的时序数据挖掘模型和挖掘算法柬处理动念环境下的挖掘问题,而 并没有考虑在空间数据查询阶段运用有效的策略来集成这类数据。 随着w e b 服务在工业界的流行,6 i s 领域的厂商都纷纷在自己的g i s 产品中 加入了基于w e b 服务技术构建的功能。但在g i s 领域出现的各种w e b 服务中 很多并不是严格意义上的w e b 服务,即不遵从w 3 c 制定的w e b 服务规范“。 而且g i s 领域中较有影响力的国际非盈利组织o o e n g i s 协会弘列所制定的各种 g i sw e b 服务规范也不要求遵从w 3 c 制定的w e b 服务规范。这导致了基于g i s 的应用程序无法有效地集成各类不规范的、异构的空问分析操作和数据。 上文提到不少关于网格与g i s 结合的方案,它们能够在一定程度上解决在分 布的、异构的、动态的环境下共享资源的问题。但现有的研究大多数集中在 以往的计算网格这类面向计算的视角之上,追求的是集成大规模的、高性能 的计算资源来进行g i s 的分析和处理操作,并没有采用现有面向服务的视角 来集成海量的、分布的、异构的、动态的g i s 空间数据资源。 中山人学坝j 。学位论文 基十g i s 网格服务的空间数据挖掘研究 1 3 2 问题的提出 空问数据挖掘在企业决策以及政府决策中的应用越来越广泛。然而如交通流 量控制预测分析这类空间数据挖掘应用,就需要考虑到各个道路监测点动态变化 的空问数据;又如房地产市场预测这类空问数据挖掘应用,除了考虑企业内部数 掘以外,还需要集成企业外部城市规划部门和统计部门中以分布和异构形式存在 的建筑物分布数据和人口密度分布数据。以上这些应用中所面临的问题实质上便 是空问信息孤岛现象的一个缩影,我们可以把它归结成以下几点: 数据的空问分扣性。网络化的发展导致空问数据资源在地理位置上越来越走 向分布,空间数据资源分散在网络中的各个结点,长期积累下来的各种空i ;i j j 信息资源被存放再相互孤立的数据生产者手中,形成无法共享的分,f | i “信息 孤岛”。 数据的系统异构性。空间信息基础设施的建设过程中,各生产单位一般只是 根据自身的需要进行空问数据资源的汇集和管理,通常没有考虑其它部门和 行k 的需求。因此,各个单位由于硬件体系的不同、操作系统的各异、数据 库系统和g i s 的差异,直接导致了现有空间数掘资源的异构性。 数据的动态变化性。空间数据资源是与时问密切相关的资源,空问数据会随 着时间的演化而改变,所以它属于一种动念数据。要满足实时空问数据挖掘 和监控的要求,就必须集成这类动念的空间数据资源。 综上所得,这些存在的问题促使数据消费者迫切需要大量空间数据,而空间 数据生产者拥有海量数掘却无法有效提供数据的矛盾正在不断加剧。现有的空间 数据挖掘策略并没有很全面的考虑以上的因素,因此我们迫切需要有一种更方 便、更有效的方式让用户集成和共享这类分布的、异构的、动态的空间数据资源。 1 3 3 本文研究工作的创新点 6 i s 网格服务的优势在于实现以一种统一、标准和丌放的方式共享分布的、 异构的g i s 系统中的各类地理空间数据。同时,空间数据挖掘应用的发展正需要 中i 山人学硕j “学位论文 基于g i s 网格服务的空间数据挖掘研究 在挖掘流程中集成这类空间数掘,而它们绝大部分都是存储在各类g i s 系统中。 因此本文研究和分析了g i s 网格服务和空间数据挖掘技术,从两者在技术层面的 共同点出发,提出了基于g i s 网格服务的空间数据挖掘框架,并设计了基于该框 架的空间数据挖掘流程。 本文研究工作的意义在于: 本研究是g i s 网格服务项目跟实际应用背景结合的一个范例。g i s 网格服务 是以_ 种统一的方式来访问现有的各类g i s 空间数据资源,因此基于g i s 网 格服务框架,我们可以把更全面的空间数据集成到现有的空间数据挖掘分析 流程中,从而提高空问数据挖掘的整体质量。 本研究在一种新的空间数据分类方法基础上,参考运用了几类现有的空阳j 数 据挖掘策略,从而提高了空间数据挖掘的效率。 本研究成果可以折射到一定的应用领域当中。文中最后模拟了一个商铺选址 决策支持的应用背景,以验证该框架和流程的设计具有一定可行性和实效 性。 1 4 文章结构框架 本文目的研究在现有空间数据挖掘的流程中,综合g i s 网格服务项目所得到 的研究成果,提出了基于g i s 网格服务的空间数据挖掘框架和流程,通过利用 g i s 网格服务共享分布的、异构的和动态的空间数据资源能力,达到提高空间数 据挖掘质量和效率的目标。 第章引售,提出了本文的项目背景,研究背景以及研究内容的组织结构, 并通过对比现有研究工作,给出了本研究工作的创新点所在。 第二章阐述了本文所涉及到的一些关键的理论和技术知识,其中包括了g i s 网格服务、服务数据与索引服务、空间数据挖掘以及基于距离的空间索引表等几 方面的技术要点介绍。 第三章、第四章以及第五章是全文的重点。 第曼章针对本文的项目背景和研究背景,提出了一个基于g i s 网格服务的卒 浏数据挖掘框架,并简要地分析了该框架中各部分所担当的角色,以及指出本文 中山大学碳i :学位论立摧于g i s 嘲格服务的卒间数据挖掘1 1 :i l 九 在该框架中的研究重点。 第四章在第三章的基础上,提出了对空问对象属性数据分类的一个新设想, 基于该分类方法和上:一章的框架结构,设计了基于g i s 网格服务的空间数据挖掘 流程。 第五章在第四章的基础上,通过商铺选址决策应用的模拟实验实现了基于 g i s 网格服务空间数据挖掘流程的总体设计构想,并验证该设计的可行性和实效 性。 第六章总结全文并讨论未来的改进工作。 8 中山大学硕卜学位论文 基于g i s 叫格服务的空间数据挖掘研究 第2 章关键理论与技术 本章从总体上研究和分析了文中所涉及一些关键理论与技术g i s 网格 服务、服务数据和索引服务、空间数据挖掘以及空间联接索引它们相关的要点。 2 1g i s 网格服务 2 1 1o g s a & 网格服务 丌放网格服务架构o g s a ( o p e ng r i ds e r v i c e sa r c h i t e c t u r e ) 是全球网 格论坛g g f ( g l o b a lg r i df o r u m ) 1 2 5 】制定的标准,它是个以服务为中心的网 格体系架构。o g s a 最突出的思想就是以“服务”为中心,在o g s a 中一切都是服 务,包括各种计算资源、存储资源、网络、程序、数据库、仪器等等。之前提出 的五层沙漏模型试图以协议的观点来实现对资源的共享,而在o g s a 中则是以服 务的观点实现对资源的共享。从协议到服务的这种抽象,把各种资源、信息、数 据等统一起来,十分有利于灵活的、一致的、动态的共享机制的实现,使得网格 分布式系统管理有了标准的接口和行为。 为了使服务的思想更加明确和具体,o g s a 定义了网格服务( g r i ds e r v i c e ) 2 6 】。 网格服务其实是一种特殊的w e b 服务( w e bs e r v i c e ) 2 2 】,现有的w e bs e r v i c e 技术提供了一种基于服务的框架结构,但是,w e bs e r v i c e 面对的一般都是永久 服务,而在网格应用环境中,大量的是临时性的短暂服务,比如一个计算任务的 执行等。考虑到网格环境的具体特点,o g s a 在原来w e bs e r v i c e 服务概念的基 础上,提出了“网格服务( g r i ds e r v i c e ) ”的概念。 网格服务是以w e b 服务为基础的自然进化,它结合了网格计算整合异构资源 的优势和w e b 服务把一切应用都抽象为服务的统一表示方法这两者的优点,为分 布式应用的设计人员透明地解决分布式异构环境下发现、动态服务创建、生命周 期管理、通知、可管理性、命名、可升级、认证和可靠调用等一系列与具体业务 9 中i h 人学硕i 学位论文 摹十g i s 网格服务的空阐数据挖掘研究 逻辑无关的问题,从而使开发人员能集中精力解决特定的商务逻辑;另一方面它 也立足于灵活的、全球可用的服务动态集成,以补充w e b 服务缺乏瞬时服务实例、 缺乏全局命名机制和服务引用解析等问题。 网格服务通过定义接口来完成不同的功能,其中只有g r i d s e r v i c e 接口是必 需的,而其它的接口如n o t i f i c a t i o n s o u r c e ( 通知) 、r e g i s t r y ( 服务注册) 和h a n d l e m a p ( 服务管理) 等都是可选的,同时服务数据则是关于网格服务实例 的描述信息,因此网格服务可以简单地表示为“网格服务= 接口行为+ 服务数 据”。图2 一l ( 引自文献 2 7 , 2 8 1 ) 是对网格服务的简单描述。 、h t 城硝m 1 0 问 ! i lj j 衍! 女 蛐i 足恕、i 仓1 翘 1 :引 i 东箍; 一n 、j 6 f i d s e r v i c e 。必剌j ) i o 臻l j - 小童曲, 一4 i t 一* 二 j 瞳 一# 7 。叫 一tl := i+i + i l _ j _ i 焉i 酗21 网格服务的组成 总的来看,以网格服务为中心的模型具有如下好处【2 3 ,2 8 j : 由于网格环境中所有的组件都是虚拟化的,因此,通过提供一组相对统一的 核心接口,所有的网格服务都基于这些接口实现,就可以很容易地构造出具 有层次结构的、更高级别的服务,这些服务可以跨越不同的抽象层次,以一 种统+ 的方式来看待: 虚拟化也使得将多个逻辑资源实例映射到相同的物理资源上成为可能,在对 服务进行组合时不必考虑具体的实现,可以以底层资源组成为基础,在虚拟 组织( v j r t u a lo r g a n i z a t i o n ) 中进行资源管理。通过网格服务的虚拟化, 可以将通用的服务语义和行为,无缝的映射到本地平台的基础设施上。 中山人学硕士学位论文基于g i s 阐格服务的窄问数据挖掘研究 2 1 ,2g i s 网格服务的演化历程 地理信息系统( g i s ,g e o g r a p h i c a ll n f o r m a t i o ns y s t e m ) 是一种决策支持 系统,它具有信息系统的各种特点。地理信息系统与其他信息系统的主要区别在 于其存储和处理的信息是经过地理信息编码的,地理位置及与该位置有关的地物 属性信息成为信息检索的重要部分。在地理信息系统中,现实世界被表达成一系 列的地理要素和地理现象,这些地理特征至少有空间位置参考信息和非空间位置 信息这两个组成部分f 2 9 1 。 地理空间数据是指以地球表面空间位置为参照的自然、社会和人文经济景观 数据,可以是图形、图像、文字、表格和数字等。它是g i s 系统中程序作用的对 象,也是g i s 其核心价值所在。据统计,一个g i s 项目的7 0 以上的资会是用于 g s 数据库的建设,对g i s 数据乃至空间数据资源的有效利用和共享则是开发一 个g i s 系统时需要慎重考虑的问题之一 3 0 , 3 1 】。 前因特网时代的g i s 发展 在前网络时代,g i s 体系结构的特点是支持集中式地理信息服务。从发展历 程看,该时期的g i s 主要经历了如下图所示的几个阶段: 倒2 - 2 前因特网时代的g i s 发展历科 上世纪9 0 年代诞生和发展的分布式对象技术与软件组件技术为g i s 应用集 成提供了新的机遇,这类新技术被迅速应用到g i s 丌发领域,形成了一种新型的 g i s 软件体系结构组件式g i s ( c o m p o n e n tg i s ,简称c o m g i s ) 。 中山人学硕l 学位论文 基于g i si 刈格服务的空间数据挖掘研究 组件式g i s 基于标准的组件模型,因而这些g i s 组件不仅呵充分利用组件生 存环境( 组件容器) 提供的对象服务支持,而且不同组件之间还可实现较高程度 的可互操作性,从而有效地支持在已有g i g 组件基础上灵活地构建新的g i s 应用 1 3 0 1 。 基于网络的g i s 发展历程( w e b g i s 与g i sw e b 服务) 基于w e b 的( ;i s 又称为w e b g i s ,这是g i s 与因特网的首次结合,也是当前 通过因特网共享6 1 s 信息与服务的主要形式。w e b 6 1 s 发展初期,需先在w e b 服 务的服务端将g i s 信息转换为g i f 或j p e g 图像和相应的文字信息,组织在h t m l 页面中传输给客户端。这种方式受制于h 1 m l 语言的限制,与用户的交! f :操作能 力报弱,而且纯图像方式也不太适合某些g i s 的深入使用。后期的w e b g i s 实现 了矢量地图文件的传输显示,目前已可实现把传统g i s 的全部功能转移到w e b ( ;1 s 上| 3 2 】。 g i s 与w e b 服务的结合诞生了当前最前沿的g i sw e b 服务技术。服务提供商 通过w e b 服务技术可以在网上共享各种g i s 应用,极大地方便了应用的维护、升 级等支持。g i sw e b 服务的历史地位是“把所有的g i s 应用联接起来”。目l i i 国 外供应商已推出了一系列g i sw e b 服务产品1 2 2 , 3 3 3 5 1 ,g i s 的国际组织o g c f 2 3 1 出出 台了相关的g i sw e b 服务规范f 1 1 , 3 7 1 。在国内,g i sw e b 服务亦已成为g i s 领域 的4 个研究与发展的热点。 g i s 网格服务 g i s 网格服务是g i sw e b 服务的自然延伸,与网格服务相结合能促使g i s 迸一步发展。与先前的6 i sw e b 服务等形式相比,g i s 网格服务还具有了以下这 些主要特点: ( 1 ) 大规模资源共享【3 8 】:可用统 高性能计算机、天文望远镜、 资源: 的方式共享分布的、异构的空间数据、 传感器、遥感设备( r s ) 等各式各样的 ( 2 ) 有状态的服务实例 3 9 1 :与无状态的传统w e b 服务相比更适合包装实时 的、动态的空间数掘资源: ( 3 ) 非集中管理的动态虚拟组织4 0 1 :更好地支持为完成各项空间分析工作 而动态组成的合作关系。 2 中山犬学坝l :学位论文 基于g i s 网格服务的空问数据挖掘 i 】f 究 2 1 3g i s 网格服务总体设计与实现概述 本文所提出的基于g i s 网格服务的空洲数据挖掘框架和流程,其核心便是利 用g i s 网格服务来集成分布的、异构的、动态的空间数据,因此g i s 网格服务的 设计与实现对于本文整个研究工作的实旌有着重要的影响。 g i s 网格服务的总体设计和实现是由中山大学软件工程实验摩的老师和同 学共同参与完成,它的核心思想是定制丌放、规范的g i s 服务接口来实现以统一 的方式对各类空间数据进行存取、分析和管理,以及无缝的集成各类的g i s 空问 数据资源,充分体现了网格服务本身统一性、规范性和丌放性的特点。g i s 网格 服务具体的服务设计与实现技术文档可参阅i 4 h 孙。下面简单介绍g i s 网格服务 总体的设计框架以及其中包含了具体那些类型服务。 g i s 网格服务的总体设计框架 g i s 网格服务是基于g l o b u st o o l k i t3 ( 简称g t 3 ) 4 4 】网格丌发工具包j a v a 版本实现的,因此在服务的设计中需要遵循g t 3 的网格服务实现机制。 g t 3 中提供了如下两种实现网格服务的机制,其中包括了继承机制和 p r o v i d e r 机制。在第一种机制中,由于j a v a 单继承的特性,而这种实现模式单 继承的配额已经在继承g r i d s e r v i c e l m p l 类时被占用,因此我们不能构造一个继 承其他类实现的网格服务类这样不利于具体g i s 网格服务的实现。相反,在第 二种机制中网格服务类实现了0 p e r a t i o n p r o v i d e r 接口,它还可以根据自己的 需求继承其他的类。另外使用第二种方式来实现网格服务更能达到模块化,非耦 合,可复用设计的作用。综合两种方式的利弊,我们在g i s 网格服务实现中采用 p r o v i d e r 机制。 图2 3 ( 引自文献1 4 2 j ) 是利用g t 3 的p r o v i d e r 机制实现具体g i s 网格服务 的简单模式: 巾山人学坝i j 学位论史 基于g i s 刚格服务的空间数据挖掘珂究 0 0 d e r a t i o n p r 0 v i d e r g l s gr i d s e r v i c e 剧2 - 3g i s 嘲格服势的o p e r a f i o n p r o v i d e r 实现机制 c , i s 网格服务项目所实现的网格服务类型 g i n 网格服务项目中,主要将g i s 网格服务分为三大类型:数据服务,力一 服务和元数掘服务。 在选择需要实现的服务过程中我们遵循以f 的原则:数据和加工服务郝必须 涉及;这些服务必须是比较有用而且是常用的;最好找到浚类服务相关的实现, 以便f = l 后进行包装;这些服务应该有比较完善的现成接口供实现参考。 基于以上的原则,本项目设计和实现了以下的服务: ( 1 ) 地图( m a p ) 服务 构造地图图像,在设计中主要参考o g c 的w m s 规范和e s r a r c w e b 、m s m a p p o in t 4 5 1 的相关服务接口。 ( 2 ) 要素( f e a t u r e ) 服务 提供数据操作功能,在设计中主要参考o g c 的w f s 规范,以及e s r i 的 m a p o b j e c t l 4 6 1 中的数掘结构和接口定义。 ( 3 ) 覆盖( c o v e r a g e ) 服务 提供c o v e r a g e 获取功能,在设计中主要参考0 6 c 的w c s 规范。 ( 4 ) 临近点分析( p r o x i m i t y ) 服务 提供简单空间分析功能,给出点或者线段,以及检索半径和条件,搜索符合 条件的地理f e a t u r e 。在设计中主要参考e s f t i 和m a p p o i n t 相关服务的接口定义。 中山大学硕i 学位论文 摹于g i s 删格服务的窄间数据挖掘研究 ( 5 ) 路径分析( r o u t e r ) 服务 提供寻路功能,输入一系列的点,找到合适的路径以图像和文字描述的方式 返回。在设计中主要参考e s r i 和m a p p o i n t 相关服务的接口定义。 ( 6 ) 坐标变换( u t i l i t y ) 服务 提供了一个作为投影的服务,能够对一个地理特征或者矩形框在不同的坐标 系之间作变换。 ( 7 ) 元数据( m e t ad a t a ) 服务 提供发布和获取服务元数据的功能,我们暂时考虑使用服务元数据自描述的 方式。 总的来看,g i s 网格服务的特性在空间数据挖掘领域能得到充分的体现: 空间数据挖掘的典型应用( 如交通流量控制、气象预报、城镇规划等) 需要 各类分布、异构以及动态的空间数据,而g i s 网格服务可以用统一的访问方 式按需集成这些数据; 实时的空问数据挖掘系统需要集成r s 、g p s 、天文望远镜等异构设备的动态 数掘信息,可以体现网格技术的集成能力; 空间数据挖掘庞大的计算量需要利用各种非常昂贵的硬件资源,适合通过非 集中管理的虚拟组织间合作以达到共享目的。 2 2 服务数据& 索引服务 2 2 1s e r v i c ed a t a 服务数据 服务数据是一个存储网格服务相关信息的集合结构,它的目标是使用户找到 合乎自身需求的服务和得到最新的服务相关信息。 图2 4 展示了一个网格服务中服务数据的结构: 中山人学删! j 1 学位论文基于g i s 刚格服务的空间数据挖捌宄 幽2 - 4 服务数据组成结构剀 首先服务数据是对服务实例而言的,每个服务实例都有 ( s e r v i c ed a t as e t ) ,该数据集由若干个服务数据元素 e l e m e n t ,简称s d e ) 组成: 一个服务数据集 同一类型( t y p e ) 的s d e 可能会在实例中出现零到多次,且同一个服务实例 可以拥有多种类型( t y p e ) 的s d e 。只要s d e 是属于同一个类型,其中的属 性结构都是一样的; 所有服务实例都有一些基本的共有的s d e ,如“s e r v i c e d a t a n a m e ,列举出实 例拥有的s d e 名、“i n t e r f a c e ”列举出实例所实现的接口等。我们在图2 - 4 中只是没有表示这些信息。 图2 - 5 是一个服务数据的应用例子 1 6 中山人学坝1 学位论文 基于g i s 恻格服务的空问数据挖掘研究 削2 - 5 服务数据廊州实例 两个g i s 地图服务的实例位于两个不同的机器上,并提供有关成本和效率 的服务数据信息,客户可以通过g t 3 提供的f i n d s e r v i c e d a t a ( ) 服务方法获取这 类信息选择使用更合适的服务实例来完成操作。 如果要使用自定义的服务数掘,必须先编写$ 9 9 ( s e r v i c ed 8 t a d e s c r i p t i o n ) 。s d d 描述的就是s d e 的类型( t y p e ) ,它是用x m ls c h e m a 来编 写的,在编译时会自动转换成相应的j a v a b e a n 。它们的对应关系如图2 - 6 : 幽2 - 6 服务数据的转换 巾山人学碗i 。学位论文 拈十g i s 嘲格服务的空间数据挖掘研究 除了自定义的那些服务数据以外,网格服务中还有一种服务数据是由服务数 据提供n ( s e r v i c ed a t ap r o v i d e r ) 直接产生,如g t 3 自带的h o s t s c r i p t p r o v j d e r 类型的服务数据等。 这些服务器相关的服务数据,加上自定义的g i s 服务相关的服务数据就构成 了整个基于g i s 网格服务的空j 、b 数据挖掘应用中获取空州数据资源动态变化信 息的依据,我们可以通过服务数据来包装空间数据的动念变化信息,使挖糖i 客户 及时地根据这些变化来调整挖掘的流程以提高挖掘的质量。 2 2 2i n d

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论