版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第2章 新一代GIS软件技术研究2.1 第四代GIS技术地理信息系统是一类获取、处理、分析、表示并在不同系统、不同地点、和不同用户之间传输数字化空间数据的计算机应用系统。空间位置、属性及时间是地理空间分析的三大要素。由于地球上80%以上的信息与空间位置有关,它应该成为在操作系统、数据库管理系统之上的主要应用集成平台,占据软件产品的主流地位。但是,目前GIS软件在技术上并不能适应飞速发展的应用要求,尤其不能适应“数字地球”和“数字城市”、“数字区域”建设中数据集成和功能集成的需要。认真研究现有GIS理论与软件实现技术的不足,寻求理论、方法、技术和工具四个层次的突破和创新,已经成为当务之急。2.1
2、.1地理信息系统软件发展的历史回顾自从1960年加拿大测量学家Roger F Tomlinson提出“要把地图变成数字形式的地图,便于计算机处理与分析”的观点以来,就一直是研究与发展GIS软件的指导思想。纵观GIS发展30多年的历史,GIS软件技术及其应用取得了巨大的发展,但也存在着严重的不足。从技术层面着眼,其发展大致可以分成三个阶段:1、第一代从60年代中期到80年代的中后期,是GIS软件从无到有、从原型到产品的阶段。由于各种条件,包括自身理论和实现技术的不成熟和IT技术的限制,这一阶段的GIS软件存在许多不足。其基本技术特点为: 以图层作为处理的基础由于当时GIS系统中空间数据的主要来源
3、是纸质地图的数字化,在GIS的数据模型中,图层处于中心地位。定义某一地理轮廓,在此范围内的相关(专题)空间数据组成图层,同一图层的空间数据存放在一个文件之中。空间定位与量算以图廓范围内的平面笛卡尔坐标系为基础,操作局限于当前图层内。利用计算机技术可以计算空间实体之间的拓扑关系,实现同一区域内各种专题数据的叠置、影响区域分析(缓冲)和线状实体的路径分析。但是,各类查询与计算只能在同一图层中进行。 以系统为中心当时的GIS软件空间数据各自有自己的数据格式,自成系统,不同的GIS系统基本上没有联系。与其它的软件工具,例如MRP软件、CAD软件等在数据和程序上不存在集成关系。 单机、单用户由于IT技术
4、的限制,当时的GIS系统只能在单机上运行,尽管在后期X协议和X终端已经普遍使用,但由于不能描述空间数据及其操作,这时的GIS软件无法实现分时操作模式。 全封闭结构,支持二次开发能力非常弱当时的GIS只提供功能极其有限的供查询和计算的自定义语言,与数据库、通用的编程语言没有建立联系,用户只能按照已经开发好的应用系统功能接口操作,或者联机地、一步一步地完成自己预定的计算任务,无法连贯地、批量地实现复杂的自定义应用功能。 在主要实现技术上,以文件系统来管理空间数据与属性数据GIS中的数据分为空间数据和属性数据两类,空间数据描述空间实体的地理位置及其形状,属性数据则描述相应空间实体有关的应用信息。由于
5、当时数据库管理系统只能管理结构化数据,对空间数据这样的非结构化数据使用无法进行定义、管理与操纵,GIS软件只能在文件系统中自行定义空间数据结构及其操纵工具。由于最初关系型DBMS不够成熟与普及,对属性数据这样的结构化数据,也放在文件系统中进行管理,空间数据、属性数据两者之间通过标识码建立联系。 应用领域基本上集中在资源与环境领域的管理类应用。2、第二代从80年代末到90年代中期,是GIS软件成熟和应用快速发展的时期。这一阶段,GIS软件作为一种软件工具,理论与技术已经基本成熟。由于其具备空间数据操纵能力,在应用中受到青睐,应用领域迅速扩展。这个时期,网络技术已经成熟并广泛应用,巨大的应用前景也
6、对GIS软件提出了各种各样的要求,GIS软件实现技术得到了迅速发展。但是,GIS的基本技术体系仍然没有发生根本的变化。其技术特点为: 以图层作为处理基础由于空间数据模型没有根本的变化,以图层为处理基础的模式依然没有变化。对属性数据的查询可以在数据库范围内进行,但对空间数据的操作仍然限制在同一图层之内。在GIS应用系统事先定义的应用功能以外,大量的应用问题求解只能采用人工的步进操作方式。 引入网络技术,多机、多用户由于这一阶段网络技术已经成熟,应用范围迅速扩大,GIS软件也转向多用户和Client/Server结构。但是,由于空间数据组织和存储模式没有根本变化,Client与Server的关系基
7、本上属于空间数据文件下载和回送的关系,基本的空间数据处理功能在Client端实现。是一种典型的“胖Client”类型。Server只作空间数据的服务器使用,以NFS技术为基础,只能实现一种Device-Shared的C/S结构。 以系统为中心GIS应用系统仍然是自成体系,不同系统之间空间数据的交换能力有所提高,以数据转换为主要手段。由于属性数据利用商用DBMS来管理,可以利用标准的结构化查询语言来进行操纵,通过属性的综合查询结果显示相应的空间图形,数据操纵能力有所增强。另一方面,可以以属性数据库为纽带与其它系统建立联系,与其它系统的集成能力略有增强,但仍然比较弱。 支持二次开发的能力有所增强由
8、于通用编程语言的编程环境逐渐完善,GIS提供应用编程接口(API)可以嵌入应用系统的程序,例如,系统定义的GIS功能程序可以以库函数的形式出现,通过“Include”方式供应用程序调用。这一阶段的GIS系统支持二次开发的能力有所增强,但灵活性仍受到较大的限制。 以商用DBMS管理属性数据,但空间数据仍用文件系统管理这一阶段的GIS软件用商用DBMS管理属性数据,但仍用文件系统管理空间数据,空间实体位置与其属性通过标识码建立联系。这样,就可以利用商用DBMS提供的强大数据管理功能,数据管理能力大有提高,特别为建立空间数据库的工作提供了许多方便,建库能力大有提高。但是,涉及空间数据的管理与操纵仍然
9、无法利用商用DBMS提供的强大功能。 应用领域开始有较大范围的扩展,但基本上是管理类应用。引入空间数据的优越性越来越为人们所认识,GIS的应用范围迅速从资源环境领域向外扩展。城市规划与公用设施管理、电力、电信管理、交通管理等许多领域成为GIS应用的新热点。规划、布点、选址、路由选择等分析决策应用开始出现,但基本上还是以管理类应用为主。3、第三代90年代中期开始,估计将延续10年或稍长的时间。这一阶段IT技术的突出进步是网络技术,特别是Internet在全球的普及以及面向对象软件方法论和支撑技术的成熟,为GIS软件的技术进步注入了新的活力。GIS逐渐渗透到人类生活的各个方面,迎来了GIS应用高速
10、扩展的时期。大量的应用要求驱使GIS软件技术快速发展,开始具备作为应用集成平台的能力。其基本技术特点为: 仍然以图层为处理的基础,但面临不断演化虽然空间数据的存储引入了新的技术,但空间数据模型仍然没有很显著的变化。商用DBMS(如Oracle、Informix、DB2、SQL SERVER等)相继实现了对空间数据的管理,尽管还不够完善,空间数据的管理手段还是有了明显的提高。但是,由于DBMS对空间数据的操纵手段还比较原始和初等,加上GIS在设计思想上没有突破地图的限制,适合空间数据处理的中间件相当缺乏,以图层为处理基础的局面并没有得到根本的变革,Client端上空间处理仍然以图层下载为主要桥梁
11、。但是,随着GIS应用的多样化,以图层处理为基础所带来应用上的不便与弊端为越来越多的人们所认识,新的处理模式正在酝酿与试探之中。 引入了Internet技术,开始向以数据为中心的方向过渡,实现了较低层次的(浏览型或简单查询型)的B/S结构由于Internet技术和WEB技术的成熟与大规模普及应用,GIS开始面向传统行业和广大民众服务,逐渐向以数据为中心的方向过渡,WebGIS走向成熟,已经成为GIS应用的一种重要方式,空间信息应用的B/S结构已经出现。但是,由于对空间数据的操纵手段比较弱,难以实现复杂的一体化操作。目前这类系统基本上是浏览型或功能相对简单的查询型系统,完全操作型的系统尚未出现。
12、 开放程度大幅增加,组件化技术改造逐步完成面向对象软件方法论的成熟,体现面向对象的软件开发工具逐渐普及。其中最突出的是软插件技术,软件系统组件化已经成为一种趋势。国外主要的GIS软件在九十年代中期开始组件化改造,并在20世纪末相继完成。这样,GIS软部件可以与主要的跨平台编程工具结合,作业控制语言可以在软部件基础上组织复杂应用,GIS软部件也可以作为各种应用软件的功能部件出现。至此,GIS软件的开放性大幅度提高,融入了主流软件,实现了跨平台运行的夙愿。 逐渐重视元数据问题,空间数据共享、服务共享和GIS系统互连技术不断发展GIS软件的广泛应用,空间数据和GIS服务功能的共享提到了重要的议事日程
13、。属性数据的共享由于ODBC的出现已经解决,不同GIS系统之间空间数据的共享已经不满足于数据的互相转换,空间数据的元数据问题受到越来越多的关注3,GIS功能标准化的问题也倍受重视,不同GIS系统之间互操作成为突出的问题4。开放GIS组织(ODC)提出了开放地理信息规范(OPENGIS)5,旨在解决空间数据的继承、共享以及地理操作的分布与共享,对GIS开发平台提出了更高的要求。可以预计,各类空间数据引擎、适应多种GIS软件的功能代理会在较短的时间内出现。OPENGIS(应该还会有改善和提高)就像ODBC之于数据库,将成为空间数据操作的统一标准。 实现空间数据与属性数据的一体化存储和初步的一体化查
14、询,并将不断完善第三代GIS软件实现了用商用DBMS实现了空间数据和属性数据的一体化存储和初步的一体化查询,提高了空间数据的操纵能力6,7。多源空间数据仓库技术也将在未来两三年内逐渐成熟。但是,由于目前对空间关系的理解和表达形式还没有一个完整的、确定的框架,空间信息的完整性、一致性研究有待深入,目前的空间数据、属性数据一体化查询语言还比较初等,表达能力还比较弱,完善和提高尚需时日。 应用领域迅速扩大,应用深度不断提高,开始具有初步的分析决策能力。随着GIS应用需求的急剧扩大,大量的LBS ( Location Best Service ) 应用为GIS注入了新的活力,开拓了广阔的市场;GIS进
15、入AM/FM领域导致出现异步更新的协同工作环境。各类分析决策需求、甚至三维应用要求也摆在应用开发的面前。第三代GIS软件一般将此类应用问题放在应用层面来解决,在没有探索出一种公共模型的情况下,这种做法不失为有用之道。但是,这必然是就事论事,缺乏一般性。在数据挖掘已经广泛使用的今天,完整意义下的空间数据挖掘还没有出现,更多的是对属性数据进行挖掘,辅以简单的空间显示。存在的问题以及原因分析1、目前GIS软件存在的共性问题归纳起来,目前GIS软件存在的主要共性问题包括; 以图层为处理的基础,处理能力、尤其大范围、跨图幅区域灵活处理能力较弱。由于目前GIS软件不能实现跨图幅的计算,多图幅的空间运算必须
16、首先将涉及的图幅拼成一个新的图幅后才能进行,批量运算的能力大受限制。 二维的空间数据组织与管理,限制了应用范围。目前GIS空间数据模型及其操作的设计在空间上是面向平面二维结构的,实质上并没有三维处理的能力。实际应用中对出现的三维问题或是针对具体问题通过在属性数据中定义附加数据项针对具体问题进行处理,或是采用三维实体表面造型的方法解决类如地形地貌的表现问题,处理能力非常有限。 静态、单时相空间数据组织与管理,限制了分析决策事务的实现。GIS延续了地图处理的模式,只能处理单时相的空间数据,虽然可以有一定的地域分析处理能力,但对于涉及空间数据挖掘,例如切片、钻取等以探索动态的变化趋势寻求发展规律等分
17、析决策事务显得无能为力。 空间数据尺度割裂,单一比例尺数据处理,不同尺度空间数据的互动关系弱。比例尺是地图的基本属性,GIS沿袭处理地图的模式,只能进行单一比例尺空间数据的处理,甚至将为地图出版而进行的地球表面投影平面化处理结果作为空间对象存储的基础。不同尺度的空间数据之间基本上没有互动关系,同时,也将长期以来困扰地图处理的许多问题带入了GIS。 基本上以系统为中心,不同系统之间壁垒比较分明,数据共享与服务共享困难。在三十多年的时间里,形成了许多GIS软件,他们在不同的环境中独自发展,有自己的文化背景、领域背景和技术背景,形成了自己的数据模型和功能组织结构。虽然在功能闭包和问题描述能力方面大同
18、小异,但实际操作上差别甚大,加上内部空间数据组织互相保密,形成了不同的壁垒,为数据共享和服务共享增加了许多困难。 影像数据管理与处理能力弱,跟不上大规模快速数据获取技术的发展。目前,大部分GIS软件处理矢量空间数据的能力较强,但影像数据的处理能力很弱,空间实体的识别和处理几乎不能自动进行。影像数据在GIS中基本上只能起到表面覆盖和场景渲染的作用,没有两者之间的互动关系,形不成一体化处理的能力。 空间事务处理组织能力弱。由于对空间实体之间的关系缺乏完整的描述框架,在GIS空间数据模型与组织方面存在不少问题,事务处理时空间实体的封锁粒度甚难把握,基本上采用图层封锁的办法,难以组织有效的原子事务和嵌
19、套事务机制,直接影响了GIS复杂应用的操作难度。2、原因初探上述问题的出现有其必然的原因。总的说来,一是GIS理论与软件技术发展的历史较短,作为一类应用软件,技术发展往往滞后软件主流技术一段时间;二是空间数据和空间关系相当复杂,缺乏完善的模型,其组织和处理要比目前大多数应用软件困难得多,其中许多方面目前还没有找到有效的方法。就具体原因而言,主要表现在以下几个方面: 处理方式停留在面向过程,而不是面向问题。主要表现在缺乏形式化的模型表达手段,涉及空间数据处理的程序综合研究甚少,提供的工具以面向过程为主。 多用户条件下空间数据的同步处理机制尚未形成,由于空间数据结构的复杂性,实现上使用了大量的指针
20、类型,在跨机参数传递上存在许多困难,不仅不能实现真正意义上的协同工作,甚至连传统意义上的RPC也没有实现。 空间数据模型与组织面向地图,而不是面向客观存在的空间实体及其时空关系。在GIS中,作为一个整体的地球表面被人为地分割成许多相对独立的经投影变换后的平面部分,引起了一系列处理上的困难。 空间数据与属性数据的联系薄弱,仅仅通过标识码实现,难以体现复杂的时空关系,适应管理但不适应分析与决策。 影像数据的数据结构问题研究不够,整体存储存储的方式手段过于简单,基本上无法建立有效的索引机制,导致矢量、影像数据之间无法建立有效的联系手段及互动关系。 虽然用商用DBMS管理空间数据,但空间数据查询能力不
21、强,空间数据和属性数据的联合操纵能力弱。 不同尺度空间数据之间基本上没有联系,缺乏相互之间的互动机制。 各类标准缺乏。第四代地理信息系统及其发展思路综上所述,目前GIS软件仍然是Tomlinson型的,基本上只适用于地图处理,由于许多关键技术尚未突破,目前IT领域中许多行之有效的处理机制与实现技术还没有在GIS软件中得到充分体现。随着GIS应用领域的不断拓展,现有的设计思想、体系结构和数据组织已经不适应应用发展的要求。尽管地图长期以来是我们认识空间世界的一种主要且有效的工具,但确实存在着许多固有的缺陷。GIS为我们提供了全新的管理、使用空间信息的手段,随着人类获取数字化空间数据的手段和能力的不
22、断提高,地图作为空间数据进入GIS系统的主渠道作用将会越来越弱,最终将回归到作为GIS处理、分析结果的表现形式之一。因此,GIS没有必要再受到地图这种表现形式的制约。我们需要的不仅仅是将地图存入计算机,而是要将地球(哪怕是一部分)存入计算机,以空间位置为框架集成各类信息。新一代GIS软件理论和技术必须有一个大的变革,才能适应需要。1、第四代GIS软件的目标第四代GIS软件应该具备支持数字地球(区域、城市)的能力,成为OS、DBMS之上的主要应用集成平台。实现:由二维处理向多维处理的转变;由面向地图处理向面向客观空间实体及其时空关系处理的转变;由以系统为中心向以数据为中心,实现空间数据共享与服务
23、的转变;由管理型向分析决策型的转变。2、第四代GIS软件的技术体系(1) 面向空间实体及其时空关系的数据组织与融合改变以图层为基础的组织方式,实现直接面向空间实体的数据组织;实现不同尺度空间数据的互动;实现矢量、影像数据的互动;实现多维属性与嵌套表组织;实现多源空间数据的装载与融合,支持数据仓库机制;强大的索引机制。(2) 统一的海量存储、查询和分析处理支持TB级以上的空间数据存储;有效的空间、属性一体化管理、查询机制;面向问题的分析、处理手段和工具;以空间数据为基础的数据挖掘;联机事务处理(OLTP)与联机分析处理(OLAP);扩充的、支持空间的“关系”概念与“关系运算”。 (3) 有效的分
24、布式空间数据管理和计算 多用户同步空间数据操作与处理机制; 数据、服务代理和多级B/S 体系结构; 异种GIS系统互连与互操作; 空间数据分布式存储与数据安全; 空间数据高效压缩与解压缩。 (4)一定的三维和时序处理能力 空间数据的增量存储与快速还原能力; 时空数据处理与分析机制; 混合式三维空间数据模型; 快速广域三维计算和显示; 数据空间化。 (5)强大的应用集成能力 有效的遥感、地理信息系统、全球定位系统集成; 强大的应用模型支持能力; GIS与MIS、特别是ERP的有机集成; GIS与OA的有机集成; GIS与CAD的有机集成; GIS与DCS的有机集成;有一定实时能力、微型化、嵌入式
25、GIS与各类设备的集成。(6)灵活的操纵能力和一定的虚拟现实表达多通道用户界面;数据空间化与可视化支持;一定的虚拟现实表达;模型定义语言及其支持机制。3、软件体系结构第四代GIS软件的核心部分是空间、属性数据的组织、管理、操纵、分析、表达以及与其它应用软件的集成接口(包括应用模型定义接口),为了适应分布式处理和互操作的要求,还需要有大量的空间数据处理中间件,制定一系列的数据、服务传输协议。而空间数据的采集、加工与分析结果的制图输出等功能可以作为外围部件,与核心部分 配套。体系结构如下图。(图2.1)用 户 界 面 可视化与虚拟现实表达 应用模型定义接口元 数据 与服 务规 范管 理 应用开发工
26、具与功能接口 分 析、处 理 功 能 部 件 空 间 数 据 模 型 与 组 织 增 量 存 储空 间数 据计 算与 传输 中间 件 操作系统、数据库管理系统及其它系统软件 硬 件 系 统 与 网 络 接 口图2.1这里,空间数据模型与组织是第四代GIS软件的关键,体现了新一代GIS的设计策略和实现方法学;空间数据元数据与服务规范、空间数据计算与传输中间件是系统的两大支柱,保证了GIS软件的开放性和标准化。它们集中体现了第四代GIS技术上的创新与跨越。4、分阶段实现策略第四代GIS软件的研究与开发是我国在这一领域攀登世界高峰重要举措,具有重要的科学意义和巨大的应用前景。这项工作必需取得国家的支
27、持和鼓励,在国家科技计划的统一安排和指导下,动员全国的力量,坚持科技创新和跨越式发展,加强学科交叉,走产业化的道路,有计划、有步骤地进行。完整的第四代GIS软件的实现既涉及理论、方法的研究与创新,需要构建一个新的理论体系,又需要有许多关键实现技术的突破,还需要工程化的软件实现,从而形成新的技术体系和新的产品,具有很高的难度,决不是可以一蹴而就的事情。因此,要抓住空间数据模型与组织这个关键,实施重点突破的方针,逐步完善各项机制,用渐进的方式实现第四代GIS软件的最终目标。2.2 现代IT与第四代GIS软件现代计算机技术,特别是软件技术的发展十分迅速,为解决各类计算机应用问题提供了有力的手段。但是
28、,由于空间数据及空间实体相互关系的复杂性以及GIS设计思想和体系结构上的局限性,虽然GIS软件也在努力地跟上IT主流技术的发展,也取得了许多有意义的进展,但相当一部分现代软件技术至今没有能够在GIS软件实现中得到有效的使用,导致许多空间信息的应用问题无法或很难得到满意的解决。OPENGIS就当前GIS软件发展提出了地理信息的抽象规范1,但没有就其中的软件实现技术展开深入的讨论和研究。结合IT技术的发展和空间数据获取技术的快速发展以及GIS日益旺盛的应用需求,认真分析GIS软件在设计思想和体系结构方面存在的问题,求得合理的解决途径是一件相当紧迫的事情。2.2.1GIS的分布式计算技术网络技术,特
29、别是Internet技术的发展和普及应用,传统的计算机应用解决方案基本上都依赖于网络与分布式计算。分布式计算环境(DCE)技术已经成熟,作为商品软件被广泛地使用。在此基础上,多数领域应用软件系统已经成功地实现了C/S、B/S结构,无论在系统规模、处理能力、维护代价和使用方便等方面都有了十分明显的进步。一般来说,实现分布式计算,其中关键的技术实现方式之一是远程过程调用(RPC)3。RPC实现模型如图2.2。 调用端 服务端 Server Stub Client Stub 应 用 程 序参数打包结果解包参数解包结果打包 服 务 程 序 Hex和in 网络 核 心 核 心 网络图2.2 RPC实现模
30、型对每一个RPC,在调用端和服务端分别有一个辅助模块(Stub),放在各自的程序库中,在服务端还有一段相应的服务例程。应用程序执行RPC,实际上相当于用本地方式调用相应的Stub,后者将要求的服务名及有关参数打包成消息,通过核心发送至服务端并等待结果回送;消息到达服务端后,相应的Stub将消息解包,根据要求调用本地相应的服务例程,服务例程执行结束后将结果返回Stub,Stub再将结果打包成消息并通过核心发送到调用端;调用端相应的Stub将结果解包并返回给应用程序,从而完成整个过程。这里,所有的工作都是隐式进行的,从用户角度看,调用远程过程就和调用本地过程一样。当然,当多个RPC同时到达服务端时
31、,服务端需要配备相应的队列管理机制来管理服务请求,有序地进行服务。对GIS软件来说,空间数据的RPC不仅是空间数据分布式计算的基础技术,也是不同GIS系统之间互操作(除了操作规范以外)的主要实现技术。同时,空间RPC也是分布式协同工作的重要基础。实现空间RPC的难点在于两个方面。首先,为了直观,往往在调用端需要有图形的显示作参考,例如在图形上进行编辑,用户是依据图形而不是依据空间实体的内部名进行操作,然后由系统转化为RPC进行远程修改。由于空间数据结构和空间实体之间关系的复杂性,同一个空间实体可能是多个其它实体的组成成分。如图所示,节点a既作为一个实体,又是多个线段、弧和多边形的组成成分,a位
32、置的变化将涉及多个多边形、弧和线段形状的变化。首先,参数的传递成了一个复杂的问题,除了实体名的传递外,还可能需要拓扑关系的传递。解决这个问题就要求空间实体不仅在图廓范围内的唯一名,还要求在全库范围内的唯一名(实体可能移出图廓),拓扑关系可以放在服务端维护,利用数据库的触发机制作相应的修改。显然,空间数据在文件系统中存储的方式将难以实现上述要求。而如何在空间数据库中存放并高效地查找和重建拓扑关系问题必须解决,高效的、动态的索引机制必须建立。 a a 空间实体及关系 其次,为了保证多用户同步关系,RPC应该作为一个“事务”来处理,这里就涉及空间实体的封锁机制。显然,加锁不能只涉及实体本身,而且应该
33、遍及与它相关的空间实体。考虑到RPC可能嵌套,这样,多个RPC就可能造成空间实体循环上锁而出现死锁的现象,问题将变得更加复杂。另一方面,空间数据的“两阶段递交”机制必不可少,必须引起高度的重视。除了上述问题,RPC的执行还可能引起空间实体的增减和相应属性数据的变更(如引起相交、切割等),必须进行适当的处理以保证数据的完整性和一致性。当然,这些问题过于复杂,不可能完全自动实现,但必须引起高度重视,制定合理的规则,同时建立适当的机制,提供相应的手段。地球上80%以上的信息都与其空间位置有关,GIS软件应该成为在OS、DBMS之上的重要应用集成平台,在一套空间数据上集成多个应用系统的情况需求强烈。G
34、IS的分布式计算能力、互操作能力上的弱势已经成为应用的瓶颈,为了有效地扩充GIS的计算能力,上述问题是难以回避的。所有这一切都要求GIS软件的空间数据组织与存储结构发生大的变革,以适应分布式计算的需要。第四代GIS软件首先应该是一个分布式空间数据计算的平台。它必须针对空间数据的特点,解决多用户环境下的同步操作机制,实现空间数据修改的UNIX语义,即“任一用户对空间数据的修改都应为其他用户所可见”;它必须提供空间数据处理事务的定义、组织和实现机制,从而允许用户在其支持下组织协同工作的环境;它必须提供一系列远程空间数据计算的手段,包括空间数据中间件和一致的空间实体定义、命名和操作等。只有这样,才能
35、与主流应用软件的体系结构和技术实现接轨,才能成为名副其实的应用集成平台。2.2.2结构化的空间数据查询语言实现分布式计算的另一种方式是使用跨机的查询语言。传统的DBMS对所管理的结构化数据提供了结构化的查询语言SQL,可以方便地在全库范围内进行查询,OBDC的出现还允许实现跨计算机的、不同数据库的互操作。从而实现了更高级的、面向问题的计算方式,使用分布式SQL已经成为分布式计算的一种重要的底层实现技术。但是,传统的GIS软件对空间数据的处理是面向过程的。即使使用商用的DBMS来存放与管理空间数据与属性数据,甚至将他们存放在同一个数据库中,通常也是把空间数据与属性数据作为相对分离的存储实体来对待
36、;虽然也定义了具有一定空间数据处理能力的查询语言,但数据操纵能力较弱,应用的组织也很不方便。因此,设计一种统一处理空间数据与属性数据的结构化查询语言十分必要。空间结构化查询语言,有时也称G/SQL或S/SQL。第三代GIS已经实现了利用商用的DBMS管理空间数据与属性数据,这就需要用一种统一的工具来操纵这两类数据,并在此基础上实现分布式计算。但是,这种一体化的查询语言目前还处于比较初等的阶段,对复杂的空间数据计算表达能力还不够强,还不能满足实际应用的需要。G/SQL的关键技术之一是空间算子集合的设计5,希望空间算子集合尽可能完备,具有强大的描述能力。通常,空间算子又包括空间关系谓词和空间函数两
37、个大类。其中,空间关系最值得注意的是拓扑关系和方向关系,拓扑关系描述空间实体之间的邻接、包含、叠置等在平移、缩放、旋转变化下保持不变的关系,方向关系则涉及空间实体之间的序。目前,空间谓词主要集中在拓扑关系的表达,基于九交叉模型,可以得到多达512种拓扑关系,目前通常从中选取8种(相离、外接、相等、交叠、包含、包含于、内接、内接于)关系建立空间谓词;对于方向关系,尚未建立适当的谓词。空间函数则作用于空间实体,更确切地说是几何体上,通过量测、变换等手段得到数值或新的几何体。目前实现的空间函数有:一元空间函数作用于点的空间函数:取点的X坐标与Y坐标。作用于曲线的空间函数:计算曲线的长度;计算线的斜率
38、;求曲线的第一个点;求曲线的最后一个点。作用于多边形的空间函数:计算多边形面积;计算多边形周长;计算多边形最小外包矩形;计算多边形质心计算多边形内部某点;取多边形的所有线段。作用于点、曲线、多边形的空间函数:计算缓冲区。二元空间函数计算两个几何体之间的最短距离;计算两个面状几何体(交)叠置的结果;计算两个面状几何体(查)叠置的结果;计算面状体被线段切割后的左部;计算面状体被线段切割后的右部;计算线、面相交后线段的面内部分。显然,这些空间函数功能的覆盖范围有限,特别是集合运算的能力更加有限,不能满足应用要求。G/SQL涉及的关键技术还包括扩充的、支持空间的“关系”及其运算和操作。在传统的GIS中
39、,空间实体与关系是一对一的,即空间关系O = 。但为了有效地处理空间数据库的连接操作,特别是在以GIS为基础的多种应用集成环境中,在查询过程中应该允许建立临时的扩展的空间型“关系”,即允许一个空间数据结构对应多个属性表。即扩展的空间型关系X_O = 。不仅如此,还要解决“嵌套表”的定义和操作来满足多种类型的集成需要。由此,数据库的基本操作应该加以扩充,不仅需要扩充操作的类别,还需要扩充操作的语义。空间数据库的基本操作应该包括关系型选择、空间型选择、关系型连接和空间型连接。关系型选择作用于基于关系成分R上,得到新的关系R,进而得到连接表L,用L过滤S,得到S的子集S。空间型选择作用于空间成分S上
40、,得到新的S, 进而得到新的连接表L, 用L过滤R,得到R的子集R。关系型连接作用于空间型关系O1和O2上,得到新的关系R3,进而得到新的连接表L3,用L3过滤S1和S2,得到S1和S2的子集S1和S2。空间型连接作用于空间型关系O1和O2上,可能得到S1和S2的子集S1和S2,进而生成新的连接表L3,用L3过滤R1和R2的全连接,得到新的关系R3;也可能得到包括两个源空间数据结构的某些组合信息的新的空间数据结构S3,同时生成新的连接表L3,用L3过滤R1和R2的全连接,得到新的关系R3。目前G/SOL存在的更关键的问题是以空间数据的查询与属性数据查询的不对称性,空间对象之间的关系与空间数据的
41、操作只能局限在当前图廓之内。这无疑将极大地限制了查询的范围,成为查询的瓶颈,这就需要对空间数据模型和存储组织进行彻底的改革,这无疑是第四代GIS软件应该集中解决的问题。不仅如此,一体化的空间查询语言还应该支持用自定义的数据类型及其操作,支持可加载的查询优化和执行模块,支持可变的数据组织和索引结构。所有这些,这些都是第四代GIS软件需要研究的问题。2.2.3以空间数据为基础的数据挖掘技术数据挖掘,就是从大型数据库的数据中提取人们感兴趣的知识6,也就是说,数据挖掘的过程实际上就是在一些事实或观察、测量数据中寻找模式的决策过程。数据挖掘一般分为三个阶段,即数据准备、挖掘操作和结果表达与解释7。数据准
42、备包括数据集成、数据选择和数据预处理等工作,其目的是:归并和清洗数据以解决语义的模糊性,辨别需要进行分析的数据集合以缩小处理范围,回避或缩小由于挖掘工具的局限性对挖掘质量的影响等。数据挖掘包括产生假设、选择工具、挖掘操作和结果证实等步骤。数据挖掘有多种分类方法,包括总结规则挖掘、特征规则挖掘、关联规则挖掘、分类规则挖掘、聚类规则挖掘、趋势分析、偏差分析、模式分析等,可以在原始层次上,也可以在高层次上或多层次进行数据挖掘,常用的挖掘技术包括人工神经网络、决策树、遗传算法、最近邻技术、规则归纳、可视化分析等。结果表达与解释是对提取的信息进行分析,分离有价值的内容并用各种方式交给决策者或决策工具8。
43、在传统的计算机应用领域里,数据挖掘的技术已经日趋成熟,并得到了广泛的应用,有助于人们透过现象认识本质,从浩瀚的数据海洋中发现趋势和规律,从而进行科学的决策,发挥了十分重要的作用。空间数据挖掘是从空间数据库中抽取隐含的知识、空间关系以及其它非显式地包含在空间数据库中但以别的模式存在的信息,供用户使用。一般来说,空间数据挖掘可以分为三个层次,传统式,以属性数据为操作对象进行挖掘,将挖掘结果通过图形和其它可视化的方式显示出来;空间式,以地理空间数据为操作对象进行挖掘,将挖掘结果通过图形、表格或其它方式表示;混合式,以地理空间数据和属性数据的结合体为操作对象进行挖掘,将结果用各种方式加以显示。由于在空
44、间数据组织模型方面的缺陷,目前的GIS软件和空间数据库还不能有效地支持这三个层次的数据挖掘。通常,空间数据库可以表示为:空间数据库 = 这里,属性表是对空间实体特性的非空间特性描述,表示成通常的关系数据表形式,其连接对象是空间实体,在数据库中表现为地理空间数据结构;地理空间数据结构包括空间实体的组成部分(也是空间实体)、组成关系和位置数据,按照目前空间数据的组织模型,地理空间数据结构的层次为:图集 图层 空间实体;连接关系则表示空间实体与属性表的连接关系,目前连接关系R 仅仅通过标识码一种简单的方式。传统式空间数据挖掘的挖掘操作及技术与通常的关系型数据的挖掘并无二致,即在A上进行挖掘操作,挖掘结果将得到新的属性数据表A。进而提取出有用的信息,由此形成规律或知识。传统式空间
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届广西桂林阳朔中学高一上数学期末预测试题含解析
- 文库发布:胆固醇课件
- 2026届上海市华师大第一附属中学高二数学第一学期期末综合测试模拟试题含解析
- 医疗数据安全与隐私保护的区块链路径
- 胃的奥秘课件
- 胃癌日语课件
- 医疗数据合规:区块链零信任架构适配策略
- 肿瘤课件内容
- 医疗数据区块链存证的法律效力与安全验证
- 医疗数据加密技术的合规应用与优化
- 湖北省鄂东南省级示范高中教育教学改革联盟2026届生物高二上期末复习检测试题含解析
- 科睿唯安 2025-年最值得关注的公司:蛋白质降解剂-使针对“不可成药”靶点的精准干预成为可能
- 2026年广东省春季高考模拟数学试卷试题(含答案解析)
- 中孕引产护理查房
- 公交司机服务规范与技能提升培训
- 福建省龙岩市龙岩北附2026届化学高一第一学期期末综合测试试题含解析
- 血透室护理组长竞选
- 2025年国家开放大学《市场调研方法与实践》期末考试参考题库及答案解析
- 水电解制氢设备运行维护手册
- 2025-2026学年部编版八年级数学上册期中考试试卷及答案
- 实验室生物安全评估报告模板
评论
0/150
提交评论