已阅读5页,还剩49页未读, 继续免费阅读
(地图制图学与地理信息工程专业论文)地理格网参照下的空间数据集成方法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 随着g i s 的社会化发展,空间数据共享已成为一种必然要求。然而要真正 实现空间数据共享,空间数据集成是一个亟待解决的问题。只有在空间数据集成 问题得到比较好的解决后,才会对其他诸如数据共享、数据分析等提供数据基础。 不同的数据依附在不同的空间范围上,缺乏共同的空间基底,无法整合集成 实现共享,从而难以满足社会各方面的应用需求。要解决这一问题,实现一体化 应用,就需要一个统一的空间基底平台,以实现不同数据的集成融合,从而实现 空间信息资源的充分共享和协同。另外,在目前的空间数据组织方式下,实现大 范围的地理空间分析统计操作的自动化水平和速度还有待于提高,需要一种新的 数据表达方式来改变这种情况。地理格网的提出和相关研究工作的开展,正是基 于这样的需求而进行的。 在深入研究空间数据集成相关理论及已有成果的基础上,分析了地理空间数 据的特征、差异和组织方式等,介绍了地理格网系统的概念及地理格网的划分与 编码,提出将地理空间数据格网化的思想,旨在以地理格网作为空间基底实现各 种空间数据的集成,为空间分析操作提供新的思路。本论文主要探讨了地理格网 参照下的空间数据集成方法,包括矢量与栅格数据的集成、多源空间数据集成、 时间多尺度空间数据集成、不同性质区域的空间数据集成等。针对林业专题数据, 以格网单元为“桥梁”,阐述了社会专题数据到格网单元归划集成的方法,实现 林业区划信息与行政区划信息的集成。 关键词:地理格网;空间数据集成;四叉树;面积内插 w i t ht h ed e v e l o p m e n to fg i ss o c i a l i z a t i o n ,s p a t i a ld a t as h a f i n gh a sb e c o m ea n i n e v i t a b l er e q u i r c m e n t b u tj no r d e ri or c a l j z ec h es h a r i n go fs p a t i a ld a t a ,s p a c i a ld a t a i n t e 掣a t i o ni sas e r i o u sp m b l e m i tc a np m v i d ed a t ab 私ef o rd a t es h 撕n g 卸dd a t a 狮a l y s i so n i yw h e nt h i sp m b l e mi sw e l lr e s o l v e d d i 虢r e n td a t aa d h e r e n t t oo nd i 仃e r c n ts p a c es c o p e ,锄dt l l e yl a c ko fau n m e ds p a c c f u n d u s s os h a r i n gc a nn o tb ea c h i e v e d ,a i l di ti sd i f ! f i c u l tt om e e t t h e 印p l i c a t i o n n e e d so ft l l ec 伽m u n j t y t bs o l v el h j sp r o b l e m ,w en e e dau n 墒e ds p a c cf l l n d u s p l a t f o mt oa c h i “et h ei n t e 铲a t i o n0 fd i 骶r e n td a t ai i io r d e r t oa c h i e v ef i i l is h a r i n g a i l ds y i i e r g i e so fs p a t i a l i n f o 加a t i o nr e s o u r c c s i na d d i t i o n ,b e c a u s eo ft h el o c a l i z a t i o n o ft h eo 唱a l l i z i n gm o d eo fs p a t i a ld a t a ,t h el e v e lo fa u t o m a t i o na n ds p e e di sl i m i t e d a n dh a sy e tt ob ei m p r o v e dw h e nw ed og e o s p a t i a la n a l y s i s s ow en e e dan 6 w p r e s e n t a t i o nw h i c hc 柚c h 柚g et h i ss i t u a t i o n f i r s to fa u ,t h i s p a p e rs u m m a r i z e d t h et h e o r i e sa b o u tt h es p a t i a ld a t a i n t e 伊a t i o nt e c h n o l o 酉e s , d i s c u s s e dt h ec h a r a c t e r s锄dt h e o 曜a n i z a t i o n o ft h e g e o s p a c ed a t a t h e ni tf 色t c h e do u tt h ec o n c e p to fg e o g r i dr e f 色r e n c es y s t e m ,a n d i n t m d u c e di t sd i v i s i o na n dc o d i n g f u r t h e 衄o r e ,t h ea u t h o rp u tf o r w a r d st h et h o u g h t o fg e o s p a t i a l i n f o m a t i o n ,t h e 争i d sc a i ib er c g a r d e da sas p a t i a lf i l n d u sp l a t f o 珊t o i n t e 掣a t ea uk i n d so fs p a t i a ld a t a ,a l l di tc a no 圩e ran e ww a yt 0d os p a t i a la n a l y s i s f i n a l l y , t h em e t h o d so ft h eg r i d b a s e ds p a t i a ld a t ai n t e g m l i o na i ei m p l e m e n t e d , i n d u d i n gt h ev e c 幻ra n dr a s t e rd a t a ,m u l f j _ r c s o u r c cs p a c j a ld a t a ,d j f f e r c n ts c a l ed a t a a n dh e t e m g e n e i t ya r e ad a t a 1 1 h i sp a p e r t a k e si n f b m a t i o no ff o r e s ta sa ne x a m p l e , e x p l a i n st h em e t h o do fi n f o 唧a t i o ni n t e 掣a t i o nf r o ms o c i a ls p e c i a ld a t at o 孕i dc e l l s i h e nt oa d m i n i s t r a t i v ed i s t r i c t s t h eg r i dc e l l sc a nb ea st h eb r i d g eo fk i n d so f i n f o n n a t i o n k e y w o r d s :g e o g r i d ;s p a t i a ld a t ai n t e g r a t i o n ; q u a d t r e e ;m e a l i n t e r p o l a t i o n 论文独创性声明 本人声明:本人所呈交的学位论文是在导师的指导下,独立进行 研究工作所取得的成果。除论文中已经注明引用的内容外,对论文的 研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本论 文中不包含任何未加明确注明的其他个人或集体已经公开发表的成 果。 本声明的法律责任由本人承担。 论文作者签名:马瘢仇沥占年占月,2 日 论文知识产权权属声明 本人在导师指导下所完成的论文及相关的职务作品,知识产权归 属学校。学校享有以任何方式发表、复制、公开阅览、借阅以及申请 专利等权利。本人离校后发表或使用学位论文或与该论文直接相关的 学术论文或成果时,署名单位仍然为长安大学。 ( 保密的论文在解密后应遵守此规定) 论文作者签名:马疵韫 导师签名 扣6 年占月,2 日 弘嘭年6 月胁日 i 1 问题的提出 第一章绪论 2 0 世纪8 0 年代初期地理信息系统( g e o g f a p h i ci n f o 咖a t i o ns y s t e m ,g i s ) 技术被引入到国内,纵观近2 0 年g i s 技术的发展历程,可以总结为以下三个阶 斟1 3 l : ( 1 ) 图形数据建库阶段( 1 9 8 3 1 9 9 3 年) 。主要进行地理信息系统概念的 理解、消化、本土化和计算机的辅助制图方面的工作,基本清理制图目的的数字 化和建库分析目的的图形数字化的区别;以沿海发达城市为试点,探索了基础地 理信息数据库建设的技术标准、方案,并逐步推广至内陆地区,建成了一批城市 级的空间数据库。 ( 2 ) 部门信息化阶段( 1 9 9 3 2 0 0 2 年) 。在数据库建成并投入应用的基础 上,各部门结合自身的办公业务需要,研制开发空间数据库辅助下的办公自动化 系统,提高本部门的信息化水平和办事效率,仍然从发达地区城市起步,逐渐辐 射到中西部地区。 ( 3 ) 数字城市阶段( 2 0 0 3 年目前) 。信息时代的悄然莅临,潜移默化地 影响人类的思维和生活方式,人们越来越习惯整体认知客观世界,全面思考事物 演变的规律,希望掌握更丰富的信息资源。城市作为一个精神财富和物质财富相 对集中的社会活动场所,她的管理者和决策者毫无例外地需要丰富、全面、准确 的信息才能科学管理、高效运营、正确应对各类突发事件。通过数字城市建设可 以将城市的各种数字信息及各种信息资源加以整合并充分利用,从而为规划和管 理者的规划、决策和管理活动提供服务。 由于在地理信息系统发展的第一、第二阶段有明确的业务部门对信息化提出 具体要求,虽历经曲折,终结硕果累累。然而,当步入第三阶段,由于受部门利 益、业务的条块分割和目标落实不到位等因素的制约,各部门信息共享和集成的 问题尚未得到有效解决。 地理空间信息资源只有被充分共享和广泛使用,才能实现其最大价值。随着 地理信息系统在各行业、部门的深入应用,空间数据的需求量日益增大。然而, 由于应用目的不同,不同的部门往往采用各自的空间数据标准、数据模型和特定 的分类分级体系进行地理信息的重复收集。这不仅造成了人力、财力的巨大浪费, 还引发了空间数据的多语义性、多时空性、多尺度性以及数据模型与存储结构的 差异等,使得各部门之间的数据难以共享,地理空间信息的支撑作用得不到充分 发挥,国民经济和社会信息化工作开展困难。要改善这种局面,实现资源共享, 关键是实现地理空间数据的有机集成。 当前,我国空间信息的应用已经走向为政府决策服务阶段,综合利用各类空 间数据进行信息深度处理与加工,将促进空间信息资源更好地为国民经济建设服 务。在国民经济和社会发展中,空间信息的有效应用有着十分重要的意义。如何 才能实现空间数据的简化、定位的方便,以便于与其他信息相关联? 我们需要一 种新的方法来管理、整合、分析空间数据。基于地理格网参照系的空间数据集成 方法,为上述问题提供了一个有效的解决方案。 1 2 研究目的和意义 据有关部门统计客观现实世界中8 0 的信息与空间数据有关系,也就是说众 多专业信息均是有空间分布的,同时随着科学技术的进步和社会信息化发展的要 求,地理空间信息在社会管理中所起的作用也日益明显和重要,决策者和管理者 要求掌握全面的信息从而做出正确的决策。遥感及其它数据获取技术的应用使地 理空间数据量迅速增加,内容和形式的多元化已成为地理空间数据存在的特征; 需解决的问题复杂化、涉及的内容领域多样化,要求使用多种数据源,而且每种 数据获取时的存储格式也不尽相同,同时空间数据的尺度也不尽相同。因此,空 间数据的集成是我们所面临的重要的问题。只有在空间数据集成问题得到比较好 的解决后,才会对其他诸如数据共享、数据分析等提供数据基础。 空间数据集成是一个十分广泛的概念与技术,涉及到空间数据的方方面面。 不同的数据依附在不同的空间范围上,缺乏共同的空间基底,无法整合集成、实 现共享,难以满足社会各方面的应用需求,更缺少在集成基础上有专业深度的数 据挖掘。要解决这一问题,实现一体化应用,就需要一个统一的空间基底平台, 以实现不同数据的集成融合,达到空间信息资源的充分共享和协同。地理格网的 提出和相关研究工作的开展,正是基于这样的需求而进行的。 例如长江流域的范围是如此界定的。长江流域的自然分界线,北以巴颜喀拉 山、西倾山、山民山、秦岭、伏牛山、桐柏山、大别山、淮阳丘陵等与黄河和淮 河流域为界;南以横断山脉的云岭、大理鸡足山、滇中东两向山岭、乌蒙山、苗 岭、南岭等与澜沧江、元江( 红河) 和珠江流域为界;东南以武夷山、石耳山、黄 山、天目山等与闽浙水系为界:长江源头地区的北部以昆仑山与柴达木盆地内陆 水系为界:西部以可可西里山、乌兰乌拉山、祖尔肯乌拉山、尕恰迪如岗雪山群 与藏北羌塘内陆水系为界;南部以唐古拉山与怒江流域为界:长江三角洲北部, 地形平坦,水网密布,与淮河流域难以分界,通常以通扬运河附近的江都至拼茶 公路为界:长江三角洲南部以杭嘉湖平原南侧丘陵与钱塘江流域为界。 而长江流域地区中的社会专题信息却又是分别以行政区、人口普查区、林业 区等各自的一个社会划分范围为单元。以行政单元等社会划分获取的数据虽然在 分析社会、经济数据时具有一定的优势,但与其它统计单元结合进行定量分析时 工作量较大,不易发展数学模型。实现各种信息的集成融合就比较困难,那么我 们就可以把自然划分和社会划分的空间信息归划到统一的格网单元上去,根据实 际需要空间单元任意组合的数据表达方式,来实现地理空间信息的有效组织,完 成基于要求区域的数据分析。地理格网成为地理空间信息的载体,即作为共享的 空间基底。 1 3 论文的组织结构 以地理格网参照下的空间数据集成方法为核心,本论文组织结构如下: 第一章:绪论。指出了目前不同行业和部门在信息共享和集成方面出现的问 题,从而引出空间数据集成的必要性。 , 第二章:空间数据集成技术。从空间数据集成的概念出发,分析了地理空间 数据研究理论依据及研究现状。 第三章:地理空间数据的特征和组织。对地理空间数据来源、特征及差异等 进行了分析讨论。讨论了当前几种空间数据组织方式及存在的问题和局限。 第四章:地理格网参照系的基本理论。由地理格网的基本概念入手,分析了 格网和栅格的区别。在此基础上提出了地理格网系统的分级与编码,并对数据格 网化方法进行研究。 第五章:地理格网参照下的空间数据集成方法研究。主要研究了地理格网参 照下的矢量数据与栅格数据的集成、多源空间数据的集成、时问多尺度空间数据 的集成,并以林业专题数据为例讲述了以地理格网为空间基底的不同性质区域的 空间数据集成。 第六章:地理格网参照下的空间数据集成应用分析。包括土地利用变化和 g d p 格网空间化模拟方面的应用。 第七章:结论与展望。总结本文的主要工作和研究成果,并提出今后需要进 一步研究的问题,对后续研究工作进行展望。 2 1 数据集成的概念 第二章空间数据集成技术 “集成”的思想源于中国古代儒家学说,孟子日:“孔子,集之大成也”。 孔庙的主体建筑“大成殿”即含有“集成”的意思。现代意义上的集成概念最初 体现在1 9 6 1 年出现的集成电路。英国拉夫堡大学w e s t o n 教授对于集成有一个很 简洁的定义:“集成是将基于信息技术的资源及应用集聚成一个协同工作的整 体”,“集成包含功能交互( f u n c t i o n ) 、信息共享( i s ) 和数据通信( d c ) ”。 简单地说,集成( i n t e 掣a t i o n ) 的意思是指通过结合分散的部分形成一个有机整 体。地理空间数据集成的说法很多,根据其侧重点可归结为以下几类:g l s 功 能观点,认为数据集成是地理信息系统的基本功能,主要指由原数据层经过缓冲、 叠加、获取、添加等操作获得新数据集的过程;简单组织转化观点,认为数据 集成是数据层的简单再组织,即在同一软件环境中栅格和矢量数据之间的内部转 化或在同一简单系统中把不同来源的地理数据( 如:地图、摄影测量数据、实地 勘测数据、遥感数据等) 组织到一起;过程观点,认为地理空间数据集成是在 一致的拓扑空问框架中地球表面描述的建立或使同一个地理信息系统中的不同 数据集彼此之间兼容的过程;关联观点,认为数据集成是属性数据和空间数据 的关联,如e s r i ( 1 9 9 0 ) 认为数据集成是在数据表达或模型中空问和属性数据 的内部关联;d a v i dm a r t i n ( 1 9 9 3 ) 认为数据集成不是简单地把不同来源的地理 空间数据合并到一起,还应该包括普通数据集的重建模过程,以提高集成的理论 价值。1 9 】 从逻辑上分析,数据集成是不同来源、格式、特点性质的地理空间数据逻辑 上或物理上的有机集中。有机是指数据集成时充分考虑了数据的属性、时间和空 间特征、数据自身及其表达的地理特征和过程的准确性。 由此,我们认为地理空间数据集成是对数据形式特征和内部特征作全部或部 分的调整、转化、合成、分解等操作,其目的是形成充分兼容的数据集。因此, 地理空间数据集成可视为对源数据集按照某种特定要求加工、重新组织的过程, 如图2 1 所示。 图2 1 地理空间数据集成机理框架结构示意图 2 2 空间数据集成的类型 在地理空间信息集成应用项目中往往要处理多个数据集,但在计算机物理操 作上,最终要化解为两个数据集之间的操作。两个数据集的差异表现在多个方面。 如果不考虑数据的外部形式,则是比较两个数据集空间、时间、属性、综合度4 个基本要素的差异。其中空间特性包括两层意思,即整个数据集的空间范围和数 据中每个实体的空间位置。两个数据集之间只要有一个有差异则有可能需要集成 处理,每个要素只有两种状态:相同或不同,则数据集成有n = c 2 1 xc 2 1 c 2 1 c 2 1 = 1 6 种基本类型。其中,4 种要素完全相同也作为一种类型,因为在实际应用 中还存在根据其他原因对内容相同数据的取舍问题。从数据集成的类型及实际应 用中的数据集成需求,可以将空间数据集成分为4 大类:区域集成、专题集成、 时间集成和数据综合集成。 ( 1 ) 区域集成指根据一定的区域范围集成各种类型的数据。数据集的空间区 域有多种类型。如自然区域内的流域、地形地貌区、温度带等;人为或人为自 然混合区的行政区、各种规划区、经济区等。该集成类型中又包括若干具体类 型,如同一区域同一数据要素的集成、同一区域不同要素的数据集成。 ( 2 ) 专题集成以要素作为数据集成的主要指标,如植被数据库形成中可能用 到各类大小、时段不同、精度各异的数据集,这类集成也有许多具体类型,如 多子区域同要素的数据集成。大区域尺度数据的获取往往是由各个子区域的数 据拼接而成。由于各自区域的数据来源可能不同,数据的各种参数及质量不尽 相同,处理这种数据时,首先对各子区域的数据集进行各种检测,将子数据集 的各参数、属性、分类标准统一起来;然后对各数据进行接边、归并等处理。 ( :3 ) 时间集成以时间为集成的主体,内容包括多时间尺度的数据集成、时间 序列的数据集成等。这类集成又有许多具体类型,如时间内插数据集成。已有 两个时段的数据集,当需要两数据集时间之间的数据集时,则需要集成处理, 如两数据集分别是2 0 0 3 年和2 0 0 5 年某区域的土地利用数据,当要获取2 0 0 4 年该区域的土地利用数据时,在没有其他数据源的情况下,由2 0 0 3 年和2 0 0 5 年的数据集可以用空问内插方法得到2 0 0 4 年的土地利用空间状况。 ( 4 ) 数据综合集成即综合度差异数据之间的集成,从数据与其表达的地理过 程空间尺度的关系分析即是多空间尺度数据集成。这是数据集成中最为复杂的 一类,当由高精度数据获取低精度大尺度数据时属于数据综合:当由大尺度数 据获取小尺度高精度数据时属于数据细化。 2 3 空间数据集成的理论依据 地理空问信息集成与多个学科、 这里主要就地理空间信息自身存在、 ( 1 ) 统一的空间参照体系 多种技术有关系,其理论依据是多方面的。 内部和外部特征来分析数据集成的依据。 地理空间信息表达的地理实体和过程存在的空间场是统一的,即都是连续地 表空间。对空间的表达有多种坐标体系,如经纬度表示球面坐标、平面坐标等; 但无论以何种形式表达,地理实体之间的拓扑关系( 相对位置) 是不会改变的。 地球表面被大陆和海洋无间隙覆盖着,空间的连续性为地理过程在地球表面的连 续展布提供了基础。 ( 2 ) 地理过程的连续性 地理过程的连续性表现在空间和时间上。空间连续性表现为独立地理过程在 空间上分布的非间断性和同类地理过程个体的连续性,如河流发育过程中对应的 一条河流( 即使是一条很小的支流) 也有属于自己的流域区;并且其流域区在空 间上是靠河流的河道连接起来的连续体;多个河流之间在空间上又是邻接的,如 我国的黄河流域与长江流域在空间上是邻接的。时间连续性表现在任意时刻、时 段的地理过程状况都是整个地学进程中的一个片断,不论时间单位是什么,它们 之间都是连续的,如2 0 0 6 年之后必然是2 0 0 7 年,1 月之后必然是2 月等。 时间和空间上的连续性为地理空间信息特征空间和时间上的拼接、合并、提 取、拆分提供了依据。这种连续性的另一种结果是数据的时间和空间特征在一定 程度上可以转换,这在遥感数据处理中已得到了应用。但当时间部分存在需求欠 缺时,用多大范围或多少空间扩充可以弥补,取决于专题内容本身需求。 ( 3 ) 地理过程的层次等级性 地理过程的层次等级性表现为空问域和时间域上的等级性。空间等级层次性 最明显的表现之一是地理过程在空间上的可分解性,如国家级行政区由省级行政 区构成,省级行政区又有诸多地市级单元构成,然后依次有县、乡、村、组等各 级行政单元。由此可以将要描述的地学现象按类别层次的组织形式表达。 时间上的层次等级性表现为时间在度量上的可分解性,c l i f f o r d ,j 和r a o a 给出了一种时间全域的描述,其中的每个时间单元称为时间域,不同级别的时间 域之间存在继承和组成的关系,如年由月组成和继承;月由日组成和继承;日由 小时组成和继承:时由分、分由秒组成和继承等。 ( 4 ) 认知过程的一致性 地理空间信息的获取过程是作为主体的人对客观世界认知的结果表达。数据 生产者根据自己的经验、知识、数据要求等,借助于数据位置和属性获取工具对 客观世界进行模型表达、模拟、描述、定义、解释等以获得数据的基础材料,然 后对数据材料进行规范化、标准化处理以形成地理空间信息。 影响地理过程空间认知和表达的要素有:内部因素,包括个人的认识能力、 知识背景、感觉限制和态度等;外部因素,如地理过程信息获取工具;表达的媒 体,包括图形、文本资料、直接感知和在环境中的实际观测。 ( 5 ) 地理空间信息透明性 地理空间信息的透明性是在数据集成前用户可以对要集成的对象数据有不 同层次的了解,即数据从形式到内容对用户来说都是透明的,这种透明性是靠地 学元数据实现的。空间数据集成是对作为空间位置、属性和时间整体的地理过程 或地理过程片断的综合处理,数据的透明性为数据集成的预处理和实际的内容集 成奠定了基础。 ( 6 ) 数据形式和内容的相对独立性 数据形式指诸如数据存储格式、存在介质、表达方式等一类的外部特征,内 容指地理空间信息的空间位置、属性、时间、综合度等类的特征。相对独立的 根本原因在于数据形式是数据内容的一种载体,一种外在表现,与数据内容没有 必然的因果关系。这就保证了可以对数据进行诸如格式转换、投影变换、传输、 区域切除、多数据集合并等集成操作而不改变其数据内涵;也可以对数据记录进 行删除、添加、合并、属性归一化等内容处理而保持数据外部形式原有的一致性。 2 4 地理空间数据集成研究现状 地理空间数据集成是在实际需要的基础上逐渐发展的,对其理论方法的研究 也在逐渐成熟中,数据集成研究主要集中在集成基础和数据集成的方法和应用 上。 数据集成基础研究即是研究数据流、功能流在集成要素之间,集成系统各部 分之间的传递,包括数据集成机理及集成过程中诸多专题的研究,如地理空间数 据表达、误差传递及数据质量控制、多尺度数据处理等汹1 。 ( 1 ) 数据集成机理研究是对集成各环节中处理各类问题的理论、方法及规则 的研究。它是以地学认知为前导,以地学规律、推理为主体内容、以计算机网络 , 和集成软件平台为载体的数据处理过程。 ( 2 ) 误差传递研究及数据质量评价与控制关于误差形式、传递、消减方法及 不确定性的描述表达,已有大量的文献进行描述,并形成了适于某些应用领域的 方法,但地理空间数据集成中的误差不是简单的图形问题,它与地学过程本身有 一定的联系。 ( 3 ) 多尺度数据处理数据尺度往往与数据精度有关,但基于数据自身的精度 与尺度的描述则没有明确的标准,虽然许多学者已对该问题进行了深入的研究, 但仍无法确定在一定精度上要用多少个中间点构成的线来描述一条河流以及 条河流小到什么程度便不用表示出来等。因而尺度问题在一定程度上只能用类似 于制图概括方法处理。 ( 4 ) 地理空间数据表达数据表达指如何用计算机来表达地理客观世界的等级、 层次特征及多种性质的空间实体,其关键问题是计算机如何识别处理不同层次数 据之间的联系,从这种意义上说数据表达也是数据多尺度处理的内容。 ( 5 ) 其它问题数据集成还涉及到数据集成价值、分布式地理空间数据库的使 用、权限、收费等问题( d a v i dr h i n d ,1 9 9 2 ) ,这些方面也需要有可操作的标准 和方法。 在实际工程中,美国地质调查局已于2 0 0 1 年提出了国家制图计划”1 。该计 划的目标是构建一个覆盖全国范围的标准统一、能够持续更新的基础地理空间数 据库,向用户提供无缝的、全国一致的、现势的、高精度的正射影像、高程数据、 水文数据、交通数据、人文信息、土地覆盖数据、地名数据等。美国国家制图计 划的产品是国家地图,它是描绘地球表面和定位要素的公共基础信息集,是一个 与其他公共或私有数据链接的平台。该计划的实施,将对美国经济和社会发展起 到巨大的推动作用:首先,它使基础地理空间数据能够很方便地实现和其他数据 的整合和共享( 整合即采用匹配、合成、链接等方法,将多尺度的基础地理数据、 基础地理数据与非基础地理数据、基础地理数据与其它专业部门地理数据集成起 来,形成新的空间数据集) ,令空问数据的使用更加方便,并保持了数据的一致 性,增加了数据的兼容性,允许不同格式文件之间的转换,使私人企业、非政府 组织和普通大众都能使用这些数据,最大限度地满足全社会对基础地理空间信息 的需求。其次,由于它能迅速提供高精度的基础地理空间数据,从而使政府能够 对紧急情况作出迅速反应,提高决策水平。第三,它为用户提供了一个可以进一 步延伸和扩展的基础数据平台,用户可以将其他数据和国家地图进行整合,以满 足自己的需求。目前,其中部分数据集成问题已得到解决,但是时态和跨比例尺 问题尚未得到很好的解决。 在英国大约有5 0 0 多个地理空间数据库,并且其数据质量要高于一般国家。 但这么丰富的资源分布在全国各地不同的系统中,用户了解很少。为解决这个问 题,英国军械测量局2 0 0 0 年初提出了数字国家框架计划( d i g i t a ln a t i o n a l f r a m e w o r k ) 。建设d n f 的主要目的是:向全国各行业提供权威的、一致的、可维 护的数据框架,便于用户选取所需的地图信息,并将军械测量局的地理框架数据 与自己的数据融合起来。d n f 由国家格网和国家地形数据库构成,它通过赋予每 个要素一个唯一的可维护的标识码,来定义现实世界中存在的每个地理要素。 1 0 第三章地理空间数据的特征和组织 3 1 地理空间数据来源 空间数据是指与空间位置和空问关系相联系的数据。g i s 的应用使地理空问 数据的内容在逐渐增加,如社会经济统计数据,现已被g i s 接收。把自身与地 理位置或区域有关,而按非地理空间数据存贮和管理的数据处理转换为地理空间 数据的过程称为地理空间数据化。在一些发达国家如美国已通过各种途径来加速 这一进程。另一方面,高科技的发展也拓宽了地理空间数据的来源。地理空间数 据的来源多种多样,大致可分为: ( 1 ) 地图数据因为地图包含着丰富的内容,不仅含有实体的类别和属性,而且 含有实体间的空间关系。地图数据主要通过对地图的跟踪数字化和扫描数字化获 取。 ( 2 ) 实测数据通过野外实地测量获取的数据,如由水文测量站测得的河流含沙 量。用这种方法得到某些典型或主要空间实体和地学过程的数据可以补充其它方 法获取的数据。 ( 3 ) 试验数据模拟地理真实世界中地物与过程特征产生的数据,它们表示在特 定条件的实际状况,如农业试验站获取的各种数据,可以近似表达某区域中大气 土壤一植被系统运作状况。实验数据和实测数据的结合使用效果较好。 ( 4 ) 遥感与g p s 数据由航空、航天各种设施获取的数据,特别是卫星影像数 据获取、处理发展很快。今后,遥感数据将成为地球空间数据的主要来源之一。 g p s 可以准确获取地物的空间位置,它已逐渐成为其它地理空间数据源的订正、 校准手段。g p s 、r s 、g l s 的一体化使用是地理空间数据获取和成功的实现的 个方向。 ( 5 ) 理论推测和估算数据在不能通过其它方法直接获取数据的情况下,常用有 科学依据的理论推测获取数据。另外,对于一些短期内需要,但又不能直接测量 获取的数据如洪水淹没损失等常采用有依据的估算方法。 ( 6 ) 历史数据指历史文献中记录下来的关于地理区域及地理事件的各种信息, 这类信息在中国是十分丰富的,它对于建立序列地理空间数据是很宝贵的。 ( 7 ) 统计普查数据有空间位置概念的统计数据通过与空间位置关联或其它处 理,可以转换为地理空间数据。普查方法获取的数据比统计数据更准确,普查涉 及经济、社会、自然环境各方面,如人口普查、工业普查、农业普查、自然资源 调查等。 3 2 空间数据的特征 空间数据除了具有一般数据的基本特征之外,还具有一些区别于其他数据的 特性。构成空间数据的特征主要有: 1 、空间性 这是空间数据最主要的特性。空间数据描述了空间地物的位置、形状和大小 等几何特征,甚至描述地物的空间拓扑关系。例如描述一条河流,一般数据侧重 于河流的流域面积,水流量,枯水期等。而空间数据则侧重于河流的位置、长度、 发源地等和空间位置有关的信息。复杂一点的还要处理河流与流域内城市间的距 离、方位等空间关系。空间性是空间数据区别于其他数据的标志特征。 2 、抽象性 空间数据描述的是现实世界中的地物和地貌特征,非常复杂,必须经过抽 象处理。不同主题的空间数据库,人们所关心的内容也有差别。所以空间数据的 抽象性还包括人为地取舍数据。抽象性还使数据产生多语义问题。在不同的抽象 中,同一自然地物的表示可能会有不同的语义。如河流既可以被表示为水系要素, 如果它与境界共线还可以被表示为行政边界如省界,县界等。 3 、多尺度性 由于空问认知水平、精度和比例尺等的不同,地理实体的表现形式也不同, 因此,多尺度性是地理空间数据的重要特征。在空间数据中多尺度性包括空问多 尺度和时间多尺度两个方面。地理空间数据描述各种尺度的地理特征和地学过 程,不同尺度上所表达的信息密度差距很大。一般来说,尺度变大信息密度变小。 在集成应用地理空间数据并进行综合分析时,大量不同来源的数据通常是不同比 例尺的,必须很好地解决尺度的问题,刁能避免在解决有关问题时因错误地处理 或理解尺度而做出错误的判断和推理。 3 3 空间数据差异分析 已有的地理空间数据集除了表达空间区域的差异外,数据内容表现形式、空 间参考体系、时间表达及数据的整体质量等方面也存在着差异。 3 3 1 空间特征表现差异 指数据空间特征的组织方式、体系的异质,具体表现在: ( 1 ) 坐标体系的差异数据空间位置的坐标系统主要有两种,一种是球面坐标 系统,空间实体位置由经纬度来描述;一种是平面坐标体系,空间实体空间位置 由相对于指定原点的x 、y 坐标对表示。数据集成时要对坐标体系进行归一化转 换。 ( 2 ) 数据投影的差异据美国某地图投影学家的统计,全世界现有2 5 6 种投影 类型【2 1 】,其依据不同的目的和要求采取不同的分类指标进行分类。表3 1 列出了 常见的几种投影类型。 表3 1 投影类型分类 构成方式方向投影面与球面关系变形性质 方位投影正轴投影等角投影 几何投影圆柱投影割投影 圆锥投影斜轴投影任意投影 伪方位投影 非几何投影 伪圆柱投影 切投影 伪圆椎投影 横轴投影等积投影 多圆椎投影 ( 3 ) 数据实体度量单位差异空间特征的度量单位不一致是经常遇到的问题,如 有的以米为单位,有的以英尺、公里为单位。甚至个别数据集采用十米为单位。 ( 4 ) 地理信息空间表征的多重性指不同数据集中对相同空间实体与地学过程表 示途径方式不同。如同等规模的水电站,在相同尺度的不同数据集中,有的用点 表示,有的则用多边形表示。 ( 5 ) 数据结构的差异常用的数据类型主要有矢量和栅格两种类型,它是空间特 征的存贮结构。 ( 6 ) 数据格式差异数据格式是空间特征及其属性特征在数据文件中的组织纪录 方式。每种地理空间数据空间平台只能接受某些特定格式的数据集,以g i s 软 件为基础的数据集成必须考虑数据的格式,并以一种或几种数据格式作为基础格 式以实现数据集成。 3 3 2 属性表现差异 指属性表现形式的异质,具体表现在: ( 1 ) 数据编码方法、原则编码的标准、方法、原则差异,会导致同一种地学 过程其特征码不同,这在数据集成时属性的集成有很多不便,因而地理空间数据 应有国家或是行业标准,并且地学编码要有一定的规则和标准。 ( 2 ) 属性的多重性同一空间实体或地学过程在不同数据集中的属性会有差异。 对于定半量数据,这种现象时常发生,如以级别表示的土壤侵蚀数据,由于分级 标准的差异,或是为了研究特殊地区的需要,同一级别所表示的土壤侵蚀的绝对 值可能有出入。 ( 3 ) 空信息的指代差异空信息( 数据中没有属性的空间特征) 在许多地理空间 数据集成中经常见到,它用于表示一些特殊信息,同一要素数据集中,空信息表 示内容可能不同。 ( 4 ) 属性类型差异不同数据集数据类型可能不一致( 字符型或数字型) 。同一 数据项,如行政区的代码,一个数据集中为整数,另一些数据集中为了操作的方 便可能为字符型。数据集成时要对数据项的类型、字节长度等属性进行一致性处 理。 3 3 3 时间特征表达形式差异 指时间特征处理、使用等差异,具体表现在: ( 1 ) 数据的时间周期差异不同数据集中,地学特征的时间间隔往往有差异,如 某区域的日平均气温数据,有的可能是每天测量4 次得到的平均值,有的则是每 天测量8 次得到的平均值,这种因观测周期不同也产生数据异质。 1 4 ( 2 ) 数据更新差异数据更新也可以认为是数据时间特征的再描述,数据集成必 须考虑数据表达内容发生的时间和数据形成的时间及更新状况,特别是对于变化 比较快的地理特征,如土地覆盖和土地利用、河流含沙量等,更应该注重数据的 时段性。 3 3 4 数据精度差异 精度即是对地学空间过程或现象的抽象表达程度,它对数据的可信度的影响 是显而易见的,不同精度的数据,其可视或可利用的最小多边形级别不同。把较 高精度数据集成到较低精度数据集中可通过数据综合及其它有关规则来使其一 致化,而把较低精度的数据集成到较高精度的数据理论上则可通过数据细化来实 现。 地理空间数据的这些差异是客观存在的,它们是数据集成的主要障碍。有些 差异存在是必然的,有些是可以消除的,数据集成的目的则是消除其差异。 3 4 空间数据组织方式 地理空间数据库所管理的对象主要是地理空间数据,包括空间数据和非空间 数据。地理空间数据库目的是为了使用户能够方便灵活地查询、提取感兴趣的地 理空间数据,同时能够进行有关地理空间数据的插入、删除、更新等操作1 8 j 。 空间数据的组织与管理是指与一定的内部数据结构为基础,通过合理的组织 管理,来实现空间数据的存储与管理,表达空间数据的三个基本特征。经过多年 的发展,空间数据组织方式主要有以下几种:基于文件组织的方式、文件与关系 数据库混合组织方式、全关系型数据组织方式、对象关系数据库组织方式和面向 对象数据库组织方式。 3 4 1 基于文件的数据组织方式 最初的g i s 数据组织是以文件的方式来组织,所有的数据都存储在自行定 义的数据结构与操纵工具的文件中。如图3 1 ,图形数据和属性数据都是通过一 定格式的文件进行组织,图形要素与属性记录之间通过关联字段进行关联。它是 空间数据与属性数据分离存储的方式。早期g l s 一般采用这种方式,如a r 印n f o 软件通过a r c 等图形文件组织空间数据和通过l n f o 属性表文件组织属性信息, 是典型的文件结构型组织模式。 图3 1文件组织方式体系结构 采用文件组织数据的优点是灵活,即每个软件厂商可以任意定义自己的文 件,管理各种数据。但它的缺点也是显而易见的,如数据冗余度太且数据重复情 况普遍、缺乏数据独立性、安全性和完善性无法保障、无法进行文件共享等等。 目前,许多g i s 软件采用文本格式文件进行数据存储,其目的是为了实现 数据的转入和转出,与其它应用系统交换数据。 3 4 2 文件与关系数据库混合组织方式 随着数据库技术的发展及商用数据库管理系统( d b m s ) 的成熟,g i s 也开 始采用数据库技术来组织空间数据,但由于一般d b m s 不适于存储和管理空间 数据。目前大部分g i s 软件采用混合管理模式,即图形数据通过文件方式进行 管理,而属性数据则借助于已有的关系数据库管理系统( r d b m s ) 进行管理, 并通过唯一的标识码i d 建立它们之间的关联,如图3 2 。 图3 2 文件与关系数据库混合组织方式体系结构 3 4 3 全关系型数据库组织方式 这种方式实现将空间图形与属性数据统一用现有的关系数据库来组织管理。 不定长的空间几何体坐标数据以二进制数据块的形式被关系数据库管理,即坐标 数据被集成到r d b m s 中,形成空间图形数据库。关系数据库管理系统的软件厂 商不作任何扩展,由g i s 软件厂商在此基础上进行开发,使之不仅能管理结构 化的属性数据,而且能管理非结构化的图形数据,如图3 3 所示。 图3 3 全关系型数据库组织方式体系结构 目前,关系数据库不论在理论还是作为工具使用,都已经成熟。它们提供 了一致的访问接口( s q l ) 以操作分布的海量数据,并且支持多用户并发访问、 安全控制和一致性检查,此外,通用的访问接口也便于实现数据共享。但是,现 有的s o l 并不支持空间数据检索,需要软件厂商自行开发空间数据访问接口。 如果要支持空间数据共享,则要对s q l 进行扩展。 3 4 4 。对象关系数据库组织方式 随着数据库技术的发展和日益完善,其应用也在日渐普及,如何扩充原有的 数据库,以便实现对复杂的空间数据进行存储,是g i s 界和数据库厂商研究的 热点。o r a c l e 公司在o r a c l e 8 i 以上版本中提供了空间数据选件,定义了操纵点、 线、面、圆等空间对象的a p l 函数,其实质是基于四叉树方法对空间数据进行 描述,0 r a c l e 利用该选件来组织管理复杂的g i s 空间图形数据,属性数据还利用 原有关系型来组织管理,空间数据组织管理模块中提供一些对各种空间对象进行 预先定义的函数,来达到存储空间数据的目的。这样,用户使用时必须满足它的 l7 数据结构要求,不能根据g i s 要求再定义,如图3 4 。 g i s 应用 f lo r t ) b m s i 一 空间数据管理专用模块 ff l 空间数据库i l 属性数据库i 图3 _ 4 对象关系数据库组织方式体系结构 这种扩展的空间对象组织管理效率比二进制的管理高得多,但仍然没有解决 对象的嵌套问题,空间数据结构不能由用户定义,使用上受一定限制。 3 4 5 面向对象数据库组织方式 面向对象模型最适应于空间数据的表达和管理,它不仅支持变长记录,而且 支持对象的嵌套、信息的继承与聚集。 g i s 应用 f io o d b m s i i 数据库访问接口空间模型服务 空间数据库 图3 - 5 面向对象数据库组织方式体系结构 如图3 5 ,如果应用对象数据库组织g i s 数据,则可以扩充对象数据库中 的数据类型以支持空间数据,包括点、线、多边形等几何体,并且允许定义对于 这些几何体的基本操作,甚至稍微复杂的运算,如缓冲区计算等,也可以由对象 数据库管理系统“无缝”地支持。这样,通过对象数据库管理系统,提供了对于 各种数据的一致的访问接口以及部分空间模型服务,不仅可实现数据共享,而且 空间模型服务也可以共享。但由于面向对象数据库管理系统还不够成熟,价格又 昂贵,目前在g l s 领域还不太通用。 第四章地理格网参照系的基本理论 不同的组织方式各有优缺点,但是不管是文件方式还是采用数据库方式、来 组织管理空间数据,在当前数据表达突出实体特征的模式下,面对海量的空间数 据进行空间分析操作时在图形调用和计算速度上都存在着局限性。 因此,一种新的空间数据表达方式呼之欲出。在这种数据表达方式下,在当 前的空间数据管理下能够实现快速的空间分析统计等,这种新的数据组织方法就 是将地理空间信息网格化,以
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025重庆南岸区海棠溪街道办事处公益岗招聘11人备考题库及答案详解1套
- 2025宁波市鄞州区五乡镇人民政府代招村工作人员2人备考题库及答案详解(夺冠)
- 2025年甘肃省白银市靖远县北滩镇选聘专业化管理村文书备考题库含答案详解(综合题)
- 南京银行2026届全球校园招聘备考题库及答案详解1套
- 2025陕西咸阳市秦都区招聘社区专职工作人员230人备考题库附答案详解(基础题)
- 2025广东南粤银行重庆分行招聘备考题库及答案详解(夺冠系列)
- 高空天气预报与航空安全规范
- 个性化营养方案在难治性糖尿病中的应用
- 2025河北衡水市公安局公开招聘警务辅助人员4人备考题库附答案详解(b卷)
- 个性化医疗方案满足跨境游客多元需求
- 药品不良反应报告与监测管理
- 乌龟养龟知识培训课件
- 《传奇歌后邓紫棋》课件
- 【MOOC】研究生英语科技论文写作-北京科技大学 中国大学慕课MOOC答案
- (高清版)DB43∕T 2510-2022 优 质灿稻单品种大米全程生产技术规范
- 沪粤版九年级物理下册全册教案
- 儿科医生进修汇报
- 专题03-隐圆(辅助圆)最值模型
- 《事故汽车常用零部件修复与更换判别规范》
- 华佗古本五禽戏智慧树知到期末考试答案章节答案2024年安徽中医药大学
- 人工全髋关节置换术后脱位课件
评论
0/150
提交评论