(信息与通信工程专业论文)多源遥感影像编目与检索机制研究.pdf_第1页
(信息与通信工程专业论文)多源遥感影像编目与检索机制研究.pdf_第2页
(信息与通信工程专业论文)多源遥感影像编目与检索机制研究.pdf_第3页
(信息与通信工程专业论文)多源遥感影像编目与检索机制研究.pdf_第4页
(信息与通信工程专业论文)多源遥感影像编目与检索机制研究.pdf_第5页
已阅读5页,还剩71页未读 继续免费阅读

(信息与通信工程专业论文)多源遥感影像编目与检索机制研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

国防科学技术大学研究生院硕士学位论文 摘要 随着遥感影像获取技术的发展和g i s 应用的深入,遥感影像日益呈现出多源、 多类型、海量、分布式的发展趋势,分散存储于不同应用部门的遥感影像存在“数 据孤岛”的现象,如何准确定位海量分布式存储的遥感影像成为阻碍遥感影像共 享的难点问题之一。 遥感影像编目技术的出现为解决这一问题提供了解决思路。遥感影像编目技 术就是根据遥感影像的形态特征和内容特征,按照一定的编目规则,编制遥感影 像的不同属性并组织成目录的过程。因此,对影像编目数据的表达方式、存储组 织以及基于编目数据的遥感影像检索算法的研究具有十分重要的理论和实际意 义。 为此,本文对影像编目数据的描述框架、编目模型、存储组织以及检索算法 等关键技术进行了研究,论文主要的研究内容和创新点如下: l 、在对目前国内外先进的空间元数据标准研究总结的基础上,定义遥感影像 编目数据核心内容,进而设计遥感影像编目数据描述框架,同时提出编目数据扩 展的基本原则和方法。 2 、基于遥感编目数据描述框架,设计扩展性良好的遥感影像数据编目模型, 并建立模型扩展机制与编目数据扩展基本原则方法的映射关系。 3 、基于遥感影像数据编目模型,设计高效的,可扩展性良好的编目数据存储 组织方案,以提升遥感编目数据管理系统的检索性能,良好地应对应用需求的变 化。 4 、设计基于编目数据的遥感影像定位检索、定性检索以及组合检索等检索算 法,考虑遥感影像检索中文本信息不能准确描述遥感影像的缺点以及海量遥感数 据分布式存储的发展趋势,分别设计面向内容的遥感影像检索算法以及分布式遥 感影像数据检索算法。 5 、基于本文设计的编目数据存储组织方式,设计实现了一个遥感影像编目数 据管理系统,在该系统中,实现了本文中提出的遥感影像据检索算法,证明了算 法的有效性。 主题词:海量遥感影像;编目模型;分布式;检索 第i 页 国防科学技术大学研究生院硕士学位论文 a b s t r a c t w i t ht h ew i d ed e v e l o p m e n to fr e m o t es e n s i n gi m a g e sa c q u i r et e c h n o l o g ya n dt h e f u r t h e ra p p l i c a t i o no fg e o g r a p h i ci n f o r m a t i o ns y s t e m ( g i s ) ,r e m o t es e n s i n gi m a g e s p r e s e n tt h et r e n do fm u l t i - s o u r c e 、m u l t i - t y p e 、m a s s i v ea n dd i s t r i b u t e dc h a r a c t e r i s t i c s c o n s i d e r i n gt h ei s s u eo fd a t as i l of o rr e m o t es e n s i n gi m a g e ss t o r e di nd i f f e r e n t a p p l i c a t i o nd e p a r t m e n t s ,h o wt oo b t a i ni m a g ee x a c t l yh a sb e c a m eo n eo ft h em o s t d i f f i c u l tp r o b l e m st h a tc o u n t e r a c t i n gd a t as h a r i n gt e c h n o l o g y t h ea p p e a r a n c eo fr e m o t es e n s i n gi m a g ec a t a l o gt e c h n o l o g yh a sp r o v i d e da s o l u t i o nf o rt h i si s s u e i m a g ec a t a l o gi st h ep r o c e s st h a te x t r a c t sd i f f e r e n ta t t r i b u t e so f i m a g ea n dm a k e sad i r e c t o r yb a s e do nt h ec o n t e n to fi m a g ea c c o r d i n gt os o m ec a t a l o g r u l e s t h e r e f o r et h er e s e a r c hf o c u s i n go ni m a g ec a t a l o gd a t ae x p r e s s i n gm o d e ,d a t a s t o r a g ea n do r g a n i z a t i o na n dr e t r i e v a la l g o r i t h mb a s e do nc a t a l o gd a t ah a sg r e a t t h e o r e t i c a la n dp r a c t i c a ls i g n i f i c a n c e t ot h i se n d ,t h i st h e s i ss t u d i e dt h ek e yt e c h n o l o g i e si n i m a g ec a t a l o gd a t a d e s c r i p t i o nf r a m e ,c a t a l o gm o d e l ,s t o r a g ea n do r g a n i z a t i o n ,r e t r i e v a la l g o r i t h m t h e m a i nw o r ka n di n n o v a t i o n sa r ea sf o l l o w s : 1 b a s e do nt h er e s e a r c ho fi n t e m a t i o n a lm e t a d a t as t a n d a r d s ,w ed e f i n ec o r e c o n t e n to fr e m o t es e n s i n g i m a g ec a t a l o gd a t aa n dd e s i g na ni m a g ec a t a l o gd a t a d e s c r i p t i o nf r a m e m e a n w h i l e ,w ep r o p o s ec a t a l o gd a t ae x t e n s i o np r i n c i p l ea n dm e t h o d u n d e rt h i sd e s c r i p t i o nf r a m e 2 b a s e do nt h er e m o t es e n s i n gi m a g ec a t a l o gd e s c r i p t i o nf r a m e ,w ed e s i g naw e l l e x t e n s i b l ec a t a l o gm o d e la n db u i l tt h em a p p i n gb e t w e e nm o d e le x t e n s i o nm e c h a n i s m a n dc a t a l o gd a t ae x t e n s i o nm e t h o d 3 w ed e s i g na ne f f i c i e n ta n dw e l le x t e n s i b l ei m a g ec a t a l o gd a t as t o r a g ea n d o r g a n i z a t i o ns c h e m eb a s e do nt h ec a t a l o gm o d e l ,i no r d e rt op r o m p tt h er e t r i e v a l p e r f o r m a n c eo fr e m o t es e n s i n gi m a g ed a t am a n a g es y s t e ma n dc o p ew e l lw i t ht h e d e v e l o p m e n to fa p p l i c a t i o nr e q u i r e m e n t 4 t h e nw ed e s i g ns o m er e t r i e v a la l g o r i t h m sw h i c hb a s e do ns p a t i a lr e g i o n ,d a t a a t t r i b u t e st h r o u g ht h ec a t a l o gd a t a , t h e nc o n s i d e rt h e d i s a d v a n t a g et h a tt h et e x t i n f o r m a t i o nc o u l d n tp r e c i s e l yd e s c r i b et h er e m o t es e n s i n gi m a g ea n dt h et r e n dt h a tt h e i m a g ed a t ad i s t r i b u t e ds t o r a g e ,w ed e s i g nac o n t e n tb a s e dr e m o t es e n s i n gi m a g e r e t r i e v a la n dd i s t r i b u t e ds p a t i a ld a t ar e t r i e v a la l g o r i t h mr e s p e c t i v e l y 5 b a s e do nt h ec a t a l o gd a t as t o r a g ea n do r g a n i z a t i o ns c h e m ew ep r o p o s e di nt h i s p a p e r ,w ed e s i g na n di m p l e m e n ta ni m a g ec a t a l o gd a t am a n a g es y s t e m i nt h i ss y s t e m , w er e a l i z ei m a g ed a t ar e t r i e v a la l g o r i t h m sw h i c hw e p u tf o r w a r di nt h i sp a p e ra n dp r o v e t h eu s a b i l i t yo fa l g o r i t h m s 第i i 页 国防科学技术大学研究生院硕士学位论文 k e yw o r d s :m a s s i v er e m o t es e n s i n gi m a g e s c a t a l o gm o d e l d i s t r i b u t e d 。r e t r i e v a l 第i i i 页 国防科学技术大学研究生院硕十学位论文 表目录 表3 1 空间元数据基本内容1 8 表3 2 遥感影像编目数据基本内容1 9 表4 1 编目对象c a t a l o g o b j e c t 属性信息2 8 表4 2 编目条目c a t a l o g e m r y 属性信息2 9 表4 3 编目对象子类c l a s s i f i c a t i o n 属性信息2 9 表4 4 编目对象子类i d e n t i f i c a t i o n 属性信息:2 9 表4 5 编目对象子类o r g a n i z a t i o n 属性信息3 0 表4 6 编目对象子类q u a l i t y 属性信息3l 表4 7 编目对象子类r e f e r e n c e 属性信息31 表4 8 编目对象子类d i s t r i b u t i o n 属性信息31 表4 9 编目对象子类i n s t r u m e n t 属性信息31 表4 1 0 编目对象子类i n s t r u m e n t 属性信息3 2 表4 1 】编目对象子类m i s s i o n 属性信息3 2 第1 v 页 国防科学技术大学研究生院硕士学位论文 图1 1 图3 1 图3 2 图3 3 图3 4 图3 5 图3 6 图4 1 图4 2 图4 3 图4 4 图5 1 图5 2 图5 3 图5 4 图5 5 图5 6 图5 7 图6 1 图6 2 图6 3 图6 4 图6 5 图6 6 图6 7 图6 8 图6 9 图6 1 0 图6 1 1 图6 1 2 图目录 a r c g i s 元数据的x m ls c h e m a 描述3 f g d c 元数据标准中的子集1 3 n f g i s 完全元数据子集的构成和相互关系17 地理信息共享领域元数据包l8 r s i c d f 基本结构图2 0 遥感影像编目数据扩展模型图2 3 r s i c d f 扩展后覆盖遥感影像元数据草案示意图2 4 e b r i m 元数据信息模型2 6 e b r i m 分类系统结构图2 7 m r s i c m 模型概要设计2 7 编目数据模型逻辑结构图3 4 遥感影像定位检索处理流程3 9 组合检索处理流程4 l 面向形状特征的遥感影像检索系统功能模块图4 5 h p s s 应用系统数据存储量示例4 7 业务部门分工不同导致数据分散4 7 存储网络示意图4 9 分布式空间数据查询用例图4 9 空间编目数据管理系统数据流图5 1 编目数据管理系统逻辑体系结构5 2 编目数据管理系统网络结构图5 3 编目数据管理系统功能模块设计5 4 编目数据维护模块接口设计5 4 编目数据检索模块接口设计5 5 空间数据管理系统主界面5 7 影像数据简单检索5 7 面向内容的遥感影像检索5 8 分布式实验环境5 8 遥感影像数据分布式检索效果图5 9 分布式遥感影像数据检索性能分析5 9 第v 页 独创性声明 本人声明所呈交的学位论文是我本人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表和撰写过的研究成果,也不包含为获得国防科学技术大学或其它 教育机构的学位或证书而使用过的材料与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示谢意。 学位论文题目: 垒婆量壁墅倦缉旦生捡塞扭剑盈窒 学位论文作者签名:d 卫整-日期: 一产 , 月 厂 日 学位论文版权使用授权书 本人完全了解国防科学技术大学有关保留、使用学位论文的规定。本人授权 国防科学技术大学可以保留并向国家有关部门或机构送交论文的复印件和电子 文档,允许论文被查阅和借阅:可以将学位论文的全部或部分内容编入有关数据 库迸行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文 ( 保密学位论文在解密后适用本授权书。) 学位论文题目:垒塑量壁显像翁旦量拴塞扭剑叠壅 学位论文作者签名: 盈拯! ) 日期: 弓 | 年i 1 月,日 每i f a 墨日 国防科学技术大学研究生院硕十学位论文 第一章绪论 1 1课题研究背景 随着遥感影像获取技术的发展,各种新型的传感器不断涌现,遥感影像数据 的类型、级别不断丰富,呈现出多格式、多类型、多尺度、海量以及分布式存储 的特征【l 】。随着社会各领域对信息的需求越来越大,各个部门或机构都建立了针对 应用的不同资源类型、彼此异构的遥感影像库,形成了一个庞大的、分布式的、 异构的、资源类型多样的遥感影像库群,从而导致遥感影像的地理分布与信息共 享需求、信息内容和组织的多样化与信息互操作需求的矛盾日益显著。面对分布 在互联网络中的海量遥感影像数据,“如何找到自己需要的遥感影像的位置? 如 何获取这些影像? 如何理解这些影像? 影像的质量如何? 如何使用这些数据? 等一系列问题接踵而至1 2 1 。因此如何有效管理这些复杂的、异构的、分布式存储的 海量遥感影像数据,以促进遥感影像数据资源的利用、共享、交换和整合,加强 政府部门与非政府部门关于数据收集、数字化处理等事务的合作,已经成为实现 遥感影像数据共享所面临的主要挑战。- 而空间元数据技术的出现为解决上述问题提出了新的思路和解决途径,空间 元数据【3 】对地理空间数据的内容、矢量、条件、标识方式、空间参照系、管理方式 和其他特征进行描述和说明,帮助和促进人们有效地定位、评价、比较、获取和 使用地理相关数据,是对空间特征的概括和抽取,为此,国内外的研究学者以及 研究研究机构纷纷提出了多种空间元数据标准,国际上比较著名的包括美国联邦 地理数据委员会制定的地理空间数据元数据内容( c o n t e n ts t a n d a r d sf o rd i g i t a l g e o s p a t i a lm e t a d a t a ,简称c s d g m ) 标准【4 】【5 1 1 6 7 】【8 】【9 1 以及国际标准化组织i s o 制定 的地理信息元数据( g e o g r a p h i ci n f o r m a t i o nm e t a d a t a ) ) ) 国际标准 1 0 l 11 1 【1 2 】( i s o 1 9 1 1 5 :2 0 0 3 ) 等,国内比较著名的包括国家基础地理信息系统( n f g i s ) 元数据标 准【1 3 】以及国家标准地理信息元数据 1 4 】等,这些标准无一例外地对空间元数据 的内容进行了分类,并加以归纳,此外,对于不同的行业也存在针对行业应用的 行业元数据标准,如测绘行业推出的基础地理信息数字产品元数据等【l 川,众 多元数据标准的编制形成标准不统一的现状,为地理空间数据的理解、使用和共 享增添了新的难度,阻碍了空间信息共享的深入实施。 面向海量的遥感影像数据和众多的行业元数据标准以及不同的应用需求,不 同影像元数据标准之间的互操作、海量遥感影像数据的检索算法以及影像元数据 的高效存储组织方式已经成为了许多学者研究的热点问题。 第1 页 国防科学技术大学研究生院硕士学位论文 1 2 课题研究现状 随着影像数据的爆炸式增长,遥感影像数据的分布式存储已经成为解决海量 遥感影像数据存储管理的必然发展趋势,目前国际上比较著名的海量遥感影像数 据管理系统也多采用分布式存储组织的方式,同时由于遥感影像数据的分布式存 储,不同的数据存储部门采用不同的元数据内容描述本部门存储的遥感影像数据, 由此造成遥感影像数据理解和使用上的困难,因此研究分布式海量遥感影像的统 一描述方法以及检索算法是具有十分重要的理论价值和实际意义。 1 2 1e o s d i s 地球观测系统e o s j 6 】( e a r t ho b s e r v i n gs y s t e m ) 是美国航空航天局( n a s a ) 制定的一项综合性地球观测计划,是以增进对球变化的认识,预测地球系统变迁 为科学目的,对陆地、海洋、大气层、冰雪圈以及生物之间的相互作用进行系统 化的综合观测。这个“星地 一体计划包括e o s 科学研究计划、e o s 空间系统、 e o s 地面系统三个方面,n a s a 地球观测系统数据信息系统e o s d i s ( d a t aa n d i n f o r m a t i o ns y s t e m ) 属于e o s 地面系统范畴,主要负责地球科学数据存档、产品 制作和分发。 e o s d i s 的设计宗旨【1 7 l 是有利于e o s 研究机构对e o s 资料的充分利用、向用 户长期提供可信度高的观测资料,通过n a s a 的9 个下属的分布式数据存档中心 实现数据共享。2 0 0 6 年5 月的统计数据表明,n a s ae s e 已存有超过4 9 p b ( 1 p b = 2 1 吁b ) 的各类数据,包括9 个航天器及外场试验中的2 2 个仪器观测数据,产品 类型多达1 7 8 6 个,每天新增4 5 t b 的数据,每天分发2 5 t b 数据给各类用户。 n a s a 庞大的地球观测系统数据信息系统e o s d i s 有9 个下属的分布式数据 存档中心d a a c t 博j ( d i s t r i b u t e da c t i v ea c h i e v e dc e n t e r ) ,分别负责制作地球观测 系统观测得到的各类各级数据产品,并进行存档管理,为不同研究领域的用户提 供各具特色的数据产品、数据信息和数据使用工具等方面的服务。 e o s d i s 系统包含的科学数据共有三类,即产品、辅助数据和元数据。产品是 指所有e o s 卫星的产品:辅助数据是产品的属性数据,用作产品描述和加工;元 数据是关于数据的数据,在此用于产品和辅助数据的目录、清单描述。每个分布 式数据存档中心遵从统一的元数据标准,进行元数据交换和管理。 在e o s d i s 系统中,所有的数据通过e o s 元数据信息交换站【1 9 】f 2 0 】( e o s c l e a r i n gh o u s e ,e c h o ) 进行统一管理。e c h o 的主要目的是通过中央集成数据库, 把n a s a 分布式数据存档中心所有数据的元数据信息进行集中管理,只存放元数 据而不存放数据,面向用户提供统一的元数据信息查询,帮助用户定位所需数据。 第2 页 国防科学技术大学研究生院硕士学位论文 c l e a r i n gh o u s e 是一个可查询的信息目录,它覆盖所有参与信息共享的地理区域, 为用户提供了对相关地理信息进行查询、发布等操作的工具。这个信息目录包含 的不是数据本身,而是关于数据的信息,即元数据。同时c l e a r i n gh o u s e 又是一个 虚拟信息空间,在这里,存放了所有地理数据的元数据,客户端通过查询元数据 来搜寻和定位感兴趣的地理信息。 1 2 2e s i ua r c g i s 作为世界上应用最广泛的g i s 软件之一的a r c g i s 2 1 】,是美国环境系统研究所 ( e n v i r o n m e n t a ls y s t e mr e s e a r c hi n s t i t u t e ,简称e s r a d 开发的新一代软件,是一个全 面的、完善的、可伸缩的g i s 平台。a r c g i s 支持矢量数据、属性数据、栅格数据 ( 遥感影像、航摄影像、图片、d e m ) 、三维地形数据等,其对海量数据的存储与管 理及多用户的并发访问性能在国内外都得到了很好的验证和考验。在a r c g i s 中, 元数据可以和数据集一起存储,也可以单独存储,通过外部链接和数据集相连。 元数据通过创建和共享,可以提供给其他人查询。因此参考a r c g i s 的编目数据模 型将有助于我们的研究工作。 a r c g i s 的元数据标准规范构建于f g d c 和i s ot c 2 l l 国际元数据标准之上, 通过向国际元数据标准中添加与e s r i 数据格式及软件相关的标准,实现自动管理 和更新元数据记录的信息,完成对国际元数据标准的扩充。 a r c g i s 元数据的x m ls c h e m a 描述如1 1 所示: 图1 1a r c g i s 元数据的x m ls c h e m a 描述 第3 页 国防科学技术大学研究生院硕士学位论文 在存储组织方面,a r c g i s 通过将使用x m l 形式表达的元数据以b l o b 对象 的形式作为底层数据表中的一条记录插入到相应的元数据表中,完成对编目数据 的存储管理。 1 2 3 研究现状优缺点 面向遥感影像数据的日益增长,分布式存储已经成为必然的发展趋势。如何 准确定位遥感影像数据已经成为制约影像数据共享的主要问题之一。目前,国际 国内上著名的海量空间数据管理系统以空间元数据作为空间数据的索引项,完成 分布式空间数据的检索。针对遥感影像元数据的表达方式,大部分都是使用x m l 文件的形式描述,国内比较著名的g e o s t a r 则采用关系数据表的形式描述空间元数 据复杂的层次结构【2 2 1 ,由于关系数据表已经被证明在表达结构化的空间元数据方 面具有明显的不足【2 3 1 ,因此x m l 已经成为空间元数据的主流表达方式,然而x m l 数据在进行检索时,必须首先知道索引项的路径,若索引项路径未知,则对x m l 使用检索项进行遍历操作,一定程度上影响了空间元数据检索灵活性及性能。因 此迫切需要设计一种空间元数据存储组织方案,它既能继承x m l 的扩展性,又能 提供较好的检索灵活性和性能。同时,目前各大公司以及部门机构构建的海量遥 感影像数据管理系统在系统设计时,根据不同的应用需求采用了不同的影像元数 据标准内容实现,由于不同影像元数据标准内容对同类地物或者属性的认识、表 达和处理也不可能做到完全一致,容易导致同名数据异义或同义数据异名等交叉、 模糊甚至冲突的情况。因此,设计一种统一的遥感影像编目数据描述框架,并建 立相应的扩展原则、方法和映射机制,成为解决上述问题的一种可行性办法,值 得进一步研究。 1 3 论文的研究意义、研究内容与组织结构 1 。3 1 论文的研究意义 面向海量遥感影像数据分布式存储的发展趋势,以及不同部门或机构采用的 影像元数据标准内容不统一的现状,本文尝试以一种具有良好可扩展性的统一的 遥感影像编目数据描述框架,描述分布在不同部门或机构中的遥感影像数据,并 提出相应的编目数据扩展原则和方法,为实现不同部门、机构之间的遥感影像数 据共享提供了新思路;其次基于该编目数据描述框架,提出遥感影像数据编目模 型,设计具有良好扩展性的编目数据存储方案,使之能较好地应对系统的发展和 用户需求的变化;然后基于编目数据,设计并实现了遥感影像数据的定位检索、 定性检索以及组合检索等简单检索算法,同时为了解决遥感信息检索中文本信息 第4 页 国防科学技术大学研究生院硕士学位论文 无法准确描述遥感影像以及分布式空间数据检索的问题,分别设计了面向内容的 遥感影像检索算法以及分布式空间数据检索算法;最后将上述研究内容应用于某 空间数据管理系统中,取得了良好的性能,证明了这种解决思路的可行性,因此 本文的研究工作具有非常重要的理论和应用价值。 1 3 2 论文的研究内容 l 、研究现有的国内外元数据标准,定义遥感影像编目数据核心内容,设计遥 感影像编目数据描述框架,制定描述框架下允许的编目数据扩展原则和方法,并 举例说明遥感影像编目数据描述框架的扩展方法。 2 、基于遥感影像编目数据描述框架,设计面向多源遥感影像数据的编目模型, 研究模型的扩展机制与方法:以应对将来系统的发展与用户需求的变更为目的, 设计具有良好可扩展性的编目数据存储组织方案。 3 、基于遥感影像数据编目模型,设计面向影像数据的定位检索、定性检索以 及组合检索等检索算法,同时为了解决遥感影像检索中文本信息难以准确描述遥 感影像的问题以及遥感影像数据分布式存储的发展趋势,本文设计了面向内容的 遥感影像检索算法以及分布式影像数据检索算法。 4 、基于本文提出的编目数据存储组织方案,设计遥感影像编目数据管理系统, 并对影像数据检索算法进行了验证。 1 3 3 论文的组织结构 第一章,绪论。首先阐述了论文的研究背景与国内外研究现状,然后介绍了 论文的研究意义、研究内容。 第二章,遥感影像编目数据相关概念与技术。分析了遥感影像编目数据中所 使用的相关概念以及技术,通过对空间元数据以及x m l 技术的介绍,为后续研究 的展开打下了理论基础。 第三章,遥感影像编目数据描述框架。通过对国内外各种先进的空间元数据 标准和遥感元数据标准的研究,定义了遥感影像编目数据包含的核心内容,提出 了具有良好可扩展性的统一的遥感影像编目数据描述框架,并以f g d c 提出的遥 感影像元数据标准草案为例,对基于编目数据描述框架的扩展方法进行了说明。 第四章,遥感影像编目数据存储管理技术。基于本文提出的遥感影像编目数 据描述框架,设计具有高可扩展性的多源遥感影像数据编目模型,并针对编目数 据的存储组织技术进行了研究,提出了一种具备较好编目检索性能,同时又具有 良好可扩展性的存储组织方案。 第五章,基于编目数据的遥感影像数据检索技术。基于本文提出的编目数据 第5 页 国防科学技术大学研究生院硕士学位论文 相关内容,设计了基于编目数据的遥感影像定位检索、定性检索以及组合检索等 算法;同时考虑基于文本查询不能正确解释遥感影像数据的缺点以及目前遥感影 像数据分布式存储的特点,分别设计了面向形态特征的遥感影像检索算法以及分 布式影像数据检索算法。 第六章,基于编目数据的影像数据管理系统设计。设计基于编目数据的影像 数据管理系统的整体架构以及逻辑结构,并以原型系统验证的方式对第五章提出 的影像数据检索算法进行了验证。 第七章,总结与展望。总结全文的主要工作和研究成果,并指出进一步研究 方向。 第6 页 国防科学技术大学研究生院硕士学位论文 第二章遥感影像编目数据相关概念与技术 2 1 空间元数据 2 1 1 空间元数据概念 元数据( m e t a d a t a ) 被概括地定义为“关于数据的数据 ,即关于数据的内容、 质量、状况和其他特性的信息。它在人们的社会生活中以多种形式存在,例如文 件卷宗、图书卡片、用户手册、地图图例等等,而以计算机能够处理的数字数据 形式存在的元数据又有许多种不同的存储格式,分为非结构化( 如纯文本) 和结 构化格式( 如s g m l 、x m l 等) ;出于不同的应用范围和目的,存在各种不同类 型的元数据,如网络资源元数据、图书书目信息元数据,政府定位信息元数据等 等。 元数据为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法, 帮助数据生产单位有效地管理和维护数据;提供通过网络对数据进行查询检索的 方法和途径,以及与数据交换和传输有关的帮助信息;帮助用户了解数据,以便 就数据是否能满足其需求做出正确判断;提供有关信息,以便用户处理和转换接 受外部数据;提供给数据生产单位数据存储、数据分类、数据内容、数据质量等 方面的信息【2 4 】【2 5 】。 综上所述,空间元数据就是在地理信息中用于描述与事务地理空间位置相关 的地理数据集的内容、质量、表示方式、空间参考、管理方式以及其它特征的数 据,它具有实现地理空间信息的有效管理和合理共享的双重目的【2 引。对于数据生 产者,通过提供空间元数据,及时发布有效的地理空间元数据,最大限度地利用 已有地理空间数据;对于各级空间数据交换中心而言,则根据数据生产者提供的 空间元数据,实现地理空间信息的准确定位,最终完成空间数据共享的目的;对 用户而言,空间元数据则为各级数据用户提供了有效的空间数据查询检索途径, 方便他们了解已有的地理空间数据集,协助他们选择符合应用需求的地理空间数 据,从而有力促进地理空间数据的共享。 2 1 2 空间元数据作用 在不同的地理信息系统中,地理空间数据的数据存储格式不同,针对不同的 应用和不同学科的用户,所关心的空间数据属性也不尽相同,空间数据不具有互 操作性,一旦空间数据离开了它的存储和开发环境,就难以被理解和识别,数据 的使用者甚至不能准确获知数据集的内容。随着空间数据量的增加和空间数据的 第7 页 国防科学技术大学研究生院硕士学位论文 分布式存储,空间数据的管理和应用遇到了一些新的问题,例如:随着数据生产 人员的变换以及时间的流失,后期接替该工作的人员会对先前的数据了解甚少或 一无所知,这样便对先前数据的可靠性产生了质疑;面向海量的空间数据,用户 缺乏查询空间数据的有效工具,无法获知在何处能够找到他所需要的数据;缺乏 空间数据的描述性文件信息,用户无法知道如何获取所需数据;而当空间数据不 符合具体应用需求时,不知道如何理解和转换数据。 而空间元数据用于辅助地理空间数据,可以帮助数据生产者、管理者以及消 费者解决上述问题。因此元数据的主要作用如下: 1 ) 协助数据生产者有效组织、管理和维护空间数据 数据生产者指进行采集、生产与加工处理空间数据的用户。这类用户主要使 用元数据信息进行数据的生产、加工、更新、归档等工作。通过空间元数据内容, 数据生产者可以充分描述数据集的详细情况,以更加方便的方式嘴直数据的生产、 更新、加工与增值服务,不仅便于数据生产资料的管理与维护,而且为数据生产 与更新提供科学的决策与依据。这样可保证即使其主要工作人员调离,仍然对过 去生产的数据集有较为全面的了解,这样可以实现对数据集的维护、更新,保护 了数据生产者对数据的投资。 2 ) 为空间数据的发现和获取提供信息 随着社会各领域对空间数据的需求越来越大,单个的组织和机构很难满足各 领域的数据需求,因此往往需要多个组织和机构联合提供符合用户应用需求的空 间数据,而只有通过根据数据集的相关元数据建立数据目录服务器或者空间信息 交换中心,用户才可以在相关工具的帮助下发现和获取需要的数据。通过空间元 数据的标识信息可以准确地识别、定位空间信息,确定地理空间数据的存在性及 其位置;通过空间元数据关于数据交换网络及数据销售等方面的信息,确定获取 地理空间数据的方法和途径,从而为用户快速定位满足应用需求的空间数据提供 了必要的信息和方法。 3 ) 为空间数据的使用提供信息 通过元数据详细地描述数据集的相关结构信息,可以帮助用户更好的使用数 据,并为实现数据集间的共享和互操作以及数据挖掘工作提供必要的信息。通过 空间元数据的数据分类、数据内容、数据质量等信息,确定地理空间数据的方法 和途径;通过空间元数据了解空间数据的数据格式、数据存储以及空间参照系等, 便于地理空间数据的转换;通过空间数据还可以确定地理空间数据的使用方法等。 4 ) 建立空间数据的目录索引 地理空间元数据最重要的特征之是具有目录索引的作用。通过空间元数据, 数据管理人员可以用最核心的、最少的信息提供对海量空间数据的管理与维护, 第8 页 国防科学技术大学研究生院硕士学位论文 以方便用户共享;同时有助于用户识别数量巨大、种类繁多的空间数据,是帮助 用户快速定位到其感兴趣的数据的导航器。 2 1 3 空间元数据特点 空间元数据既有空间数据本身的描述信息,又包含空间数据的空间信息和时 间信息,是空间数据和普通属性数据的结合体。因此,它除了具有普通数据的选 择性、可靠性、实践性、完备性、详细性和综合性的基本特征外,还具有如下特 占 2 r 1 ,” l 、空间性。这是空间元数据的重要特征,它描述了空间数据的位置,指定了 空间数据之间的空间拓扑关系【2 引,构成了空间数据空间推理的基础,完成对空间 数据的空间查询和空间分析。 2 、复杂性。空间数据描述的是现实世界中的地物和地貌特征,非常复杂,必 须经过一定的处理,才能获取人们感兴趣的信息。针对不同的应用,数据用户所 关心的内容也有差别。因此,空间数据的元数据项因数据处理系统和人们关心的 内容的不同存在差别。 3 、大容量性。空间元数据不仅包括普通文本数据,在必要的时候还要包括浏 览的图像数据,这会导致空间元数据量剧增,同时由于目前空间数据日益海量的 发展趋势,也会导致作为描述信息的空间元数据的数据量剧增。 4 、多元、多尺度性。空间数据按照数据类型、空间数据获取等不同方式可划 分为不同的类型,同一类型的数据有可能由不同的空间分辨率和时间分辨率,因 此生成的空间元数据也存在多种数据源和多种尺度。 5 、永久性。空间元数据是对空间数据性质和质量进行描述的结构化信息,可 以作为空间数据的目录和摘要信息,空间元数据的丢失会严重影响数据用户对空 间数据的理解和使用,因此需要永久保存。 2 2x m l 技术 标准通用置标语言( s t a n d a r df o rg e n e r a l i z e dm a r k u pl a n g u a g e ,简称s g m l ) 被 首先引入空间元数据表达领域 2 9 l 。s g m l 用一种不受机器和软件类型限制的方法 标识文档内容,主要手段是将标识符号嵌入到原文内容信息中,以产生有用的格 式信息。其产生的标识具有很好的逻辑性和层次性,使信息元素的管理更符合人 们的思考方式,便于阅读和理解,同时其结构性可以自然体现元数据标准中复合 元素和数据元素间的层次关系或依赖关系,因此得以广泛应用。如美国联邦地理 数据委员会的地理空间元数据标准就是基于s g m l 格式的,很多g i s 软件厂商处 第9 页 国防科学技术大学研究生院硕士学位论文 理元数据的模块也都支持元数据的s g m l 格式输出、输入与交换。由于s g m l 体 系庞大,语法复杂,一般用户难以在短期内熟练运用其表达空间元数据。可扩展 标志语言x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) 作为s g m l 的一个子集【3 0 】,在继承 s g m l 可扩展性、结构性及可校验性的同时,具有更精简的内核结构,使用方便、 灵活,为解决元数据表达所面临的问题提供了崭新的思路。 x m l 是一种网络通用语言,有独立的、预定义的语言标识,同时也允许用户 定义自己的标识【3 1 1 。因此不仅可用于空间元数据的精确表达,而且可为异构系统 之间的元数据交流提供有效的方法。x m l 功能强大,完全能够胜任空间元数据的 表达【3 2 】。 采用x m l 表达空间元数据,可以方便地实现空间元数据的查询。信息的结构 化程度是与查询的效果成正比的,x m l 在信息的组织上结构性较强,基于x m l 的查询语言同时支持结构化和半结构化的查询。用x m l 表示的数据在不知道具体 的d t d 或x m ls c h e m a 时,可以认为是一种半结构化的数据,因为可满足x m l 规范,具有一定的结构性。当用户知道元数据的具体结构时,可以直接构造查询 语句来进行查询【3 3 1 。 用x m l 进行数据表达时,信息内容与信息表示是分开的。同时x m l 对于数 据转换有很强的支持,利用x s l t 技术在对相互的信息定义和结构的了解的基础 上,可定义相应的样式文件来让x s l t 处理器做相应的转换工作,同时在输出元 数据时,可根据用户的需要将系统中的元数据信息按照某种格式来输出。 同h t m l 一样,x m l 也是网络上的通用语言。但x m l 并不是一个独立的, 预定义的标识语言,它是一种语言,是用来描述其它语言的语言。它允许用户定 义自己的标识。h t m l 是一种预定义的标识语言,它只是在一类特定的文件中定 义了一种描述信息的方法,随着w e b 应用的不断深入和拓展,h t m l 逐渐在日益 增长的网络设计需求面前呈现出难以扩展、交互性差、语义模糊等弱点【3 4 1 。而x m l 能允许你在不同的文件中定义你自己设计的标识语言。它的目标是允许普通的 s g m l 在w e b 上以目前h t m l 的方式被服务、接收和处理,要求易于实现,并且 可以在s g m l 和h t m l 之间互相操作。 因此x m l 具有以下特点【3 5 】: l 、自描述性,x m l 的每个数据项都有自己的元素类型名称,也就是标签, 并且允许自定义元素的标签,因此标签可以包含丰富的语义信息; 2 、平台独立和应用无关的,x m l 的文档内容是基于u n i c o d e 的文本,适 用于网络传输; 3 、半结构化,不同于纯文本中的数据,x m l 数据可以用d t d 或者s c h e m a 来规范:但同时x m l 表示的是一种层次性的数据,因此比数据库更适合描述现实 第1 0 页 国防科学技术大学研究生院硕士学位论文 中的数据; 4 、机器可处理的,相对于完全无规则的文本,计算机很容易处理x m l 文档。 同时相对于无法标识语义的h t m l 文档,计算机比较容易理解x m l 文档的语义, 并且这种可读

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论