




已阅读5页,还剩69页未读, 继续免费阅读
(计算机软件与理论专业论文)元数据catalog服务系统框架的研究与设计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 随着计算机网络技术和数据库技术的迅速发展,i n t e r n e t 上存在着数量非常 庞大的地理信息资源。然而,这些地理信息资源仍然面向特定行业和依赖于特 定的支撑环境。它们分布在各种各样的数据库中,并存储成多种格式,属于不 同的个人和组织。如何在网络上获取和有效地使用这些地理信息资源,避免地 理信息资源的重复性建设,以及协调不同部门之间的资源共享就成为目前急需 解决的问题。 本论文提出了一个地理信息资源c a t a l o g 服务系统框架,用于解决基于 i n t e r n e t 的地理信息数据资源和服务资源的元数据管理,从而实现地理信息资源 的共享和数据交换。该系统框架一方面可以为c a t a l o g 服务系统提供总体软件结 构,同时也为c a t a l o g 服务系统的实现提供了种种支持。c a t a l o g 服务系统实现 了如下几个功能:元数据查找、元数据管理、作业管理和索引管理。其中元数 据查找是系统的核心部分。 c a t a l o g 服务系统是一个信息注册中心,用来对描述地理信息资源的元数据 进行统一管理。用户通过将网络上的地理信息资源的元数据注册到c a t a l o g 服务 系统的元数据库中,并利用该服务提供的查询接口就能获取所需要的地理信息 资源的元数据,基于这些元数据导航到地理信息资源,完成对地理信息资源的 访问,从而实现地理信息资源共享和数据交换。 c a t a l o g 服务系统框架是借鉴了已有的元数据系统成功的经验,以o p e n g i s 规范为基础进行设计的,并实现与基于z 3 9 5 0 协议的元数据系统的互操作:该 服务系统框架提供一种专门的结构化的查询语言o g cc o m m o n 语言,利用该 语言可支持包含空间几何类型和空间运算的查询条件,支持多种标准的元数据 格式,并可由用户动态修改所支持的元数据标准;同时,它还提供了基于网关 和基于自身的两种分布式的查询方式。 c a t a l o g 服务系统框架一个显著的特点是对x m l 的支持:元数据在表达、 转换、查询和存储等方面都与x m l 紧密结合的。首先,元数据是以x m l 文档 的形式进行显示,用一个x m ls c h e m a 文档描述一种元数据标准并用来约束元 数据的格式。同时,以x m l 文档形式存在的元数据查询策略是基于查找核心 北京工业大学硕士学位论文 元素的结构化查询。而且元数据的存储策略是将查找核心元素从x m l 文档提 取并存储在关系数据库中,然后将整个x m l 文档存储在一个域段或文件系统 中。 最后在c a t a l o g 服务系统框架以及元数据处理技术的基础上实现一个 c a t a l o g 服务系统应用实例c a t 系统,用来验证c a t a l o g 服务系统框架的正 确性、可靠性和正确性。c a t 系统将应用于北京市电子政务的决策g i s 系统中, 实现北京市各部委的地理信息资源的共享,把研究的成果推向实际应用。 关键词:c a t a l o g 服务;地理信息资源;元数据;x m l a b s 仃a c t a b s t r a c t w i t ht h eh i g h s p e e dd e v e l o p m e n to f c o m p u t e r n e t w o r ka n dd a t a b a s et e c h n o l o g y , t o d a y s i n t e m e tc o n t a i n sa l a r g e a m o u n to f g e o r e s o u r c e s h o w e v e r ,t h e s e g e o r e s o u r c e so n l y c a nb e a p p l i e d t oc e r t a i nf i e l d s ,d e p e n do n s p e c i f i e dp l a t f o r m s ,a n d a r ed i s t r i b u t e da m o n g m u l t i p l ed a t a b a s e s ,s t o r e di nm a n yf o r m a t sa n dm a i n t a i n e db y v a r i o u si n d i v i d u a l sa n do r g a n i z a t i o n s t h u s ,t h ep r o b l e mo fh o wt oa c c e s st h e s e g e o r e s o u r c e st h r o u g hi n t e m e t ,h o wt op r e v e n tt h er e p e a t e dc o n s t r u c t i o no f t h e ma n d h o wt oc o o r d i n a t et h es h a r eo ft h e m a m o n g d i f f e r e n td e p a r t m e n t ss h o u l db er e s o l v e d i m m e d i a t e l y t h i sp a p e rp r e s e n t saf r a m e w o r ko fg e o - i n f o r m a t i o nc a t a l o gs e r v i c e s y s t e m , w h i c hi su s e df o rt h ea d m i n i s t r a t i o no ft h em e t a d a t ai ng e o d a t a r e s o u r c e sa n ds e r v i c e r e s o u r c e st h r o u g hi n t e m e t a c c o r d i n gt ot h i s f r a m e w o r k ,t h es y s t e mc a ni m p l e m e n t t h es h a r eo fg e o - i n f o r m a t i o n r e s o u r c e sa n dd a t a e x c h a n g e i na d d i t i o n ,t h i s f r a m e w o r ke x h i b i t sa g e n e r a l a r c h i t e c t u r ef o rt h e c a t a l o g s e r v i c e s y s t e m ,a n d p r o v i d e ss o m eg u i d a n c ef o rt h ei m p l e m e n t a t i o no fi t c a t a l o gs e r v i c es y s t e mh a sf o u r b a s i cf u n c t i o n s :m e t a d a t aq u e r y , m e t a d a t am a n a g e m e n t ,s e s s i o n m a n a g e m e n ta n d i n d e xm a n a g e m e n t t h ef u n c t i o no fm e t a d a t aq u e r yi st h ec o r ef u n c t i o no f c a t a l o g s e r v i c es y s t e m c a t a l o g s e r v i c ea d m i n i s t r a t e st h em e t a d a t a d e s c r i b i n g t h e g e o r e s o u r c e s u n i f o r m l y i ti s a ni n f o r m a t i o nr e g i s t r a t i o nc e n t e ri n e s s e n c e ,w h i c hr e g i s t e r st h e m e t a d a t ao f g e o r e s o u r c e so n l i n et ot h ed a t a b a s es t o r i n gt h em e t a d a t ao f t h ec a t a l o g s e r v i c e ,p r o v i d e s t h e n a v i g a t i o n o ft h e s em e t a d a t at ot h eg e o r e s o u r c e s ,c o m p l e t e st h e a c c e s st ot h eg e o r e s o u r c e s ,a n di m p l e m e n t st h es h a r eo fg e o i n f o r m a t i o nr e s o u r c e s a n dd a t a e x c h a n g e c a t a l o g s e r v i c e s y s t e mf r a m e w o r kr e f e r s t ot h es u c c e s s f u l e x p e r i e n c e s o f e x i s t e dm e t a d a t as y s t e m ,a n db a s e so nt h eo p e n g i ss p e c i f i c a t i o n i tc a nc o o p e r m e w i t ht h em e t a d a t as y s t e mu s i n gz 3 9 5 0p r o t o c o l ,a n dc o n t a i n sak i n do fs p e c i a l - i i i - 北京工业太学硕士学位论文 s t r u c t u r e d q u e r yl a n g u a g e n a m e d o g c c o m m o nl a n g u a g et h a t c a n s u p p o r t g e o m e t r yt y p e sa n ds p a c i a lo p e r a t i o n s t h ef r a m e w o r kp e r m i t sm u l t i p l em e t a d a t a f o r m a t s ,a n da d m i n i s t r a t o r sc a na d do rd e l e t ea n ym e t a d a t af o r m a t ss y s t e mc o n t a i n m o m e n t a r i l y f u r t h e r m o r e ,t h ef r a m e w o r ki m p l e m e n t s t h et o wt y p e sd i s t r i b u t e d q u e r yo f m e t a d a t a :d i s t r i b u t e dq u e r y b a s e do ng a t e w a y s y s t e ma n dd i s t r i b u t e dq u e r y b a s e do nc a t a l o gs e r v i c es y s t e mi t s e l f s u p p o r t i n gx m l i st h ei m p o r t a n tp o i n to f c a t a l o gs e r v i c es y s t e mf r a m e w o r k t h ef r a m e w o r ks u p p o r t sx m li nm e t a d a t ap r e s e n t ,m e t a d a t ae x c h a n g e ,m e t a d a t a q u e r ya n dm e t a d a t as t o r e m e t a d a t ai sp r e s e n t e da s ax m ld o c u m e n t ,a n dx m l s c h e m ad o c u m e n td e s c r i b ea n dr e s t r i c tt h ef o r m a t so fm e t a d a t a t h es 订a t e g yo f m e t a d a t aq u e r yi sas t r u c t u r e dq u e r yb a s e do nq u e r yc o r ee l e m e n t ,a n dt h es t r a t e g y o fm e t a d a t as t o r ei st h a tt h e s eq u e r yc o r ee l e m e n t sa r es t o r e di nd a t a b a s ea n dt h e x m ld o c u m e n ti ss t o r e di naf i e l do f d a t a b a s et a b l eo rf i l es y s t e m s f i n a l l y , t h i sp a p e rp r o v i d e sa ni m p l e m e n t a t i o no ft h ec a t a l o gs e r v i c es y s t e m n a m e dc a t s y s t e m ,w h i c hi su s e dt o v a l i d a t et h ec o r r e c t n e s sa n dr e l i a b i l i t yo ft h e c a t a l o gs e r v i c es y s t e mf r a m e w o r k ,a n df o r w a r dt h er e s u l t so f t h i sr e s e a r c ht ot h e a p p l i c a t i o ni np r a c t i c e k e y w o r d s :c a t a l o gs e r v i c e ,g o e r e s o u r c e ,m e t a d a t a ,x m l i v - 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 签名:主鑫鲲日期:幽 关于论文使用授权的说明 本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权 保留送交论文的复印件,允许论文被查阅和借阅:学校可以公布论文的全部或部 分内容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 签名:主鑫强 导师签名: 日期:2 竺旦垡t ,3 第1 章绪论 第1 章绪论 1 1 动机 自从8 0 年代第一个地理信息系统( g e o g r a p h i c a l i n f o r m a t i o ns y s t e m ,g 1 s ) 商业化产品诞生开始,地理信息系统逐渐形成了一个重要的计算机应用产业。 尤其随着计算机网络技术和数据库技术的迅速发展,地理信息系统也经历了主 机一终端系统、桌面工作站系统、局域网分布式系统,到目前的基于互联网的 应用信息系统的发展历程,特别是近几年w e bg i s 的迅速发展将地理信息系统 的应用范围也从面向专业领域扩展到诸如“数字地球”面向社会的信息基础设 施,成为社会化的应用信息系统。 社会化的地理信息系统目的在于提供一种开放式的地理信息获取手段,使 得人们能够根据需要获取来自任何计算平台的地理信息资源,实现地理信息资 源的共享。鉴于网络上各种资源分布在各种各样的数据库中,存储成多种格式, 属于不同的个人和组织,如何获取在网络上存在着数量非常庞大的地理信息资 源是一个急需解决的问题,同时需要采取一定的措施来避免地理信息资源的重 复性建设,以及协调不同部门之间的资源共享。 共享的最终目的是使用户能够使用更多的资源。要实现地理信息资源的共 享,最基本的要求是必须清楚地知道这些资源的访问地址,而共享的最终目的 是使用户能够使用更多的资源。这样就会存在着这样的问题:在网络上存在着 数量巨大的地理信息资源,用户不可能知道每个资源的访问地址:而且这些资 源当中会存在一些功能与用途类似的情况,用户如何能访问到更符合需求的资 源? 这就需要有一个资源的注册查询中心,类似电话查询台或图书馆书目等, 其中注册登记了这些地理信息资源的连接和特征等信息,利用这些信息用户能 快速准确地获取自己所需的资源。地理信息资源的连接和特征等信息称之为元 数据( m e t a d a t a ) ,注册查询中心被称为元数据系统。 元数据,是关于数据的数据,是关于数据和信息资源的描述性信息。它并 不是新的概念,在我 f 生活中处处可见,e 匕如;各秘广告、产品说明书,以及 图书馆里的书目等等。目前,人们对于地理信息元数据的研究己广泛开展,并 北京工业大学硕士学位论文 形成了多个标准,其中主要有美国联邦数据委员会( f e d e r a lg e o g r a p h i c a ld a t a c o m m i t t e e ,f g d c ) 的元数据标准和国际标准化组织i s o t c 2 1 1 的元数据标准。 这两个标准都从不同侧面对地理信息数据进行了比较详细的描述 1 1 。 各种元数据标准描述了为了实现数据维护、数据共享、查询和传输等功能, 系统需要有什么内容的元数据。至于如何在计算机上组织和管理这些元数据信 息,如何在数据传输的过程中组织数据,如何将数据提交、传输或呈现给用户 是系统实现时需要考虑的问题。在制定了元数据标准的基础上,还需要各种软 件的支持,才能建立元数据系统来帮助用户发布、发现、获取、使用和维护数 据。目前已有很多种元数据的工具软件,来完成元数据的编写、录入、查询和 管理功能。 1 2 元数据系统研究现状 目前已经有一些组织和公司推出了自己的元数据系统方案或产品,这些已 有的元数据系统都是基于z 3 9 5 0 协议的,在下面的1 2l 节中将对z 3 9 5 0 协议 和目前比较知名的几个元数据系统进行简单的介绍。 1 2 1z 3 9 5 0 协议 z 3 9 5 0 协议标准( i s 0 2 3 9 5 0 ) 是由美国国家标准化组织制定的”1 。z 3 9 5 0 协 议是一种在客户服务器环境下计算机与计算机之间进行数据库检索的通讯协 议。它的发布及使用解决了不同系统间的数据交流问题,克服了信息检索网络 化的障碍。在1 9 9 2 年以后的z 3 9 5 0 协议标准中增加了对空间数据查询的支持, 使得空间信息的查询可以通过z 3 9 5 0 协议进行。 z 3 9 5 0 协议描述了客户端和服务器端交换信息的格式和过程。主要包括以 下内容: 客户端和服务器如何建立连接。 客户端如何指定一个或多个数据库,根据所要查询的记录标识来构造查 询条件和指定查询的结果,以及返回记录的条数。 服务器返回部分或全部查询结果的记录标识。 一2 一 对查询结果集合的处理,包括命名( 以后还可以基于它查询) ,排序,删 除。同时服务器还可以根据用户的身份来限制客户对查询结果集合的权 限。 客户端如何取得查询的结果。 客户端何如终止与服务器的连接。 1 2 2i - s i t e 空间信息交换中心( c l e a r i n g h o u s e ) 是由f g d c 提出的一个提供空间信息 共享的策略。用户可以通过z 3 9 5 0 协议在分布在i n t e m e t 上的各个空间信息交 换中心上搜索和获取按f g d c 标准组织的地理信息元数据。而i - s i t e 是f g d c 推荐的用于建设空间信息交换中心的软件包。任何组织如果想建立自己的空间 信息交换中心只需将这个软件包下载安装,再进行简单配置就可以了。如果想 要将该节点发布到i n t e r n e t 上,只需向f g d c 申请注册即可。( 在国家空间信 息基础设施部门的网站上就有一个空间信息交换中心,用户可以通过浏览器来 查询相关的空间信息的元数据) 。其一般的大致的结构如图1 - 1 所示,各部件功 能介绍如下: 图1 1 用i - s i t e 搭建的信息交换中心示意图 f i g u r e1 - ii n f o r m a t i o ne x c h a n g es y s t e m b u i l db yi - s i t e - 3 一 北京工业大学硕士举付诊童 z s e r v e r :是i - s i t e 的核心,是一个z 3 9 5 0 一1 9 9 2 服务器端的实现。它可 以接收来自z 3 9 5 0 客户端的查询请求,经过分析处理后通过s e a r c h a p i 发送给本地或异地的信息所在地,得到查询结果后按指定的格式返回给 客户端。 搜索应用程序接n ( a p i ) :用户可以将自己选定的搜索引擎或数据库查 询引入到系统中来。目前支持全文的索引和检索( 例如i - i n d e x 和 i - s e a r c h ) ,同时支持基于命令行的查询协议( 用户可以定义自己的 s c r i p t 语言来组织z s e r v e r 处理后的查询,以命令行的形式传给自己的 搜索引擎) 。用户也可以直接基于i - s i t e 提供的s a p i c 来编程实现接口。 z c l i e n tg a t e w a y :使用户能够直接通过浏览器将查询信息发送到 z s e r v e r , 并且可以将查询结果以h t m l 格式返回给浏览器。 i - i n d e x :用来帮助元数据管理者在指定的数据集上建立索引的工具。 目前主要是将某个目录下的元数据文件做一个倒排表,以备做全文检 索。 i - s e a r c h :是用来对i - i n d e x 处理过的元数据文件做全文检索。 一系列的元数据的编辑工具和文件有效性检查工具:提供了支持各种格 式( 如f g d c ,g i l s ,d i f ,u s m a r c 等等) 的元数据编辑工具和有效性 检查工具。 z c l i e n t :一个简单的基于z 3 9 5 0 的客户端软件。使用户能够直接通过 t c p i p 协议连接到z 3 9 5 0 服务器( 例如z s e r v e r ) ,进行信息检索和获取。 目前,国家信息中心的n r e d i s 空间元数据管理系统正是基于i s i t e 的框架 实现的【7 1 0 1 2 3m e t a s t a r 由b l u ea n g e lt e c h n o l o g i e s 开发的m e t a s t a r 系列提供了一个端到端的元数 据在i n t e r n e t 或i n t r a n e t 上的输入、管理、发布和使用的解决方案。其体系结构 和功能如1 - 2 图所示,由以下几个部件组成: 第1 章绪论 图1 - 2m e t a s t a r 元数据系统结构图 f i g u r e1 - 2m e t a s t a rs y s t e ms t r u c t u r e 1 元数据管理器( m e t a d a t a m a n a g e r - m d m ) :用来导入,导出和管理各种格 式元数据的一组工具。包括: 元数据模板( m e t a d a t at e m p l a t e ) :描述了元数据元素的结构和属性。如 果用户要产生新的元数据模板,系统就自动先按照指定的元数据标准将 其预先组装起来,然后再由用户根据规则生成自己的元数据模板。 元数据记录管理( r e c o r ds e t ) :根据不同的元数据模板,为用户提供工具 来输入和维护不同元数据模板的元数据记录。 导入导, m , ( i m p o r ta n de x p o r t ) :可将外部文件根据指定的元数据模板导入 到系统中,也可以将某个元数据模板中的元数据记录导出到指定格式的 外部文件。 2 元数据服务器f m e t ad a t as e r v e r m d s ) :通过网络为远端的用户提供访问 的服务。用户可以按照开放式的网络传输标准搜索和取得数据。它由如下 三个部分构成: 协议层( p r o t o c o ll a y e 0 :将h t t p 作为传输协议,h t m l 作为显示格 式。搜索参数一般通过网页的f o r m 来收集,结果数据以h t m l 格式 返回给用户。a n s i n i s oz 3 9 5 0 协议被用来在各种不同种类的资源中 搜索和获取信息。通过配置协议层可以使用任何种类的z 3 9 5 0 的p r o f i l e 一5 一 北京工业大学硕士学位论文 文件。 元数据标准层( m e t a d m as t a n d a r d sl a y e r ) :元数据标准层为不同的元数 据标准及其相应的p r o f i l e 文件提供支持。它可以支持具有以下特性的任 何元数据记录的格式:分层、重复和基本数据类型( 如整型,字符串) 。 目前支持的比较常见的几种元数据标准有: f g d c ,g i l s ,d i f , m a r c 。 搜索引擎层( s e a r c he n g i n el a y e r ) , 搜索引擎层是一个可以接任何一种 搜索引擎的模块。很多商业化的搜索引擎已被引入到m d s 产品中。 3 ,元数据客户端( m e t ad a t ac h e n t - m d c ) :是一个提供给用户从一个或多个 服务器搜索和获取信息的工具。它还可以让用户通过w w w 网远程输入元 数据。它包括两个部分: 搜索部件( s e a r c hc o m p o n e n t ) :可以通过网络从一个或多个z 3 9 5 0 服 务器搜索和取得信息。它同时还提供了用户一套s d k ,只需通过少量 的编程就可以形成z 3 9 ,5 0 的查询语句。 数据入口部件( d a t a e n t r yc o m p o n e n t ) :提供给用户一个友好的界面来远 程管理元数据。也可以利用工具生成一定格式的元数据,然后发送给管 理员。由它负责将数据导入到系统中。 目前该系统增加了一些新的功能,主要是针对x m l 的支持和元数据的数 据挖掘工作。比如: 输入和编辑d t d 格式的元数据( 可以通过w e b 浏览器) 。 输出结构良好的x m u s g m l 文件。 存贮结构化的元数据:将元数据可靠地存到数据库或文件系统中。 从h t m l 或x m l 格式的数据文件中提取元数据。 1 2 4a r c i m sm e t a d a t as e r v i c e 美国的e r s i 公司的也发布了一套元数据服务一一a r c 蹦sm e t a d a t a s e r v i c e ,该服务并没有专- f - j 的软件来实现,而是集成在a r c g i s 的系列产品中, 其软件结构如图1 - 3 所示,其中主要部件介绍如下: 第1 章绪论 图1 3a r c i m sm e t a d a t as e r v i c e 系统结构 f i g u r e1 - 3a r c l m sm e t a d a t as e r v i c e m e t a d a t ae x p l o r e r :元数据浏览器,主要功能是通过一个搜索元数据服 务的交互接口。 a r c c a t a l o g :元数据管理的客户端软件,一方面用来创建、编辑和发布 元数据文档:另一方面用来管理和组织已发布的元数据文档。 a r c l m s :是一个应用服务器,提供一个在线的服务器客户端的交互平 台。 a r c s d e :用来存储、搜索、索引和检索元数据文档,提供一个地理辞 典存储仓库。 1 3 问题与不足 上面所介绍的元数据产品都有各自的优点和使用领域,但随着应用需求的 不断变化和技术的不断发展,还有着一些不足之处: 1 虽然利用i - s i t e 很快就可以搭建一个元数据系统,而且相关软件包是免 费的,直接到国家空间信息基础设施网站就可以下载,但其无论是在对 元数据的描述能力包括支持元数据的标准和对x m l 的支持,还是存储 和查询的支持都十分有限。 2 利用现有的商用产品搭建元数据系统的代价比较大,特别是e r s i 公司 a r c i n f o 产品,并没有专门的产品实现元数据系统,而是集成在a r c g i s 产品中,利用a r e g i s 产品实现元数据系统代价是非常高的。 3 所有的元数据系统都是支持z 3 9 5 0 协议,不支持o p e n g i s 规范。 一7 - 北京工业大学硕士学位论文 1 4o p e n g i s 的c a t a l o gs e r v i c e s o p e n g i s ( o p e ng e o d a t ai n t e r o p e r a b i l i t ys p e c i f i c a t i o n ) 是开放地理数据互 操作规范的简称,由国际开放地理数据协会( o p e ng e o d a t ac o n s o r t i u m ,简称 o g c ) 提出。它规定了应用程序之间进行互操作的地理数据应包含的各种标准 数据类型和在其上所实施的基本操作,并规定了互操作的规范和对数据语义的 共同理解。遵循该规范所开发的软件允许用户在一个开放的信息技术环境中访 问和处理不同来源的地理数据。虽然目前还没有完全实现o p e n g i s 抽象规范的 软件产品,但仍被业界认定是今后g i s 软件发展的方向。o p e n g i s 也定义了一 套元数据系统的规范,称之为c a t a l o gs e r v i c e 。o p e n g i s 用文件来定义c a t a l o g s e r v i c e s 的细节: t h e o p e n g i s a b s t r a c ts p e c i f i c a t i o nt o p i c1 3 :c a t a l o gs e r v i c e s ( v e r s i o n4 1 : 给出c a t a l o gs e r v i c e s 定义和作用;给出地理信息资源的基本模型;定 义了c a t a l o gs e r v i c e s 的抽象数据模型引。 o p e n g i sc a t a l o gs e r v i c e ss p e c i f i c a t i o n ( v e r s i o n1 1 1 ) :主要定义一个 c a t a l o gs e r v i c e s 的基本接口以及这个接口如何与z 3 9 5 0 协议进行互操作 1 9 。 虽然o p e n g i s 对c a t a l o g s e r v i c e s 做了一些规范,但是不够完整,特别是数 据模型和管理接口还需在后续的版本中进一步完善。对x m l 的支持也不够, 同时与实际的应用有一定的差距。因此在设计c a t a l o g 服务系统框架时,以 o p e n g i s 的c a t a l o g s e r v i c e s 规范为基础,进行了一定的改动和扩充,如自定义 了元数据管理接口和增加对x m l 的支持。 1 5 课题简介 1 5 1 课题来源 在国务院提出政务信息化带动企业和社会信息化的策略后,为了增强北京 市的宏观管理指挥能力,增强北京市行政部门之间协同能力,推动各级政府之 间信息交换,提升政府为公众服务质量,经国务院审批在北京建设电子政务的 第1 章绪论 试点示范应用,并由8 6 3 计划资助。其主要任务是以国务院为枢纽,“依托一个 公共体系、建设两个支撑平台、重点推进三项示范应用”。北京市决策g i s 支撑 系统正是示范应用之一,其第一步的目标是实现北京市各部委的各种地理信息 资源的共享,为了实现这一目标需要实现三个软件:w e bf e a t u r es e r v i c e 系统、 w e b m a ps e r v i c e 系统和c a t a l o g 服务系统。 1 5 2 课题内容 本课题的目标是:一个元数据c a t a l o g 服务系统的系统框架,并在该框架的 基础上实现一个应用实例,主要工作包括: 1 研究c a t a l o g 服务系统在地理信息服务体系中的作用,确定其基本功能: 2 研究目前国内外地理信息元数据及其标准的现状; 3 研究和设计c a t a l o g 服务系统的框架,完成c a t a l o g 服务系统的总体软 件体系结构: 4 设计c a t a l o g 服务系统元数据的查询和存储技术: 5 实现一个c a t a l o g 服务系统应用实例c a t 系统( c a t 是c a t a l o g 取 前3 个字母) 。 1 6 小结 本章介绍了元数据系统的社会作用和当前元数据系统的研究现状,并在此 基础上提出了本课题的研究内容:基于o p e n g i s 规范的元数据c a t a l o g 服务系 统框架以及基于该框架的应用实例。 北京工业大学硕士学位论文 第2 章元数据与元数据标准 随着数字化地球概念在全球范围内的广泛讨论,人们对于数字地球所需关 键技术的认识己越来越深刻。被戈尔列为数字地球六大技术之一的元数据则更 加引人注目,成为数字地球建设能否走向成功和实用的关键。元数据是元数据 系统包括c a t a l o g 服务系统的基础,因此非常有必要对元数据及其相关的内容进 行深入的研究。本章主要介绍了元数据的概念与作用,元数据标准的研究现状 和元数据的分类情况。 2 1 元数据的概念 人们对元数据的理解比较混乱,有的将其与数据字典混为一谈,迄今尚没 有一个统一的元数据定义。但是,一般都认为元数据就是“关于数据的数据”。 在地理空间数据中,元数据是说明数据内容、质量、状况和其他有关特征的背 景信息。 元数据并不是一个新的概念。实际上传统的图书馆卡片、出版图书的版权说 明、磁盘的标签等都是元数据。纸质地图的元数据主要表现为地图类型、地图 图例,包括图名、空间参照系统和图廓坐标、地图内容说明、比例尺和精度、 编制出版单位和日期或更新日期、销售信息等。在这种形式下,元数据是可读 的,生产者与用户之间容易交流,用户通过它可以非常容易地确定该书或地图 是否能够满足其应用需要。 与以前的元数据不一样的是,现在讨论的元数据是以数据的形式存储的。 而且随着信息技术的发展,其无论在内容还是在数量上都有了很大的变化,必 须依靠元数据系统来管理、维护和帮助用户查找、获取和使用信息。 2 2 元数据的作用 组织和维护对数据的投资 元数据帮助确保一个组织在数据上的投资。随着技术的进步,信息的采集 变得越来越容易,人们每天都在收集各种各样大量的信息,然而随着人员的变 第2 章元数据与元数据标准 更或者时间的流逝,关于数据的信息可能会丢失。如果缺少必要的关于数据的 信息,后来的工作人员可能无法使用或者因为对数据的质量缺乏信任而放弃使 用,于是先前获取数据的投资将会遭受损失。完整的数据信息的描述和关于信 息的可靠性的保证将帮助用户很好地使用数据。另方面,这些描述信息在因 用户错误地使用数据而引发纠纷时给予数据提供者保护。 为数据的发现和获取提供信息 一般的应用可能会涉及到各个方面的数据。比如一个有关城市规划的应用 项目就可能会用到各种基础数据:测绘局的城市地形图,遥感所的测绘图,水 利局的地下供水管道图,电讯局的光缆分布图等等。这些数据显然是不可能由 一个组织来提供的,只有通过根据数据集的相关元数据建立的数据目录服务器 或空间信息交换中心,用户才可以在相关工具的帮助下发现和获取需要的数据, 进而才能有效地利用各种基础数据。通过元数据定义数据集用于检索的相关信 息,使得被查询的数据具有了一定的结构性,从而使查询更加准确和方便。就 像现在图书馆网站提供的复杂查询功能,在系统界面的帮助下,用户可以输入 某些域段需要满足的条件,以及这些条件的逻辑关系,从而形成一条比较准确 的查询语句,这样可以大大地减少查询的返回结果。同时元数据还提供了有关 数据获取的信息( 比如用户要找的某本书所在图书馆及其书号) 来帮助用户取 得数据。 为数据的使用提供信息 通过元数据详细地描述数据集的相关结构信息及其语义解释,可以帮助用 户更好地使用数据,并为实现数据集间的共享和互操作以及数据挖掘工作提供 必要的信息。例如,有时用户取回的图层数据并不是自己系统直接能用的格式, 此时就需要根据其元数据对该图层空间信息结构的描述信息来理解该数据,进 行数据格式转换后使用。还比如,用户拿到一幅地图数据以后不知道它是否满 足自己系统的精度要求,这就需要根据元数据提供的数据质量信息来做判断。 由此可见,元数据是使数据充分发挥作用的重要条件之一。它可以用于许 多方面,包括数据文档建立、数据发布、数据浏览、数据转换及数据使用等。 元数据对于促进数据的管理、使用和共享均有重要的作用。 北京工业大学硕士学位论文 2 1 3 元数据标准的研究现状 随着元数据重要性目益突出,全世界的许多国家、国际学术团体和公司都 在研究和制定与其密切相关的元数据标准。下面将介绍三种目前比较典型的元 数据标准。 2 3 1f g d c 的元数据标准 美国联邦地理数据委员会( f e d e r a lc o n g r a p h i cd a t ac o m m i t t e e ,f g d c1 成 立于1 9 9 0 年,由来自1 6 个单位的1 7 位专家组成。1 9 9 2 年6 月举办了地理空 间元数据讨论会,与会者认为需要研制地理空间数据的元数据内容标准 ( c s d g m ) 。该委员会下设的标准化工作组起草了c s d g m 标准草案,然后开 始公开征求意见。1 9 9 4 年8 月f g d c 通过并发布第一版c s d g m 。此后,美国 联邦政府内外的许多单位根据1 2 9 0 6 号总统令的要求,从1 9 9 5 年开始执行这一 标准,并利用自动索引和服务机制,为用户提供通过因特网访问其数据库的服 务。f d g c 于1 9 9 7 年完成了第二版c s d g m ,并于1 9 9 8 年6 月认可了该标 准( f g d c - - s t d 一0 0 l 一1 9 9 8 ) 。 该标准主要包括以下几个各部分1 3 】: 标识信息( i d e n t i f i c a t i o n ) :是关于数据集的基本信息。主要包括:引用,描 述信息。状态信息,空间范围,关键词,访问限制,使用限制等。通过它 用户可以对数据有一个大致的了解。 数据质量信息( d a t aq u a l i t y ) :对数据质量进行总体评价的信息。包括属性 精度,逻辑可靠性报告,完整性报告,位置精度,继承信息( 数据源+ 处理 步骤) 等。 空间数据表示信息( s p a t i a l d a t ao r g a n i z a t i o n ) :数据集中空间信息的组织方 法。由空间表示类型,矢量空间表示信息,栅格空间表示信息等组成。有 了它,用户在取得数据以后就可以对它进行分析和处理了。 空间参照系信宙, ( s p a t i a lr e f e r e n c e ) :数据集中坐标的参考框架以及编码方式 的描述,是反映现实世界和地理数字世界之间关系的通道。包括平面坐标 系定义和垂直坐标系定义。 第2 章元数据与元数据标准 实体和属性信息( e n t i t ya n d a t t r i b u t e ) :是关于数据集内容的细节信息,包 括实体类型,它们的属性及属性的值域。 发行信息( d i s t r i b u t i o n ) :是关于数据发行和获取的信息。包括发行部门, 数据资源描述,发行部门责任,获取手段等。通过发行信息,用户可以了 解数据集在何处,怎样获取,获取介质以及费用等相关信息。 元数据参考信息( m e t a d a t a r e f e r e n c e ) :元数据当前状况及其负责部门的信 息,包括元数据日期信息、联系地址,制定元数据所使用的标准、版本、 限制条件、安全信息以及元数据扩展信息等内容。它是当前数据集所作元 数据的描述依据。通过元数据参考信息,可以更好地帮助用户了解元数据 描述方法的信息,从而加深对数据集的理解。 引用信息( c i t a t i o n ) :引用和参考数据集时所需的简要信息。包括标题、作 者信息和参考时间等。 时间范围信息( t i m e p e r
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年花艺师职业资格考试真题模拟训练-花艺设计风格演变与传承试题
- 2025年中学教师资格考试《综合素质》心理辅导案例解题试卷
- 2025年摄影师职业技能鉴定摄影作品版权法律知识解析解读试题试卷
- 2025年成人高考《语文》得体表达:访谈记录修改要点试题
- 2025年花艺师职业资格考试真题模拟训练:花艺师职业发展规划与就业前景试题
- 地理图表分析能力:2025年初中学业水平考试试卷及答案
- 2025年乡村医生考试题库:农村慢性病管理公共卫生应急试题
- 2025年安全生产风险分级管控考试题库(安全风险评估题)
- 2025年成人高考语文经题型强化训练:文学创作试题
- 2025年专升本艺术概论模拟试卷(艺术鉴赏能力路径)
- 2025至2030年中国稀奶油市场分析及竞争策略研究报告
- 小学四年级上册语文学历案 教学设计
- DB11T 695-2025 建筑工程资料管理规程
- 高考补习学生管理制度
- 检验科三基培训
- 占用林地补偿协议书
- 涉爆人员培训内容
- 信息技术智能办公教程 课件 任务5-邮件合并
- 中建三局项目商务策划书(23P)
- 高一数学必修一必修二各章知识点总结
- 《拆装液压系统》课件
评论
0/150
提交评论