




已阅读5页,还剩57页未读, 继续免费阅读
(计算机软件与理论专业论文)数据中心面向主题的数据管理系统的设计与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
东北大学硕士学位论文摘要 数据中心面向主题的数据管理系统的设计与实现 摘要 数据中心接入的系统非常复杂,数据类别多,数据量大,所以必须有一种有 效的机制把这些数据组织好。本文明确提出以主题的模式对数据进行管理,数据 的提供者、使用者和管理者都可以通过主题很方便地查看、订阅和发布数据。主 题足元数据的一种组织模式,通过主题,可以了解数据标准,方便知道能够获取 和使用哪些数据,并进行数据使用的定制。 本文主要研究在数据中心实现面向主题的数据管理系统。主题管理包括两乃 面内容,是主题管理本身的设计与实现:二是应用主题来对数据处理。主题本 身的设计与实现在数据中心中心端的主题管理中实现。主题与数据中心元数据是 不可分割的的两部分,因此主题管理中包含了元数据管理。按照主题对数据进行 处理是在数据中心的公共数据管理中实现的。它采用面向主题的数据组织方式 即用树状的主题树将参与共享和交换的数据清晰地组织起来。本文的研究j :作一 直围绕主题与数据中心元数据的概念、内容架构设计、功能实现和应用主题进行 的数据管理进行。 论文首先介绍了主题及元数据的相关概念、特点。然后介绍数据中心的总体 设计,包括业务模型设计、技术架椅及数据架构设计。最后介绍了面向主题的数 据管理系统在数据中心的设计和详细实现。 关键词主题元数据数据中心j 2 e em v c i i 东北大学硕士学位论文 a b s t r a c t d e s i g na n di m p l e m e n t a t i o no fs u b j e c t - o r i e n t e dd a t a m a n a g e m e n ts y s t e mi nd a t ac e n t e r a b s t r a c t d a t ac e n t e ra c c e s ss y s t e mi sv e r yc o m p l i c a t e dw i mm a n yd a t at y p e sa n dl a r g e q u a n t i t yo fd a t a , s oi ti ss u p p o s e dt oh a v ea ne f f e c t i v em e c h a n i s mt oo r g a n i z et h ed a t a t h ep a p e rc l e a r l yp u t sf o r w a r daw a yt om a n a g ed a t aw i t hs u b j e c tm o d e ,b ys u b j e c tt h e p r o v i d e r , u s e ra n dm a n a g e ro fd a t ac a ne a s i l yr e a d ,o r d e ra n dr e l e a s ed a t a s u b j e c ti sa l l o r g a n i z a t i o np a t t e r no fm e t a d a t a ,b yw h i c ht h e yc a nu n d e r s t a n dt h ed a t as t a n d a r d , e x p e d i e n t l yk n o ww h a td a t at og e ta n dt ou s e ,a n dc u s t o m i z et h eu s eo f d a t a , t h ep a p e rm a i n l ys t u d i e ss u b j e c t o r i e n t e dd a t am a n a g e m e n ts y s t e mi nd a t ac e n t e t s u b j e c tm a n a g e m e n ti n c l u d e st w oa s p e c t s :o n ei st h ed e s i g na n di m p l e m e n t a t i o no f s u b j e c tm a n a g e m e n ti t s e l f ;t h eo t h e ri sp r o c e s s i n gd a t aw i t hs u b j e c t t h ed e s i g na n d i m p l e m e n t a t i o no f s u b j e c ti t s e l f w i l lb ec o m p l e t e di nc e n t e ro f d a t ac e n t e r s i n c es u b j e c t a n dm e t a d a t ai nd a t ac e n t e ra r en o ti n t e r s e c t e d ,s u b j e c tm a n a g e m e n ti n c l u d e sm e t a d a t a m a n a g e m e n t p r o c e s s i n gd a t aw i t hs u b j e c ti s t ob ei m p l e m e n t e di nc o m m o nd a t a m a n a g e m e n to fd a t ac e n t e r t h es y s t e ma d o p t ss u b j e c t - o r i e n t e dd a t ao r g a n i z a t i o nm o d e , n a m e l yw i t has u b j e c t ,t h ed a t at os h a r ew i t ha n de x c h a n g ec a nb eo r g a n i z e dc l e a r l y t h ew o r ko ft h ep a p e ri sa l l a l o n gd e v e l o p e da r o u n dt h ec o n c e p t so fs u b j e c ta n d m e t a d a t a ,c o n t e n tf r a m e w o r kd e s i g n ,f u n c t i o ni m p l e m e n t a t i o na n dd a t am a n a g e m e n t w i t hs u b j e c t t h ep a p e rf i r s ti n t r o d u c e ss o m ec o n c e p t sa n df e a t u r e so fs u b j e c ta n dm e t a d a t a t h e nt h eg e n e r a ld e s i g no f d a t ac e n t e rw i l lb ed e s c r i b e d ,w h i c hi n c l u d e sb u s i n e s sm o d e l d e s i g n ,t e c h n i q u ef r a m e w o r kd e s i g na n dd a d af r a m e w o r kd e s i g n f i n a l l yt h ed e s i g na n d d e t a i l e di m p l e m e n t a t i o no f s u b j e c t o r i e n t e dd a t am a n a g e m e n t s y s t e mi nd a d ac e n t e rw i l l b eo p e n e do u t , k e yw o r d ss u b j e c t ,m e t a d a t a , d a t ac e n t e r , j 2 e e ,m v c i 一 独创性声明 本人声明所呈交的学位论文是在导师的指导下完成的。论文中取 得的研究成果除加以标注和致谢的地方外,不包含其他人己经发表或 撰写过的研究成果,也不包括本人为获得其它学位而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明显 的说明并表示谢意。 本人签名:纠硼p e l期:沙f 、停 学位论文版权使用授权书 本学位论文作者和指导教师完全了解东北大学有关保留、使用学 位论文的规定:即学校有权保留并向国家有关部门或机构送交论文的 复印件和磁盘,允许论文被查阅和借阅。本人授权东北大学可以将学 位论文的全部或部分内容编入有关数据库进行检索、交流。 ( 如作者和导师同意网上交流,请在下方签名;否则视为不同意。) 学位论文作者签名:玉? 蛹p 签字日期: 如一! ,、馏 导师签名: 签字日期: 东北走学硕士学位论文 第一章引言 第一章引言 1 1 研究背景与意义 近年来,我国政府的信息化建设步伐越来越快,一批如“金卡工程”、“金关 程”、“金税工程”、“金盾工程”这样的大型项目从根本上带动了国内电子政务 市场的发展。而电子政务的实施也为国家带来了不可估量的经济效益和社会效益。 对于个完整的电子政务系统来说,统一的框架和相应的数据模式是十分重 要的。电子政务的构建,正经历着由以技术为中心向以数据为中心的方向转变, 没有数据也就没有信息,也就没有政府网站及电子政府。数据中心在电子政务系 统中处于中心地位,具有公共数据( 信息) 库、数据交换站的功能,各数据源将 自己的数据上传给数据中心,而各部门根据自己的需要从数据中心获取数据,实 旌自己的应用。 由于我国政府各部门对信息化建设的深远意义认识不够,以及政务建设有一 个发展过程,造成了政府各部门、城市各行业信息化发展步调不一,从而使政务 信息化建设存在一些问题。如信息的共享、公开没有立法,信息采集、储存标准 不统一,造成了互联互通不畅,共享程度低;信息共享机制尚未建立,各职能部 门内部的信息相对封闭,产生了信息孤岛效应,造成了信息资源的巨大浪费;大 部分单位业务应用系统还未形成一个内部资源共享、有效运行的整体,需要在电 子政务设计建设的过场中进行整合和改造;网络建设各自为政,结构不合理,互 连互通十分困难;安全性存在隐患,人门还不放心在网上共享数据。 政府数据中心的建设,将有助于打破各级政府和部门对信息的垄断和封闭, 能够有效整合政务信息资源,强化对信息资源的不断开发、更新和维护;从长远 柬说,这项工作的开展,将有助于推动政府信息资源对社会的开放,使之发挥巨 大的社会效益和经济效益。 本文研究的社保数据中心系统建设思路是基于各机构在竞争中共同协作、共 同发展,追求共同利益和价值,从多资源集成的角度出发,构造c o i ( c o m m u n i t y o f i n t e r e s t ) 的价值链。 价值链( v a l u ec h a i n ) 作为一种强有力的战略分析框架,这些年来不断发展 创新并被财务分析、成本管理、市场营销等专门领域广泛融入和吸收。 同样,许多政府机构在寻求最佳投资方案时也采用了价值链的设计思路。诚 然,政府机构追求的价值与企业追求的价值有所不同。数据中心在社会保障体系 东北大学硕士学位论文 第一章引言 的价值链中起着非常重要的作用。 数据中心系统建设的目标是实现全市社会保障管理、服务的信息化与网络化, 建成覆盖地区范围,联接政府、企事业单位和个人,业务功能完整、标准舰范统 一、系统安全可靠、服务方便快捷、管理模式先进的统一的社会保障信息系统, 为电子政务系统建设奠定基础。 1 2 数据中心分析 数据中心的主要功能数据共享与交换。以前的数据交换主要在两个业务系统 之l 瑚进行,如果多个业务系统之间要进行数据交换就会形成复杂的交换网。这样 的交换有其自身的优缺点。它的优点是结构简单,实施方便:两点相通即可交换, i 依赖于第三方:一个节点的错误不会对其它节点造成影响。缺点是连接数随交 换点个数呈几何基数级增长;只能支持点对点式传输;参与交换的双方必须同时 在线;维护工作量较大。而在数据中心建立后,数据交换在各业务系统和数据中 心之问进行,多个业务系统与数据中心交换形成星型交换网。它的优点:连接数 呈线性增长:支持点对点和订阅发布式数据交换;发送方和接收方不需要同时在 线,只要在工作时与数据交换中心相连即可;中心可做交换内容备份和公证,集 中监控和管理。缺点:对交换中心过于依赖,性能要求很高。 正因为数据中心的星型交换结构,使数据标准的统一制定和公开发布在数据 中心实现成为可能。以前的数据交换标准机制并不完善,主要方法是将制定的数 据共享标准以w o r d 文档的格式提供给交换双方。在数据中心中则以元数据管理 来制定数据标准,并通过主题将元数据组织起来,主题发布后各业务系统可以查 看到数据标准,并方便地知道可以获取和使用哪些数据,并进行数据使用申请的 定制。 以前在两个业务系统交换数据后,数据直接进入到业务系统的数据库。这样 就不能确保业务生产库的安全。数据中心采用基于前置机交换库的统一数据中心 接口系统,使业务系统与数据中心的数据交换能过前置机交换库进行,而并不与 、眦务系统的数据库关联,保证了业务系统数据库的安全。 数据中心接入的系统非常大,数据类别多,数据量大,所以必须有一种有效 的机制把这些数据组织好。数据中心以主题的模式对数据进行管理,数据的提供 者、使用者、管理者都可以通过主题很方便地查看、订阅和发布数据。数据中心 的数据库的主体是面向主题的操作数据库( o s d - o r i c n t c d s u b j e c t d a t a b a s e ) 。o s d 中的表与主题存在一一对应的关系,当一个新建的主题被发布时,o s d 中相应的 新建一个表。业务系统的数据按照主题映射到o s d 中形成以主题模式组织的数 2 一 东北大学硕士学位论文 第一章引言 据。数据存放在主题表中后,就可以方便的按照主题来对其进行处理并最终形成 旗享数据。 1 3 本文的组织 本论文的内容组织安排如下: 第一章引占:说明本文研究的目的与意义;要介绍本文研究的主要内容。 第二章主题及元数据介绍:介绍了数据中心主题的含义,分析了传统业务系 统与数据中心系统数据组织模式的区别。叙述了面向主题的数据管理的优越性; 介绍与主题不可分割的数据中心元数据的概念。 第三章数据中心架构设计:对数据中心进行整个介绍。从数据中心的业务模 型入手,设计了中心端和统一客户端。根据数据中心的业务架构设计了中心端三 大功能模块。数据架构分析了中心端和统一客户端的数据库设计。软件架构叙述 了数据中心技术体系架构及实现策略,并对其支撑平台作了简述。 第四章数据管理系统总体设计:这是本文的重中之重。从主题管理设计,中 心端就用主题进行数据管理设计,统一客户端的主题管理三方面入手,介绍了面 向主题的数据管理的设计思想。并进一步论述了主题管理,中心端数据管理的功 能组成及各部分的设计思想。 第五章数据管理系统实现:编程实现元数据管理,主题管理,数据中心中心 端数据管理,数据中心客户端主题管理。说明该项研究生正确性,可行性和实用 性。 第六章总结与展望:对全文进行总结,阐述本论文研究工作的成果与结论, 并对未来工作进行展望 东北大学硕士学位论文 抛。数据存放在年题表中后 其享数据。 1 3 本文的组织 第一章引言 就可以方便的按照主题来对其进行处理并最终形成 本论文的内容组织安排如下: 第一章引言:说明本文研究的目的与意义;要介绍本文研究的主要内容。 第二章 题及元数据介绍:介绍了数据中心主题的含义,分析了传统业务系 统与数据中心系统数据组织模式的区别。叙述了面向主题的数据管理的优越忭: 介绍与主题不可分割的数据中心元数据的概念。 第三章数据中心架构设计:对数据中心进行整个介绍。从数据中心的业务模 型人手,设计了中心端和统一客户端。根据数据中心的业务架构设计了中心端= 大功能模块。数据架构分析了中心端和统一客户端的数据库设计。软件架构叙述 了数据中心技术体系架构及实现策略,并对其支撑平台作了简述。 第四章数据管理系统总体设计:这是本文的重中之重。从主题管理设计,中 心端就用主题进行数据管理设计,统一客户端的主题管理三方面入手,介绍了面 向主题的数据管理的设计思想。并迸一步论述了主题管理,中心端数据管理的功 能组成及各部分的设计思想。 第五章数据管理系统实现:编程实现元数据管理,主题管理,数据中心中心 端数据管理,数据巾心客户端主题管理。说明该项研究生正确性,可行性和实用 t 件。 第六章总结与展望:对全文进行总结,阐述本论文研究工作的成果与结论, 并对未来丁作进行展望 并对未来工作进行展望 东北大学硕士学位论文 第二章主题及元数据介绍 第二章主题及元数据介绍 2 1 数据的组织形式分析 在数据中心的总体设计中我们可以看到,数据中心服务的对象非常多。以前 存两个业务系统进行数据共享时,共享数据的组织主要依据业务系统的应用来安 排,也就是说,业务系统的系统中数据在数据库中是如何存储的,交换得到的共 享数据仍存储在相同结构的表中。如果数据中心的数据库采用与各业务系统相同 的表来组织数据,就要为不同业务系统汇聚到数据中心的数据创建与其原业务系 统相同的表,而在数据中心的总体设计中我们可以看到,数据中心服务的对象非 常多,这必将导致数据表的暴增,而且同一含义的信息还会因为存储表的不同而 难以管理。所以,在数据中心必须采用一种与应用不相关的、统一的数据组织方 式来装载来自各业务系统的数据。 在数据中心中,提出了面向主题的数据库,应用主题表来作为数据库中的数 据组织方式。数据中心数据库主要由面向主题的数据库组成,与业务相关的数据 都存储在这样的数据库中。主题与面向主题的数据库的含义在下面介绍 2 1 】数据中心的面向主题的操作数据库 根据数据库的操作性、数据的语义,应该把数据库分为三大类:一般意义的 数据库即关系数据库、文本数据库( d b - d a t a b a s e ) ;供综合业务系统和门户使用 的面向主题的数据库( o s d o r i e n t e ds u b j e c td a t a b a s e ) ;数据仓库,它是供内部 门户决策者使用的数据库( d w d a t aw a r e h o u s e ) 。d b 数据主要分布在各局委办, 数据中心只有少量的;所以它是集中分布的。面向主题的操作数据库( o s d ) 是 数据中心的主体,它是d b 按主题映射的数据库;数据仓库建立在d b 和o s d 之 上的主题数据库。 这三种数据库的关系可以作如下描述。 面向主题的操作数据库是数据库体系的中间层,一方面包含全局一致的、细 节的、当前或接近当前的数据;另一方面它是面向主题的,集成的数据环境,且 数据量小,供各个综合业务系统查询处理使用,主要用作辅助完成日常决策的数 据分析处理。 4 东北大学硕士学位论文第二章主题及元数据介绍 2 1 2 主题的含义 “面向主题”的概念在数据仓库中明确的提出。数据仓库( d a t a w a r e h o u s e ) 是 一个面向主题的( s u b j e c to r i e n t e d ) 、集成的( i n t e g r a t e ) 、相对稳定的( n o n v o l a t i l e ) 、 反映历史变化( t i m e v a r i a n t ) 的数据集合【25 1 ,用于支持管理决策。对于数据仓库 的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析 型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构 的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在 数据仓库中的数据一般不再修改。 操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离, 而数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是 指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型 信息系统相关。传统数据库是面向应用建立的,其数据的组织仅按具体的应用处 理要求柬划分,未必适合于决策分析。 数据仓库的面向主题的定义,是较长时间的,具有战略意义的主题。 数据中心存在于业务系统数据库和数据仓库之间,它的主题是根据数据共享 的需求建立。接近于业务,但又是多个业务系统的抽象。它的功能主要是为交换 和共享提供基础,次要的才是为决策分析起辅助作用。 2 2 主题与元数据的关系 在对数据中心的数据组织之前,要先在数据库中生产主题表。因此,就在数 据中心系统中建立生产主题表的功能。主题管理就是为完成这一功能而存在的。 主题表的产生必然包含对数据的定义信息。于是,引出了元数据的概念。元 数据是描述数据的数据,主题表中的属性列就根据与主题表相关的元数据来建立。 元数据不仅在建立主题表时起作用,它本身也建立了数据的标准。很多信息 的描述、定义、获取、表示形式由于缺乏统一、严格的标准,致使大量的信息数 据处于分散的、部门所有的和各自为政的状态,造成数据信息资源浪费,不利于 实现数据共享。为了提高信息的共享和集成分析,保证为政府的管理决策和社会 各阶层提供科学准确的信息,迫切需要开发出一种统一的、以标准数据元形式的 对政务信息的表示方法,以支持政务信息的共享和交换。随着主题的发布,数据 标准的发布灵活而快捷。 在建立主题管理之前要先建立元数据。元数据是用一组属性描述其定义、标 示、表达和允许值的一个数据单元。组成元数据规范的基本属性分为标示类属性、 - 5 东北大学硕士学位论文第二章主题及元数据介绍 定义类属性、关系类属性、表示类属性、管理类属性。当然还可以根据需要增加 扩展属性。元数据属性应依照一种标准方式来注册和控制,以便元数据在信息交 换中保持一致性,并且能够进行元数据管理。因此,在数据中心系统中也要建立 用柬生产元数据的功能。元数据管理也是必要的。 2 2 1 元数据的概念 关于元数据的描述或者定义有很多,下面介绍几个常见的说法。 元数据是数据库管理领域的概念,是关于数据组织的数据。 元数据是对数据的描述,以及对数据集中数据项的解释,它能提高数据的利 用价值1 。 元数据是一种机制,用来说明数据集成其他形式的信息存在的描述。 元数据是描述地理数据集内容、表示空间参考系、质量以及管理的数据i ”。 数据中心元数据与数据仓库元数据的业务元数据概念类似,下面就先介绍一 一数据仓库中的元数据,进而来认识数据中心的元数据。 按照传统的定义,元数据( m e t a d a t a ) 是关于数据的数据。在数据仓库系统 中,元数据可以帮助数据仓库管理员和数据仓库的开发人员非常方便地找到他们 所关心的数据;元数据是描述数据仓库内数据的结构和建立方法的数据吣n ,可 将其按用途的不同分为两类:投术元数据( t e e h n i c a lm e t a d a t a ) 和业务元数据 ( b u s i n e s sm e t a d a t a ) 。 业务元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实 际系统之闾的语义层,使得不懂计算机技术的业务人员也能够“读懂”数据仓库 中的数据。业务元数据主要包括以下信息:使用者的业务术语所表达的数据模型、 对象名和属性名;访问数据的原则和数攒的来源;系统所提供的分析方法以及公 式和报表的信息;具体包括以下信息: 企业概念模型:这是业务元数据所应提供的重要的信息,它表示企业数据模 型的高层信息、整个企业的业务概念和相互关系。以这个企业模型为基础,不懂 数据库技术和s q l 语句的业务人员对数据仓库中的数据也能做到心中有数。 多维数据模型:这是企业概念模型韵熏要组成部分,它告诉业务分析人员在 数据集市当中有哪些维、维的类别、数据立方体以及数据集市中的聚合规则。这 里的数据立方体表示某主题领域业务事实表和维表的多维组织形式。 数据中心元数据对元数据的认识是:元数据是“关于数据的数据” 1 8 j 9 1 。 元数据即m e t a d a t a ,其中的m e t a 是希腊语,意思是“改变”,m e t a d a t a 的定 义为数据本身及其变化的描述。人们对元数据的理解比较混乱,迄今尚没有一个 6 、 东北大学硕士学位论文 第二章主题及元数据介绍 统一的元数据定义。但元数据( m e t a d a t a ) 是关于数据的数据( d a t aa b o u td a t a ) ,是关 于数据和信息资源的描述信息一这一点是大家共识的。它通过数据的内容、质量、 条件和其他特征进行描述和说明,帮助人们有效地查找、评价、获取、比较和使 用数据。 从元数据标准涵盏的功能层次来划分,可以分成两个层次,首先是如何描述 要著录的对象方面的规定 2 0 , 2 6 】,如元素定义;其次,编码规则,编码是为了适合 数据或元数据记录传输和存储,编码规则说明编码数据的类型、有序排列、结构 和编码模式,用于执行编码服务。 2 2 2 元数据标准分析 下面对国际上比较有影响的7 种元数据进行了分析和比较,它们分别足 c d w a 、d c 、e a d 、f g d c c s d g m 、g i l s 、t e i 、v r a 。 ( 1 ) c d w a ( c a t e g o r i e s f o rt h ed e s c r i p t i o no f w o r k so f a r t ) 艺术作品描述类目 c d w a 元数据标准是为从事艺术史研究、艺术品管理人员,以及信息技术专 家而设计的元数据标准,用来描述艺术品,主要在博物馆界使用【3 4 】。 ( 2 ) d c ( d u b l i nc o r e ) 都柏林核心元素集 d u b l i nc o r e 元数据格式描述的对象是网络资源。最初由美国o c l c 公司 发起,国际性合作项目d u b l i nc o r em e t a d a t ai n i t i a t i v e 设计,由参与合作项目的机 构共同维护修改,每年都召开w o r k s h o p ,并在会上提出新的修改意见。最初应用 目的是为了网络资源的著录与挖掘,由于d c 元素简单易用,加之o c l c 的大力 推广和网络资源著录的巨大需求,d c 发展成为可用于任何媒体。简单的元素定 义和设置可以很方便的著录,是d c 获得广泛应用的重要原因,然而它也带来另 外一个问题,对著录对象的描述深度不够,不能进行专指度较高的检索。 ( 3 ) e a d ( e n c o d e d a r c h i v a ld e s c r i p t i o n ) :编码档案描述 e a d ( e n c o d e d a r c h i v a ld e s c r i p t i o n 编码档案描述) 由美国国会图书馆网络丌 发& m a r c 标准办公室维护( t h en e t w o r kd e v e l o p m e n ta n dm a r cs t a n d a r d so f f i c e o f t h el i b r a r yo f c o n g r e s s ) ,同时美国档案管理员协会( t h e s o c i e t yo f a m e r i c a l l a r c h i v i s t s ) 是其合作者。e a d 格式主要用于描述档案和手稿资源,包括文本文档、 电子文档、可视材料和声音记录。 ( 4 ) f g d c ( f e d e r a lg e o g r a p h i cd a t ac o m m i t t e e ) 联邦地理数据委员会 f g d c 数字地理元数据内容标准的目的是确定一个描述数字地理空间数据的 术语及其定义集合,包括满足这些目的的数据元素、复合元素( 一组数据元素) 以及它们的定义和域值,以及描述数字地理空间数据集的元数据信息内容。 东北大学硕士学位论文第二章主题及元数据介绍 f 5 ) g i l s ( g o v e r n m e n ti n f o r m a t i o nl o c a t o rs e r v i c e ) 政府信息定位服务 g 1 l s 的研究机构有:t h eo f f i c eo fm a n a g e m e n ta n db u d g e tt h en a t i o n a l a r c h i v e sa n dr e c o r d sa d m i n i s t r a t i o n ,t h eg e n e r a ls e r v i c e sa d m i n i s t r a t i o n 。g i l s 项目的目的是为公众提供可以方便地检索、定位、获取公共联邦信息资源的服务。 g i l s 体系是一个分布式信息资源利用体系。各政府机构利用g i l s 规定的标 准描述自己的信息资源,建立相应的资源目录和检索系统( g i l s 定位器或g i l s 服务器) :如果信息资源本身是数字化资源,则在资源目录和实际资源间建立链接; 公众可以通过互联网直接检索这些目录数据,并通过链接直接获得有关数字化资 源。g i l s 体系的基本构建要素是对具体资源进行描述的元数据,即g i l s 记录 ( g i l sl o c a t o r r e c o r d ) ,它用来描述信息资源的内容、位置、服务方式、存取方 法等,描述对象主要是来自政府的公用信息资源。 ( 6 ) t e i ( e l e c t r o n i ct e x te n c o d i n ga n di n t e r c h a n g e ) :电子文本编码与交换 t e i 元数据标准是一套用于电子形式交换的文本编码标准。标准规定了对电 子文本的描述方法,标记定义,记录结构,文本编码方式。一般认为t e i 是包含 了m e t a d a t a 和c o n t e n t 两部分描述或标记方法的元数据标准。 t e l 适用于对电子形式的全文的编码和描述。t e l 元数据标准同时也规定了 可供数据交换的标准编码格式,使用s g m l 作为编码语言。t e l 格式具有很大限 度的灵活性、综合性、可扩展性,能支持对各种类型或特征的文档进行编码。 t e i 元数据标准可以对元数据( m e t a d a t a 通常叫做书目信息部分) 和内容数据 ( c o n t e n td a t a ) 进行描述。 r 7 ) v r a ( v i s u a lr e s o u r c e sa s s o c i a t i o nd a t as t a n d a r d sc o m m i t t e e ) v r a 视觉资料 核心类目 v r a 由美国视觉资料协会制定,是为在网络环境下描述艺术、建筑、史前古 器物、民间文化等艺术类可视化资源而建立的元数据标准【3 ”。目前已推出到第三 版本,在前两个版本中,v r ac o r e 格式由两个部分组成:t h ew o r kd e s c r i p t i o n c a t e g o r i e s ( 包括1 9 个数据单元) 和t h e v i s u a ld o c u m e n td e s c r i p t i o nc a t e g o r i e s ( 包 括9 个数据单元1 。v r a 在2 0 0 0 年7 月2 4 日推出了3 0 版本,在第3 版本中,将 t h ew o r k ( w ) 和t h ev i s u a ld o c u m e n t ( v ) 单元进行了合并,制定了1 7 项元数据。 v r a 著录单元集合比较简单,比较适用于艺术作品、建筑、民间文化等三维实体。 表2 。l 对国际上比较有影响的7 种元数据进行了分析和比较,它们分别是 c d w a 、d c 、e a d 、f g d c c s d g m 、g 儿s 、t e i 、v r a 。 8 东北大学硕士学位论文第二章主题及元数据介绍 一-_-_-_-_-_-_-_-_-_-_-h_-,- 表21 几种国外主要元数据比较对照表 需求情况元素 应用使用 目的结构特点核心元素 从事艺术历史研究、 对芝术品的反映了艺术品的特点 c d 、v a 岂术品 艺术品管理的人员, 6 类2 3 个 分类编剧类耳和元素较多 以及信息技术专家 任何人,包括学者、结构简单,包含了嫱 d u b l i n 嘲络资源专家和图书馆编目资源发现 常用的i5 个核心元1 5 1 7 m e t a 个 c o 瑶 人员素; 按照s e c t i o n 、7 段主要段,j 索 地理窄闽信政府,公定或私立研 为n s d i 制 f g d c作、共享地理 c o m p o u n de l e m e n t 、 可以独立使用: 息究机构或公司 d a t ae l e m e n t 组织的, 3 个辅助段,1 i j 信息 结构复杂以独立使用 政府的公用 方便公众查e l e m e n t和s u b 0 i l s政府部门找定位公用e l e m e n t ,结构复杂:3 1 个元素 信息资源 鼬信息资源可与m a r c 格式转换 艺术、建筑、 史前古器物、方便描述艺 v r a民间文化等艺术品收藏单位术类可视化 结构简单,第三版尤 1 7 个 艺术类可视资源 其类似d c 化资源 档案和手稿 分为m e t a d a t a 和 资源,包括文针对电了文 c o n t e n td a t a 两部分。 e a d本和电子文任何本全文的编 m e t a d a t a 部分包括 d a m 必备部分: 和 档、可视材料 码标准 - 和声音记录 两部分, 结构比较简单 m e t a d a t a 必备: 分为r n e t a d a t a 和 t e i h e a d e l 对电子彤式电子形式交c o n t e n td a t a 两部分, f i l e d e s c t e i 全文的编码任何换的文本编m e t a d a t a 部分包括 和描述码标准 t e i h e n d e r , f r o n t 翮 - e n c o d i n g d e s c p r o f i l e d e s e b a c k ,结构简单 r e v i s i o n d e s c 。9 东北大学硕士学位论文第二章主题及元数据介绍 经过分析和比较,有下面的结论。 f 1 ) 元数据的设计原则:从对象特点出发的个性化 表3 2 元数据标准分别适用于不同类型的对象,其使用者和所针对的用户范 围电有所不同,元数据实现的功能虽然都包括对资源的描述、管理和定位,以及 对资源的评估,但个性化的特点非常突出。比如,c d w a 、f g d c 、g i l s 、d c 、 v r a 、c d l 等可以说均实现了上述功能,但其所包含元素如 “o r i e n t a t i o n m a n a g e m e n t ”、“i n s c r i p t i o n m a r k s ”( c d w a ) 、“c l o u dc o v e r ”( f g d c ) 、 “c o v e r a g e ”( d c ) 等则很有特性,代表了不同类型的资料的特色。可以结论说, 制作元数据标准的出发点要以具体的应用为背景,针对某一特定类型的资源或实 体的特点,不求标准可以包罗力象,满足具体需要即可1 3 6 t 3 7 ,4 2 1 。这样可以保证元 数据标准是简单易用,而且具有足够的描述能力。 ( 2 ) 元数据的设计原则:互操作性 可扩展标记语言( x m l ) 是独立于系统和计算机平台的,有很大的市场前景, 是为在w w w 上进行数据交换而设计的 2 8 , 4 1 l 。使用基于x m l 的编码规则是较好 的选择,是使系统理解未知标准的元数据 9 , 1 3 】,从而实现互操作的第一步。 ( 3 ) 元数据的功能:不仅是对数据和对象的管理,也强调用户需求的实现 在此基础上元数据实现的功能既包括对资源的描述、管理和定位,也有对资源的 评估和为用户提供更多的检索途径,为此大部分元数据标准都设置了针对这些需 求的特色元素。c d w a 、f g d c 、g i l s 、d c 、v r a 、c d l 等可以说均实现了上 述功能,其所包含元素如“o r i e n t a t i o n m a n a g e m e n t ”、“i n s c r i p t i o n m a r k s ”( c d w a ) 、 “c l o u dc o v e r ( f g d c ) 、“c o v e r a g e ”( d c ) 等则更有代表性。 ( 4 ) 元数据的结构:多层次与多功能的结合 元素集包括核心元素集和个别元素集,核心元素一般为1 0 个左右;元素层次 可以有一级元素和子元素,但强调层次不可过多,予元素不可过繁;元素内容则 同时包括对物理彤态的对象及其数字化信息两方面的描述;元数据也可以和内容 数据结合使用。 2 2 3 元数据的作用 伴随着电子技术和信息技术的广泛应用,作为各种信息的基础支持的元数据 信息在全球范围内正受到越来越多的关注,社会各领域对元数据信息的需求也越 柬越大。不同机构对数据从各自的角度进行采集、处理、生产。这些数据既可以 满足本单位的需要,也可以满足其它应用需要。人们便希望用种统一的格式来 表示数据信息。以满足不同数据部门之间的资源共享。元数据的建立可以满足人 1 0 东北大学硕士学位论文 第二章主题及元数据介绍 们对信息共享的需求。 具体说来元数据的主要作用可以归纳为如下几方面: n ) 元数据是进行数据集成所必需的 数据中心的特点之一就是它的集成性。这一特点不仅体现在它所包含的数据 卜,还体现在实施数据中心项目的过程当中。一方面,从各个数据源中抽取的数 据要按照一定的模式存入数据中心中,这些数据源与数据中心中数据的对应关系 及转换规则都要存储在元数据知识库中;另一方面,在数据中心项目实施过程中, 很容易形成“蜘蛛网”现象,而元数据管理是解决“蜘蛛网”的关键。如果在 建立数据中心的过程中,注意了元数据管理,在集成到数据中心中时就会比较顺 利;相反,如果在建设数据集市的过程中忽视了元数据管理,那么最后的集成过 程就会很困难,甚至不可能实现。 ( 2 ) 元数据定义的语义层可以帮助最终用户理解数据 最终用户不可能象开发人员那样熟悉数据库技术,因此迫切需要有一个“翻 译”,能够使他们清晰地理解数据的含意。元数据可以实现业务模型与数据模型之 i 、日j 的映射,因而可以把数据以用户需要的方式“翻译”出来,从而帮助最终用户 理解和使用数据。 ( 3 ) 元数据是保证数据质量的关键 数据中心建立好以后,使用者在使用的时候,常常会产生对数据的怀疑。这 些怀疑往往是由于底层的数据对于用户来说是不“透明”的,使用者很自然地对 结果产生怀疑。而借助元数据管理系统,最终的使用者对各个数据的来龙去脉以 及数据抽取和转换的规则都会很方便地得到,这样他们自然会对数据具有信心: 当然也可便捷地发现数据所存在的质量问题【3 9 】。甚至国外有学者还在元数据模型 的基础上引入质量维,从更高的角度上来解决这一问题。 ( 4 ) 元数据可以支持需求变化 随着信息技术的发展和企业职能的变化,企业的需求也在不断地改变。如何构造 一个随着需求改变而平滑变化的软件系统,是软件工程领域中的个重要问题。 传统的信息系统往往是通过文档来适应需求变化,但是仅仅依靠文档还是远远不 够的f 4 2 a 3 。成功的元数据管理系统可以把整个业务的工作流、数据流和信息流有 效地管理起来,使得系统不依赖特定的开发人员,从而提高系统的可扩展性 东北大学硕士学位论文第三章数据中心架构设计 第三章数据中心架构设计 3 1 数据中心业务架构设计 3 1 1 数据中心业务模型 数据中心在社会保障体系的价值链中起着非常重要的作用。我们应从公共服 务产品、电子化业务协作两个角度,构造社会保障信息系统的价值链。基于电子 化业务协作的价值链,提升业务协作机构之间的电子化协同工作能力,提高社会 保障机构的办事效率,节省业务处理成本。 基于公共服务产品的价值链,提高社会保障机构的服务形象,为市民与企业 提供在任何时间在任何地方利用任何设备获取社会保障相关服务( 5 a : a n y o n e - - a n y t i m e h y r l a c e , - - a n y d e v i c e - a n y s e r v i c e ) ,让社会保障服务延伸到每 一个市民身边。 根据上述的价值链模型设计,图3 1 形象的表示了社会保障信息系统数据中 心业务模型设计。 致新一扣山信总 餐源体系、 省数据 中心交接 壬务 定铡盈臂 _ 1理 教委 数据中心一 中心恃理端 。 劳动 、 = = i ?主腰数据订噼及发布 数据服务注册及申请 其它政府部i 1 主题数据 使用申请 数据中心的 服务对荤 住痨 公积金 磐资 l 数据中心烧 一客户端 图3 1 数据中心业务模型简图 f i g3 1t h eb u s i n e s sm o d e lo f d a t ac e n t e r 该模型以信息资源体系为核心,通过数据中心中心端系统与统一客户端系统 1 2 东北大学硕士学位论文第三章数据中心架构设计 的协同工作,为社保、公安等数据中心服务对象提供统一的基于服务的数据交换 接口,同时为相关服务对象提供宏观的协同工作流服务,以实现整个社会保障信 息系统价值链的统一。 3 。l 。2 数据中心业务架构设计 数据中心系统边界外围的接入环境从抽象的角度看有四
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第一次海边旅行记:海浪沙滩与我记事作文6篇
- 春天里的一棵树中考作文(11篇)
- 高一物理实验设计:《重力与弹力实验操作技巧》
- 一次难忘的体验事件记叙作文(4篇)
- 经济全球化与文化多样性的保护-洞察阐释
- 公益组织德育项目负责人岗位职责
- 疫情期间课程评估与调整计划
- 南方科大产业园规划方案
- 七年级半命题作文我什么我快乐500字13篇范文
- 2024-2025第二学期九年级英语课程创新计划
- 人才盘点与人才储备计划设计合同
- 医美公司保密协议书
- 2025届浙江省嘉兴市高三9月基础测试-数学(含答案)
- 道路交通安全宣传课件
- 艺术基金授课协议书
- 2025年入团考试时事热点及试题与答案
- (2025)保密观题库及答案
- 中华人民共和国民营经济促进法
- 2024年山东省济南市中考地理试题卷(含答案解析)
- 电大信息技术应用终结性作业
- JJG 162-2019饮用冷水水表 检定规程(高清版)
评论
0/150
提交评论