(管理科学与工程专业论文)面向政府信息资源的数据仓库元数据研究.pdf_第1页
(管理科学与工程专业论文)面向政府信息资源的数据仓库元数据研究.pdf_第2页
(管理科学与工程专业论文)面向政府信息资源的数据仓库元数据研究.pdf_第3页
(管理科学与工程专业论文)面向政府信息资源的数据仓库元数据研究.pdf_第4页
(管理科学与工程专业论文)面向政府信息资源的数据仓库元数据研究.pdf_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大连理工大学硕十研究生学位论文 摘要 围家信息化领导小组关于我国电子政务建设指导意见指出:“十五”期间,我 国电子政务建设要坚持整合资源、统一标准、保障安全的原则。本文作者在对目前政府 信息资源状况进行细致分析,并对国内外各类元数据标准深入研究的基础上,利用数据 仓库技术以及元数据理论和方法,设计出我国政府信息资源元数据的创建方法,并建立 政府信息资源元数据标准体系,实现对标准的管理。通过对政府信息资源元数据的研究, 解决政府信息资源整合过程中涉及到元数据的问题。 本文以政府信息资源元数据为主要研究对象,共有五章,围绕如何在标准元数据体 系下对政府信息资源元数据进行描述、实现对政府信息资源元数据标准化管理、解决政 府信息资源整合进行了研究。第一章简单介绍了政府信息资源元数据的研究背景、国内 外政府信息资源元数据的研究状况以及研究的目标和意义;第二:章介绍了政府信息资源 的概念、分类和特征,元数据的概念、各类元数据标准和元数据的应用领域,设计一种 政府信息元数据的描述方法,并用实例说明了政府信息资源标准元数据的表述;第三章 介绍了我国政府信息资源元数据标准化的现状,在国家信息编码标准体系和电子政务标 准体系框架的基础上建立政府信息资源元数掘标准体系,并阐述了政府信息资源元数据 标准的管理方法;第四章以本人参与的项目“数字长海”建设规划为案例,说明了氏海 县政府信息资源元数据的设计、元数据标准体系的建立,并利用标准7 i 数据解决政府信 息资源共享的问题;第五章作者对研究结果进 i 了总结和评价,并提m 了末米的研究方 向。 关键词:政府信息资源;元数据;政府信息资源管理 赖洪波:面向政府信龃资源的数据仓库元数据研究 s t u d yo nd a t aw a r e h o u s em e t a d a t ao fg o v e r n m e n ti n f o r m a t i o n r e s o u r c e s ( g i r ) a b s t r a c t “s u g g e s t i o no nb u i l d i n ge l e c t r o n i cg o v e r n m e n ta 髓j ro fc h i n a ”b yi n f o r m a t i o nw o r k l e a d i n gg r o u po ft h es t a t ec o u n c i lp r o p o s e dt h ep r i n c i p l e sw e r ei n t e g r a t e dr e s o u r c e s , u n i f l e ds t a n d a r d g n a r u n t e e ss a f e l yd u r i n gt h ep e r i o do f “1 0 t hf i v e y e a rp l a n ”:b a s e do nt h e d e t a i l e da n a l y s i so nt h ec u r r e n ts t a t u so fg o v e r n m e n ti n f o r m a t i o nr e s o u r c e sa n ds t u d yo n m e t a d a t a ,t h ea u t h o rd e s i g nt h em e t a d a t ad e s c r i p t i o nm e t h o do fg i rb yu s i n gd a t aw a r e h o u s e t e c h n i q u ea n dm e t a d a t am e t h o d i na d d i t i o n t h es t a n d a r da r c h i t e c t u r eo fg i rm e t a d a t ai s d e s i g n e di no r d e rt om a n a g et h es t m a d a r d t h ei s s u eo fm e t a d a t ac a nb er e s o l v e db ys t u d y i n g o nt h em e t a d a t a o fg 【r t h ep r i m a r ys u b j e c ti n v e s t i g a t e di nt h i ss t u d yi sm e t a d a t ao fg l r t h ew h o l et h e s i s c o n s i s t so ff i v ec h a p t e r s ,w h i c hi n c l u d eh o wt od e s c r i b et h em e t a d a t ao fg i r ,h o wt oc a r r y o u tt h es t a n d a r dm a n a g e m e n to nt h em e t a d a t ao fg i r a n dh o wt oa c h i e v et h ei n f o r m a t i o n s h a r i n g i nt h ef i r s tc h a p t e r ,t h er e s e a r c h i n gb a c k g r o u n da n dp r o g r e s s e so fg i ra r ei n t r o d u c e d , t h eo b j e c t i v ea n ds i g n i f i c a n c eo ft h i st h e s i sa r ea l s oe x p a t i a t e d i nt h es e c o n dc h a p t e r ,t h e c o n c e p t ,c l a s s i f i c a t i o n ,a n dc h a r a c t e r i s t i c so fg i r ,t h ec o n c e p t ,v a r i o u ss t a n d a r d s a n d a p p l i c a t i o n so fm e m d a t aa r ee x p o u n d e d i na d d i t i o n ,t h ea u t h o rd e s i g n st h em e t h o do f d e s c r i b i n gt h em e t a d a t ao fg i r ,a n de x p l a i n si tw i t ht h ee x a m p l e i nt h et h i r dc h a p t e r ,t h e p r e s e n ts i t u a t i o no fs t a n d a r dm e t a d a t ao fg i ri si n t r o d u c e d t h ea u t h o rm a k ec l e a rt h e b u i l d i n go fs t a n d a r dm e t a d a t ao fg o v e r n m e n ti n f o r m a t i o ns y s t e mb a s e do nt h en a t i o n a l s y s t e m o fs t a l l d a r d sf o ri n f o r i l l a l i o nc l a s s i f i c a t i o n c o d i n g a n dt h es t a n d a r do f e g o v e r n m e n t ,t h em a n a g e m e n to fm e t a d a t ai si n t r o d u c e di nt h i sc h a p t e rt o o i nt h ef o u r t h c h a p t e r ,t h er e a lp r o j e c to fp l a n n i n gn a m e d d i g i t a lc h a n g h a i ”i sd e s c r i b e d ,t h ed e s i g no f c h a n g h a ig i rm e t a d a t aa n dt h eb u i l d i n go fs t a n d a r dm e t a d a t as y s t e ma r ee x p l a i n e di nt h i s p l a n n i n g i nt h el a s tc h a p t e r ,t h ec o n c l u s i o n sa r ee v a l u a t e d ,a n dt h ef u t u r er e s e a r c hd i r e c t i o ni s o u t 】i n e d k e yw o r d s g o v e r n m e n ti n f o r m a t i o nr e s o u r c e s ( g 1 r ) ;m e t a d a t a ;m a n a g e m e n to f g i r 独创性说明 作者郑重声明:本硕士学位论文是我个人在导师指导下进行的研究工 作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得大连理 工大学或者其他单位的学位或证书所使用过的材料。与我同工作的同志 对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。 作者签名:趣i 釜盈日期:21 :! ! 人连理r 大学硕j _ 研究乍学位论文 大连理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位论文版权使用 规定”,同意大连理工大学保留并向国家有关部门或机构送交学位论文的复印件和电子 版,允许论文被查阅和借阅。本人授权大连理工大学可以将本学位论文的全部或部分内 容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论 文。 作者签名:裁j 乎爱 导师签名:至塾曼垒鱼 卫! ! 年l 月么r 大连理t 大。硕士研究生学位论文 1 绪论 1 。1 研究背景 _ 二卜一世纪是信息技术飞速发展的世纪。经济全球化、社会信息化的趋势使我因的 政治、经济、文化等领域对于信息基础设施的依赖性不断增强,人们的生活方式也随之 发生深刻的变化。 一方面,计算机和网络技术的发展使政府信息资源的数量和种类迅速增加,这使得 政府信息资源的管理发生改变。另一方面,社会的不断进步使人们对信息的价值也愈加 重视,其利用的要求也不断提高。如何保证政府信息资源的有效管理使之能够在政府各 部门之间实现共享摆在我国政府信息工作者面前,成为迫切需要解决的难题。 国家信息化工作领导小组通过的关于我国电子政务建设指导意见指出,在“十 五”期间,我国电子政务建设的指导思想是:以邓小甲理论和“三个代表”重要思想为 指导,适应改革丌放和现代化建殴对政务工作的要求,转变政府职能,提高工作效率和 监管的有效性,更好地服务人民群众;以需求为导向,以应用促发展,通过积极推广和 应用信息技术,增强政府工作的科学性、协调性和民丰性,全面提高依法行政能力,加 快建设廉洁、勤政、务实、高效的政府,促进国民经济持续伙速健康发展和社会全面进 步。我国电子政务建设要峰持以下原则:统一规划,加强领导;需求主导,突出重点; 整合资源,拉动广业;统一标准,保障安全。关于我国电子政务建设指导意见特别 指出电子政务建设必须充分利用已有的网络基础、业务系统和信息资源,加强整合,促 进互联互通、信息共享,使有限的资源发挥最大效益。要在符合标准的条件下优先使用 国产设备与软件,逐步推进系统建没、运行维护的外包和托管模式,带动我国信息产业 发展。加快制定统一的电子政务标准规范,大力推进统一标准的贯彻落实。要正确处理 发展与安伞的天系,综合平衡成本和效益,一手抓电了政务建设,一手抓网络与信息安 全,制定并完善电子政务网络与信息安全保障体系。 1 2 国内外政府信息资源元数据的研究状况 目前政府信息的元数据格式主要有两种:g o v e r n m e n ti n f o r m a t i o nl o c a t e rs e r v i c e 【0 i j 0 2 1 0 3 1 1 0 4 1 ( 以下简称o i l s ) 及d u b l i n c o r e 0 5 i 。其巾依照o i l s 发展指引服务的剀家较多, 包括美国、加拿大、日本、俄罗斯等,澳大利亚以d u b l i nc o r e 作为构建系统的标准。 在系统规格方面年要遵循z 3 9 5 0 的信息检索标准,可跨资料库,跨机构组织,甚至国 界,以单一检索界面检索所需的政府信息资源。虽然各国采取的标准各异,名称也不尽 相同,但为了使政府信息资源达成共享,均朝着令球一体化的方向发展。 0 6 j 赖洪波:面向政府信息资源的数据仓库元数据研究 对于g i l s ,有的学者认为是一种信息检索系统,该系统依据国际标准建立,可跨 机构查询政府信息,是国家信息基础设施( n i i ) 的一部分;有的则认为是一种元数据 格式,依据信息特性设计栏位,可展现某种知识架构,分析资料来源,保障资料安全, 避免使用者直接存取实际资料可能造成损失或蓄意破坏的风险;从字面上看,g i l s 又 像是一种服务形式。综上所述,g i l s 代表“系统”、“元数据”及“服务”等概念。 它是一个辨识描述政府信息资源,提供获得该资源方式的系统,依据z 3 9 5 0 建立系统 规格书,并设计专属政府信息的元数据栏位,建立一套指引记录( 类似编目、款目) , 可在网络环境中检索并取用,且记录中可能包含超连接,指向实际文件,提供公众便利 获取政府信息的服务。 从世界范围看,推进政府部门办公电子化、自动化、网络化,实现信息资源共享已 是大势所趋。联合国经济社会事务署把推进发展中国家政府信息化作为今后工作的重 点,希望通过信息技术的应用改进政府组织,重组公共管理,最终实现办公自动化和信 息资源的共享。目前,世界各国正在积极构建自己的“电予政府”,我国实施“政府上 网工程”,其目的也在于推动我国各级政府部门为社会服务的公共信息资源汇集和应用 上刚,实现信息资源共享,并以此来带动和促进我困困民经济和社会生活的信息化。据 2 0 0 1 年1 月的统计数据,政府上网工程网站g o v c n 下的各级政府域名已达2 4 0 0 多个, 其中有1 2 0 0 多个政府部门拥有w w w 服务器,面向社会提供服务。到2 0 0 0 年全国已 有8 0 的政府上网。我国政府通过上网一定程度上促进了政府信息资源的公开化,但与 发达国家相比还存在很大差距。我困各级政府上网的信息量普遍较少,信息检索、信息 服务的功能较弱,更没有将所有政府信息资源数据库以单一窗u 检索( 跨库检索) 的机 制。 目前,我国尚未建立政府信息资源元数据标准,针对政府信息资源元数据的研究也 相对较少,而针对某些具体的领域,如档案【0 7 】 0 8 1 、电子公文等都有较多的研究。 1 3 政府信息资源元数据研究的方法、目标和意义 1 3 1 研究方法 政府信息资源具有数量大、种类多、内容多样化等特点,本文作者通过图书馆和互 联网查阅大量资料,首先对政府信息资源进行详细的研究,结合i 数据的一些理论和标 准,提出政府信息资源元数据的描述方法,建市一套政府信息资源数据标准管理体系; 利用统一的元数据标准,解决政府信息资源共享问题,整合政府信息资源,提高政府工 作人员对信息的利用效率。 大连珲j 二大学硕士研究生学位论文 通过研究政府信息资源元数据,解决政府信息资源整合。在电子环境下,由于政府 信息资源内容复杂、种类繁多、数量巨大,为了保证信息的原始和真实,人们f i 得刁i 借 助元数据,由于元数据描述了政府信息资源的内容和外部特征,并记录有信息在设计、 形成、传递、维护这运转流程中的全部情况,因此只有在掌握元数据的基础上,才能 对政府信息资源进行有效而安全的控制,保证信息资源的完整性、真实性和证据效力, 它同时也是政府信息资源组织、维护和检索的重要依据和手段。将元数据应用于政府信 息资源管理的意义非常重大。政府信息资源元数据记录了信息的特征及其变化情况,是 有关信息数据库中所储存的内容、结构、背景的全面、系统和有序信息。元数据可以用 来组织和管理信息,并挖掘信息资源,帮助用户查询所需得信息,利用它可以通过网络 在数据库中准确地识别、定位和访问信息,用来建立信息的数据目录和数据交换中心, 通过数据目录和数据交换中心等提供的元数据内容,用户可以共享到信息、维护数据结 果,以及对数据提出优化方案等,元数据还能够提供数据转换方而的信息,以保证信息 的长期存取。 1 3 2 研究目标和意义 本文的研究f 1 标是设计一套标准的、可升级的政府信息资源元数据格式,实现对信 息的描述,达到资源共享的目的。将各部门信息资源详细调查,组织起米,加以描述。 绎过描述的政府信息成为标准元数据,在元数据管理体系下实行标准化管理,并提供标 准的数据接口。各部门可以从数据接口中查询、获取信息,进行网上联合办公,办事程 序统入口、办事结果统一出口等系统的建设。在企业和居民看来,整个政府是一个统 一、快捷的办事人部门,真正实现电子政务的服务功能,促进信息交换,加强信息沟通, 使更多的人共享信息。 电子政务中信息资源整合是实施电子政务的核心,政府信息资源开发利用的层次决 定了电子政务的发展过程,有效组织丌发利用我困丰富的信息资源,服务于电了政务足 一个需要研究和探索的重大问题,需要我们不断总结经验教训,充分发挥政府信息资源 价值,实现电了政务功能。 通过对政府信息资源元数据的研究,作者认识到建立+ 套在国际i :通用的元数据标 准可以有效地避免我国电子政务的重复建设,解决我田电子政务建设过程中出现的“信 息孤岛”等问题。 赖洪波:面向政府信息资源的数据仓库元数据研究 2 政府信息资源元数据 2 1 政府信息资源 2 1 1 政府信息资源概念 政府信息资源可以从狭义和广义两个方面来理解。狭义地讲,政府信息资源是政府 部门在政务过程中产生、获取、处理、存储、传递和利用的信息资源;广义的理解,政 府信息资源是对一切产生于政府内部,或虽然产生于政府外部,但对政府活动有影响的 信息资源的统称。【1 0 】 政府信息资源具有较为宽泛的外延,具体内容包括信息内容、存储与获取信息内容 的数据库系统、传递信息内容的网络通讯设施以及开发管理信息资源相关的人才、资金 等。由于政府与社会、与每一个机构、每一个人都有着直接或间接的联系,因此政府因 处理政务而产生的各类信息总量多的惊人。据统计,目前各级政府部门大约聚集了全社 会信息总量的8 0 。 由丁政府信息资源很多直接涉及到国民经济与社会发展的状况,所以与一般的信息 资源相比具有更高的价值,也具有更可靠的质量和更高的可信度,是社会不可多得的信 息财富。 2 1 2 政府信息资源分类 我国政府信息是指国家机关部门,在运行过程中从十l :会生活获取的各种信息,它们 发出的各种决策、执行信息及接受的各种信息反馈的总和1 1 1 l 。我国政府信息资源可以按 其掌控的国家机构进行划分。我国的幽家权力机构是以叶央为核心的“6 + 1 + 2 体系”l o l l 。 “6 ”是指通常所说的“六大领导班子”,即巾共中央委员会、中共中央纪律检查委员 会、全国人民代表大会及其常务委员会、国务院、中央军事委员会和中国人民政治协商 会议全国委员会;“l ”是指国家主席;“2 ”是指最高人民法院和最高人民检察院。由 此我国政府信息资源按政府机构划分如图2 1 所示。 国家机构每天处理大量的信息,种类繁多。可以从不同的角度对政府信息资源进一 步划分: 1 2 j f 1 ) 政府决策信息。如国家和地方的政策、法规条例、决策咨询、战略发展研究报 告( 包括个职能机构和院所历年的研究成果) 和阶段性的总体规划; ( 2 ) 为社会服务的信息。如国际国内重大政治新闻、经济运行分析、热点透视、统 计报表、市场供求信息、社会与经济预测信息、金融财经信息、科技与人才信息等等; 大连理工大学硕士研究乍学位论文 ( 3 ) 各政府组成部门的工作职能、各种公文、会议情况、总结报告、记录数据、办 公文档、机关行政管理信息、经验介绍、驻外办事处工作流信息等政府间交流信息; 政匝豆耍匹噩垂亟 二二二 府 信 息 资 源 睑旦垦! ! 垂丕垒墨基堂箜耋堡叁兰垄盟笪星j 剧2 1 我围政府信息资源划分 f i g 2 1t h ec l a s s i f i c a t i o no f g i r ( 4 ) 整个城市的各类资源要素储备和分布情况,行政组织及人力资源调配预案,对 自然灾害和意外事故的处理重大事件( 维护城市稳定方面的信息:突发事什、重大案件、 大规模群众集访和应用早期掌握的信息解决弱势群体困难、做好群众工作) 的应急预案 数据库; ( 5 ) 不断收集城市规划与发展的思想序以及城市发展和政府行政的历史沿革等信 息。还应包括:城市地下网、管、道和线的分布和结构。 2 1 3 政府信息资源的特征 政府信息除了具有一般信息的基本特征外,还有其自身的特点:副 ( 1 ) 宏观性 信息理论将信息分为宏观、中观和微观信息。政府信息从本质上讲是属于宏观信息。 一般来讲,政府信息的着眼点不是追求直接的经济效益,而是政府的l :作效益或社会效 益,它乇要从宏观角度反映战略性、全局性的重大情况和问题,即使是反映一些局部性 的情况和问题,也对全局具有普遍的意义。 ( 2 ) 权威性 赖洪波:面向政府信息资源的数据仓库元数据研究 政府信息的主要来源是各级政府及其职能部门,而各级政府及其职能部门是国家权 力机关的执行机关,代表国家行使权力,制定政策和执行政策,这种政治地位决定了它 的权威性。因此,由各级政府及其职能部门提供、发布的信息,具有很高的真实性和可 靠性。 ( 3 ) 目的性 政府信息具有很明确的目的性,或者为政府决策服务,或者为各部门各行业的发展 服务,或者为社会公众服务。 ( 4 ) 超前性 政府信息的目的性要求政府信息必须具有一定的超前性。通过对现有信息进行深层 次的筛选、分析和综合,预测事物的发展趋势,对政府的科学决策具有重要意义。 ( 5 1 层次性 各级政府及其职能部门所处的层次不同,担负的工作职责不同,所掌握的信息内容 也不同。 2 1 4 我国政府信息资源管理现状 2 0 0 1 年以后,电子政务在全国热起来,许多地力和政府机构采取行之有效的措施, 发展电子政务,加强信息资源建设。北京、上海、广东、福建等数十家地方政府宣布建 设“数字化北京”、“数字化上海”、“数字化广东”等计划。 我国政府电予信息资源开发开放存存的问题: 1 5 1 ( 1 ) 重硬轻软、信息资源建设资金投入严重不足 信息资源丌发利用是信息基础设施投资增值的最大引擎,信息资源丌发利用是信息 基础设施三个要素( 计算机、通信系统和信息内容) 中的核心要素。从困外信息化进程 的成功经验看,往往是三分信息技术,七分信息设备,十二分的信息资源。任何国家在 建设信息基础设施时,其直接目的都是使全社会能够快速有效地获取、使用信息资源, 利用信息创造财富,实现经济增跃和知识创新。目前我困对信息基础设施的硬件方面投 入很大,发展速度也比较快,在“九五”期间,令困邮电投资规模达到6 3 2 9 亿元,建 成以光缆为手,微波、卫星综合利用,固定电话、移动通讯、数据通讯、多媒体通讯多 网并存,覆盖全国城乡,通达世界,大容量、高速率,安全可靠的电信网。但对软件和 信息资源丌发利用的投入只有1 5 亿元左右。对信息资源开发利用投入不足会导致国家 的巨大硬件投资效益递减。 ( 2 ) 缺乏全国性的管理协调机构 大连理丁大学硕士研究生学位论文 电子信息资源与国家各个行业密切相关,每个行业既是电子信息的制造者,又是电 子信息的利用者,电子信息的有效流动促进了各个行业的科技进步。因此,电子信息资 源的开发利用需要跨部门、跨行业、跨地区的| 办同作战,而这又需要国家有效地参与, 做出有效的管理、规划与协调,保证这一产业链条的有效转动。在我国,缺乏国家层次 的全国性、跨行业、强有力的管理协调机构。这对实施国家的发展战略、发展协作性的 生产体系、规范行业行为等不利。 ( 3 ) 政府部门对信息资源的独占性较为严重 据统计,目前国内约8 0 的社会信息资源由政府部门控制。改革开放以来虽然信 息服务市场的需求情况已发生了很大变化,但信息资源开发以政府为主,信息系统建设 为政府服务,相关投入由政府资助的基本格局并没有发生根本性的改观。不仅如此,经 过2 0 世纪8 0 年代一系列政府信息应用系统和9 0 年代金字系列工程的建设,政府部门 的信息采集与加工能力更加强大,以致目前包括市场信息在内的信息采集的主渠道仍是 政府部门及其属下的信息机构,这使得信息资源进一步集中于政府手中。民间公司若要 形成覆盖比较广泛和有权威性的信息采集网络决非一朝一夕之功。在此基础上,尽管国 内信息咨询服务市场存开放竞争方面没有政策限制,但信息流上游环节的封闭状念远不 能令人满意。大量的信息资源如果彳i 能从政府手巾及时转移到市场上,国内的信息咨询 市场则很难健康发展,民间咨询公司总彳i 免要受无源之水的困扰。 ( 4 ) 信息共享性较差 受现行体制下的利益分配关系驱使,许多政府信息部门各自为政,一是信息共享意 识较落后,有些政府部门认为拥有信息越多,权力就越大,不愿把信息送上网共享。二 是部分行、l k ( 部门) 各自开发自己的网上信息服务系统,信息产品重复、不足与闲置并 存,造成资源的严重浪费,也升i 能形成规模优势和效益。在现有围内的3 0 0 0 多个数掘 库中,真正流通起来被利用的不足l o 。二三是公用信息与保密信息的界限不明,信息价 值无法确定。各省有关部门对于利用网络手段,开发利用政府信息资源做了一定的工作, 但在令国范围内目前还未形成通过网络利用政府信息资源的态势,且缺乏行之有效的组 织和办法,网卜可利用的政府信息资源较少。 纵观全国政府信息资源的状况,当前有这样几个特点:i l 6 l ( 1 ) 相关法规、标准相继制定 中央利各地方政府机构加强了信息资源建设的立法和规划工作,制定了有关政府信 息资源管理、信息采集、交换、公告、信息网络建设的标准及信息库建设的规范。其表 现为:有关的立法步伐正在加快,国家止在制定信息公丌的法律。 ( 2 ) 从中央到地方加强了电子政务的基础性数据库建设 赖洪波:面向政府信息资源的数据仓库元数据研究 国家正在规划和建设中国电子政务的数据中心,并建立一批具有公益性、基础性、 宏观性的数据库。国家在十血时期启动了人口基础信息库、法人单位基础信息库、自然 资源和空间地理基础信息库、宏观经济数据库的建设。同时各地方政府都在有机地整合 本地的政府信息资源。 ( 3 ) 政府信息网络已经具有一定规模 据统计,“全国政府办公业务资源网”已与3 1 个省、市、自治区政府和1 6 个副部 级市政府联网。中央和省级政府普遍建设了内部网,部分地、市、县的政府信息网络建 设也取得了很大进展。 ( 4 ) 各级政府逐步建立网络平台,实现信息资源的整合 各地方逐渐建立了统一的网络平台,以实现信息资源的规范建设和信息共享。例如, 北京市政府各机构以“首都之窗”为网络平台,实现内部信息流通、统一管理、规范信 息公开及资源共享。 ( 5 ) 强化政府信息资源的管理和开发利用 目前,许多政府机构已经能主动适应电予政务的特点,根据办公自动化、领导决策、 对外发布、内部交流、公众使用及企业经营等方面不i j 的需要,对信息资源进行分类加 工整理,并按照规范的文件格式,建立行业或部门的专项业务数据库。如北京市成立信 息资源管理中心,全面负责信息资源的开发工作,主要职责是提出北京市信息资源开发 利用的规划,并组织实施,集中管理北京市霉要的信息资源,负责北京市信息资源的共 享、交换和整合工作,研究拟定北京市信息资源的规范和技术标准,为政府机关和社会 提供信息咨询服务。 ( 6 ) 加强信息资源的整合 电子政务的目标是集中政府和社会信息资源,为政府行政和“一站式”服务的实现 提供强有力的支持。因此有效整合分散于政府各部门和社会上的信息资源,建立一种能 满足电子政务需要的信息资源模式,是电子政务成败的关键。许多政府部门已经认识到 了这个问题,并积极做好这方面的工作。如浙江省在十五规划中提出:“整合全省人文、 社会、窄间、环境、经济、科技、教育等信息资源,通过数字化、网络化、可视化、智 能化处理,建立城市规划、远程教疔、旅游指导、土地利用、交通整治、环境保护、灾 害预防等各领域的应用系统,大力发展电子政务与电子商务,最终实现浙江省困民经济 和社会发展的令面信息化”。 ( 7 ) 各类数据库建设取得了很大成就 近年来,许多政府机构十分注重数据库的建设,并取得了一定的成就,初步满足了 电子政务的需要。如j “州市已经开发了3 0 0 多个数据库,政府信息资源数据库占8 0 以 大连理工大学硕十研究生学位论文 上,福建令省累计建立了5 0 0 多个数据库,遍及国民经济和社会的各个领域。北京市信 息资源网将由1 0 0 0 个主题数据库、2 万个重点专题数据及超过2 0 万个共享数据构成, 江苏省开发了一批实用性强、应用范围广、动态更新的大型数据库,包括国民经济宏观 信息、政府法规、国土资源、投资环境及人口信息等。 2 1 5 政府信息资源管理必要性 为了加强对政府记录的管理,从1 9 世纪术开始到2 0 世纪8 0 年代初,美因国会先 后成立了8 个专业委员会,负责对联邦政府的记录管理情况进行调研并提出具体措施。 国会还制定了许多法律以规范和指导联邦记录处理活动。如1 8 8 9 年的通用记录处理 法( g e n e r a lr e c o r d sd i s p o s a la c t ) ,该法案“提高了记录处置的效率”,1 9 2 1 年的 预算和审计法案( b u d g e ta n da c c o u n t i n ga c to f1 9 2 1 ) ,该法要求设立预算局( b u r e a u o f t h eb u d g e t ,即现在的o m b 前身),并要求联邦政府机构控制所生产的记录数量。 国家层次的记录管理工作大约是从1 9 3 4 年建立美国国家档案馆( u n i t e ds t a t e sn a t i o n a l a r c h i v e s ) 开始的,此前联邦各部门负责维护自己的记录,自行决定保管期限。1 9 4 2 年, 国会制定了联邦报告法( f e d e r a lr e p o t sa c t ) ,这是联邦政府首次通过控制政府文 书的需求来控制公民和企、k 的文书负担。1 9 4 3 年,围会通过t 记录处置法( r e c o r d s d i s p o s a la c t ) ,授权国家档案馆在记录调查结束后制订处置计划。 信息资源管理( i r m ) 概念在美国公共管理领域中的 ;现,足联邦文书委员会工 作的结果。美围困会在1 9 7 5 年成立了联邦文书委员会( c o m m i s s i o no nf e d e r a l p a p e r w o r k ) ,它对联邦文书负担过重的问题进行了为期2 年的调查研究,并于1 9 7 7 年 1 0 月向国会和总统提交了一份含有8 0 0 项建议的最终报告,报告分为两大部分,约有 6 5 0 条建议涉及到诸如卫生、教阿、能源等领域中的记录保管要求以及削减强加在联邦、 州、地方政府身上的文书及官派文章负担的方法,另有约1 5 0 条是关于联邦信息政策制 定过程的具体改革措施。这些建议的目的就是要政府官僚不再把数据和信息视为“免费 物品”。为了推行这一思想,便引入了信息资源管理的概念。实施信息资源管理思想, 就是把在控制和监督诸如资金、人员利设施等资源过程中所使用的管理技能应用到信息 上。 信息资源开发与利用已经成为我国当前信息化工作的重点和热点。其厂r i 政府信息资 源的管理、开发和应用更为重中之重。一方面政府拥有整个社会8 0 左右的信息,是最 大的信息拥有者,是信息开发的主体和资源提供者,另一方面,随肃政务公开和信息透 明的要求,各级政府和部门也必须通过有效的途径公开自己的信息。 赖洪波:面向政府信息资源的数据仓库元数据研究 2 2 元数据 2 2 1 元数据概述 1 9 6 9 年,j a c ke m y e r s 为有效地描述数据集,创造了“元数据”( m e t a d a t a ) 的概 念。【0 1 】九十年代,当网络资源的检索遇到困境时,人们又重新提出了元数据的概念并将 它的应用扩展到因特网上。“元数据”的英文名词是“m e t a d a t a ”或“m e t a - d a t a ”,对 应的中文术语是“元数据”或“元资料”( 主要是我国台湾省使用) 。目前,较普遍的 元数据定义是:“关于数据的数据”( ”d a t a a b o u t d a t a ”) 或“描述数据的数据”( “d a t a m a td e s c r i b e sd a t a ”) ,因为元数据是专门用来描述数据的特征和属性的。1 1 7 j 虽然在一定程度上元数据类似于图书馆的书目信息,但它是出现在传统文本和书目 领域之外的一个新概念。元数据的描述对象主要是网络环境下的电子资源,它是关于最 广泛意义上的“数据”数据集、文本信息、图像、音乐和其它任何电子化事物的数 据信息。元数据与传统图书馆编目标准的不同之处还在于:它除了具有描述功能外,还 具有控制、管理信息资源的能力。 元数据能从多个角度和层次说明信息对象的信息集合。一般来说,所有的信息对象, 不管它的物理状态或智能形式如何,都具有3 个特征:内容、背景、结构,它们都可以通 过元数据反映出来。内容是指对象包括什么、关于什么,它揭示信息对象的内在本质; 背景是指与对象的创建相关的谁、什么、为什么、在哪旱、如何等方面信息,它揭示信 息对象的外部信息:结构则是指信息对象内部或信息对象之间的存在形式和相互关系, 可以指对象的内部结构也可以指对象的外部结构。因此,元数据是用于描述任何网络数 据和资源,促进网络信息资源组织和获取的数据。 元数据和数据具有类似的行为和特征,将数据和元数据截然分开是不合适的,在某 些情况下的元数据在另一些情况下也许就成为数据。例如,对一部电影的介绍也许可以 称为是元数据它是对电影内容的描述。然而在很多情况下,电影介绍本身也可以作 为一种独立的信息对象看待,就像其他电子数据对象一样。它也可以有自己的元数据, 这种数据与元数据关系可以回溯到任意深度。 元数据本身呵视为一个系统,它是由不同层次的元数据单元及其相互关系所构成的 完整的系统。同时,元数据也有表达信息的基本方法和规则。元数据语法的核心是怎样 将元数据融入到一种通用语言中去,也就是说,使元数据的表示尽可能少受到环境和系 统因素的影响。日前一般采用x m l 作为处理元数据的通用语法结构体系。 大连理工大学硕士研究牛学位论文 2 2 2 元数据的分类和特征 2 2 2 1 元数据的分类 从不同的角度,二数据可以划分为不同的类别:【l 8 j ( 1 1 按“数据类型”分类 根据元数据是关于数据仓库系统中基础数据的还是关于数据处理过程的,将数据仓 库元数据分为: 基础数据的元数据:基础数据是指数据仓库系统中所有的数据源、数据仓库、 数据集市和应用中的数据。因此该类元数据包含了数据仓库系统中关于数据源、数据仓 库和数据集市的结构信息。 数据处理的元数据:数据处理元数据是与数据仓库系统中数据处理过程紧密相 关的,它包含了数据装载、清洗、更新、分析和管理的信息。 f 2 ) 按“抽象层次”分类 在数据仓库系统的设计、构建过程中,元数据可以分成概念元数据、逻辑元数据和 物理元数据。 概念元数据应用自然语言描述,包含了数据仓库所有事务的信息,同时也包含 与系统应用、预定义查询和分析应用相关的信息。 逻辑元数据应用数学语言描述,从某种程度上讲是概念元数据的更深层的描 述。 物理元数据是最底层的关于数据仓库实现的信息,包括事务规则s q l 编码、关 系索引文件和分析应用代码等。 ( 3 ) 从系统用户的角度来分类 从数据仓库系统用户的角度出发,数据仓库元数据可以分为商业元数据和技术元数 据。 商业元数据是为系统最终剧户服务的,目的是使用户能够理解系统各项操作以更好 地应用数据仓库系统为其服务。与之卡甘比,技术元数据是为数据仓库系统管理员和系统 应用开发人员服务的,目的是使数据仓库系统的丌发和维护人员能够更好地进行各项操 作。技术元数据支持系统开发、维护,同时支持管理系统环境中所有的分析、设计、丌 发和管理人员,它是连接开发工具、应用程序和系统的技术纽带。商业元数据则使得食 业数据仓库环境的服务更易为终端用户所理解,它为商业f 1 标和过程的解释提供便捷的 浏览导航和数据查询服务。 赖洪波:面向政府信息资源的数据仓库元数据研究 ( 4 ) 根据元数据来源分类 根据数据仓库系统元数据来源的不同可把元数据分成: 工具元数据工具元数据是指由e t l t 姻j 组件、数据仓库设计工具等产生的元数 据。 资源元数据资源元数据是指由操作系统、数据库和数据集市的数据字典等资源 产生的元数据。 外来元数据外来元数据是指从本数据仓库系统以外的其他系统输入的元数据。 表2 1 元数据的类型以及功能 t a b 2 1t h et y p ea n df u n c t i o no f m e t a d a t a 类型 定义 例子 管理型元数据 用于管理和控制信息资源的元采购信息 ( a d m i n i s t r a l j v em e t a d a t a )数据 版权及复制纪录 获取权力控制( 密级) 馆藏信息 数字化的选择标准 版本控制 描述型元数据用来捕述或识别信息资源的元编目纪录 ( d e s c r i p t i v em e t a d a l a ) 数据,一般为丁t 制作的元数查找帮助 据专门索引 资源之间的超链接 用户的注解 保存型元数据与信息资源的保存管理相关的资源的物理状态描述文件 ( p r e s e r v a t i o nm e m d a t a )信息有关保存资源的物理或数字化 版本的文档。如数字的更新和 迁移 技术型元数据 与系统功能相关的元数据或元硬件和软件支持 ( t e c h n i c a lm e m d a l a ) 数据行为模式 数字化信息、如格式、压缩比 例、缩放比例常规 系统响应时间的纪录 许可和安全数据,如密码、口 令 使用型元数据与信息资源利用的等级和类型展出纪录 ( u s em e t a d a t a ) 相关的元数据用户及利用纪录 内容再利用和多版本的信息 大连理工大学硕上j 研究生学何论文 ( 5 ) 根据功能分类 a l i n ej g i l l i l a n d s w e t l m a d 根据功能将元数据划分为管理型冗数据、描述型元数据、 保存型元数据、技术型元数据和使用型元数据物种类型,其各自的定义及相应的例子如 表2 1 : 根据结构和语义将描述型元数据又分为三级,如表2 _ 2 : 表2 2 描述型元数据的分类 t a b 2 2t h es o r to f t h ed e s c r i p t i o nm e t a d a t a 笫一级 第二级 第二级 记录特征简单格式结构化的格式复杂模式 非标准化的全文检索逐渐成为标准字段格式国际标准 详细的标记 元数据格式举 l y c o s d u b l i nc o r ef g d c 例 a l t av i s t ai a f at e m p l a t e se a d y a h o o r f c l 8 0 7 t e i g o o g l e s o i f g i l s m a r c ( 6 ) 根据二数据生成使用时间段分类 根据这种分类标准,数据仓库的元数据可以分为: 数据仓库设计阶段收集的元数据是指数据仓库资源规划定义、访问权限和转换 规则等。 数据仓库建设阶段产生的元数据 殊数据轨迹等。 数据仓库运行阶段产生的元数据 计和工作规范等。 是指数据仓库的日志文件、数据质量属性和特 足指数据仓库运行 1 志文件、进度表、使用统 总之,从不同的角度出发可以将数据仓库的兀数据分成不同的类别,数据仓库元数 据的分类对丁数据仓库元数据管理的其他工作如存储、更新、维护、集成和交换等有着 重大的影响。目前,业界大多将数据仓库系统的元数据按照系统用户的不同分为技术元 数据和商业元数据两类。 ( 7 ) 根据元数据所描述的数据划象的层次划分 根据张晓林对元数据所做的描述性定义,我们可以将元数据划分为六个层次:见表 23 : 赖洪波:面向政府信息资源的数据仓库元数据研究 表23 不同层次数据对象对府的元数据类型 t a b 2 3t h em e t a d a t at y p eo f d i f f e r e n th i e r a r c h y 第一层第二层第= 层 第四层第五层第人层 信息内容格内容对象元资源集合元组织与管理信息系统过 宏元数据( 对描述 名 式元数据数据数据机制元数据程与信息系元数据的标记语 ( 对组成各 统模式元数言、格式语言、复 称 类对象的内据用共享机制、转换 容结构进行 机制等进行描述) 描述) 茬皇s v g m a r cr s l p c d sv o g m lw s d lx m l 例 m a t h m ld cx t m w s p lx m l n a m e s p a e e s m i kv r a c o r ep i c s b p s s r d f

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论