元数据管理的五种成熟度_第1页
元数据管理的五种成熟度_第2页
元数据管理的五种成熟度_第3页
元数据管理的五种成熟度_第4页
元数据管理的五种成熟度_第5页
已阅读5页,还剩1页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

元数据管理的五种成熟度...元数据管理的五种成熟度当公司内外部的数据越来越多时,元数据管理就会成为许多公司的一种核心问题。本文从顾客、解决和技术的不同角度,描述公司元数据管理的不同成熟度模型和公司沿着成熟度阶梯向上提高的环节。对于什么是元数据,现在存在着许多个不同的描述。本文中的元数据涉及技术上的元数据和业务上的元数据。技术上的元数据指数据源的位置、数据访问合同(ODBC、JDBC、SQL*NET等)、数据源的物理构造(如数据库描述、表定义、栏目描述等)、数据源的逻辑构造(ER模型、目的模型、实体模型)等。业务上的元数据指与信息获取有关的上下文信息、定义公司组织机构和产品层级的分类法、用来定义商业术语的控制性词汇的词汇表或参考数据,例如医学词典、金融术语等。所谓元数据管理,就是对技术元数据和业务元数据进行管理,其目的是为了提高共享、重新获取和理解公司信息资产的水平。不对元数据进行管理或管理不得当,信息将被丢失或处在隐匿状态而难以被顾客使用,数据集成将十分昂贵,不能对业务进行有效支撑。终端顾客要识别有关的信息将十分困难,最后顾客将失去对数据的信任。本文描述了元数据管理的五级成熟度模型。各个公司能够根据我司人们如何解决元数据的行为特性,运用它作为指导,决定公司现在所处的级别。第一级:随机状态(Ad-hoc)行为特性在这一级上,对元数据的管理是随机的。元数据由某个人或某一组人员在局部产生或获取,并在局部使用。在大多数时间里,元数据是隐匿在信息中,例如存储于诸如Word、Excel等形式的办公文档,这些文档使用的术语仅局部的顾客能懂得其确切含义。人们通过与“负责人”直接通信或通过信息会话来获取这些知识。在局部环境工作数月或数年后,人们使这些元数据以及对它的理解内在化,使对这种信息有习惯性的理解。在这一阶段,元数据通过组织机构缓慢的传输或根本不传输,这取决于局部小组与其它小组间的通信量的大小,这些元数据可能永远“待”在该局部小组或某个人那儿。如果这样的小组或个人调离,则这种元数据信息可能永远丢失。人元数据知识保存在人的大脑中。在这种环境中,懂得(或不懂得)与谁交谈对于理解元数据成为一件十分重要的事。解决元数据要通过与“负责人”的交谈才干共享。新来者需要通过他们的日常工作来学习元数据。外部人员难以理解元数据,他们必须与“负责人”交谈才干得到他们想要的东西。由于元数据在局部产生或抓取并在局部使用,因此普通也只能在局部修改,这种修改普通也不会告知公司里其它的组织。技术能够用多个不同的工具来生成元数据。绝大部分是面对个人电脑的应用软件。例如,ERWin可用于数据库建模,Rational用于为对象建模、Excel用于生成商品列表等。这些工具都没有设计成能够交换信息,因此,只能在本地的文献系统中保存所生成的元数据。第二级:发现行为特性在元数据管理的这一级上,能够发现在不同公司之间的元数据。像第一级的状况同样,元数据仍然在局部产生和抓取,然而,它处在可发现状态,这样的元数据在公司一级显露,使得每一种对它有爱好的人都能随时理解“什么已经存在”。元数据仍然能够在局部级上维护,然后更新中央知识库,但它们仍然使用不同的命名法。成果,相似的名字被用于表达意义不同的事情,而同一件事情则使用了几个不同的名字。尽管如此,相比之下,从不同来源来的数据和数据的含义已经含有了更多的透明度。对于商业顾客,如果他们需要,现存的技术可为他们提供有关数据的来源和如何对数据进行计算的信息。人人们开始感知到共享元数据信息的重要性。业务分析员、数据拥有者和应用开发者现在自觉地将元数据信息加载到中央知识库中。解决元数据知识经由中央数据库进行共享。凭借对中央知识库地理解,人们能够发现在其它应用系统中的数据。然而,由于使用术语的不同,人们互相之间需要交流,方便搞清某些元数据的含义。并且,由于元数据的更新不受任何方式的控制,使得这种更新没有通告或贴切的分析。技术有某些元数据管理工具可用于共享来自数据源的元数据,并能把来自不同建模工具的逻辑元数据导入到元数据知识库中。AGRochade、Unicon、MetaMatrix是该类产品的某些例子。然而,除了以商业含义来定义数据表格的栏目名之外,这些工具没有一种能较好地抓取元数据。第三级:管理控制行为特性这一级对元数据的修改善行集中管理。局部业务单元或开发小组如不告知其它的元数据保管者和顾客,就不再能按照自己的想法对元数据进行修改。在一种地方发起的元数据的修改将传输给其它地方。有多个工具和办法可用于不同业务单元之间交换元数据。为了整合不同数据源中的数据,仍然必须用手工进行数据的映射,以解决不同数据源的数据整合。但是,这种映射在一种中央知识库上进行维护和管理。人数据拥有者、应用开发人员、顾客和其它的数据保存者现在比以往任何时候更清晰元数据管理的重要性。人们遵照有关元数据管理的“监督”解决操作规程。在对元数据进行修改前,他们就分析这种修改将会产生的影响。他们认识到元数据的共享将使组织的运作更有效,并使他们的生活更轻松。解决建立了监督体系构造(谁是数据和应用的拥有者),监督资产(数据仓库、数据集市、命名原则)和流程(何时开始更新、如何更新)。技术有几个工具经常被用于元数据的监督解决。SchemaLogic是一种新兴的工具,普通被用于协助监督解决发现业务的词汇及其分类。尚有某些软件提供商正在互相竞争,以弥补这一空间,但还没有一家能提供商用的产品。第四级:优化行为特性在对元数据实施集中存储并通过监督体制对元数据进行管理后,公司会发现,通过原则化和整合能够实施故意义的优化。为了优化各业务单元之间的多个冲突和各个副本,人们开发了一种公司数据模型和词汇表。人们能够将这些原则模型和词汇表用于多个新的应用。时机成熟时,能够把多个老的应用迁移到这些模型上。人在这一级,人们坚持不懈地探索优化的途径。人们协同工作,通过在数据的入口点确认数据的有效性来提高数据的质量。通过拟定各业务实体的权威数据源,使数据的映射达成最小化。数据开始从一种业务单元平滑地流到另一种业务单元,而不用紧张昂贵的数据集成成本。解决首先,生成公司数据模型,并在中央知识库进行维护。第二,对数据模型中定义的每一种实体拟定权威数据源或公司应用的主参考数据,然后将业务的上下文信息和含义与这些数据源进行关联。在整个组织中对业务的词汇表进行原则化。激励应用开发小组使用这些原则化的术语,来生成、传输和表达信息。技术现在,仅有少数几个能协助公司实施优化的工具。并且,每一种工具只能完毕其中一到两个任务,还没有哪个工具能做公司优化所需的全部事情。第五级:自动化行为特性在这一级,元数据管理是自动进行的。当在逻辑层次发生元数据更新时,它们将被传输到物理层次。反之,当在物理层次发生更新时,逻辑层次将被更新,以反映这种更新。在元数据中的任何变化也将触发业务工作流,以解决其它各个业务系统所需的相对应的任何修改。由于各个应用系统遵摄影似的词汇表,它们之间的关系能够通过知识本体进行推断,因此,各应用系统之间数据格式的映射自动产生。人人们把元数据管理作为常规业务的构成部分。就像电信网对业务的支持同样,元数据成为组织运作中一种核心的、普遍存在的、无形的资产。元数据管理变成业务解决的一种重要构成部分,并且,整个业务运作都要依赖于它。事实上,如果元数据管理实施得较好,人们能够无需关心它在何处。在自动化级,元数据管理成为一种使能器,而不被视为一种障碍。解决在这一级,元数据管理的解决较为抱负。绝大多数解决是自动完毕的。人们从手工和程序解决过程中解放出来。他们在元数据鉴定上能够工作得更有效。当业务变化时,由知识工人对公司数据模型、词汇表和知识本体进行维护。这样一种变化立刻会在各个应用中反映出来。例如,如果一种新产

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论