数据建模方法标准及应用_第1页
数据建模方法标准及应用_第2页
数据建模方法标准及应用_第3页
数据建模方法标准及应用_第4页
数据建模方法标准及应用_第5页
已阅读5页,还剩8页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据建模方法标准及应用

数据建模用于定义和分析数据要求,支持信息系统设计的过程。装备管理数据

建模主要用于两个方面,一是支撑装备管理信息系统建设和数据交互,二是服务于

装备大数据业务分析所需的数据结构框架。技术发展促进信息系统的升级换代,数

据是可继承的资产,需要持续维护、管理、分析和挖掘;数据建模是信息系统设计

和业务分析的核心要素,直接影响系统的架构设计和技术特性;所以,深入剖析业

务本质,抽象对象模型表达,设计科学、合理、可扩展的数据架构和数据模型,是

数据资产建设的基础,是业务系统设计的重中之重。作战装备结构复杂、研制周期

较长,装备管理涉及要素多,不同装备类型研制管理模式和部门分工不同,依照业

务流程设计的信息系统结构和逻辑也不尽相同,在数据交互和关联分析时,出现信

息融合困难、关联度低等问题,归根到底还是数据建模是否科学、合理,包括是否

顶层设计、合理抽象、横向考虑、适当超前超宽规划等。

一、体系结构设计方法体系

结构框架是体系结构设计方法学的别名,为开发、描述和沟通体系结构提供指

南、模型和规则。最早是上世纪80年代J.A.Zachman提出的企业体系结构框架“扎

克曼框架”,先后开发了C4ISR和DoDAF体系结构框架,基于信息管理技术架构The

OpenGroup组织开发了面向复杂组织信息系统设计参考的企业架构框架TOGAF等。

体系结构框架提供了信息系统设计和实施的一般方法和步骤,其中对数据框架和模

型都有不同程度的单独论述,作为方法论都可以作为数据建设自顶向下设计、循环迭

代开发的参考,也为数据建模提供了顶层视图和全局思维方式。

1.1TOGAF开放组织结构框架

T0GAF是用于开发组织架构的一套方法和工具,支持最佳实践和一套可重用的

架构资产。它将架构域分为四个关键领域:

1)业务架构,定义业务战略和组织,关键业务流程以及治理和标准;

2)应用架构,为部署各个系统提供蓝图,包括应用程序系统之间的交互以及与

基本业务流程的关系;

3)数据架构,记录逻辑和物理数据资产的结构以及任何相关的数据管理资源:

技术架构,描述了支持关键任务应用部署所需的硬件,软件和网络基础架构,如图

1所示。其中,数据架构,需要清晰理解业务功能、流程和服务如何使用数据实

体,以及在哪里如何创建、存储、传递、转换数据。

架构原则、需求和路线图

原则•约束+假设一::;r

差距」工作包~能力一

R务架内

动机.组织“功能•

■电机旷展技术架构

■基砧设施&疗便

平台服芬~

■渔理犷展

■京务犷及物理技术组件•

______端心庆会

图1TOGAF关键领域架构

Determinethe《定架构的用途

intendeduseof

thearchitecture•利益攸关方的需求

•目的

6步法•关键问题

(DoDAF标•目标任务

•重要的权衡

准)•决

•可能使用的分析工具

定义春决定攵

Coll«ct.oroanlz*Document

Determinerequiredtoanalysestn森杓

狗的龟杓占杓corral”,and基双.林义利ResultsIAW

scopeofsupportsupixjrtof编横

开发所sto<*»rchit«ctur«存曾蔡的推导.Dedsion-Maker

architecturearchitecture

architecturedataneeds

,developmentJ考的效,的代据objectivesj分析

----------急

地理的、作鹿口所需的体系架构特征

•।•自动化的存储库•缺陷分析•体系架构的表

金力分柝

功能的约束•体系架构物居实体•活动模型•方啾图

•技术上的约束•详细程度•数据模型•互操作性阳古■可复用的体系

•时间上的限制•度量•动^«型•业务流程分析鼎瞬据

•体系架构资源和•相关的元黝居

•组模型・测试体系架构的•分析报告

进度的约束•元雌注册完成性、精确性和

充分性

图2DoDAF体系架构六步法

参考步骤如下:

1)选择参考模型、视角和工具,包括确定总体建模流程、识别所需的数据构建

块目录集、识别所需的矩阵和图、识别待收集的需求类型,形成数据目录集、数据

权限矩阵、数据实体业务功能矩阵、实体关系图和类图、数据架构视图(概念数据

图、逻辑数据图、数据传播图、数据生命周期图、数据迁移图、数据安全图)、数

据需求类型等。

2)开发数据架构描述,包括基线描述、目标描述、差距分析、候选路线图、分

析架构影响、利益攸关者审视、确定数据架构、定义架构文件,形成业务数据模

型、逻辑数据模型、数据管理流程模型、数据实体业务功能矩阵、数据交互需求

等。

3)输出结果细化和更新,包括草拟的架构工作说明、数据原则、架构定义文

件、架构需求规范,和数据实体/数据组件目录、数据实体/业务功能矩阵、应用/数

据矩阵、概念/逻辑数据图、数据传递/安全图、数据迁移图、数据生命周期图。

T0GAF给出模板式数据架构设计方法,衔接业务、应用和技术架构,保证需求和架

构的整体性、步骤和操作的规范性,且要素齐全,是信息系统正向设计的规范表

达,在信息系统设计数据建模过程中可直接参考。

1.2DoDAF体系结构框

体系结构框架(DoDAF)2.0版是一套顶层的、全面完整的框架和概念模型,聚焦

于关键决策者所需的体系结构数据和信息。DoDAFV2.0提供了体系结构开发6步方

法论、DM2本体模型、概念模型和元模型数据组、视角和模型。DoDAF是以数据为

中心的体系结构设计方法,通过典型的全景、能力、数据和信息、作战、计划、服

务、标准、系统等8个视角为各利益相关方提供决策视图,构建了一套数据建模方

法支撑数据采集、汇总、分析、展示,包括:

1)基于DM2基础本体的数据建模方法论,将顶级基础本体元素抽象为事物、个

体、类型、组合;

2)将整个领域对象概括为条件、规则、活动、资源、能力、计划、位置等24

个关键概念,形成概念级体系结构框架数据元模型,见图3;

3)按照业务概念域描述概念关系,形成执行者、资源流、信息和数据、规则、

能力、服务、组织结构、谱系等11个数据组和52个视角模型;在数据交互规范

中,给出领域概念和概念关系的全貌。DoDAF以数据为中心的体系结构方法,非常

适合大数据建设或决策系统建设参考。其定义的DM2基础本体、领域概念、领域概

念关系,是自顶向下、高度抽象的建模方法,保证整个数据模型的体系性和一致

性;其定义的数据组元模型描述、视图元模型图,是对业务领域实体及关系的描

述,信息系统设计数据建模可直接参考。

全部都可以度量

图3DoDAF2概念数据模型

二、数据建模抽象方法

根据GB18391和GB32392中的定义,元数据是定义和描述其他数据的数据,

元模型是描述模型的模型。在信息技术标准中,元是相对的概念,是对数据、结构

进行抽象的表达,以适应信息系统的设计和开发。

2.1元数据概念与标准

GB18391《信息技术元数据注册系统》系列标准是对元数据注册系统的一个定

义,用于管理数据的语义。包含六个部分:

1)第一部分对数据的表示、概念、含义以及它们之间的关系进行形式化描述,

使任何机器都能理解;

2)第二部分确定了一系列原则、方法和程序,用于规范在为各类管理项与一个

或多个分类方案间建立关联时至少要的记录信息;

3)第三部分规定了数据元的基本属性,包括定义、说明及内容等,保证对数据

元有共同的认识;

4)第四部分规定了构建数据和元数据定义的要求与建议;

5)第五部分规定了对数据元概念、概念域、数据元和值域等管理项的命名和标

识;

6)第六部分规定了对不同应用领域的管理项进行注册和赋予国际唯一标识符的

规程。标准的第一部分给出了数据元的基本模型,包括数据元概念和表示,其中概

念又由对象类和特性组成,见图4。

图4数据元的基本模型

对象类是我们希望采集和存储数据的事物,对应描写对象模型中的类,对应实

体-关系模型中的实体;特性对应类和实体中的属性。这就是信息系统数据建模的抽

象用法和基本概念,可直接用于装备管理的数据建模。标准的第三部分给出了数据

元属性的常规描述符集,包括名称、定义、约束、条件、最多实例数、数据类型、

最大长度、字符集、语言和备注等;和数据元属性的基本属性,包括标识类、定义

类、关系类、表示类和管理类等。在数据建模的过程中,定义、关系和表示类的属

性是基本要求,标识和管理类的属性在建大系统的数据模型过程也要遵循。

2.2元对象设施与标准

GB32913《信息技术元对象设施》定义了元模型、接口集合,可以用来定义和

操纵一组可互操作的元模型以及它们对应的模型。它是一种抽象语言,用于说明、

构建和管理技术中立的元模型;是一种框架,用于实现拥有由元模型描述元数据的

存储库和集成框架。MOF研究的中心主题是元数据管理的可扩展性,提供支持任何

种类的分层元数据框架,给出了经典的四层建模体系结构,通过递归地将语义应用

到不同层次上,完成语义结构的定义,为元模型扩展以及实现提供体系结构基础,

如图5所示。

图5MOF典型四层建模结构

每层具体描述如下:

1)信息(对象)层(M0)的信息包含了用户希望描述的数据。

2)模型层(Ml)包含了描述实例层数据的元数据。元数据聚在一起形成了模型。

3)元模型层(M2)包含定义了元数据结构和语义的描述信息(即元元数据)。元

元数据聚在一起形成的元模型是一种抽象语言,可以用来描述不同类型的数据。

4)元元模型层(M3)包含描述元元数据结构和语义的描述信息。换句话说,这是

定义不同类型元数据的“抽象语言”。构建适用于装备全寿命周期管理数据建模的

元模型,按应用领域泛化形成业务数据模型,对应的装备全寿命周期数据模型的

MO、Ml、M2层见图6,

图6MOF技术映射

1)M0层信息包含了装备管理信息系统存储的各类装备、器材、计划、项目等

的具体数据;

2)Ml层包含了描述实例层数据的元数据,聚在一起形成预研科研、采购接

装、使用维护、退役报废等数据模型;

3)M2元模型层定义装备管理所需的元数据结构和语义的描述信息。装备管理

数据建模工作量大、涉及要素众多,建立规范一致的建模规则和具有普适性参考模

型意义重大,可保证具体业务领域数据建模过程中的一致性和体系性。DoDAF中的

DM2本体模型本质上就是所有数据模型的元模型,支撑各种具体对象和业务的数据

建模,保证美国国防部规划、指挥、采办、保障等系统数据汇总分析和共享交互。

三、数据建模管理与评价

体系架构设计方法强调迭代完善,数据管理和数据模型管理也是其中的一个方

面。DAMA国际和GB36073中,都将数据模型迭代设计和评价完善作为一个重要内

容。

3.1DAMA数据建模与设计过程

国际数据管理协会(DAMA国际)编制的《DAMA数据管理知识体系指南》将数据

建模定义为发现、分析和确定数据需求的过程,用数据模型的精确形式表示和传递

这些数据需求。

1)在建模方法中,推荐了关系、多维、面向对象、事实、时间序列和NoSQL等

6种表示模式,概念、逻辑、物理等3层模型,描述了数据建模和设计过程的基本

概念、目标和原则。

2)在规范化抽象化要求中,DAMA强调规范化和抽象化,规范化强调了每个属

性只在一个位置出现,以消除冗余和不一致性,对应于每个层次的主键和外键,阐

述了三范式、BCNF范式和四五范式;抽象化强调了对重要和本质属性的保留,对细

节的移除,以便更广泛情况下的扩展性,包括泛化和特化、超类和子类的运用,使

模型具有良好的扩展性、减少冗余。

3)在建模活动中,DAMA强调了建模规划、正向逆向建模、模型审核、模型维

护等过程,把模型作为长期工作保持最新状态。详细见图7。装备管理领域庞大,

其数据模型的确需要一个数据组织进行全寿命周期的管理和维护,一方面保证业务

需求对数据的正确理解,另一方面管理数据模型的状态有效性。良好的数据建模能

够降低开发和维护成本,增加未来需求重复利用的可能性。

数据建模与设计

提供者:参与者:消费者:

•业务领域专家•业务分析师•业务分析师

•业务分析师•数据建模师•数据建模加

•数据架构师•DM与开发人员

•DBA与开发人员•软件开发人员

•业务领域专家•数据管理专员

•数据管理专员•数据质量分析师

•元数据管理员•数据消费者

技术驱动因素

__________I

工具:

•命名规范•数据建模工具

•数据库设计规范•数据血缘工具

・数据库类型选择•数据分析工具

•元数据资料库

•数据模型模式

・行业数据标准

(P)计划(C)控制(D)开发(0)运营

图7DAMA数据建模设计

3.2能力成熟度模型评价方法

GB36073《数据管理能力成熟度评估模型》是对组织和机构进行数据管理能力

成熟度评估的标准方法,规定了从数据战略、治理、架构、应用、安全、质量、标

准和生存周期等8个能力域进行评估。与数据模型有关的在数据架构和数据标准中

描述。

1)数据架构包括数据模型、数据分布、数据集成与共享、元数据管理等4个部

分,其中数据模型从粒度上分为主题域、概念、逻辑和物理模型,从应用上分为组

织级和系统应用级数据模型,过程上包括收集和理解数据需求、制定模型规范、开

发数据模型、数据模型应用、模型符合性检查、模型变更管理等。

2)数据标准包括业务术语、参考数据和主数据、数据元、指标数据等4个部

分,业务术语是组织内部理解数据、应用数据的基础,数据元标准保证数据拥有者

和使用者对数据有一致的理解。能力成熟度评价模型一定程度上就是数据管理的目

标,其中对数据模型的要求就是数据建模的目标。装备管理数据建模也要能够指导

装备应用系统的结构设计、编制数据模型规范指导数据模型开发、建立统一数据资

源目录方便数据查询应用、跟踪预测需求变化和属性同步更新机制。

四、装备管理数据建模应用

4.1装备数据建模需求目标

不管是TOGAF还是DoDAF,都强调对组织战略目标的支持和系统循环迭代的过

程。装备工作的核心问题是解决“任务目标”与“装备资源”之间的矛盾性问题,

即围绕面向作战的要求,以作训任务的保障和完成为目标、以装备能力的生成与保

持为导向,对各类资源进行优化调配和使用•装备全寿命周期管理数据建模主要面

向信息系统研制和大数据建设需求,在业务层面,数据建模应能够表达装备管理计

划与状态的偏差、装备系统能力与结构组成;在技术层面,数据模型应能够满足装

备系统与管理业务数据间的集成交互、多维跨域的数据横向关联分析和多层次的数

据决策支持。

4.2装备管理数据资源体系

对应于DAMA和数据管理能力成熟度评价标准,对组织架构、业务流程和数据要

素等的全面性、关联性、追溯性等提出整体宏观的要求,如数据目录、数据需求等

的组织和记录。装备工作是一个多层次、多维度的业务体系,立体交织,融汇一

体。可从三个维度对数据资源体系进行分析梳理:一是管理维度,以规划计划为中

心调配资源、安排项目,在规定的时间、经费约束条件下,确保使命任务和战略目

标的实现;二是全寿命维度,主要包括需求变更、研制状态、列装部署、使用维

护、退役报废等方面;三是对象维度,按照配套形成能力的各类装备资源或管理对

象进行细分。系统分析装备全寿命周期管理全业务过程,梳理装备全寿命周期数据

来源、分布和形态,形成科学合理地装备数据目录;深入剖析装备内外部数据及其

关联,标记数据之间的关联关系,围绕装备管理业务和装备系统能力两条主线,形

成范围覆盖全面、要素关联一体的装备全寿命周期数据资源体系。

4.3装备管理数据模型设计

GB18391元数据和GB32913元模型的建设一般步骤都对数据的描述、模型的

抽象、格式的规范等提出要求,尤其是元模型的四层结构及其逐层抽象描述的严谨

逻辑,有力保证了整个数据模型的体系性和一致性。首先,根据装备数据资源体系

的划分,抽取与装备全寿命周期管理密切相关的对象,并将对象分类和抽象。构建

适用于装备管理数据建模的元模型,为数据建模提供规则和约束。参考MOF,构建

装备管理元模型,至少包含以下几个元素:

1)对象,包括装备、器材、设备等实体和采购、维修、训练等活动;

2)关系,包括包含、前后时序、重叠、超子等关系;

3)属性,对象和关系的描述,如名称、编号(型号)、价格、时间、地点等;

4)约束,是业务层面的规则和限制,如制度、规程、有效构型状态等。

其次,建立装备管理业务和系统能力两个核心参考模型,抽象概况出装备管理

普适性的对象关系,用于具体业务领域数据建模的参考。

1)装备管理业务的核心是在有限资源、时间等约束下,综合军队和研制部门力

量,规划开展提升装备技战术指标、装备数量质量、保持和生成装备战斗力的管理

活动。

2)装备系统能力的核心是提高装备系统作战能力,包括围绕战斗力生成的装备

作战能力、装备编成与作战能力、装备状态保持、人员训练能力等。最后,根据具

体业务流

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论