




已阅读5页,还剩22页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
i c s7 5 0 2 0 e0 7 备案号:2 2 0 8 4 - - 2 0 0 7 sy 中华人民共和国石油天然气行业标准 s y t6 7 0 5 - - 2 0 0 7 石油工业数据元设计原则 d i r e c t i v e sf o rd e s i g nr u l eo fp e t r o l e u mi n d u s t r yd a t ae l e m e n t 2 0 0 7 1 0 一0 8 发布2 0 0 8 0 3 一0 1 实施 国家发展和改革委员会发布 s y t6 7 0 5 - - - 2 0 0 7 前言 引言 1 范围 2 规范性引用文件 3 术语和定义 4 数据元的规范与标准化框架 5 数据元的分类 6 基本数据元分析与设计 附录a ( 资料性附录) 附录b ( 资料性附录) 附录c ( 资料性附录) 附录d ( 资料性附录) 目次 数据成分及数据元名称结构 数据元素与其他数据概念的联系 数据元的元数据属性 元数据与数据元 ,4 0他俩揭扎为 前言 s w t6 7 0 5 - - 2 0 0 7 石油企业内部的信息系统所采用的绝大多数数据模型是面向应用设计的,其不足是数据模型结构 不稳定,严重影响企业的数据集成与信息共享。导致这种现象的主要原因是数据的名称、类型以及值 域存在着冲突,对象、特性及表示的分类不合理。通过对企业数据元素的分析与设计,不仅可以消除 这些数据项属性名、型以及值的冲突问题,而且还可以建立起企业级的对象按自然属性( 对象类、特 性、表示形式) 的分类关系,从而使企业的对象分类、标识以及值域等实现规范化;同时,通过对企 业数据元素的分析与定义,也为企业的元数据定义及应用奠定基础。 本标准主要引用g b t1 8 3 9 13 2 0 0 1 信息技术数据元的规范与标准化第3 部分:数据元 的基本属性 i s o i e c1 1 1 7 9 1 :1 9 9 9 ( v 1 ) 和i s o i e c1 1 1 7 9 1 :2 0 0 4 ( v 2 ) 的原则与规则, 并结合中国石油工业信息系统建设中的实际,运用数据元素分析方法,制定了在石油企业数据元素分 析与设计的原则,规定了数据元素规范的基本框架、数据元素分类方法以及基于这些不同的分类方法 分析数据元素的过程和原则。 本标准中的一些术语引用g b t1 8 3 9 11 2 ( ) 0 2 信息技术数据元的规范与标准化第1 部分: 数据元的规范与标准化框架和i s o i e c111 7 9 1 ;2 0 0 4 ( v 2 ) 。 本标准的附录a 、附录b 、附录c 、附录d 均是资料性附录。 本标准由石油信息与计算机应用专业标准化委员会提出并归口。 本标准起草单位:中国石油勘探开发研究院、大庆石油学院。 本标准主要起草人:袁满、高雪、李鹏飞。 s y t6 7 0 5 - - 2 0 0 7 引言 随着信息化技术在石油企业中应用水平的不断加深,各个企业或企业部门之间对信息的共享程度 的要求越来越高。为增加企业的竞争力,企业已经将他们的数据资源作为资产来管理,由此可见数据 在企业信息化中的重要地位。以前,绝大多数部门都独立地进行本部门或本企业的信息系统的设计, 而不与其他企业或部门进行交流。结果导致同一信息的重复设计,而且这些重复的信息在不同的企业 或部门的信息系统中可能会拥有不同的名称、类型以及值域等。在信息化应用水平普遍不是很高的当 时环境是允许的,但随着不同企业之间、企业内部部门之间数据集成共享程度要求的提高,以前设计 的这些数据模型出现了数据的名称、类型以及值域的冲突问题,即这些不同企业或部门对同一数据的 理解出现了二义性。因此,解决信息单元最基本的问题,即数据自身规范化问题摆在石油企业面前。 由于企业数据的不一致性也造成了这些企业数据质量的低下,那么如何对企业的数据进行有效地规 范,即对数据本身的名称、类型以及值域的规范化是石油工业必须解决的一个问题。本标准正是由此 目的出发,而制定的一个规范,旨在指导石油工业利用数据元素分析方法体系来指导石油工业对数据 的规范化,圊时通过对数据元素的分析与定义可以对企业信息化涉及的各种对象进行科学地分类,定 义出这些对象的自然关联关系,定义出数据值域。更重要的是通过对数据元素的分析最终可以直接定 义出企业的元数据标准。企业的元数据标准不仅为企业构建稳健的、可扩充的数据模型奠定基础,而 且为企业的不同系统间的数据交换定义了元数据标准。 1 范围 石油工业数据元设计原则 本标准规定了石油行业信息系统数据元的基本概念、结构和设计原则。 本标准适用于石油行业各级信息系统的设计和建立,包括: a ) 企业信息模型; b ) 数据模型; c ) 数据流程图; d ) 数据库设计( 模式、文件、表格) ; e ) 接口规范; f ) 计算机程序。 s y t6 7 0 5 2 0 0 7 2 规范性引用文件 下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有 的修改单( 不包括勘误的内容) 或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方 研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 g b t7 4 0 8 数据元和交换格式信息交换 日期和时间表示法 g b t1 5 2 3 71 2 ( ) o o 术语工作词汇第1 部分;理论与应用( e q vi s o1 0 8 7 1 :2 0 0 0 ) g b t1 8 3 9 1 1 2 0 ( 】2 信息技术数据元的规范与标准化第1 部分:数据元的规范与标准化 框架( i s o i e c1 1 1 7 91 :1 9 9 9 ,i d t ) g b t1 8 3 9 1 2 2 0 0 3 信息技术数据元的规范与标准化第2 部分:数据元的分类( i s o i e c 1 1 1 7 9 2 :2 0 0 0 ,i d t ) g b t1 8 3 9 13 2 0 0 1 信息技术数据元的规范与标准化第3 部分:数据元的基本属性( i d t i s o i e c1 1 1 7 9 3 :1 9 9 4 ) g b t1 8 3 9 14 2 0 0 1 信息技术数据元的规范与标准化第4 部分:数据定义的编写规则与 指南( i d ti s o i e c1 1 1 7 9 4 :1 9 9 5 ) g b t1 8 3 9 15 2 0 0 1 信息技术数据元的规范与标准化第5 部分:数据元的命名和标识原 则( i d ti s o i e c1 1 1 7 9 5 :1 9 9 5 ) g b t1 8 3 9 16 2 0 0 1信息技术数据元的规范与标准化第6 部分:数据元的登记( i d ti s o i e c1 1 1 7 9 6 :1 9 9 7 ) g b t2 0 0 0 1 1 2 0 0 1 标准编写规则第1 部分:术语( i s o1 0 2 4 1 :1 9 9 2 ,n e q ) i s o i e c1 1 1 7 91 :2 0 0 4 ( v 2 ) i n f o r m a t i o nt e c h n o l o g ym e t a d a t ar e g i s t r i e s ( m d r ) p a r t l :f r a m e w o 以 3 术语和定义 g b t2 0 0 0 11 2 0 叭所确立的以及下列术语和定义适用于本标准。 3 ,1 数据元素d a t ae l e m e n t 用一组属性描述定义、标识、表示和允许值的一个数据单元。 1 s y t6 7 0 5 - - 2 0 0 7 3 2 分类模式c l a s s i f i c a t i o ns c h e m a 根据对象的来源、组成、结构、应用、功能等共同特性,将其排列或分组。 3 3 语境c o n t e x t 一个名称所用于的或所源白的应用环境或规程的描述。 3 4 属性a t t r i b u t e 某个对象或实体的一种特性。 3 5 属性值a t t r i b u t ev a l u e 某种属性的一个实例表示。 3 6 数据元值d a t ae l e m e n tv a l u e 数据元允许值集合中的一个值。 3 7 数据项d a t ai t e m 数据元的一个具体值。 3 8 同义名称s y n o n y m o u sn a m e 与给定名称有区别但表示相同的数据元概念。 3 9 限定词q u a l i f i e r 帮助定义和呈递唯一性概念的术语。 3 1 0 允许的数据元值p e r m i s s i b l ed a t ae l e m e n tv a l u e s 根据在相应属性中规定的表示形式、布局、数据类型、最大范围和最小范围,表示数据元允许事 例的集。该集可以依据名称、参照来源、列举事例的表示或产生事例的规则而加以肯定。 3 1 1 域d o m a i n 一种属性的可能数据值的集合。 3 1 2 值域v a l u ed o m a i n 允许值的集合。 3 1 3 数据值d a t av a l u e 值域中的一个元素。 3 1 4 域名d o m a i nn a m e 将数据元的值域及度量单位利用一个统一的名称来表示。 3 1 5 数据类型d a t at y p e 由数据元操作决定的用于采集字母、数字和( 或) 符号的格式,以描述数据元的值。 , s y t6 7 0 5 - - 2 0 0 7 3 1 6 关系类型t y p eo fr e l a t i o n s h i p 数据元与相关数据元间关系的一种表述。 3 1 7 实体e n t i t y 任何具体的或抽象的事物,包括事物间的联系。 3 1 8 标识符i d e n t i f i e r 给定相关环境的对象的无歧义的名称。 3 1 9 对象类o b j e c tc l a s s 对象集。现实世界中的想法、抽象概念或事物的集合,有清楚的边界和含义,并且特性和其行为 遵循同样的规则而能够加以标识。 3 2 0 对象类术语o b j e c tc l a s st e r m 数据元名称的成分,用于表示其所属的对象类。 3 2 l 对象o b j e c t 可以想象或感觉的世界的任一部分。 见g b t1 5 2 3 71 2 ( ) 0 0 3 2 2 特性p r o p e r t y 对象类的所有个体所共有的某种性质。 3 2 3 特性术语p r o p e r t yt e r m 数据元名称的一个成分,用于表述对象类的特性( 数据元名称的一个成分,表述数据元所属类别) 。 3 2 4 限定术语q u a l i f i e rt e r m 帮助定义和区分数据库中某个名称词或词组。 3 2 5 表示r e p r e s e n t a t i o n 值域、数据类型的组合,必要时也包括度量单位或字符集。 3 2 6 表示类别r e p r e s e n t a t i o nt y p e 用于表示数据元的符号、字符或其他表示的类型。 3 2 7 表示术语r e p r e s e n t a t i o nt e r m 数据元名称的成分,用于描述数据元的表示形式。 3 2 8 术语t e r m 以语言表述的形式对某一特定语言中已经定义的概念的标示。 3 2 9 数据模型d a t am o d e l 以反映信息结构的某种方式对数据组织的某种描述。 s y t6 7 0 5 - - 2 0 0 7 3 3 0 数据元值的数据类型d a t at y p eo fd a t ae l e m e n tv a l u e 表示数据元值的不同值的集合。 3 3 1 元数据m e t a d a t a 定义和描述其他数据或过程的数据称为元数据。 4 数据元的规范与标准化框架 4 1 数据的成分 数据是对象特性及其行为的记录。数据是由对象类、特性及值的表示等基本的成分或单元组成的 ( 参见附录a ) 。 4 2 数据元的基本概念 数据元素( 以下简称数据元) 由以下三部分组成: a ) 对象类:现实世界中的想法、抽象概念或事物的集合,有清楚的边界和含义,并且其特性和 行为遵循同样的规则而能够加以标识。对象类是我们希望用于收集和存储数据的事物,例如 人、井、岩心、管线、储罐、聚乙烯等都是对象类。 b ) 特性:对象类的所有个体所共有的某种性质。特性是用来区别和描述对象的,例如颜色、性 别、年龄、收入、地址、价格等均为描述对象的特性。 c ) 表示:值域、数据类型的组合,必要时也包括度量单位或字符集。 示例l :典型的数据元组成实例( 见表1 ) 。 表1 数据元的组成实例 示例号数据素名称对象类词特性词表示词 1 原油密度原油密度( 值) 2 天然气相对密度 天然气 相埘密度 ( 值) 3 艮输管道长度长输管道挺度( 值) 4 聚乙烯规格型号聚乙烯规格型号( 代码) 5 聚乙烯生产厂家名称聚乙烯生产厂家名称 6 项目费用金额项目 费用金额 7 成品油价格成品油价格( 金额) 8 化肥( 生) 产量化肥( 生) 产 注1 :在特性词中含有表小的含义时,町以无表小词。如“原油密度”中,可以小写表月i 训“值”。 注2 ;在“表示词”一列中,表小旧用捂垮括起来时,表示这峰数据元奉身的特性词中就蕴岔首表小州。 4 3 数据元的基本模型 数据元的基本模型由两部分组成: a ) 数据元概念:一个数据元概念是能够以数据元形式表示的概念,它的描述独立于任何特定的 表示。 b ) 表示:表示是值域、数据类型、度量单位 数据元 ( 类型) 通配数据元 在图2 中: a ) 数据模型中的实体对应于数据元中的“对象类”,数据模型中的属性对应于数据元中特性与表 示的结合。 b ) “对象类”与“特性”结合构成“数据元概念”;“数据元”则是由数据元概念和表示组合而 成;特性的表示( 未标识“对象类”时) 是“通配数据元( g e n e r i cd a t ae l e m e n t ) ”。 c ) “数据元”、“数据元概念”、“通配数据元”都是数据元的类型。而在数据元分类结构中的基本 成分是:“对象类”、“特性”与“表示”。 d ) 在数据元分类结构中,特性是一公共成员,传递着客观事物特征的语义,反映了数据元属性 的相关性。 沣1 :数掂元成分- t ,加入限定词时称为面向应用的数据元素( 简称应用数据元) 。数据儿、数据元概念、通配数 据j l 、应用数据兀等这些类型的划分是为了数据元的分析和应用。为了便于理解和应用,本标准将“数据 元概念”的表乐命名为基本数据元。未注明“应用数据元”、“通配数据元”、“基本数据元”等特定数据j c 名称时,所标识的“数据元”即为广义的“数据元”。 注2 :数据元是按照数据元规范的数据,本标准为叙述的方便,不特别说明“数据”即被认作是巳规范的数据元。 刀i 别5 :数据i 的成分和分类( 见表7 ) 。 表7 数据元的成分和分类示例 数据元分类结构示例1月i 例2示例3 数据,i 概念( d e c ) s c 3 2d e 1 e g a t e sc o u n t r y 地层温度原油( 生) 产 数艋 元崇( d e ) s c 3 2d e l e g a t e sc o t m t r yn a m e 地层温度f a原油( 生) 产量 列象类 s c 3 2d e l e g a t e s 地层原油 s y t6 7 0 5 - - 2 0 0 7 表7 ( 续) 数据元分类结构 示例1示例2示例3 特性c o u n t r y温度( 生) 产 表示 n a m e 值量 通配数据元c o u n t r yn a m e温度值( 生) 产量 5 2 数据元的分类模式 数据元的“分类模式”是根据对象的来源、组成、结构、应用、功能等共同特性,将对象排列或 划分成组的模式的分类参照。 一个基本的分类结构应能有助于数据元的注册、分析和应用。它基于这样的前提:数据元是自然 界存在的对象类的特性的表示。数据元的类别由这样三个类组成: a ) 对象类。 b ) 特性。 c ) 表示形式。 5 2 1 基于“对象类”的分类 对象类有清楚的边界与含义,概据它们的名称,辨识它存在的空间和范围。同时,“对象类”间 存在着概化和特化、继承、聚合、分解以及i s a 等关系。基于“对象类”的分类模式能够较好地反 映业务领域、业务过程和业务活动的分类,此外,同一对象类的数据元集合的子集可以刻画对象类的 特征。将其固定后,可作为规范的实体予以标识,并为其他实体所引用。基于“对象类”的分类特 征,有利于业务模型分析和数据模型的设计。 5 2 2 基于“特性”的分类 按照数据元的特性对数据元进行分类,下层次数据元对上层次数据元属性有继承性,其基本的含 义是: a ) 值域继承可以定义为同一个“值域”。如果下层次数据元另定义值域名称,则新名称所标 识的“值域”不能超出上层次的数据元“值域”。应要求数据类型、度量单位一致,取值范围 小于或等于上层次的取值范围。 b ) 名称继承名称命名有连续性,一般下层次数据元的名称中包含有上层次数据元名称,仅 增加了限定词成分( 或对象类成分) 。 c ) 定义继承上层次数据元的明确定义,在下层次数据元定义中可以不重复定义已定义过的 含义。 基于“特性”的分类包括以下三种基本模式: 1 ) 基于对象类继承的特性分类模式。 数据元的“对象类”之间存在超类与子类关系时,子类数据元继承超类数据元的属性。 2 ) 基于概念类的数据元的特性分类模式。 数据元概念相同的数据元集合,其属性继承基本数据元( 数据元概念的表示) 的属性。 示例6 :“计划原油产量”继承数据元“原油产量( 值) ”的属性。 示例7 :“地面原油密度”继承数据元“原油密度( 值) ”的属性。 3 ) 基于通配数据元的特性分类模式。 同一特性的表示,当有“值域”时是通配数据元,数据元之间的属性有联系,其超类是通 配数据元本身。 示例8 :“含油饱和度”、“含水饱和度”、“含气饱和度”虽然是不同的对象类,但是,都是计量在地层孔隙中所占 的空间与全部含量孔隙空间的百分率,有相同的取值范围和度量单位。可以将“饱和度”定义为通配数据元,并对这 个通配数据元定义统一的“值域”。 0 基于“特性”的分类包括三种基本模式,如图3 所示。 o s x 九z 研日s - 2 0 0 7 图3 基于“特性”分类的三种基本模式 5 2 3 基于“表示形式”的分类 “表示”是值域、数据类型的组合,必要时也包括度量单位或字符集。“表示术语”则是数据元名 称的成分,用于描述数据元的表示形式。 5 2 3 1 表示形式的分类 可以将数据元的表示形式分为三大类,即量值类型、标识类型和描述类型。 a ) 量值类型:这种类型的数据元可以对其进行定量的约束,并且有度量单位表示,这些量值类 型具体包括长度、质量、时间、电流、温度、光强度、物质的量等基本量以及体积、速度、 密度等一批导出的量。其中量值类型数据元的度量单位是这些“特性”的表示符。 b ) 标识类型:可以定性界定的数据元及其集合,每一个数据元实例均可唯一标识。 c ) 描述类型:有抽象的范围,但其内容无法约束。可分为描述、说明和备注几种类型的数据元。 上述三种数据元的表示类型,是可以变换的。 示例9 :井的深度,可以记录为数值量,也可以根据需要事先定义:浅井( 井深小于1 5 0 0 r e ) 、中深井( 井深为 1 5 0 0 m 3 0 0 0 m ) 、深井( 井深为3 0 0 0 m 5 0 0 0 m ) 、超深井( 井深大于5 0 0 0 r e ) 。 示例1 0 :“事故情况”是描述类型的数据元,但是分解后可以用“事故等级”、“直接经济损失”、“死亡人数”等 数据元来刻画。 按照“表示”词的词语进行分类时,同一“表示”词的数据元之间,有相同的表示形式;但是数 据元属性之间的联系,由于“表示”词本身无定义,还需考察“特性”词的定义。 5 1 3 2 数据元的表示分类 数据元的表示最重要的是“值域”,因此,按照数据元的表示分类,从某种意义上讲,即可认为 是按照数据元的“值域”分类。 数据元的“值域”主要由以下属性组成: a ) 数据元值的数据类型:表示数据元值的不同值的集合。 b ) 数据元值的最大长度:表示数据元值的( 与“数据类型”相对应的) 存储单元的最大数目。 c ) 数据元值的最小长度:表示数据元值的( 与“数据类型”相对应的) 存储单元的最小数目。 d ) 度量单位:量值数据的物理量纲单位。由于同一个数据元可以有不同的度量单位,还需要联 系度量单位之间的对照、转换关系。 1 i s y t6 7 0 5 - - 2 0 0 7 要实施按照数据元的表示分类,就需要命名定义“值域”,按照数据元属性的性质,将其与命名 定义的“值域”联系起来。每个数据元都归属一个特定的“值域”。通过“值域”的归类,将每个数 据元的数据类型、取值范围、度量单位规范化并联系起来从而达到规范数据元属性的目的。 “值域”的定义和应用有以f 好处: a ) 将数据元之间的属性联系进行固化,作为约束条件溶人数据元结构,可以有效地解决数据元 之间的属性冲突。 b ) 数据元通过“值域”统一定义其数据类型、取值范围等表示类属性,也就控制r 数据元的质 量。可以通过修改“值域”定义,来修改数据) l 的表示属性。 c ) 数据元的“值域”联系,通过“值域”的命名定义将其显性化,明确_ 数据元的边界和范围 及其相互关系,反映了数据元的“对象类”的某些特性,有助j 二规范数据元的“名称”与 “定义”等属性的规范。 5 2 4 方法论 数据元的分类法是基于概化或特化以及集、子集和集隶属关系这样的层次结构。这对j :研究并定 义数据元之间的结构性联系,规范数据的属性( 属性名、属性型、属性值) 具有特别的意义。 在数据元的基本分类结构中,基于数据元的基本成分“对象类”、“特性”、“表示形式”作为基本 的分类单元与客观世界的“对象类”、“特性”、“表示形式”之间,存在着概念 二的联系呈网状结 构,反映了自然界这种概念上联系的客观性。 从概念上讲。数据元的“对象类”的等同体是数据模型中的“实体”,数据元的“特性”( 加表 示) 的等同体是“实体”的“属性”。数据元的名称是“实体”名称和“属性”名称的组合,数据元 的成分“对象类”、“特性”和所对应数据库的“实体”及其“属性”是有结构性联系的。 6 基本数据元分析与设计 6 1 数据元概念 是能以数据元形式表示,且与任何特定的表示无关的一种概念。 示例1 1 :“原油密度( 的测量值) ”、“地面原油密度( 的测量值) ”、“地层原油密度( 的测帚值) ”、“原油密度( 的 测量值) 平均值”等,是同一个数据元概念“原油密度”,其数据元的基本属性具有相关一r :。 示倒1 2 :“原油实际产量”、“机采原油产量”、“单元原油产量”、“计划原油产量”等,“原油( 生) 产”是一个数 据元概念,其表示的值域是一种交集,如图4 所示。 图4 数据值域的交集 示例1 2 中,以“原油产量”作为父类,其基本属性和值域涵盖所有集合内以及呵能有的与该数 据元概念相关的数据元的基本属性和值域。 1 2 s y t6 7 0 5 - - 2 0 0 7 在一组概念类似的“数据”中,抽象出数据元概念,是对数据进行数据元分析,规范其属性 “名”、属性“型”、属性“值”的基础。数据元概念具有以下性质: a ) “对象类”与“特性”组成数据元概念没有表示词。 b ) 其成分“对象类”可以有一个或多个概念类似的成员。 c ) 数据元概念相同的“数据元”之间其基本属性有相关性,因为它们是对于同一对象类( 父类) 从不同视角的分类( j 二类) 。 6 2 基本数据元 在具有相同特性的相关数据元集合中,有一个上层次数据元的属性是该集合中所有下层次数据元 属性定义的源头,为此,将这样的上层数据元确定为基本数据元。基本数据元的确定对于规范数据元 属性和结构,具有重要意义。饲如,储量类数据元的基本数据元为:“石油储量”、“天然气储量”。油 气生产量类数据元的基本数据元为:“原油产量”、“天然气产量”。 同一类的数据元集合中,基本数据元的“值域”和“名称”将被下层次数据元继承,基本数据元 是应用数据元属性定义的源头。基本数据元具有以下性质: a ) 独立使用的数据类目,它表示一个数据元概念。 b ) 该数据元的性质特征是被认可的数据元属性集合。 c ) 基本数据元集合为数据交换提供支持,由于它们是派生数据元的源头,控制了派生数据元的 属性,在编辑数据元主目录时,仅出现首选的基本数据元的属性,集合中派生的数据元可以 由计算机程序或人工自动产生。 6 3 面向应用的数据元 6 3 1 应用数据元的性质 应用数据元是采用不同方法被用于派生出面向应用的数据元,是基本数据元与其主要成分的分类模式 组合而成。因此,应用数据元( 子类) 继承基本数据元( 父类) 的属性,其间层次关系可以用图5 表示。 图5 数据元的层次关系 胃溅鬻蘸 孓 s y t6 7 0 5 - - 2 0 0 7 图5 表达以下概念: a ) 数据元概念是一组相类似的数据元集合的概念化。 b ) 基本数据元是数据元概念的表示,也是应用数据元的超类。它的属性为下层次数据元所 继承。 c ) 从数据元的“值域”考察,基本数据元与应用数据元的“值域”之间是“全集”与“子集” 的关系。 6 3 2 应用数据元的派生 不同的方法被用于派生出面向应用的数据元。应用数据元是:派生的面向应用的数据元,用分类 模式的允许值( 限定符) ,对数据元主要成分进行限定,是数据元的“精确化”表示,因此要求对相 关分类模式的允许值取值的规范性。应用数据元的名称由数据元名称和分类模式的实例组合而成。数 据元与应用数据元之间层次关系可以用图6 示意。 数据元 分类模式 除熏曩,醐it 据元 i 4 燃。 图6 应用数据元的派生 示例1 3 :数据元“单元原油产量”与分类模式“开采方式”组合,派生一组面向应用的数据元:“机采单元产油 量”、“自喷单元产油量”。 6 4 分类模式 分类模式的表示形式是枚举类型的数据元。主要业务对象的分类是基于对象类整体特征的分类; 业务对象类某个属性的类别是对于该对象特定视角的分析。它们均以枚举实例的列表呈现,其实例取 值是派生的面向应用的数据元成分的限定词。对象类别的定义和规范与数据库设计中实体7 的定 义、标识相联系,是设计企业信息编码体系的技术基础。 6 5 数据元的变体与派生 数据元中所展示的成分与其语义环境有关,数据的组成成分在不同环境下,其身份是可以变 化的。在此处是对象类词,到彼处是特性词;数据元也可以由别的几个数据元组成,或由其他数据元 派生。 6 5 1 数据元的变体 数据元成分的变换对象类的特性,也可以成为对象类。如颜色在“颜料颜色标记”和 “眼睛颜色标记”中的“颜色”是特性,而在数据元“颜色标记”中的“颜色”也可以是“对象类”, 如图7 所示。 图7 数据元成分的变换 斟n6 7 0 5 - - 2 0 0 7 6 5 2 数据元的派生 数据元的基本成分,即“对象类”、“特性”、“表示”,结合特定的分类模式可以派生一类结构 名称。 示例1 4 :报告期:“年”、“月”、“日”、“年末”等,与数据元“单元产油量”相结合,可派生名称:“单元年产油 量”、“单元月产油量”、“单元日产油量”、“单元年末产油量”等。 示例1 5 :“单元产油量”与生产方式结合,可派生出“机采单元产油量”、“自喷单元产油量”。 示例1 6 :铁含量、铜含量、锌含量等数据,是数据元“矿物成分”与“矿物含量”组合派生的。“铁”、“铜”、 “锌”是数据元“矿物成分”的实例名称,而“含量”又是数据元“矿物含量”特性的表示。 6 5 3 数据元的复合 有时,数据元可以由几个表示为数据元的要素部分来派生,每个部分又表示为数据元。 示例1 7 :数据元“电话号码”可分隔成“区号”、“交换码”、“线路号”,形成三个数据元。将区号、交换码、线 路号接起来形成一个数据元。 示例1 8 :平均值是一组观测值及其个数的算术运算结果。 示例1 9 :数据元“地址”是由“国家名称”、“省市名称”、“街区名称”、“门牌号码”组成,而其成分叉可以是独 立的数据元。因此,它是一个复合的结构类型的数据元。 6 5 4 数据元的层次性 数据元的“对象类”是企业采集和存储数据的事物。因此,数据元的定义与应用领域、范围有 关,不同层次对于采集、存储、处理数据的粒度是不同的。 6 6 数据元的信息元素 在i s o i e c1 1 1 7 9 1 :2 0 0 4 ( v 2 ) 中,“对象类”、“特性”、“表示类”( 以及“数据元概念”、 “数据元”) 是数据元的信息元素。在信息标准制定和数据模型优化设计中,应按照相关的信息元素, 规范、约束数据模型中业务对象的类型、特性以及在计算机中的表示。 6 6 1 对象类 对应于主要业务对象( 包括活动) 类。可以此对主要业务活动及对象进行归类,进而,为设计不 同业务部门共享的业务过程,以及抽象出共同的业务领域奠定基础。 6 6 2 特性 量值类数据的超类是自然属性( 如长度、温度、质量等) ,下层次的数据元( 或数据) 继承其的 值域,并不得超越该值域,并可继承其名称和含义。为数据库设计中的属性“名”、“型”、“值”的规 范提供基础。 6 6 3 表示 数据元的表示的规范,应导向数据的值域及相关的数据类型、度量单位的规范和统一。 6 7 数据元的元数据属性 在i s o i e c1 1 1 7 9 1 1 :2 0 0 4 ( v 2 ) 中,元数据的定义为:“描述和定义数据的数据”。与传统 的对元数据的理解、认识上有了发展。因为元数据是数据,所以可以创建数据库,用户可以通过元数 据,访问应用数据库中的数据。 实际上,i s o i e c1 1 1 7 91 :2 0 0 4 ( v 2 ) 的理论、方法基础是“数据元基本模型”,与i s o i e c 1 11 7 9 1 :1 9 9 9 ( v 1 ) 完全一致。事实上,在:s o t e e1 1 1 7 9 1 :2 0 0 4 ( v 2 ) 元数据注册e m e t a d a t a r e g i s t r i e s ( m d r ) 中属性描述的是数据元素。而且,任何一个描述符的集合或元数据属性,可以 被解释为数据元素并在元数据注册中被注册。因此,i s o i e c1 1 1 7 9 1 :2 0 0 4 ( v 2 ) ( m d r ) 中的 元数据,在这个层面上是不定义的。 数据元素是用一组属性描述的,基本的描述属性与元数据是相同的,一个组织的数据元必须具备 元数据。但是,元数据不可能涵盖理解数据元所要表示的数据所必需的所有信息。因此,按本标准规 定分析、设计的数据元成果,可以用于元数据的管理,设计元模型。 s y t6 7 0 5 - - 2 0 0 7 a 1 数据成分实例见表a1 。 附录a ( 资料性附录) 数据成分及数据元名称结构 表a 1 组成数据的成分实例 生产力式描述曲对象时间记录对象活动或状态对象特,盹值的表示 机采原油 日产: 鞋 ( 俏) 天然气月储藏量( 值) 化肥 拄 销售量 ( f 卣) 地层 渗透率( 值) 项日累计投资费用( 金额) 表a1 说明: a ) “数据”描述九业务活动的“对象”、“性质”、“值的表示”等基本要素,也表示r “时问”、 “活动或状态”、“生产方式”等环境成分。 b ) 一个“数据”的命名、定义是有一定规则可循的,规范的数据名称含有丰富的信息。 c ) “数据”与“数据”之间的成分是有联系的,这种联系与“对象”、“性质”、“值的表示”以及 “时间”、“活动或状态”、“生产方式”等有关。 通过对这些数据成分的分析,可以将这些数据“结构化”,通过分析可以揭示、建立起这些成分 间的联系。这种结构化的“数据”,不仅可以有效地解决“数据”的完整性和一致性,而且为“数据” 的进一步加工、分析等奠定基础。 a 2 数据元名称结构在油田上游生产的应用实例见表a 2 。 表a 2 数据元名称结构在油田上游生产的应用实例 类别示例1示例2小例3 通配数据,l储量产量孔隙度 基本数据,l石油+ 储量原油+ 产量岩石+ 孔隙度 石油+ 地质) + 储量、原油+ 口) + 产量、储集岩+ 孔隙度、 应用数据元 i f 油+ f 剩余 + 储最原油+ f 年) + 产油量雄岩+ 孔隙度 注:“+ ,表币数据儿素扣各个要素间的连接关系。 从表a2 中可以看出,“储量”、“产量”以及“孔隙度”为通配数据元。这衅通配数据7 二与不同 的“对象类”联合就会形成不同含义的基本数据元,例如石油储量、地f 水储量、煤储量、天然气储 量等;如果对这些基本数据元再进行限定将会得到意义更加明确的应用数据元。例如,“原油产量” 本身是一个基本数据元,加上不同的限定阋就会派生出不同含义的应用数据死,如果加上时间属性的 限定词,它就形成与时间有关的应用数据元,诸如原油日产量、原油年产鼋、原油累产量、原油月产 量等应用数据元;如果对对象进行“石油开采方式”的限定,则会形成关于不同开采方法的“原油产 量”应用数据元,例如自喷原油产量、热采原油产量、机采原油产量等;如果加上单元的限定,则会 16 s n7 16 7 0 5 - - 2 0 0 7 形成关j _ 二单元原油产量数据元,如单井原油量、单元原油产量等。这里面的不同限定词就是从不同的 角度对数据元的分类,即对应着数据元分析方法中的分类模式如果将这些不同性质的限定词联合到 基本数据元之上就会派生出大量的有意义的应用数据元。如果将单元、开采方式、时间等不同分类模 式进行统一的联合限定将派生出意义更加明确的应用数据元,例如单井机采原油日产量、单井机采原 油月产量、单井机采原油年产量、单井自喷原油年产量等。 a 3 数据元名称结构在化工生产与销售中的应用实例见表a3 。 表a 3 数据元名称结构在化工生产与销售中的应用实例 类别示例1 示例2 示例3 通配数据几名称规格等级 低密度聚乙烯+ 名称低密度聚乙烯+ 规格低密度聚乙烯+ 等级 基本数据元 高密度聚乙烯+ 躬称高密度聚乙烯+ 规格高密度聚乙烯+ 等级 a 4 数据元名称结构在天然气与管道中的应用实例见表a 4 。 表a 4 数据元名称结构在天然气与管道中的应用实例 类别示例1求例2示例3 通配数据兀宽度长度直径 基术数据元焊缝+ 宽度管段十k 度套臀+ 直径 s y t6 7 0 5 2 0 0 7 附录b ( 资料性附录) 数据元素与其他数据概念的联系 数据元与信息系统中各类应用环境所涉及到的数据都有联系。在数据库、文件和事务集中,数据 库或文件由记录、段和元组等组成,而记录、段和元组则由数据元组成;数据7 i 包含字符、图像、声 音等多类数据。 一个组织需要将数据传输给其他组织时,数据元构成了事务集的基本单元,信息传输的公共单元 是数据元,如图b 1 所示。 图b 1 数据元素与其他数据概念 b 1 数据模型中的数据元 在数据建模出现之前,“数据元”这个术语已被普遍使用。用于表示指导企业商务信息的数据单 元传统上被称之为数据元。数据建模的演进就是为捕捉这些数据表示的语义提供一种有效的方法。 1 8 s y t6 7 0 5 - - 2 0 0 7 图b2 描述了用于g b t 1 8 3 9 1 1 2 ( ) ( ) 2 ,g b t 1 8 3 9 1 2 2 ( ) ( ) 3 ,g b t 1 8 3 9 13 2 ( ) ( ) 1 ,g b t 1 8 3 9 142 0 0 1 ,g b t1 8 3 9 15 2 0 0 1 ,g b t 8 3 9 162 ( ) ( ) 1 中的数据元结构和术语与一些更为传 统数据建模术语的关联, 在一个数据模型巾,一个实体( 实体类型、对象类等) 的某个特性的属性会被企业选择记录为数 据。对每个实体,通常有许多属性会引起企业的兴趣。 数据模型和对象模型( 面向对象定向范例中) 用于识别兴趣体( 实体或对象) 应用相关环境中的 诸多事物。属性提供关于这些实体和对象使用所需的信息。用于整个自动化信息系统环境的数据元是 面向对象范例中这些实体或对象以及它们属性的表示。产生于数据模型的数据元的名称的典型形式是 实体名称和实体属性名称的合成( 如图b2 所示) 。 实体 属性 数据元 图b 2 数据模型中的数据元 数据元名称大体上是以同样方式产生的。在对象模型中,类或对象名称与类或对象属性混合使用 以形成数据元名称( 如图b3 所示) 。对象模型不同于数据模型的地方在于:前者可包含有关对象或 类的附加信息,如行为或运行。 类匾 二 类属性1 篆i 码 数据元 类属性 标识码 瓤琚兀 p 二j 类行为 图b 3 对象模型中的数据元 在数据模型或对象模型中,一个属性经常等同于一个数据元( 如图b3 所示) 。它是自然界中对 象某个类型单个特性的表示。而另一类思路是将对象类特性的概念与特性的表示分隔开来。由于数据 元包含r 表示,人们不必依靠其在数据库、屏幕和纸张等中的表示就可以了,解其隐含的意义,因而将 其隐含意义分隔开来是比较合理的。这与那些将属性看作与值域有关,而不是属性具有值域的数据建 模技术是相吻合的。 在某些情况下,如度量单位,属性与数据元间存在着明显的差异。例如,“日期”是时间连续区 上用来度量最近一天的一个点。这样,它可以被看做一个单独的事实并用一个单独的属性表示在一个 数据模型中。但是,有好几种方式来表示一个日期。在美国,最常用的是:月的名称、一月中的天数 和年数。它们是三个数据元。然而,同样的日期事实町以用过去某确定日期后所流逝的天数这样一个 单独的数据元来表示( 如天文学家就使用儒略历) 。许多单独事实可以用多于种度量衡单位来表示, 既可用英制单位表示,也可用同际单位制单位来表示。 一个数据元概念 :的等同体被称之为:属性、特性、数据元概念、逻辑数据元和商务事实。在 此,它是作为个特性米沦及的,以区别于人们通常所说的属性( 一般包括其表示形式) 。这样特性 就成了某个对象类所有成员共有的特性。 特性可以用一个例子来解释。假设一棵树是自然界中我们感兴趣的对象,但是,我们关心的是任 一棵树,而不足某棵具体的树。树的特征中我们感兴趣的是其高度。树高就是一个对象类加上一个特 s y t6 7 0 5 - - 2 0 0 7 性( 数据元概念) ,但不是一个数据元,因为适当的表示形式尚末明确。我们可以从多个度量高度的 方式中选择一个来表示树高。 相对于特性,人们更倾向于用特性类这个术语来命名数据元。对象中的一类,如人群没有身高, 而每一个对象个体,即个人就有身高。因此,对于称之为人群的对象类来说,身高是该对象类的- 个 特性类。 有时,数据元可以由几个表示为数据元的要素部分来派生,每个部分又表示为数据元。这些派q 二 物可以有许多形式。例如,电话号码由几个要素部分组成,在美国,电话号码由十位数字唯一地描 述,这些号码很容易由一个数据元表示。但是,电话公司( 和其他公司) 需要将电话号码分隔为区 号、交换码和线路号,形成三个数据元,将区号、交换码和线路号串联起来( 以正确的方式) 形成一 个数据元以表示整个电话号码。 另一个派生的例子是代数运算。均值( 或平均数 的计算需要观测值及其个数,因此,一个人群 平均年龄的计算需要表示人群年龄的数据元和表示人群中人总数的数据元。这样,就可以用派生中阐 明的公式进行直接的算术运算。 b 2 表中的数据元 关系型数据库中的数据元以字段名的形式出现于表格中。图b4 给出r 数据库数据元的个 例子。 记录 属性 数据值 雇员 号码姓出生日期 工资额 lr o o d4 7 3 44 8 3 0 0 2h e r d e n4 8 6 35 0 10 0 3 l b r ig h t 5 1 7 94 9 0o 图b 4 数据元库表格中的数据元 c 1 标识 附录c ( 资料性附录) 数据元的元数据属性 s y t6 7 0 5 - - 2 0 0 7 如同由数据元表示的特性和对象类一样,唯的数字型标识符赋予给每个已注册的数据元。在 有些情况下,唯一的数字型标识符也是一个数据元的给定数值。这些唯一的标识符也被注册在一个数 据元注册中。它们使得可以跨越自然和应用系统直接解释这些数据元。虽然数据元在不同的自然语言 中或在同一种语言的多种版本中会有不同的解释,但其唯一性标识符保持彳i 变,并成为由一个版本向 另一个版本转化的桥梁。 每一个数据元应获得一个标识符以使浚数据元在整个计算空间中得到唯一的标识。而这些计算空 间有:应用程序、区域计算系统、分布式的计算系统、组织、企业以及面向所有国家的全球性此类计 算空问。标识符不含有任何信息,因此,它们可以由注册员赋予数据元并永久地依附于它们。数据交 换用的标识符由注册机构赋予并维护。 在所限定的学科或其主题领域内,除了标识符外,数据元可以被赋予任何个可替换的名称或图 标。一个数据元名称可以是一个注册机构内酋选的名称。如同标识符一样,首选名称与数据元之间保 持着一对应的关系。名称通常是数据用户标识数据元并与之相互作用的基本手段。 数据元由不同的注册机构注册。它们中的每一个都首选持有数据用户熟悉的标识符、名称、图符 或其他形式的标识。对于可替换标识符,标识符连同其相关环境一起以应用文件的形式表现出来。 一些值域中的每一个数据值也有可能被赋予一个标识符。这对穷举域具有特殊的用处,它将为与 数据实例相关的名称国际语言问的翻译提供便利。例如,数据元“眼睛颜色名称”可有穷举域“灰 色、蓝色、绿色和褐色”,在此,每个数据值可以有一个它们自己唯一的标识符( 如灰色= 1 3 5 7 ,蓝 色= 2 4 6 8 ) 。 c 2 定义 定义是数据元含义的自然语言表述。对于数据元开发来说,数据元的定义是至关重要的一个方 面。为了共享,数据元必须有一个形式上完备的、清楚的、精确并被普遍理解的定
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 砖厂经营权承包与环保节能技术改造合作协议
- 标准合同模具制作合同4篇
- 公司向公司借款合同协议书书2篇
- 土地收储 涤除 租赁合同4篇
- 多维变更影响分析-洞察及研究
- 旅游目的地市场细分策略-洞察及研究
- 2025-2030锂电池材料技术创新分析及产能扩张与投资风险评估研究报告
- 2025-2030苗木花卉产业市场细分与渠道建设分析报告
- 海鲜质量检测创新创业项目商业计划书
- 水果低盐食品创新创业项目商业计划书
- 幼儿园数学活动《6和7的认识》课件
- 大语言模型与安全 课件 第3章 多模态大语言模型
- 人民医院开展“改善就医感受提升患者体验”主题活动实施方案
- 2025四川成都崇州市国有资产监督管理局市属国有企业面向社会招聘中层管理人员和员工19人笔试模拟试题及答案解析
- 2025年《医疗器械质量管理规范》培训试题(附答案)
- 2025年小学生宪法素养竞赛题库
- 2025年php考试题及答案笔试
- 骨折固定与康复技术新进展
- 美国学前教育史
- 海关AEO高级认证供应链安全培训2025.7.14(一)
- 防压疮护理课件
评论
0/150
提交评论