




已阅读5页,还剩22页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
i c s3 5 2 4 0 7 0 ;0 7 0 4 0 l6 7 a 雪 中华人民共和国国家标准 g b t2 1 3 3 7 - - 2 0 0 8 i s 01 9 11 3 :2 0 0 2 2 0 0 8 - 01 - 0 9 发布 地理信息质量原则 g e o g r a p h i ci n f o r m a t i o n - - q u a l i t yp r i n c i p l e s ( i s o1 9 1 1 3 :2 0 0 2 ,i d t ) 2 0 0 8 - 0 8 - 01 实施 宰瞀鹘鬻瓣訾糌瞥星发布中国国家标准化管理委员会促1 9 g b t2 1 3 3 7 - - 2 0 0 8 1 s 01 9 1 1 3 :2 0 0 2 目次 前言 ;l 言- 1 范围 2 一致性 3 规范性引用文件 4 术语和定义 5 描述地理信息质量的原则- 5 1 数据质量说明的组成部分 5 2 数据质量量化元素和数据质量量化子元素 5 3 数据质量非量化元素 6 地理信息质量的确定 6 1 量化质量信息的确定- 6 2 非量化质量信息的确定 7 质量信息的记录 7 1 量化质量信息的记录 7 2 非量化质量信息的记录 附录a ( 规范性附录) 抽象测试套件 附录b ( 资料性附录)数据质量概念及其应用- 附录c ( 资料性附录) 数据质量量化元素、数据质量量化子元素和数据质量非量化元素 参考文献 国家基础地理信息系统全国1 :2 5 00 0 0 地形数据库示例1 6 t - - - 2 3 i 1 1 l 1 4 4 5 6 7 7 8 9 9 9 0 2 刖罱 g b t2 1 3 3 7 - - 2 0 0 8 i s 01 9 1 1 3 :2 0 0 2 本标准等同( i d t ) 采用国际标准化组织地理信息技术委员会( i s o t c2 1 1 ) 制定的国际标准 i s o1 9 1 1 3 :2 0 0 2g e o g r a p h i ci n f o r m a t i o n - - q u a l i t yp r i n c i p l e s ,并做了如下改动: a ) 标准的编写方法执行了国家标准g b t1 1 2 0 0 0 标准化工作导则第1 部分:标准的结构 和编写规则的要求。 b ) 将“本国际标准”和“i s o1 9 1 1 3 ”改为“本标准”。 c ) 删除了原国际标准的前言。 d ) 增加了规范性引用文件:g b t1 9 0 0 02 0 0 0 质量管理体系基础和术语。 e ) 将“i s o1 9 1 1 4 :2 0 0 3g e o g r a p h i ci n f o r m a t i o n 一q u a l i t ye v a l u a t i o np r o c e d u r e s ”改为 “g b t2 1 3 3 6 - - 2 0 0 8 地理信息质量评价过程”,将“i s 0i 9 1 1 4 ”改为“g b t2 1 3 3 62 0 0 8 ”; 将“i s o1 9 1 1 5 :2 0 0 3g e o g r a p h i ci n f o r m a t i o n - - m e t a d a t a ”改为“g b t1 9 7 1 0 - - 2 0 0 5 地理信息 元数据”;将“i s o1 9 1 1 5 ”改为“g b t1 9 7 l o 一2 0 0 5 ”;将“i s o1 9 1 0 5 ”改为“g b t1 9 3 3 3 5 - - 2 0 0 3 ”;将“i s o1 9 1 0 8 :2 0 0 2g e o g r a p h i ci n f o r m a t i o nt e m p o r a ls c h e m a ( 地理信息时间模 式) ”改为“g b t7 4 0 8 - - 2 0 0 5 数据元和交换格式信息交换 日期和时间表示法”,将 “i s 01 9 1 0 8 ”改为“g b t7 4 0 8 ”。 f ) 按照全国科学技术名词审定委员会2 0 0 2 年公布的测绘学名词( 第二版) 确定术语“准确度 a c c u r a c y ”及其定义。按照g b t1 9 0 0 0 - - 2 0 0 0 确定术语“质量q u a l i t y ”的定义。 g ) 将“d a t aq u a l i t ye l e m e n t ”译为“数据质量量化元素”,“d a t aq u a l i t ys u b e l e m e n t ”译为“数据质量 量化子元素”,“d a t aq u a l i t yo v e r v i e we l e m e n t ”译为“数据质量非量化元素”。 h ) 删除了资料性附录c 原有的示例内容,用我国国家基础地理信息系统全国1 :2 5 00 0 0 地形 数据库数据质量控制暂行规定有关内容作为示例替代。 i ) 增加了参考文献部分及相关内容。 本标准附录a 为规范性附录,附录b 和附录c 为资料性附录。 本标准由全国地理信息标准化技术委员会提出并归口。 本标准起草单位:国家基础地理信息中心 本标准主要起草人:刘若梅、蒋景瞳、贾云鹏、周旭。 g b t2 1 3 3 7 - - 2 0 0 8 i s o1 9 11 3 :2 0 0 2 引言 地理数据集的共享、交换和超出生产者预期目的的应用均在不断增加。数据集中数据的值与其质 量直接相关,地理数据集的质量信息对选择数据集的过程至关重要。数据用户对数据质量的要求不完 全相同。一些数据用户要求数据的准确度非常高,以满足特定的需求,而另一些用户对数据准确度的要 求则相对较低。由于技术进步,允许收集和使用其质量超出数据用户需求的地理数据集,地理数据质量 信息正成为数据应用的决定性因素。 描述地理数据质量是为了便于选择最适合应用需求的地理数据集。对数据集质量的完备描述能促 进相应地理数据集的共享、交换和使用。地理数据集可看作是商品或产品。地理数据质量信息使数据 生产者或供应方能够证实其数据集对产品规范规定的符合程度,并帮助数据用户确定产品满足其特定 应用要求的能力。 本标准的目标是提供描述地理数据质量的基本元素和处理地理数据质量信息的概念。 g b t2 1 3 3 7 - - 2 0 0 8 i $ 01 9 1 1 3 :2 0 0 2 地理信息质量原则 1 范围 本标准确定了描述地理数据质量的基本元素,规定了质量信息报告的组成部分及组织数据质量信 息的方法。 本标准适用于数据生产者提供质量信息,正式地或隐含地描述和评估其数据集按产品规范规定对 论域映射的符合程度,并适用于数据用户确定特定的地理数据质量是否能满足他们的特定应用要求。 获取和购买数据的有关单位应参照本标准,衡量产品是否满足规范的要求。它还可以用于定义应用模 式和说明质量要求。 本标准的质量基本元素适用于数字地理数据,可以扩展用于识别、采集和报告地理数据集的质量信 息,其基本元素还可扩展用于识别、采集和报告数据集系列,或作为数据集子集的较小数据组的质量 信息。 虽然本标准适用于数字地理数据,但其基本元素可扩展用于许多其他形式的地理资料,如地图、图 表以及文档。 本标准不对地理数据规定可接受的最低质量要求。 2 一致性 任何声明与本标准一致的产品,都要符合附录a 提出的抽象测试套件中描述的所有要求。 3 规范性引用文件 下列文件中的条款通过本标准的引用面成为本标准的条款。凡是注目期的引用文件,其随后所有 的修改单( 不包括勘误的内容) 或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究 是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。 g b t7 4 0 8 - - 2 0 0 5 数据元和交换格式信息交换日期和时间表示法( i s o8 6 0 1 :2 0 0 0 ,i d t ) g b t1 9 0 0 0 - - 2 0 0 0 质量管理体系基础和术语( i s o9 0 0 0 :2 0 0 0 ,i d t ) o b t1 9 7 1 0 - - 2 0 0 5 地理信息元数据( i s o1 9 1 1 5 :2 0 0 3 ,m o d ) g b t2 1 3 3 6 - - 2 0 0 8 地理信息质量评价过程( i s o1 9 1 1 4 :2 0 0 3 ,m o d ) i s o1 9 1 0 9 :2 0 0 5 地理信息应用模式规则 4 术语和定义 本标准采用下列术语和定义。 4 1 准确度a c c u r a c y 在一定观测条件下,观测值及其函数的估值与其真值的偏离程度。 4 2 一致性c o n f o r m a n c e 满足规定的要求。 e g b t1 9 3 3 3 5 2 0 0 3 1 g b t2 1 3 3 7 - - 2 0 0 8 1 s 01 9 11 3 :2 0 0 2 4 3 一致性质量级别c o n f o r m a n c eq u a l i t yl e v e l 数据质量结果的一个或一组阈值,用于确定数据集符合产品规范规定或用户要求的程度。 g b t1 9 3 3 6 - - 2 0 0 8 4 4 数据质量日期d a t aq u a l i t yd a t e 度量数据质量的日期或日期范围。 4 5 数据质量量化元素d a t aq u a l i t ye l e m e n t 说明数据集质量的量化组成部分。 厂i s o1 9 1 0 1 3 注:数据集数据质量量化元素的适用性既取决于数据集的内容也取决于其产品规范,因此并非所有数据质量量化 元素都适用于所有数据集。 4 6 数据质量评价过程d a t aq u a l i t ye v a l u a t i o np r o c e d u r e 应用和记录质量评价方法及评价结果的操作。 4 7 数据质量度量d a t aq u a l i t ym e a s u r e 数据质量量化子元素的取值。 示例;正确的属性值所占的百分比。 4 8 数据质量非化元素d a t aq u a l i t yo v e r v i e we l e m e n t 说明数据集质量的非量化组成部分。 i s 0 19 1 0 1 注:有关数据集目的、使用情况和数据志等信息是非量化质量信息。 4 9 数据质量结果d a t aq u a l i t yr e s u l t 数据质量度量得到的一个值或一组值,或者将获取的一个值或一组值同规定的一致性质量级别相 比较得到的评价结果。 示例:数据质量量化元素及其数据质量量化子元素“完整性多余”的数据质量结果为。9 0 ”、数据质量值类型为 “百分比”,是对数据质量范围指定的数据进行数据质量度量而得到的值的例子。而数据质量结果为“真”、 数据质量值类型为“布尔型变量”是将值( 9 0 ) 同规定的、可接受的一致性质置级别( 8 5 ) 相比较的例子,记录的 评价结果为良好、合格或不合格。 4 1 0 数据质量范围d a t aq u a l i t ys c o p e 记录其质量信息的数据的覆盖范围或特征。 注:一个数据集的数据质量范围可以由该数据集所属的数据集系列组成,也可由该数据集本身,或是物理上位于数 据集中、具有相同特征的较小的数据组组成。相同特征可以是相同的要素类型、要素属性或要素关系;可以是 相同的数据采集标准i 可以是相同的数据源;或是一个指定的地理或时间覆盖范围。 2 4 1 1 4 1 2 4 1 3 4 1 4 g b t2 1 3 3 7 - - 2 0 0 8 i s o1 9 3 :2 0 0 2 数据质量量化子元素d a t aq u a l i t ys u b e l e m e n t 数据质量量化元素的组成部分,描述该数据质量量化元素的一个特定方面。 数据质量值类型d a t aq u a l i t yv a l u et y p e 记录数据质量结果的值的类型。 示例:“布尔型变量”、“百分比”、“比率”。 注:每个数据质量结果都要给出数据质量值类型。 4 1 5 4 1 6 数据质量值单位d a t aq u a l i t yv a l u eu n i t 记录数据质量结果的值的单位。 示例:“米”。 注:只在应用数据质量结果时,才给出数据质量值单位。 数据集d a t a s e t 可以识别的数据集合。 g b t1 9 7 1 0 - - 2 0 0 5 注:通过诸如空间覆盖范围或要素类型的控制,数据集在物理上可以是更大数据集较小的部分。从理论上讲,数据 集可以小到更大数据集内的单个要素或要索属性。一张硬拷贝地图或图表均可以被认为是一个数据集。 4 1 7 4 1 8 数据集系列d a t a s e ts e r i e s 符合相同产品规范的数据集集合。 g b t1 9 7 1 0 - - 2 0 0 5 要素f e a t u r e 现实世界现象的抽象。 i s o1 9 1 0 1 注:要素可以作为类型或实例出现,当只能用一个含义时,应使用要素类型或要素实例 要素属性f e a t u r ea t t r i b u t e 要素的特征。 i s o1 9 1 0 1 注:一个要素属性包括名称、数据类型和与之关联的值域等。一个要素实例的要素属性同样具有来自该值域的属 性值。 要素操作f e a t u r eo p e r a t i o n 一个要素类型的每个实例都可执行的操作。 i s oi 9 1 1 0 例1 :对要素类型“水坝”执行的操作是提升坝面高程。该操作的结果是提高水库的蓄水位。 例2 :要素类型“水坝”的操作可能阻断船沿河道航行。 注:要素操作提供要素类型定义的基础。 3 g b t2 1 3 3 7 - - 2 0 0 8 i s 01 9 11 3 :2 0 0 2 4 1 9 元数据m e t a d a t a 关于数据的数据。即数据的标识、覆盖范围、质量、空间和时间模式、空间参照系和分发等信息。 g b t1 9 7 1 0 2 0 0 5 4 2 0 产品规范p r o d u c ts p e c i f i c a t i o n 论域的描述和将论域映射到数据集的技术要求说明。 4 2 1 质量q u a l i t y 一组固有特性满足要求的程度。 e g b t1 9 0 0 0 - - 2 0 0 0 注1 :术语“质量”可使用形容词如差、好或优秀修饰。 注2 :“固有的”( 其反义是“赋予的”) 是指在某事或某物中本来就有的,尤其是永久的特性。 4 2 2 论域u n i v e r s eo fd i s c o u r s e 包含所关心的所有事物的现实或假设世界的视图。 i s o1 9 1 0 1 3 5 描述地理信息质量的原则 5 1 数据质量说明的组成部分 本标准可用于: 确定和记录质量信息; 评价数据集质量; 制定产品规范和用户需求说明; 确定应用模式。 g b t1 9 7 1 0 - - 2 0 0 5 和g b t2 1 3 3 62 0 0 8 说明记录质量信息的模式。 g b t2 1 3 3 6 - - 2 0 0 8 提供数据集质量评价的框架。 i s o1 9 1 0 9 :2 0 0 5 说明采用的应用模式。 质量说明可应用于数据集系列、数据集,或物理上位于具有相同特征的数据集内的较小数据组,从 而可以对其质量进行评价。 数据集质量应使用两个组成部分说明: 数据质量量化元素; 数据质量非量化元素。 数据质量量化元素、数据质量量化子元素以及数据质量量化子元素描述符说明数据集对产品规范 规定的符合程度,并提供量化的质量信息。 数据质量非量化元素提供概括的非量化描述信息。 注:对不同于预期用途的特定应用,数据质量非量化元素是评价数据集质量的关键。 本标准认为量化和非量化质量信息可以是相关的。 质量信息的质量可包括质量信息可信度或可靠性的度量。此类信息记录在g b t2 1 3 3 6 - - 2 0 0 8 质 量评价报告中。 图1 给出数据质量信息的总貌。 附录b 讨论数据质量概念,用于建立描述地理数据质量的组成部分。 确定质量信息 g b t2 1 3 3 7 - - 2 0 0 8 i s 01 9 1 1 31 2 0 0 2 记录质量信息 图1 数据质量信息总貌 5 2 数据质量量化元素和数据质量量化子元素 5 2 1 数据质量量化元素 在必要时,应当用以下的数据质量量化元素描述数据集符合产品规范规定的程度: 完整性:要素、要素属性和要素关系的存在和缺失; 逻辑一致性:对数据结构( 数据结构可以是概念的、逻辑的或物理的) 、属性及关系的逻辑规则 的符合程度; 位置准确度:要素位置的准确度; 时间准确度:要素时间属性和时间关系的准确度; 专题准确度:量化属性的准确度、非量化属性的正确性、要素分类及其关系的正确性。 允许扩充新的数据质量量化元素,描述本标准未列出的数据集量化质量部分。 5 2 2 数据质量量化子元素 对于5 2 1 中确定的数据质量量化元素,应使用下列适用的数据质量量化子元素描述数据集的量 化质量情况: 完整性 多余:数据集中含有多余的数据; 遗漏:数据集中缺少应该包含的数据。 5 g b t2 1 3 3 7 - - 2 0 0 8 i s 01 9 11 3 :2 0 0 2 逻辑一致性 概念一致性:对概念模式规则的遵循程度; 域一致性:值对值阈的符合情况; 格式一致性:数据存储符合数据集物理结构的程度; 拓扑一致性:数据集拓扑特征显式编码的正确性。 位置准确度 绝对或外部准确度:数据中的坐标值与可接受值或真值的接近程度; 相对或内部准确度:数据集中要素的相对位置与各自可接受的或真实的相对位置的接近 程度; 格网数据位置准确度:格网数据位置值与可接受值或真值的接近程度。 时间准确度 时间度量准确度:一个检验单元时间参照的正确性( 记录时间度量误差) ; 时间一致性:有序的事件或顺序的正确性; 时间有效性:与时间有关的数据的有效性。 专题准确度 分类正确性:赋给要素或其属性的类型与论域( 例如地表真值或参照数据集) 的比较 非量化属性正确性:非量化属性的正确性; 量化属性准确度:量化属性的准确度。 以上任何一种数据质量量化元素都可以扩展数据质量量化子元素。 5 2 3 数据质量量化子元素描述符 应记录每个适用的数据质量量化子元素的质量信息。完整记录数据质量量化子元素信息的方法是 采用7 个数据质量量化子元素描述符: 数据质量范围; 数据质量度量; 数据质量评价过程; 数据质量结果; 数据质量值类型; 数据质量值单位; 数据质量日期。 注:上述每个数据质量量化子元素描述符在第4 章中定义。 5 3 数据质量非量化元素 应使用下列适用的数据质量非量化元素描述数据集的非量化质量: 目的; 使用情况; 数据志。 目的应说明建立数据集的原因和数据集预期用途。 注:数据集的预期用途不一定与实际应用相同。数据质量非量化元素使用情况描述实际应用。 使用情况应说明数据集已经实现的实际应用,说明数据生产者或其他各种不同的数据用户对数据 集的应用。 数据志应尽可能详细地描述数据集的历史,叙述数据集从采集和获取、编辑和派生,直到其当前状 况的生命周期。 6 g b t2 1 3 3 7 - - 2 0 0 8 i s o1 9 1 1 31 2 0 0 2 数据志可以包含两个独立的组成部分: 说明数据集出处的数据源信息; 处理步骤或历史信息,说明数据集建立过程中发生的事件或转换记录,包括是否持续地或周期 性地对数据集进行维护处理,以及起止时间。 本标准未规定的数据集某一方面非量化质量,可另行扩展数据质量非量化元素予以描述。 6 地理信息质量的确定 6 1 量化质量信息的确定 6 1 1 概述 6 1 说明确定量化质量信息的一般过程。某些条款不一定适合所有的情况。 6 1 2 适用的数据质量量化元素的确定 应确定适用于数据集的所有数据质量量化元素。某些数据质量量化元素可能不适用于特定类型的 数据集。 注1 :应参照数据集产品规范确定数据质量量化元素的适用性。 示例:仅以邮政编码作为空间参照的数据集不包含数据质量量化元素“位置准确度”。 注2 :附录c 为确定适用的数据质量量化元素的示例。 6 1 3 数据质量量化元素扩展 如果本标准中列出的数据质量量化元素不能充分表达质量的组成部分,可以命名和定义新的数据 质量量化元素。扩展数据质量量化元素的名称和定义应作为数据集质量信息的一部分。 6 1 4 适用的数据质量量化子元素的确定 应确定每个适用的数据质量量化元素的所有适用的数据质量量化子元素( 每个适用的数据质量量 化元素,至少应确定一个适用的数据质量量化子元素) 。一个适用的数据质量量化元素的某些数据质量 量化子元素不一定适用于特定类型的数据集。 注1 :应参照数据集的产品规范确定数据质量量化子元素的适用性。 注2 ;附录c 为确定适用的数据质量量化元素的示例。 6 1 5 数据质量量化子元素扩展 如果本标准中列出的数据质量量化子元素不能充分表达质量的某一方面,可以命名和定义新的数 据质量量化子元素。扩展的数据质量量化子元素的名称和定义应作为数据集质量信息的一部分。 6 1 6 数据质量量化子元素描述符的使用 6 1 6 1 数据质量范围 每个适用的数据质量量化子元素至少应确定一个数据质量范围。数据质量范围可以是数据集所属 的数据集系列,也可以是数据集,或者是物理上位于具有相同特征的数据集中的比较小的数据组。如果 不能确定数据质量范围,则数据质量范围应为数据集。 注:应参照数据集的产品规范和数据质量非量化元素提供的非量化质量信息确定数据质量范围。 质量在数据集内可能是变化的。可以为一个适用的数据质量量化子元素确定多重数据质量范围, 以便比较完整地描述量化质量信息。应充分地说明数据质量范围,下列各项可以用于描述数据质量 范围: 层级( 数据集所属数据集系列、数据集,或物理上位于具有相同特征的数据集中的比较小的数 据组) ; 项( 要素类型、要素属性和要素关系表) 或特定项( 要素实例、属性值和要素关系实例表) 的 类型; 7 g b t2 1 3 3 7 - - 2 0 0 8 i s 01 9 1 1 3 :2 0 0 2 地理覆盖范围; 时闻覆盖范围( 参照的时间框架和时间框架的准确度) 。 6 1 6 2 数据质量度量 每个数据质量范围都应有一个数据质量度量,用于简要说明对数据质量范围指定的数据进行检测 的类型,当有名称时应给出类型的名称,并应包括范围或限制参数。 注:范围或限制参数例子如可靠区问和误差率。 本标准认可使用多种检测来度量数据集的质量。单一的数据质量度量可能不足以对数据质量范围 确定的数据进行全面的评价,也不足以为数据集所有可能的应用提供质量检测。数据质量度量的组合 可以产生有用的信息。可以为数据质量范围确定的数据进行多重数据质量度量。 注:g b t2 1 3 3 6 - - 2 0 0 8 包含数据质量度量类型名称和说明的示例。 6 1 6 3 数据质量评价过程 每个数据质量度量都应有数据质量评价过程。数据质量评价过程应说明,或引用文献说明对数据 质量范围确定的数据如何进行数据质量度量的方法,并应包括所使用方法的记录。 注1 :文献的例子如发表的文章或认可的行业标准。 注2 :g b t2 1 3 3 6 - - 2 0 0 8 包括适用于数据集的数据质量评价过程框架,并进一步阐明了数据质量评价过程中记录 的信息类型。 6 1 6 4 数据质量结果 每个数据质量度量都应有数据质量结果,该数据质量结果应是下面两种情况之: 对数据质量范围确定的数据进行数据质量度量得到的一个值或一组值,或 按照指定的可以接受的一致性质量级别,对数据质量范围确定的数据进行数据质量度量得到 的一个值或一组值的评价结果。本标准中规定的这一类型数据质量结果为合格或不合格。 本标准中规定的这两种数据质量结果都可以采用。 注:g b t2 1 3 3 6 - - 2 0 0 8 说明如何决定一致性质量级别。 6 1 6 5 数据质量值类型 每个数据质量结果都应有数据质量值类型。 注:数据质量值“合格或不合格”的类型是“布尔变量”。 6 1 6 6 数据质量值单位 必要时,每个数据质量结果应有适用的数据质量值单位。 6 1 6 7 数据质量日期 每个数据质量度量都应有符合g b t7 4 0 8 - - 2 0 0 5 规定的数据质量日期。 6 2 非量化质量信息的确定 6 2 1 确定适用的数据质量非量化元素 任何情况下数据集的目的都是适用的。 数据生产者已知的数据集的所有使用情况都是适用的。 数据集的数据志应当总是适用的。在极特殊的情况下,可能不知道有关数据志的信息。因此,应当 记录数据志,或解释缺少数据志信息的原因。 数据质量范围确定的数据集中较小数据组的数据志,可以采集并不同于该数据集其余部分的数据 志。可以为数据质量范围确定的数据集中较小数据组提供不同的数据志,作为数据集非量化质量信息 的一部分,以使非量化质量信息更完整。 6 2 2 数据质量非化元素扩展 如果本标准规定的数据质量非量化元素不能说明非量化质量的某一方面,可以命名和定义新的数 据质量非量化元素。扩展的数据质量非量化元素的名称和定义应作为数据质量信息的一部分。 8 g b t2 1 3 3 7 - - 2 0 0 8 1 s 01 9 1 1 31 2 0 0 2 7 质量信息的记录 7 1 量化质量信息的记录 应按照g b t1 9 7 1 0 - - 2 0 0 5 的规定,作为元数据记录量化质量信息。 另外,可按照g b t2 1 3 3 62 0 0 8 的规定,采用质量评价报告形式记录量化质量信息。 7 2 非量化质量信息的记录 应按照g b t1 9 7 1 02 0 0 5 的规定,作为元数据记录非量化质量信息。 注:在g b t2 1 3 3 6 - - 2 0 0 8 定义的质量评价报告中,不记录非量化质量信息。 9 g b t2 1 3 3 7 - - 2 0 0 8 i s o1 9 1 1 3 :2 0 0 2 a 1 抽象测试套件 附录a ( 规范性附录) 抽象测试套件 a 1 1 概要 本附录中的所有测试用侧的测试类型都是基本测试。 a 1 2 测试用例标识符:组成部分测试 a ) 测试目的:保证质量组成部分都在质量说明中使用,以确定一致性。 b ) 测试方法:检查质量说明并检验用于提供量化质量信息的数据质量量化元素( 以及数据质量 量化子元素和数据质量量化子元素描述符) 。 检查质量说明并检验用于提供非量化质量信息的数据质量非量化元素。 c ) 引用:本标准,5 1 。 a 1 3 测试用例标识符:有效性测试 a ) 测试目的:保证数据质量的有效性,以确定一致性。 b ) 测试方法:检查数据质量说明,并检验本标准列出的或扩展的数据质量量化元素和数据质量 量化子元素,并说明本标准没有明确规定的量化质量组成部分或某一方面。 检查质量说明并检验为说明量化质量而使用的、本标准规定的数据质量量化子元素描述符。 检查质量说明并检验本标准列出的数据质量非量化元素,或扩展和说明的、本标准未明确规定 的非量化质量的范围。 c ) 引用:本标准,5 2 和5 3 。 a 1 4 测试用例标识符:量化质量适用性测试 a ) 测试目的:保证量化质量说明的适用性,以确定一致性。 b ) 测试方法:标识产品规范中与量化质量有关的陈述,并用它们确定适用的数据质量量化元素 及其适用的数据质量量化子元素。将适用的数据质量量化子元素与质量说明中使用的数据 质量量化子元素进行比较,确保适用于数据集的所有数据质量量化子元素已经在质量说明中 确定和使用。 注:如果额外使用了非适用的数据质量量化子元素来描述量化质量,则一致性是有效的。然而,非适用的数据质量 量化子元素不能进行进一步的一致性测试。 c ) 引用:本标准,6 1 。 a 1 5 测试用例标识符:非量化质量适用性测试 a ) 测试目的:保证非量化质量说明的适用性,以确定一致性。 b ) 测试方法:检查用于描述非量化质量的适用的数据质量非量化元素。 c ) 引用:本标准,6 2 。 a 1 6 测试用例标识符:唯一性测试 a ) 测试目的:保证质量说明中扩展条目的唯一性,且提供有关扩展条目的足够信息,以确定一 致性。 b ) 测试方法:检查所有扩展的数据质量量化元素,确保每一个元素说明的量化质量的组成部分, 在本标准中没有明确列出或描述。 检查所有扩展的数据质量量化子元素,确保每一个子元素说明的量化质量的某一方面,在本 标准没有明确列出或描述。 】0 c ) a 1 7 a ) b ) c ) a 1 8 a ) b ) c ) a 1 9 a ) b ) c ) g b t2 1 3 3 7 - - 2 0 0 8 i s o1 9 1 1 3 :2 0 0 2 检查所有扩展的数据质量非量化元素,确保每一个元素说明的非量化质量的某一方面,在本 标准中没有明确列出或描述。 引用:本标准,6 1 3 ,6 1 5 和6 2 2 。 测试用例标识符:数据质量量化子元素描述符的正确使用 测试目的:检验质量说明中数据质量量化子元素描述符使用的正确性,以确定一致性。 测试方法:将本标准和每个适用的数据质量量化子元素( 包括扩展的数据质量量化子元素) 的 质量信息进行比较,确保遵从了使用数据质量量化子元素描述符的出现规则。 引用:本标准,6 1 6 。 测试用例标识符;用元数据记录质量信息 测试目的:检验用元数据记录的质量说明,以确定一致性。 测试方法:按照g b t1 9 7 1 0 - - 2 0 0 5 检查元数据中记录的量化质量信息。 按照g b t1 9 7 1 0 - - 2 0 0 5 检查作为元数据记录的非量化质量信息。 引用:本标准,第7 章。 测试用例标识符:用质量评价报告记录量化质量信息 测试目的:检验用质量评价报告记录的质量说明的量化质量信息,以确定一致性。 测试方法:按照g b t2 1 3 3 6 - - 2 0 0 8 的要求,检查质量评价报告中的量化质量信息。 引用:本标准,7 1 。 g b t2 1 3 3 7 - - 2 0 0 8 1 s o1 9 1 1 3 :2 0 0 2 b 1 背景 附录b ( 资料性附录) 数据质量概念及其应用 数据集定义为可识别的数据集合。这些数据表示现实世界的实体,它们具有空间、专题和时间方面 的特征。从现实世界到论域的抽象过程包括将现实世界实体潜在的许多特征模型化为用位置、专题和 时间定义的理想形式,以使这些实体可以理解和表示。产品规范说明论域,依据它检测数据集内容( 或 部分内容) 的质量。 b 2 数据质概念的意义 由于数据集一般不是为某一专门应用生产,而是为多种应用生产的,因此只能通过了解数据质量量 化元素和数据质量非量化元素对数据集质量进行评价。数据质量量化元素评价生产的数据集与论域 ( 即完全符合产品规范的数据集) 之间的差异。数据质量非量化元素提供一般的、非量化的信息。其中: 目的是提供生产数据集动机和预期的数据集应用信息,使用情况提供数据集已经实际使用的各种应用 信息,数据志说明数据集的历史。 数据质量概念为数据生产者和数据用户提供重要的框架。数据生产者可以用其说明生产数据集所 用的方法反映其论域的好坏程度。数据生产者能够用其证实数据集满足产品规范规定的程度。数据用 户可以用其评价从论域导出的数据集与用户应用需求的一致性。数据用户可以评价质量,确定数据集 是否能满足其应用需求( 见图b 1 ) 。 圈b 1数据质量概念提供的框架 g b t2 1 3 3 7 - - 2 0 0 8 1 5 01 9 11 3 :2 0 0 2 b 3 数据集结构和质量说明组成部分 数据集可以隶属于数据集系列。一个数据集系列所属的所有数据集的质量通常是相同的。数据质 量概念认可数据集系列,并顾及用数据集系列的质量替代和记录数据集的质量。 数据集可以看作由大量,但数量有限的较小数据组构成。可以认为共享相同特征,如属于同一要素 类型、要素属性或要素关系,或采用相同的数据采集规定或相同覆盖范围的较小数据组具有相同的质 量。较小数据组可以小到一个要素实例、属性值或一种要素关系,在理论上数据质量概念允许数据集的 每个要素实例、属性值和要素关系具有其自身的质量。不可以假定较小数据组的质量与数据集所属其 他数据具有相同的质量。数据质量概念考虑了记录数据集质量,同时通过将这些数据组确定为数据质 量范围指定的数据,补充记录较小数据组质量的不同。记录的多重数据质量范围的质量信息提供更加 完整的质量描述。 注:对数据生产者而言,产品规范描述论域并包含建立数据集的参数。对数据用户而言,用户需求描述论域它可 能与数据集的论域一致或不一致。数据集的真实质量说明它表示论域的好坏程度。 为描述数据集的质量,采用两种唯一的数据质量信息组成部分:量化质量组成部分和非量化质量组 成部分。数据质量量化元素是质量信息的量化组成部分;数据质量非量化元素是数据质量的非量化组 成部分。 数据质量量化元素能够衡量数据集符合其产品规范规定的好坏程度。数据质量量化元素含有不同 的数据质量量化子元素。数据质量量化子元素可以用多种方法度量或检测。数据质量概念认为并非所 有数据质量量化元素,或所有数据质量量化子元素及其相应的度量和检测方法都适用于某一特定类型 的数据集。因而,一些数据质量量化子元素适用于一个数据集和对它们进行度量或检测,而其他数据质 量量化子元素则适用于数据质量范围说明的数据集中较小的数据组和对它们进行度量或检测。 本标准规定的数据质量量化元素,主要作为检测和记录不同种类质量信息的方法。然而,本标准还 认定数据质量量化子元素常常是相关的。例如,坐标的错误至少有两种:位置错误和拓扑关系错误。按 照产品和数据质量量化子元素处理方法,数据质量量化子元素的含义是质量评价的范围。 数据质量量化元素能够衡量数据集满足其产品规范规定的程度,而数据质量非量化元素则提供目 的、用途和数据志信息,便于为特定应用对数据集进行评价。 b 4 记录质量信息 b 4 1 记录质量信息的时间 随着数据集的不断建立、更新和融合,数据集的质量或质量的组成部分可能随之发生变化。数据集 的质量信息可能受到3 种情况影响: a ) 数据集中删除、修改或增加了任何数量的数据 b ) 数据集产品规范进行了修改; c ) 现实世界发生了变化。 第一种情况,数据集可能非常频繁地修改。许多数据集不是静态的。信息的交换、多重目的的数据 集应用、为满足多重目的而进行的数据集更新和优化等都在不断进行。如果记录的数据集质量会随数 据集的修改而改变,该数据集质量应当重新进行评价,并按要求进行更新。 在建立数据集时,应当可以获得所有适用的数据质量量化元素和除应用外所有数据质量非量化元 素的完整信息。起初只能记录数据生产者的应用情况( 假定数据生产者事实上使用了数据集) 。依据数 据用户提供不同于数据集预期目的的实际应用,能够对该特定的数据质量非量化元素连续进行更新,反 映已经发生的、未预料的应用。 第二种情况,在数据集最初建立之前和发布质量信息之前,最有可能修改数据集的产品规范。可以 想像由于数据集执行更新过的产品规范,因此对数据集的进一步修改能更好地满足实际需要。由于产 13 g b t2 1 3 3 7 - - 2 0 0 8 i s 01 9 1 1 3 :2 0 0 2 品规范的改变,当前数据集的质量也随之改变。数据集质量信息应当总是反映按当前产品规范生产的 当前数据集的质量。 第三种情况,现实世界变化不断地出现。这种变化可能由于自然现象如地壳运动或侵蚀而产生,但 最常见的是人类活动的结果。变化常常是快速的和动态的。由于这一原因,当评价数据集质量时,数据 采集日期是重要的。在某些情况下,如果知道变化的比率也是有意义的。 质量信息的数量和存储要求可以超越数据集的要求。重要的是用简洁、易于理解和易于获取的形 式表示质量信息。 元数据文件或元数据库一般包含数据集系列、数据集或数据组的质量信息。其中,数据组是按数据 质量范围说明,大于要素实例、属性值或出现的要素关系的数据质量范围。 b 4 2 用元数据记录质量信息 b 4 2 1 用元数据记录量化质量信息 可以记录数据集多重数据质量范围的量化质量信息。数据质量范围说明的数据可能包含数据集所 属的数据集系列、数据集本身、物理上位于数据集内的较小数据组。 数据质量概念允许用数据集所属数据集系列的量化质量信息替代,因为数据集系列的所有数据集 的质量是相同的,且在数据集系列层次上度量是最好的。质量信息可以作为数据集系列的元数据存储, 在这种情况下,数据集的元数据必须提供指向它的指针,或在数据集元数据中重复该质量信息,并将其 作为数据集元数据的一部分。如果已知数据集的质量信息是独特的,与数据集系列中其他数据集的质 量信息不同,则应提供该数据集独特的和不同的质量信息,而不进行替代。 量化质量信息可以按数据集和数据质量范围说明的许多较小数据组进行采集,它们的量化质量信 息可以不同。记录的量化质量信息的数量部分地取决于确定的数据质量范围的数目。仅当与“较高”等 级记录的质量信息不同时,才特别地记录数据质量范围说明数据的量化质量信息。 在记录质量信息时,典型的是从最高等级的数据集开始,通过数据集向下记录。表b 1 示出这一 情况。 表b 1 分等级的量化质量信息记录 位置准确度绝对或外部准确度数据记录的位置准确度绝对或外部准确 数据质量范围说明的数据 质量结果度数据质量结果 数据集 1 3 51 3 5 道路 1 1 01 1 0 水系 1 3 5 不记录 铁路 1 2 01 _ 2 0 管线 1 8 01 8 0 注:上例中所有数据质量结果的数据质量值类型为“距离”,所有数据质量结果的数据质量值单位为。米”。 为了使创建、存储和解释该示例元数据的工作减到最小,建议仅对数据集和数据质量范围说明的 “道路”、“铁路”和“管线”包含的数据作为元数据记录质量信息。数据质量范围说明的“水系”包含的数 据的质量信息则予以省略。 g b t1 9 7 1 02 0 0 5 未明确提供量化质量信息记录,作为要素实例、属性值或出现的要素关系的元 数据( 这可以通过确定数据质量范围说明的数据为要素实例、属性值或出现的要素关系予以解决) 。当 出现的要素关系与其父类型的量化质量信息不同时,可以将该质量信息处理为在数据集中出现的属性。 记录的层次原理也可以在数据类型和出现的要素关系之间应用。建议仅当要素实例的量化质量信息与 其父要素类型不同时才记录,仅当属性值的质量信息与其父要素属性不同时才记录,且仅当出现的要素 关系的质量信息与其父要素关系不同时才记录。由于属性在数据集中出现的方式是依赖于数据集的, 因此不对要素实例、属性值或出现的要素关系的质量信息的实际归属提供指导。 14 g b t2 1 3 3 7 - - 2 0 0 8 i s 01 9 1 1 31 2 0 0 2 图b 2 表示作为元数据记录数据集量化质量信息的层次,并提出记录方法建议( 或者作为元数据 文件或元数据库的一部分,或者作为数据集的属性) 。 g b t2 1 3 3 62 0 0 8 提出了量化质量信息过多和需要压缩这类信息的问题,以及质量评价报告需 要使用更详细量化质量信息的问题。 b 4 2 2 用元数据记录非量化质量信息 数据质量非量化元素中的目的和使用情况质量信息是基本信息,仅与数据集有关,且仅为数据集记 录。如果数据集隶属数据集系列且共享相同的目的和使用情况,本标准允许取代数据集系列的目的和 使用情况。在取代时,数据集的元数据可以指向数据集系列元数据的目的和使用情况,而不是重复该 信息。 数据质量非量化元素中的数据志质量信息是数据集的基本信息。另外,数据志信息可以按数据集 和数据质量范围说明的许多较小数据组进行采集,它们的数据志可以不同。建议只当数据质量范围说 明的较小数据组的数据志与记录的数据集的数据志不同时,才进行采集。( 同样,本标准允许记录数据 集所属数据集系列的数据志信息,而不记录数据集的实际数据志。在替代时,数据集元数据指向数据集 系列元数据中的数据志,而不是对该信息进行重复。) g b t2 1 3 3 7 - - 2 0 0 8 i s o1 9 1 1 3 :2 0 0 2 c 1 概述 附录c ( 资料性附录) 数据质量量化元素、数据质量化子元素和数据质量非量化元素 国家基础地理信息系统全国1 ;2 5 00 0 0 地形数据库示例 示例说明数据生产者依据产品规范,通过
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 心理健康试题及答案大全
- 如何建立电商与农业的协同发展机制试题及答案
- 基于SDN的工业互联网平台智能生产质量优化与集成报告
- 金融机构2025年数字化转型中的风险管理与内部控制
- 家具行业理论基础与实际应用结合试题及答案
- 自主品牌电动汽车的竞争优势试题及答案
- 文化素养与数学的试题及答案
- 物理考试复习的最终冲刺试题及答案
- 四川省泸州市天立国际学校2025年高三第5次月考试题语文试题试卷含解析
- 建筑施工安全责任制落实的重要步骤试题及答案
- 烟台某公寓电气设计毕业论文
- 2022全国高考真题化学汇编:专题 烃 卤代烃
- 脑血管病介入诊疗并发症及其处理课件
- 家校共育一年级家长会ppt
- 《微电子学概论》第八章-光电子器件课件
- 化学分析送样单2
- 化工原理教案:6 吸收
- 【高考真题】2022年新高考浙江语文高考真题试卷(Word版含答案)
- 铝镁料仓等施工方案精品
- 目前最准确的通达信缠论分笔公式
- 《丑小鸭》教学设计
评论
0/150
提交评论