



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、DB15/T 1873 2020附录 A(资料性附录)数据质量评价维度A.1完整性按照数据规则要求,数据元素被赋予数值的程度。即完整性指的是数据信息是否存在缺失的状况,数据缺失的情况可能是整个数据记录缺失, 也可能是数据中某个字段信息的记录缺失。 不完整的数据所能借鉴的价值会大大降低,完整性是数据质量评估标准的基础。表 A.1完整性评价指标序号指标名称指标描述计算方法按照业务规则要求, 数据集中应计算公式: X=A/B1数据元素完整性被赋值的数据元素的赋值程度。式中A=被赋值的数据集中元素的个数;B=预期被赋值的数据集中元素的个数按照业务规则要求, 数据集中应计算公式: X=A/B2数据记录完
2、整性被赋值的数据记录的赋值程度。式中A=被赋值的数据集中元素的个数;B=预期被赋值的数据集中元素的个数A.2规范性数据符合数据标准、数据模型、业务规则、元数据或权威参考数据的程度。表 A.1规范性评价指标序号指标名称指标描述计算方法数据符合数据标准的度量。计算公式: X=A/B注1:评价数据质量时需要收集数据在命名、创建、定义、式中更新和归档时遵循的标准,包括国际标准、国家标准、行A=满足数据标准要求的数据集中1数据标准业标准、地方标准或相关规定等。元素的个数;注2:和数据归档一样甚至更重要,在一个完整的数据规B=被评价的数据集中元素个数则中,旧数据的销毁一般也有一个比较详细且具有可行性的规定
3、。数据符合数据模型的度量。计算公式: X=A/B注1:数据模型是一种直观描述组织数据结构的手段,是式中2数据模型数据表达的规范。A=满足数据模型要求的数据集中注 2:评价数据质量时需要检查是否存在清晰且可理解的元素的个数;数据模型定义以及这些数据的组织形式。B=被评价的数据集中元素个数10DB15/T 1873 2020表 A.2(续)序号指标名称指标描述计算方法数据符合元数据定义的度量。计算公式: X=A/B注 1:元数据标注、描述或刻画其他数据、以使检索或使式中3元数据用数据更容易。 评价数据质量时需要检查是否提供可解读A=满足元数据定义的数据集中元的元数据文档。素的个数;B=被评价的数据
4、集中元素个数数据符合业务规则的度量。计算公式: X=A/B注 1:业务规则是一种权威性原则或业务方针,用来描述式中4业务规则业务交互,并建立行动和数据行为结果及完整性的规则。A=满足业务规则的数据集中元素注 2:评价数据质量时需要检查是否存在良好归档的业务的个数;规则。B=被评价的数据集中元素个数参考数据是系统、应用软件、数据库、流程、报告及交易计算公式: X=A/B权威参考数记录和主记录用来参考的数值集合和分类表。式中5注 1:评价数据质量时需要收集参考数据列表。A=满足参考数据规则的数据集中据元素的个数;B=被评价的数据集中元素个数安全规则是安全和隐私方面的规则,包括数据权限管理,计算公式
5、: X=A/B数据脱敏处理等。式中6安全规则A=满足安全规范的数据集中元素的个数;B=被评价的数据集中元素个数A.3 一致性数据与其他特定上下文中使用的数据无矛盾的程度。即一致性是指数据是否遵循了统一的规范,数据集合是否保持了统一的格式。数据质量的一致性主要体现在数据记录的规范和数据是否符合逻辑。表 A.2 一致性评价指标序号指标名称指标描述计算方法同一数据在不同位置存储或被计算公式: X=A/B不同应用或用户使用时,数据的式中1相同数据一致性一致性,数据发生变化时,存储A=满足一致性要求的数据集中元素的个数;在不同位置的数据的同一数据B=被评价的数据集中元素个数;被同步修改。根据一致性约束规
6、则检查关联计算公式: X=A/B数据的一致性。式中2 关联数据一致性A=满足一致性要求的数据集中元素的个数;B=被评价的数据集中元素个数;11DB15/T 1873 2020A.4准确性数据准确表示其所描述的真实实体 (实际对象) 真实值得程度。 即准确性是指数据记录的信息是否存在异常或错误。表 A.3准确性评价指标序号指标名称指标描述计算方法数据内容是否是预期数据。计算公式: X=A/B式中1数据内容正确性A=满足数据正确性要求的数据集中元素的个数。B=被评价的数据集中元素个数;数据格式包含 (数据类型、数据计算公式: X=A/B2数据格式合规性范围、数据长度、精度等)是否式中满足预期要求。
7、A=满足格式要求的数据集中元素的个数。B=被评价的数据集中元素个数;特定字段、记录、文件或数据集计算公式: X=A/B3数据重复率意外重复的度量。式中A=重复数据集中元素的个数B=被评价的数据集中元素个数;特定字段、记录、文件或数据集计算公式: X=A/B4数据唯一性唯一性的度量。式中A=满足唯一性要求的数据集中元素的个数;B=被评价的数据集中元素个数;正确字段、 记录、文件或数据集计算公式: X=A/B5脏数据出现率之外无效数据的度量。式中A=有脏数据出现的数据集中元素的个数;B=被评价的数据集中元素个数;A.5唯一性数据唯一不重复。即唯一性是指度量哪些数据是重复数据或者数据的哪些属性是重复
8、的。A.6关联性数据的关联不可缺失的。即关联性是度量哪些关联的数据缺失或者未建立索引。关联性评价因素:a) 查找到的信息和主题不完全一致,但确是其中某一方面的阐述;b) 查找到的信息集合多数在用户需要的检索主题内;c) 提供的信息主题与用户检索主题相匹配;d) 查找到的信息多数与用户需要的信息无关;e) 信息必须和用户需求有相关性。12DB15/T 1873 2020A.7时效性数据在时间变化中的正确程度。即及时性是指数据从产生到可以查看的时间间歇,也叫做数据的延时时长, 及时性对数据分析本身要求并不高,但如果数据分析周期加上数据建立的时间过长,就可能导致分析出的结论失去借鉴意义。表 A.4时
9、效性评价指标序号指标名称指标描述计算方法基于日期范围内的记录计算公式: X=A/B1基于时间段的正确性数或频率分布符合业务式中需求的程度。A=满足有效性要求的数据集中元素的个数;B=被评价的数据集中元素个数;基于时间戳的记录数、计算公式: X=A/B2基于时间点的及时性频率分布或延时时间符式中合业务需求的程度。A=满足及时性要求的数据集中元素的个数B=被评价的数据集中元素个数;数据集中同一实体的数计算公式: X=A/B3时序性据元素之间的相对时序式中关系。A=满足时序性要求的数据集中元素的个数;B=被评价的数据集中元素个数;A.8可访问性数据能被访问的程度。表 A.5可访问性评价指标序号指标名称指标
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年考古勘探钻孔作业合同
- 二零二五年度防火门行业技术交流与合作合同
- 二零二五版智能家居产品陈列销售合同
- 母亲节礼物活动方案
- XX年大学元旦晚会活动策划方案
- 个人电话销售工作总结
- 国有资产管理处工作总结模版
- 2025年中国砖瓦机械行业市场调查研究及投资前景展望报告
- 中国水族PH计行业市场前景预测及投资价值评估分析报告
- 外科医生工作总结
- 2025夏秋贵州省旅游产业发展集团有限公司员工招聘115人笔试历年参考题库附带答案详解
- 人员车辆进出管理办法
- 保险营销费用管理办法
- etc客服电话管理办法
- 2025年广东省深圳市中考历史试卷(含解析)
- 氧气吸入操作技术课件
- 数据安全意识培训
- 海关政策培训课件
- 家庭教育对孩子心理健康的影响论文
- 2025年劳动关系协调员(四级)考试大纲与试题
- 中国节能灯市场深度调查研究报告(2025-2030版)
评论
0/150
提交评论