T∕CIIA 060-2025 数据质量鉴证评价方法_第1页
T∕CIIA 060-2025 数据质量鉴证评价方法_第2页
T∕CIIA 060-2025 数据质量鉴证评价方法_第3页
T∕CIIA 060-2025 数据质量鉴证评价方法_第4页
T∕CIIA 060-2025 数据质量鉴证评价方法_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS 03.120.10CCS A00团 体 标 准T/CIIA060—2025Verificatoryevaluationmethodfordataquality2025-11-11发布 2025-11-11实施中国信协会 发布T/CIIA060—2025T/CIIA060—2025ⅠⅠ目 次前 言 III引 言 IV范围 1规性用件 1术和义 1鉴评指构原则 1面原则 1统原则 1态原则 1比原则 1操性1威原则 1鉴评指框架 1鉴评指说明 11范性 1整性 1确性 1致性 1效性 1全性 1属性 1鉴评流程 1程述 1标求评方法 1据景求加计算 1附录A(料)据量鉴评综得计步骤 1附录B资性数量鉴评指加计表 1参考献 2T/CIIA060—2025T/CIIA060—2025ⅡⅡ前 言本文按GB/T1.1—2020《准工作则 第部分标化件结和起规》规起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由中国信息协会提出并归口。(本文件主要起草人:杨绍亮、魏连、王佳慧、毛立明、安根生、李萌、毛胤奇、王奇飞、沈余锋、韩明畅、陈嘉、关雨呈、李德新、郑嵩、华宇、寇无玷、王敏、温天宁、周源、居俊、林存银、王伟、刘云松、薛伟成、宋欣明。T/CIIA060—2025T/CIIA060—2025ⅢⅢ引 言ESGT/CIIA060—2025T/CIIA060—2025PAGEPAGE10数据质量鉴证评价方法范围本文件规定了数据质量鉴证评价指标体系的构建原则、指标体系以及评价流程。本文件适用于数据资产入表、数据价值评估、数据融资增信、数据合规审计、数据产品定价、数据流通交易、ESG治理评价以及数据司法证明等场景,为数据质量鉴证活动提供评价依据。(GB/T36344 下列术语和定义适用于本文件。3.1数据data数据是指任何以电子或其他方式对信息的记录。数据在不同视角下被称为原始数据、衍生数据、数据资源、数据产品和服务、数据资产、数据要素等。[来源:国家数据局《数据领域常用名词解释(第一批)》]3.2元数据metadata元数据是定义和描述特定数据的数据,它提供了关于数据的结构、特征和关系的信息,有助于组织、查找、理解、管理数据。[来源:国家数据局《数据领域常用名词解释(第一批)》]3.3脏数据dirtydata脏数据是指存在错误、未能遵守既定标准或业务规则,以及由于缺乏维护而变得不准确、不完整或过时的数据。3.4数据质量dataquality在指定条件下使用时,数据的特性满足明确的和隐含的要求的程度。[来源:GB/T36344]3.5数据质量鉴证dataqualityverification数据质量鉴证是指通过系统方法和程序,对数据进行检验和验证,以确保其满足司法证明力要求。3.6数据标准datastandard数据的命名、定义、结构和取值规范方面的规则和基准。3.7数据安全datasecurity数据安全,是指通过采取必要措施,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。[来源:《中华人民共和国数据安全法》]3.8数据司法证明力dataadmissibilityasevidence电子数据作为电子证据在司法程序中进行举证时对于案件中待证事实的证明效果和作用。各评价指标之间应当形成系统的逻辑关联,在结构上形成上层指标由下层具体指标构成的层级架构,在关系上保持各个指标相对独立性与内在关联性的统一,从而系统反映数据质量。评价指标的选取紧密结合国家颁布的数据相关法律法规以及行业标准,确保所选指标不仅能够全数据质量鉴证评价指标框架见图1。图1数据质量鉴证评价指标框架说明:————准确性——数据准确表示其所描述的真实实体(实际对象)真实值的程度。一致性——数据与其他特定上下文中使用的数据无矛盾的程度。时效性——数据在时间变化中的正确程度。————概述从规范性、完整性、准确性、一致性、时效性、安全性以及权属性角度,分别罗列具体评价标准。规范性规范性应包括下列内容:(参照[GB/T36344]);([GB/T36344]);[GB/T36344]);完整性完整性应包括下列内容:数据元素完整性,按照业务规则要求,数据集中应被赋值的数据元素的赋值程度(参照[GB/T36344]);数据记录完整性,按照业务规则要求,数据集中应被赋值的数据记录的赋值程度(参照[GB/T36344]);准确性准确性应包括下列内容:([GB/T36344]);((参照[GB/T36344]);([GB/T36344]);([GB/T36344]);e)证明力。一致性一致性应包括下列内容:(参照[GB/T36344]);参照[GB/T36344]);时效性时效性应包括下列内容:参照[GB/T36344]);基于时间点的及时性,基于时间戳的记录数、频率分布或延迟时间符合业务需求的程度(参照[GB/T36344]);([GB/T36344]);d)e)安全性安全性应包括下列内容:权属性权属性应包括下列内容:数据质量鉴证评价应当按照以下流程:首先,依据既定评价指标体系和评价方法对各指标的(“图2鉴证评价流程图

1指标编号指标名称指标描述计算方法0101数据标准规范性数据符合数据标准的度量。注1:价据量时收集据在命建义 更和归时遵循标包国准家标X=A/B*100式中:A=满足数据标准要求的数据集中元素的个数;B=被评价的数据集中元素的个数等。2:一个完整的数据规则中旧数据的销毁一般也有一个比较详细且具有可执行性的规定。0102元数据规范性数据符合元数据定义的度量。可解读的元数据文档。X=A/B*100式中:A=个数;B=被评价的数据集中元素的个数.0103业务规则规范性数据符合业务规则的度量。1:业务规则是一种权威性原则或立行动和数据行为结果及完整性的规则。注2:评价数据质量时需要检查是否存在良好归档的业务规则。X=A/B*100式中:A=满足业务规则的数据集中元素的个数;B=被评价的数据集中元素的个数0104安全合规规范性0-1002。

2指标编号指标名称指标描述计算方法0201数据元素完整性按照业务规则要求,数据集中应被赋值的数据元素的赋值程度。X=A/B*100式中:A=被赋值的数据集中元素的个数;B=预期被赋值的数据集中元素的个数0202数据记录完整性按照业务规则要求,数据集中应被赋值X=A/B*100式中:A=被赋值的数据集中元素的个数;B=预期被赋值的数据集中元素的个数0203数据完整性证明力应通过区块链完整性校验,获得鉴定机构或第三方公证机构的存证证书,具备完整性的数据司法证明力。X=A/B*100式中:A=被赋值的数据集中元素的个数;B=预期被赋值的数据集中元素的个数准确性评价指标定义见表3。3指标编号指标名称指标描述计算方法0301数据内容正确性数据内容应当是预期数据。X=A/B*100式中:A=满足数据正确性要求的数据集中元素的个数;B=被评价的数据集中元素的个数0302数据格式合规性(的内容;身份证号不能出现标点符X=A/B*100式中:A=满足格式要求的数据集中元素的个数;B=被评价的数据集中元素的个数0303数据唯一性X=A/B*100式中:A=满足唯一性要求的数据集中元素的个数;B=被评价的数据集中元素的个数0304脏数据出现率X=A/B*100式中:A=有脏数据出现的数据集中元素的个数;B=被评价的数据集中元素的个数0305元数据描述客观性元数据中描述内容和赋值应准确可。X=A/B*100式中:A=满足数据计算科学性要求的数据集中元素的个数;B=被评价的数据集中元素的个数一致性评价指标定义见表4。4指标编号指标名称指标描述计算方法0401相同数据一致性同一数据在不同位置存储或被不同应用或用户使用时,数据的一致性数据发生变化时,存储在不同位置的同一数据被同步修改。X=A/B*100式中:A=个数;B=被评价的数据集中元素的个数0402关联数据一致性根据一致性约束规则检查关联数据的一致性。X=A/B*100式中:A=个数;B=被评价的数据集中元素的个数0403数据一致性证明力应通过区块链一致性比对,获得鉴定机构或第三方公证机构的存证证书,具备一致性的数据司法证明力X=A/B*100式中:A=被赋值的数据集中元素的个数;B=预期被赋值的数据集中元素的个数时效性评价指标定义见表5。5指标编号指标名称指标描述计算方法0501基于时间段的正确性基于日期范围的记录数或频率分布符合业务需求的程度。X=A/B*100式中:A=个数;B=被评价的数据集中元素的个数0502基于时间点及时性X=A/B*100式中:A=个数;B=被评价的数据集中元素的个数0503时序性数据集中同一实体的数据元素之间的相对时序关系。X=A/B*100式中:A=个数;B=被评价的数据集中元素的个数0504更新频率景需要和成本收益。根据更新频率进行0-100专家打分0505可验证性X=A/B*100式中:A=满足可验证性要求的数据集中元素的个数;B=被评价的数据集中元素的个数安全性评价指标定义见表6。6指标编号指标名称指标描述计算方法0601数据采集安全性采取对数据源鉴别、数据源安全认证、数据分类分级标记等安全措施X=A/B*100式中:A=满足数据采集安全性要求的数据集中元素的个数;B=被评价的数据集中元素的个数0602数据传输安全性采取安全的传输协议和认证机制等安全措施。X=A/B*100式中:A=满足数据传输安全性要求的数据集中元素的个数;B=被评价的数据集中元素的个数0603数据存储安全性X=A/B*100式中:A=满足数据存储安全性要求的数据集中元素的个数;B=被评价的数据集中元素的个数0604数据处理安全性X=A/B*100式中:A=满足数据处理安全性要求的数据集中元素的个数;B=被评价的数据集中元素的个数0605数据交换安全性X=A/B*100式中:A=满足数据交换安全性要求的数据集中元素的个数;B=被评价的数据集中元素的个数0606数据销毁安全性采取不可逆的数据销毁技术。X=A/B*100式中:A=满足数据销毁安全性要求的数据集中元素的个数;B=被评价的数据集中元素的个数权属性评价指标定义见表7。7指标编号指标名称指标描述计算方法0701数据权属证明程度X=A/B*100式中:A=满足权属证明要求的数据集中元素的个数;B=被评价的数据集中元素的个数记证书,或授权许可协议等其他具备司法证明力的数据权属证明。0702数据权属可追溯性数据生成及应用链路的可追溯性与可验证性。示例:可以通过区块链等数据权属追溯技术手段,追溯数据的采集、存储、处理、分析、管控等过程以及流转关系,形成司法可信证据链X=A/B*100式中:A=满足权属可追溯性要求的数据集中元素的个数;B=被评价的数据集中元素的个数"100%30%AB。附录 A()数据质量鉴证评价综合得分计算步骤数据质量鉴证评价综合得分计算步骤包括二级指标评分、一级指标评分以及综合评分。二级指标评分技术思路对每个一级指标的子项指标(如0101,0102...)根据其“计算方法”进行评分,得到Si。一级指标评分技术思路100%按照每个一级指标下的二级指标重要性系数WiB。参考公式(A.1)式中:B ——Si ——该一级指标下第iWi ——i(20%n ——综合评分技术思路按照第7.3节的方法,根据“基准权重约束、场景动态调整”原则,为七项一级指标分配权重,最终得到数据质量的综合评分。参考公式(A.2)式中:A ——Bi ——Ci ——C1+C2+...Ct=1;t ——附录 B(资料性)数据质量鉴证评价指标加权计算表数据质量鉴证评价指标加权计算见表B.1.表B.1数据质量鉴证评价指标加权计算表序号指标名称权重系数(单位:%)单项得分加权总分01规范性02完整性03准确性04一致性05时效性06安全性07权属性参 考 文 献[1]SF/ZJD0400001—2014电子数据司法鉴定通用实施规范[2]GB

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论