科技数据管理体系:数据标引-2201_第1页
科技数据管理体系:数据标引-2201_第2页
科技数据管理体系:数据标引-2201_第3页
科技数据管理体系:数据标引-2201_第4页
科技数据管理体系:数据标引-2201_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS03.100.20

CCSA02

T/CPPC

团体标准

T/CPPC—××××

科技数据管理体系:数据标引

ScienceandTechnologyDataManagementSystemStandards:DataIndexing

(征求意见稿)

2021-xx-xx发布2021-xx-xx实施

中国生产力促进中心协会发布

T/CPPCXX—2021

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定

起草。

本文件由广西科技情报研究所提出

本文件由中国生产力促进中心协会归口。

本文件起草单位:广西壮族自治区科学技术情报研究所、北京万方软件有限公司、北海市科技信息

研究所、桂林市科学技术情报研究所、河池市科学技术情报和创新服务所、百色

市科学技术情报研究所

本文件起草人:李家深、潘家新、许露、唐澍、李莲靖、张天、陆东亮、林建华、唐青青、董婷梅、

韦青松、陆桂军、张娜、李茜茜、宋敏、韦昌联、唐磊、孙启元、张正峰

本文件为首次发布。

II

T/CPPCXX—2021

科技数据管理体系:数据标引

1范围

本文件规定了科技数据管理体系中对数据标引的要求。

本文件适用于科技管理、科技统计、科技决策服务等活动。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T30523-2014科技平台资源核心元数据

3术语和定义

下列术语和定义适用于本文件。

3.1

数据标引dataindexing

数据标引指通过对数据的分析,选用确切的检索标识(类号、标题词、叙词、关键词、人名、地名

等),用以反映该数据的内容的过程。主要指选用检索语言词或自然语言词反映数据内容,并以之作为

检索标识的过程。

4总则

本文件依据《国务院关于加快科技服务业发展的若干意见》,《国家科技服务业统计分类》等文件,

对数据标引进行了规范,确定了科技数据管理体系中的数据标引标准。

5元数据标准

科技数据管理体系中的数据标引标准包括:(1)标引要求;(2)标引原则;(3)标引步骤;(4)

标引问题处理等4项内容,具体见本文件5.1~5.4。

1

T/CPPCXX—2021

5.1标引要求

(1)分类标引

成果持有机构数据,按照《全部经济活动国际标准行业分类》(第四版)、2016国家重点支持的高

新技术领域目录等分类标准进行分类标引,每条数据需标引出1-3个分类号,多个分类号用半角分号分

隔,标引深度需要标引到三到四级。

技术成果数据,按照标准产业分类法(第四版)、2016国家重点支持的高新技术领域目录等分类标

准进行分类标引,每条数据需标引出1-3个分类号,多个分类号用半角分号分隔,标引深度需要标引到

三到四级。

技术领域专家数据,按照《中华人民共和国学科分类与代码(国家标准GB/T13745-2009)》和标

准产业分类法(第四版)等分类标准进行分类标引,每条数据需标引出1-3个分类号,多个分类号用半

角分号分隔,标引深度需要标引到三到四级。

(2)主题标引

对成果持有机构、技术成果、领域专家三类数据进行主题标引,每条数据需标引3-8个中文关键词,

多个关键词用半角分号隔开,需选用具有实际意义的关键词标引,不得标引研究、先进等无意义词。

5.2标引原则

数据标引遵循下列原则:

(1)以科技创新数据监测与决策支撑数据的学科属性为主要标准;

(2)掌握分类法的系统性、等级性和逻辑性;

(3)保持同类科技数据相对集中;

(4)不能单凭科技数据共享服务平台数据名称分类;

(5)结合单位性质和任务进行分类;

(6)正确处理单主题、多主题科技数据的分类;

(7)正确处理不同类型载体科技数据的分类。

5.3标引步骤

数据标引应遵循下列步骤:

(1)数据的内容分析,对数据的各种特征进行分析,掌握其内容特征(事物、问题、研究对象、

学科领域等概念)和外部特征(理论、方法、手段、过程、地理、时间等概念)确定内容特征及其相互

关系,以使数据分类达到反映充分、归类准确的目的;

(2)查表归类,根据数据所反映的内容特征、外部特征以及主题概念之间的关系,依据类目表、

通用表及其有关注释要求,找到主要分类号码,按照需要再合理配以相应组配分类号码;

(3)标注分类号码,将代表数据内容的概念并把已严格组配好的相应分类号码,标注在数据规定

位置;

(4)复核,由专人或标引人员相互间对标引准确性、深度和专指度进行校对和审核,以保证分类

标引的质量。

5.4标引问题处理

(1)没有单独列类的主题概念如何确定类号

数据分类与编码力求完整,但不可能穷举所有主题概念,如果某一个单一的主题概念在分类编码表

中没用直接对应的类目,当其同位类下有其他类目时,该主题概念入其他类,如果没有其他类,则归入

最相近的同位类或能概括该主题概念的上位类中。如果在分类编码表中找不到同位类,则根据该主题概

念的隶属关系确定类号。

2

T/CPPCXX—2021

(2)应用关系主题的科技数据分类

应用关系的主题是指一个主题应用到另外一个或几个主题,或者是指几个主题同时应用到另一个主

题,且主题类目下没有应用关系的类目。凡是一方面到一方面或多方面的应用则数据按照前者的主题进

行分类标引,凡是多方面到一方面的应用,则成果数据按照后者的主题进行分类标引。

(3)影响关系主题的数据分类

影响关系主题是指一个主题影响到另外一个或几个主题,或者是指几个主题同时影响到另一个主题。

分类标引的实现与应用关系的处理方法相同。

(4)从属主题数据的分类

从属主题是指数据的主题之间具有包含关系或属种关系或整体与部分的关系,一般依据较大较全的

主题归类标引,如果数据的重点突出内容是小主题,则按照小的主题进行归类标引。

(5)因果关系主题的数据分类

因果关系主题是指数据涉及几个主题,其中一个主题是使另一个主题或多个主题产生的原因或结果。

此类数据分类标引时,如果是一个原因产生多个结果则按照原因的主题进行分类标引,否则按照结果方

面的主题进行分类标引。

注:重金属污染对农业生产带来的损失,应该按照原因方面的“重金属污染”进行分类标引。

(6)复合主题的数据分类

复合主题是指单一主题含有多个概念因素:主体因素(事物或问题,以及组成部分)、通用因素(事

物的状态、过程、性质等)、位置因素、时间因素等。

标引该类数据时限根据主题因素归入学科或专业大类,然后依据其他因素归入相关的下位类目。如

果数据集是关于一个主题的多个方面则归入到能概括该主题的上位类。

(7)综合性数据的分类

各类综合性数据依据研究对象、主要的应用领域、应用的理论方法和学科的渊源关系归入相关的类

目。

(8)新学科新主题数据的分类

新学科新主题的分类应满足下列要求:

1)衍化分化生成的数据,一般情况下归到最近的上位类;

2)交叉形成的新学科新主题如果内容隶属的重点不突出,则应用两个学科主题组配;

3)否则归入重点隶属的主题类目进行分类标引;

4)没有明显的继承和交叉关系的新学科新主题归入相近的类目或归入能概括该主题的上位类目。

3

T/CPPCXX—2021

参考文献

[1]国务院关于加快科技服务业发展的若干意见

[2]国家科技服务业统计分类

[3]GB/T4754-2017国民经济行业分类

[4]GB/T30523-2014科技平台资源核心元数据

_________________________________

4

T/CPPCXX—2021

目次

前言...............................................................................II

1范围................................................................................1

2规范性引用文件......................................................................1

3术语和定义..........................................................................1

4总则................................................................................1

5元数据标准..........................................................................1

参考文献..............................................................................4

I

T/CPPCXX—2021

科技数据管理体系:数据标引

1范围

本文件规定了科技数据管理体系中对数据标引的要求。

本文件适用于科技管理、科技统计、科技决策服务等活动。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T30523-2014科技平台资源核心元数据

3术语和定义

下列术语和定义适用于本文件。

3.1

数据标引dataindexing

数据标引指通过对数据的分析,选用确切的检索标识(类号、标题词、叙词、关键词、人名、地名

等),用以反映该数据的内容的过程。主要指选用检索语言词或自然语言词反映数据内容,并以之作为

检索标识的过程。

4总则

本文件依据《国务院关于加快科技服务业发展的若干意见》,《国家科技服务业统计分类》等文件,

对数据标引进行了规范,确定了科技数据管理体系中的数据标引标准。

5元数据标准

科技数据管理体系中的数据标引标准包括:(1)标引要求;(2)标引原则;(3)标引步骤;(4)

标引问题处理等4项内容,具体见本文件5.1~5.4。

1

T/CPPCXX—2021

5.1标引要求

(1)分类标引

成果持有机构数据,按照《全部经济活动国际标准行业分类》(第四版)、2016国家重点支持的高

新技术领域目录等分类标准进行分类标引,每条数据需标引出1-3个分类号,多个分类号用半角分号分

隔,标引深度需要标引到三到四级。

技术成果数据,按照标准产业分类法(第四版)、2016国家重点支持的高新技术领域目录等分类标

准进行分类标引,每条数据需标引出1-3个分类号,多个分类号用半角分号分隔,标引深度需要标引到

三到四级。

技术领域专家数据,按照《中华人民共和国学科分类与代码(国家标准GB/T13745-2009)》和标

准产业分类法(第四版)等分类标准进行分类标引,每条数据需标引出1-3个分类号,多个分类号用半

角分号分隔,标引深度需要标引到三到四级。

(2)主题标引

对成果持有机构、技术成果、领域专家三类数据进行主题标引,每条数据需标引3-8个中文关键词,

多个关键词用半角分号隔开,需选用具有实际意义的关键词标引,不得标引研究、先进等无意义词。

5.2标引原则

数据标引遵循下列原则:

(1)以科技创新数据监测与决策支撑数据的学科属性为主要标准;

(2)掌握分类法的系统性、等级性和逻辑性;

(3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论