生殖健康科学数据共性描述规范_第1页
生殖健康科学数据共性描述规范_第2页
生殖健康科学数据共性描述规范_第3页
生殖健康科学数据共性描述规范_第4页
生殖健康科学数据共性描述规范_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICSxx.xxx

Yxx

T/CRHxxxx—2019

生殖健康科学数据共性描述规范

Reproductivehealthsciencedatageneraldescriptorsspecification

(草案)

xxxx-xx-xx发布xxxx-xx-xx实施

中国生殖健康产业协会发布

前言

本标准按照GB/T1.1-2009《标准化工作导则第1部分:标准的结构和编写》起草。

本标准由中国生殖健康产业协会提出并归口。

本标准起草单位:

本标准起草人:

本标准由中国生殖健康产业协会标准化技术委员会负责解释。

本标准为首次发布。

本标准知识产权归属中国生殖健康产业协会所有。

II

引言

为了规范生殖健康科学数据采集、存储、评价、研究和利用,确保生殖健康科学数据能

有序、准确并有效地进行管理和使用,特制定《生殖健康科学数据共性描述规范》,以统一

生殖健康科学数据的描述体系、分类编码,实现生殖健康科学数据的充分共享和可持续发展。

III

生殖健康科学数据共性描述规范

1范围

本标准规定了生殖健康科学数据统一的共性描述体系、分类编码和指标项说明。

本标准适用于全国各地区采集、整理、存储生殖健康科学数据的研究机构、大专院校、

企业等机构对生殖健康数据进行规范描述,以及数据库间的信息交换和共享。

2规范性引用文件

下列文件中的条款通过本规范的引用而成为本规范的条款。凡是注日期的引用文件,其

随后所有的修改(不包括勘误的内容)或修订版均不适用于本规范,然而,鼓励根据本规范

达成协议的各方研究使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用

于本规范。

《ICD-10疾病和有关健康问题的国际统计分类》

GB/T2261.1-2003《人的性别代码》

GB/T3304《中国各民族名称的罗马字母拼写法和代码》(第十次修订本)

GB/T2260《中华人民共和国行政区划代码》

GB/T2261.3-2003《个人基本信息分类与代码第3部分:健康状况代码》

GB/T7408-2005《数据元交换格式信息交换日期和时间表示法》(GB/T7408-2005,

eqvISO8601:2000)

《中国人类遗传资源共性信息描述规范及编码标准》(2006-07)

《中国人类遗传资源特性信息描述规范》(2006-07)

3术语和定义

下列术语和定义适用于本规范。

3.1

生殖健康科学数据scientificdataofreproductivehealth

人类生殖系统及其功能和过程所涉及一切事宜上的身体、精神和社会等方面的数据信息。

3.2

知情同意informedconsent

1

在以人为研究/试验/服务对象的科研领域,数据采集者必须使被采集者了解并理解研究

/试验/服务的目的和内容,并自愿同意参加研究/试验/服务的原则。知情同意在保护被采集

者合法权利的同时也保护采集者免于诉讼。

3.3

标记信息markerinformation

每条数据在数据库中的数据编号,每条数据均有一组数据编号。包括:平台数据编号及

数据原始编号。

3.4

平台数据编号No.ofdataintheplatform

数据在数据库中的编号。该编号是在数据导入生殖健康科学数据库后自动生成。平台数

据编号生成规则为:数据集编号+00+8位流水号组成,例如S0101010000000001;数据子集

编号+8位流水号组成,例如S0101010100000001。

3.5

数据原始编号originalNo.ofdata

为方便数据管理,数据在导入生殖健康科学数据库时,需提供数据原始编号,该编号在

一个数据集中应唯一。

3.6

性别sex

我们日常称呼的男性与女性,一般指具有XY染色体者为男性,具有XX染色体者为

女性,生殖健康科学数据库中性别包括未知的性别、男性、女性、两性、未说明的性别。

3.7

国别nationality

一个人属于某一个国家的国民或公民的法律资格,表明一个人同一个特定国家间的固定

的法律联系,即个人具有的属于某个国家的身份。生殖健康科学数据库中国别包括中国、外

籍。

3.8

民族nationality

民族是人们在历史上形成的有共同语言、共同地域、共同经济生活以及表现于共同的民

族文化特点上的共同心理素质这四个基本特征的稳定的共同体。

3.9

2

籍贯nativeplace

一个人的出生或祖居地。

3.10

生命周期lifecycle

个体从出生前到出生至死亡的生命各个阶段。在生殖健康科学数据库中生命周期包括出

生前、婴幼儿期、儿童期、青春期、青年期、中年期、年轻老年人、老年人、长寿老年人和

死亡。

3.11

妊娠期gestationperiod

女性受孕后至分娩前的生理时期。

3.12

健康状况healthstatus

对个体生理、心理及社会适应三个方面状况的综合评价。

3.13

生物样本biologicalsample

为了开展研究工作,收集的生殖健康科学数据对应的人体各种组织器官样本,如:血液、

皮肤、骨髓、肌肉、毛发、分泌物、内脏器官等所有类型的样本。

3.14

生物样本编号No.ofbiologicalsample

为方便生物样本的管理设置的编号。

3.15

研究设计researchdesign

在一个大的过程中进行的一系列行动/思考/选择,为了实现某一个目标,首先预先根据

可能出现的设计问题制定的若干对应的方案,并且在实现设计最终方案的过程中,根据形势

的发展和变化来制定出新的方案,或者根据形势的发展和变化来选择相应的方案,最终实现

目标。在生殖健康科学数据库中研究设计包括横断面调查、抽样调查、普查、监测、前瞻队

列、病例对照、临床试验、临床诊疗、社区试验及生态学研究等。

3.16

医疗健康数据资料medicalandhealthdata

泛指所有与医疗和生命健康相关的数据资料,在生殖健康科学数据库中医疗健康数据资

3

料包括体检数据、筛查数据诊断数据、治疗数据、干预数据、随访数据鉴定数据、家系数据

及组学数据等。

3.17

社会环境数据资料socialenvironmentdata

个体的社会环境数据资料,在生殖健康科学数据库中社会环境数据资料包括城乡数据、

地域数据、地理数据、社会数据、污染数据、暴露数据和极端气候数据等。

3.18

数据采集涉及其他对象信息otherobjectinformationrelatetodatacollection

在采集某个个体数据资料的过程中涉及的其他相关个体的数据资料,在生殖健康科学数

据库中数据采集涉及其他对象信息包括丈夫、妻子、子女、父母、兄弟姐妹及其他亲属等。

3.19

共享方式sharingmode

获取生殖健康科学数据时协议信息使用的方式,例如:公益性共享、公益性借用共享、

合作研究共享、资源交换性共享等。

4编写方法

4.1描述信息分类要求

为方便数据使用者能全面直观地了解生殖健康科学数据,将数据信息分为4类:

a)标记信息

b)基础信息

c)数据特征信息

d)管理信息

4.2描述符编码

由描述类别加两位顺序号组成,如“101”、“202”、“301”。描述符编码应是有序的。

4

5生殖健康科学数据共性描述表

表1生殖健康科学数据共性描述表

标记信息

平台数据编号(1)

数据原始编号(2)

基础信息

性别(3)国别(4)

民族(5)籍贯(6)

民族-未分类民族(7)

出生年份(8)

生命周期(9)

妊娠期(10)

健康状况(11)

健康状况-其他状况(12)

疾病和有关健康问题名称(13)疾病和有关健康问题别名(14)

数据特征信息

生物样本(15)生物样本编号(16)

研究设计(17)

医疗健康数据资料(18)

城乡(19)

地域(20)

地理(21)

社会环境数据资料社会(22)

污染(23)

暴露(24)

极端气候(25)

数据采集涉及其他对象信息(26)

其他补充说明(27)

5

管理信息

科技项目类别/经费来源(28)

科技项目类别/经费来源-其他(29)

共享方式(30)

共享方式-其他(31)

获取途径(32)

获取途径-其他(33)

联系单位(34)联系人(35)

联系电话(36)电子邮箱(37)

单位地址(38)

6

6生殖健康科学数据共性描述字段说明表

表2生殖健康科学数据共性信息描述规范简表

序号类别编码字段名称字段说明

11101平台数据编号生殖健康科学数据库中统一生成的数据编号

21102数据原始编号数据采集时对每一条数据赋予的编号

32201性别按照国家标准GB/T2261.1-2003《人的性别代码》进行改编

42202国别填写数据对象的国别归属

按照国家标准GB/T3304《中国各民族名称的罗马字母拼写法

52203民族

和代码》进行分类编码

若字段“民族”填写为“未分类民族”则需要在该字段处填写

62204民族-未分类民族

实际的民族信息

按照国家标准GB/T2260《中华人民共和国行政区划代码》进

72205籍贯

行分类编码

82206出生年份按照公历填写数据对象的出生年份

92207生命周期填写数据对象在数据采集时所属的生命周期

102208妊娠期填写数据对象在数据采集时是否处于妊娠期

按照国家标准GB/T2261.3-2003《个人基本信息分类与代码第

112209健康状况

3部分:健康状况代码》进行改编

健康状况-其他状若字段“健康状况”填写为“其他状况”则需要在该字段处填

122210

况写其他状况的详细信息

疾病和有关健康问根据《ICD-10疾病和有关健康问题的国际统计分类》进行命名

132211

题名称及分类编码

疾病和有关健康问

142212填写疾病的其他名称、叫法

题别名

153301生物样本填写是否有与数据对象对应的生物样本实物

163302生物样本编号填写生物样本实物对应的编号

7

173303研究设计填写采集数据对象信息的研究设计类型

183304医疗健康数据资料填写数据对象所涉及的医疗健康数据资料

193305城乡填写数据对象的城乡归属

203306地域填写数据对象的地域归属

213307地理填写数据对象的地理归属

223308社会填写数据对象的社会行政归属

233309污染填写数据对象暴露的污染情况

243310暴露填写数据对象是否存在不良因素的职业暴露或日常生活暴露

253311极端气候填写数据对象是否暴露于极端气候

数据采集涉及其他

263312填写数据对象的数据资料中涉及的其他对象信息

对象信息

273313其他补充说明填写需要补充说明的其他相关数据信息

科技项目类别/经

284401按照产生该数据所属的科技项目或经费来源进行分类

费来源

科技项目类别/经若“科技项目类别/经费来源”填写为其他,则需要在该字段处

294402

费来源-其他填写其他的详细信息

304403共享方式描述生殖健康数据的共享方式

若“共享方式”填写为其他,则需要在该字段处填写其他的详

314404共享方式-其他

细信息

324405获取途径描述获取生殖健康科学数据的途径或方式

若“获取途径”填写为其他,则需要在该字段处填写其他的详

334406获取途径-其他

细信息

344407联系单位填写数据的负责联系单位全称

354408联系人填写数据负责联系人姓名

364409联系电话填写数据负责联系人的联系电话

8

374410电子邮箱填写数据负责联系人的电子邮箱

384411单位地址填写数据负责联系人的单位地址详细信息

9

7生殖健康科学数据共性描述

7.1标记信息

7.1.1平台数据编号

指数据在生殖健康科学数据库的编号,该编号是在数据导入数据库后自动生成。平台数

据编号生成规则为:数据集编号+00+8位流水号组成,例如S0101010000000001;数据子集

编号+8位流水号组成,例如S0101010100000001。

7.1.2数据原始编号

为方便数据管理,数据在导入生殖健康科学数据库时,需提供数据原始编号,该编号在

一个数据集中必须唯一。数据原始编号仅在后台数据库中显示,以作标记使用。

7.2基础信息

7.2.1性别

由1位阿拉伯数字组成,根据国家标准GB/T2261.1-2003《人的性别代码》编写,部分

修改。具体编码见附录A—表3。

7.2.2国别

由1位阿拉伯数字组成,根据生殖健康科学数据管理的数据进行粗略划分,具体编码见

附录A—表4。

7.2.3民族

由2位阿拉伯数字组成,根据国家标准GB/T3304《中国各民族名称的罗马字母拼写法

和代码》,补充了2个编码。具体编码见附录A—表5。

7.2.4民族-未分类民族

字符型,若“7.2.3民族”填写为“未分类民族”,则此处“民族-未分类民族”填写未

分类民族的详细信息;若“7.2.3民族”填写为非“未分类民族”选项,则此处“民族-未分

类民族”不用填写。

7.2.5籍贯

由2位阿拉伯数字组成,编码按照国家标准GB/T2260《中华人民共和国行政区划代码》

的前两位编写,编码对应到省(直辖市、自治区)。同时补充“99”作为资料不详编码。具体

编码见附件A—表6。

7.2.6出生年份

出生年份为公历,格式为6位阿拉伯数字YYYYMM。

7.2.7生命周期

10

由2位阿拉伯数字组成,按照人类从出生前到出生后至死亡的全生命周期进行分类编码,

具体编码见附录A—表7。

7.2.8妊娠期

由1位阿拉伯数字组成,填写数据采集时数据对象是否处于妊娠期,具体编码见附录

A—表8。

7.2.9健康状况

由2位阿拉伯数字组成,按照国家标准GB/T2261.3-2003《个人基本信息分类与代码第

3部分:健康状况代码》进行改编。具体编码见附件录A—表9。

7.2.10健康状况-其他状况

字符型,若“7.2.8健康状况”填写为“其他状况”,则此处“健康状况-其他状况”填写其他

健康状况的详细描述;若“7.2.8健康状况”填写为非“其他状况”选项,则此处“健康状况-其他

状况”不用填写。

7.2.11疾病和有关健康问题名称

字符型,根据《ICD-10疾病和有关健康问题的国际统计分类》进行分类的疾病名称。

7.2.12疾病和有关健康问题别名

字符型,给出疾病除了ICD-10中记录的名称外的其他名称。

7.3数据特性信息

7.3.1生物样本

由1位阿拉伯数字组成,根据是否可以提供与数据相对应的生物样本进行逻辑判断,并

对字段进行赋值,具体编码见附件A—表10。

7.3.2生物样本编号

字符型,给出数据的生物样本实物的编号,若“7.3.1生物样本实物”填写为“有”,则此处

“生物样本编号”填写数据对象样本实物所对应的编号;若“7.3.1生物样本实物”填写为非“有”

选项,则此处“生物样本编号”不用填写。

7.3.3研究设计

由2位阿拉伯数字组成,编码按照采集数据信息时所使用的研究设计类型进行分类编码,

具体编码见附录A—表11。

7.3.4医疗健康数据资料

由2位阿拉伯数字组成,编码按照数据所涉及的医疗健康数据资料类型进行分类编码,

具体编码见附录A—表12。

11

7.3.5社会环境数据资料

由2位阿拉伯数字组成,编码按照数据所涉及的社会环境数据资料类型(包括城乡、地

域、地理、社会、污染、暴露、极端气候)进行分类编码,具体编码见附录A—表13。

7.3.6数据采集涉及其他对象信息

由1位阿拉伯数字组成,编码按照数据资料中涉及的其他对象信息进行分类编码,具体

编码见附录A—表14。

7.3.7其他补充说明

字符型,填写其他需要补充说明的相关资料。

7.4管理信息

7.4.1科技项目类别/经费来源

由1位阿拉伯数字组成,按照生殖健康科学数据所属项目类别或经费来源进行划分,具

体编码见附录A—表15。

7.4.2科技项目类别/经费来源-其他

字符型,若“7.4.1科技项目类别/经费来源”填写为“其他”,则此处“科技项目类别/经费

来源-其他”填写其他情况详细描述;若“7.4.1科技项目类别/经费来源”填写为非“其他”选项,

则此处“科技项目类别/经费来源-其他”不用填写。

7.4.3共享方式

由2位阿拉伯数字组成,表示生殖健康科学数据进行数据共享的方式,具体编码见附录

A—表16。

7.4.4共享方式-其他

字符型,若“7.4.3共享方式”填写为“其他”,则此处“共享方式-其他”填写其他情况详细

描述;若“7.4.3共享方式”填写为非“其他”选项,则此处“共享方式-其他”不用填写。

7.4.5获取途径

由1位阿拉伯数字组成,编码按照生殖健康科学数据共享时数据具体获取方式进行划分,

具体编码见附录A—表17。

7.4.6获取途径-其他

字符型,若“7.4.5获取途径”填写为“其他”,则此处“获取途径-其他”填写其他情况详细

描述;若“7.4.5获取途径”填写为非“其他”选项,则此处“获取途径-其他”不用填写。

7.4.7联系单位

字符型,填写数据共享时数据的负责联系单位的全称。

12

7.4.8联系人

字符型,填写数据共享的数据负责联系人的姓名。

7.4.9联系电话

字符型,填写数据负责联系人的联系电话。

7.4.10电子邮箱

字符型,填写数据负责联系人的电子邮箱。

7.4.11单位地址

字符型,填写数据负责联系人的单位地址的详细信息。

13

附录A

(规范性附录)

字段编码表

字段编码表见表A.1~表A.15。

表A.1性别编码

编码性别

0未知的性别

1男性

2女性

3*两性

9未说明的性别

说明:*为新增内容。

表A.2国别编码

编码国别

1中国

2外籍

表A.3民族编码

编码民族民称编码民族名称

01汉族30土族

02蒙古族31达斡尔族

03回族32仫佬族

04藏族33羌族

05维吾尔族34布朗族

06苗族35撒拉族

14

07彝族36毛南族

08壮族37仡佬族

09布依族38锡伯族

10朝鲜族39阿昌族

11满族40普米族

12侗族41塔吉克族

13瑶族42怒族

14白族43乌孜别克族

15土家族44俄罗斯族

16哈尼族45鄂温克族

17哈萨克族46德昂族

18傣族47保安族

19黎族48裕固族

20傈僳族49京族

21佤族50塔塔尔族

22畲族51独龙族

23高山族52鄂伦春族

24拉祜族53赫哲族

25水族54门巴族

26东乡族55珞巴族

27纳西族56基诺族

28景颇族57*未分类民族

29柯尔克孜族99*资料不详

说明:*为新增内容。

表A.4籍贯编码

编码省(直辖市、自治区)名称编码省(直辖市、自治区)名称

11北京44广东

15

12天津45广西

13河北46海南

14山西50重庆

15内蒙古51四川

21辽宁52贵州

22吉林53云南

23黑龙江54西藏

31上海61陕西

32江苏62甘肃

33浙江63青海

34安徽64宁夏

35福建65新疆

36江西71台湾

37山东81香港

41河南82澳门

42湖北99*不详

43湖南

说明:*为新增内容。

表A.5生命周期编码

编码生命周期

00出生前

01出生前-配子期

02出生前-受精卵期

03出生前-胚胎期(1-8周)

04出生前-胎儿期(9周以上)

10婴幼儿期(0-3岁)

20儿童期(3-11岁)

16

30青春期(12-17岁)

40青年期(18-44岁)

50中年期(45-59岁)

60年轻老年人(60-74岁)

70老年人(75-89岁)

80长寿老人(90岁以上)

90死亡

表A.6妊娠期的逻辑判断编码

编码是否处于妊娠期

1是

2否

表A.7健康状况编码

编码健康状况说明

10健康或良好

20一般或较弱

30/40有慢性病

31心血管病

32脑血管病

33慢性呼吸系统疾病

34慢性消化系统疾病包括溃疡、肝炎和肝硬化

35慢性肾炎

36结核病

37糖尿病

38神经或精神疾病

41癌症

17

49其他慢性病

60残疾

61视力残疾

62听力残疾

63语言残疾

64肢体残疾

65智力残疾

66精神残疾

67多重残疾

69其他残疾

50*先天性畸形不包括遗传性疾病

51*神经系统先天性畸形不包括遗传性疾病

52*眼、耳、面和颈部先天性不包括遗传性疾病

畸形

53*循环系统先天性畸形不包括遗传性疾病

54*呼吸系统先天性畸形不包括遗传性疾病

55*消化系统先天性畸形不包括遗传性疾病

56*生殖泌尿系统先天性畸不包括遗传性疾病

57*肌肉骨骼系统先天性畸不包括遗传性疾病

59*其他先天性疾病不包括遗传性疾病

70*遗传性疾病

71*单基因遗传病

72*多基因遗传病

73*染色体异常

74*线粒体遗传病

75*其他遗传性疾病

80*传染病

18

81*病毒性传染病

82*细菌性传染病

83*螺旋体传染病

84*立克次体传染病

85*衣原体传染病

86*支原体传染病

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论