基因检测服务中微生物组学数据共享规范(编制说明)_第1页
基因检测服务中微生物组学数据共享规范(编制说明)_第2页
基因检测服务中微生物组学数据共享规范(编制说明)_第3页
基因检测服务中微生物组学数据共享规范(编制说明)_第4页
基因检测服务中微生物组学数据共享规范(编制说明)_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《基因检测服务中微生物组数据共享规范》

编制说明

一、工作简况

1.1任务来源

2021年6月11日,由深圳市生命科技产学研资联盟批准《基因检测服务中

微生物组数据共享规范》立项。本标准由深圳华大生命科学研究院、深圳华大智

造科技股份有限公司、深圳华大基因股份有限公司、兰州大学第二医院、北京量

化健康科技有限公司、北京知因新生活细胞生物科技有限公司、深圳生命科技

产学研资联盟、深圳华大基因科技有限公司等单位的专家组成标准起草工作组,

共同完成标准的制定工作。

1.2编制背景、目的和意义

随着高通量测序技术日渐成熟以及成本的迅速降低,相关组学研究进展迅猛。

促进微生物组学在医疗检测,健康管理等领域的广泛应用,国内外出现诸多基于

微生物组检测的健康管理类产品。

微生物组数据处理涉及数据生产,分析,存储,传输和应用等多个环节。微

生物组的快速发展也伴随出现不同的产业分工,存在数据多中心多节点间交互传

输的情况,如数据所有者和算法提供方分离,数据分析端与应用端分离等业态。

而目前微生物组的生物信息分析中产生大量格式不统一、非结构化或半结构化的

数据,不利于各节点间的数据分享及交互。目前的现状是在微生物组数据生产过

程中,会出现元数据记录不全等问题,下游数据应用端难以还原数据生产环境及

追溯质量控制条件。此外,数据分析端与应用端的数据交互还多以文本拷贝等形

式进行,时效性不佳,不利于下游基于互联网的解读应用开发,也不利于数据审

核机制的建立及进行必要的数据安全管控。

本标准旨在规范微生物组在数据交换中的数据格式及元数据,以便下游应用

开发,降低沟通成本和减少歧义,促进产业分工及数据分享。建立数据交换标准

可提升微生物组数据的可应用性,打通数据分析、数据分享的信息壁垒。

1

1.3简要编制过程

1.3.1前期准备

本标准起草工作组通过查阅大量国内外文献和多方调研学习,从以下几个方

面做了前期准备工作:

(1)2020年12月,开始调研国内外相关标准、专家论著、期刊研究、技

术规范和国际通用微生物组数据格式等文件材料;

(2)调研微生物组的数据处理规范;

(3)结合实际使用场景,调研实际生产环节中,微生物组数据实际交换及

传输形式。

(4)2020年12月,根据前期调研资料加以整理分析,初步确定标准框

架。

(5)2021年1月,经过起草工作组内部讨论,初步确定标准编制的原则

和标准的框架内容,起草了标准讨论稿。

1.3.2标准立项

2021年6月11日,深圳市生命科技产学研资联盟批准《基因检测服务中微

生物组数据共享规范》的立项。

1.3.3起草阶段

2021年6月,通过邮件等方式将标准讨论稿发送给各起草单位的专家。从

微生物组数据共享和交换流程、元数据的规范化定义、格式标准要求等标准内容

进行了多次沟通讨论,进一步完善了标准讨论稿。

2021年7月8日,召开标准研制推进会。主要讨论标准的范围扩大、定义

修改、技术内容调整等,进一步对标准讨论稿进行修订,形成标准草案。

1.3.4征求和处理意见阶段

2021年8月13日至9月13日,起草工作组将征求意见稿发送给各单位的

专家,就征求意见稿进行讨论,征求意见和建议。同时,将征求意见稿投放在网

络上,广泛征求生物信息、基因测序等各领域人士的意见和建议。

2

二、制标原则/依据和主要内容

2.1制标原则/依据

2.1.1标准制定原则

本标准以现行法律法规的规定和相关标准为基础,与现行国家标准和行业标

准相衔接。主要对基因检测检测服务中,在微生物组数据处理节点间的数据共享

进行规范,旨在规范微生物组在数据交换中的数据格式及元数据,以便捷下游应

用开发,降低沟通成本和减少歧义,促进产业分工及数据分享。建立数据交换标

准可提升微生物组数据的可应用性,打通数据分析、数据分享的信息壁垒。

2.1.2标准制定依据

标准编写遵循GB/T1.1—2020《标准化工作导则第1部分:标准化文件的

结构和起草规则》的有关要求。

2.2主要内容

2.2.1标准的主要框架

本标准主要由范围、规范性引用文件、术语和定义、微生物数据共享和交换

流程、微生物组数据元数据、分析级数据类型、微生物组数据格式要求这几部分

所组成。

2.2.2标准的主要内容

在本标准制定过程中,随着研究的深入,先后完成标准讨论稿、草案和标准

征求意见稿,标准内容不断完善,并趋于科学合理。根据需要,本标准的主要技

术内容确定为:

在术语和定义中,对元数据,微生物组,宏基因组学,扩增子,生物观察矩

阵格式,数据生产,数据分析,分析级数据,数据存储,数据服务,基因丰度,

分类学丰度,功能丰度,相对丰度,操作分类单元,FASTQ格式,TSV格式等进

行了定义。

在微生物组数据共享和交换流程中,描述了微生物组数据的生产、传输、使

用等过程。将此过程分为四个环节:数据生产、数据分析、数据存储和数据服务,

并描述各环节细节及注意要点。

在微生物组数据元数据中,标准根据数据产生的环节,将元数据分为:样本

3

信息关联的元数据、测序数据关联的元数据和分析级数据关联的元数据三个部分,

规范了各部分微生物组数据交换中的常用元数据和最低要素。

在微生物组数据格式中,标准规范了微生物组数据在各个过程环节中的数据

格式,介绍了常用格式作为参考。根据产生的环节,微生物组数据分为原始数据

和分析级数据。高通量测序方法的原始数据为FASTQ,分析级数据指原始数据经

生物信息学方法分析所得的微生物组成分组成信息,并提出TSV(制表格分割文

本)和BIOM格式可作为分析级数据文件存储使用的文件格式。此外,也提出了

在网络交互场景下的建议数据结构。

三、国内外相关研究依据、技术标准

国内外相关组织和研究机构意识到数据交换和共享的重要性和必要性,正积

极制定微生物组研究及应用的相关标准。目前关于组学数据交换及格式规范的国

内外相关标准情况如下:

3.1国际标准情况:

ISO/TC276生物技术委员会、ISO/TC215健康信息学委员会(基因组信息

学委员会分会)、基因组标准协会(GenomicStandardsConsortium,GSC)、

地球微生物组计划(EarthMicrobiomeProject,EMP)、临床数据交换标准协会

(ClinicalDataInterchangeStandardsConsortium,CDISC,)都有涉及数据共

享和数据格式标准的制定或研究及应用等方面。ISO/TC215在2020年发布了关

于微生物资源中心数据管理和发布规范(ISO21710:2020),主要规范化了微生

物数据储存的基本信息格式。但对于微生物组学数据共享和交换流程及元数据和

数据格式,目前国际上还没有相关的标准。

CDISC在数据共享和交换及数据文件格式的标准方面走的比较前沿,在之前

就提供了一整套用于临床试验的研究数据和元数据采集、交换、提交和存档的标

准,包括临床数据获取协调标准(CDASH)、实验室数据模型(LAB)、操作数据模型

(ODM)、研究数据表格模型(SDTM)、分析数据模型(ADaM),以及受控术语

(ControlledTerminology)等。而基因组标准协会(GenomicStandards

Consortium,GSC)对宏基因组测序数据最小信息进行定义及规范(MIMS),。地球

微生物组计划(EarthMicrobiomeProject,EMP)与GSC提出biom数据格式,以

方便微生物组数据的传输及交互。但主要应用场景针对于科研领域,也缺少对医

4

疗健康等实际应用场景的支持。FHIR(FastHealthcareInteroperability

Resources)通过测序资源将基因组数据纳入,但暂未包含微生物组数据。

3.2国内标准情况:

我国尚未有微生物组学数据共享的相关标准,但对于生物数据格式有相关要

求,如:GB/T7408-2005数据元和交换格式信息交换日期和时间表示法、GB/T

33919-2017生物数字标本数据交换规范、GB/T35890-2018高通量测序数据序

列格式规范等国家推荐性标准;由深圳基因产学研资联盟发布的多项团体标准也

有对样品采集、处理和数据格式进行规范的相关标准:T/LTIA1.1-2019基于高

通量测序的环境微生物检测第1部分:基本规程中、T/SZAS14-2019组学数据

标准第2部分:宏基因组学、T/SZAS15-2019组学数据标准第3部分:RNA脑

科学等团体标准。主要针对样品采集及处理等进行规范,没有对数据格式做定义

规范,缺少对需要数据交换等实际应用场景的支持。

四、标准中涉及的专利

五、产业化情况、推广应用论证和预期达到的经济效果等情况

本标准提供了基因检测服务中,微生物组数据的生产及共享规范。该标准的

实施,可加强团体内部企业的合作,便捷下游应用开发,降低沟通成本和减少歧

义,促进产业分工及数据分享。

六、采用国际标准和国外先进标准情况,与国际、国外同类标准水平的对比情况

数据格式部分采用地球微生物组计划(EarthMicrobiomeProject)与基因

组标准协会(GenomicStandardsConsortium)提出的biom数据格式。国际同

类标准暂未覆盖微生物组数据共享的使用场景。

七、与现行相关法律、法规、规章及相关标准,特别是强制性标准的协调性

本标准基于在微生物组基因检测产品中数据的实际使用情况出发,参考了国

内外相关资料,体现了科学性、先进性和可操作性原则,在制定过程中充分考虑

国内相关的法规要求,与相关标准法规包括强制性标准协调一致。

八、重大分歧意见的处理经过和依据

本标准在编写过程中无重大分歧意见。

5

九、标准的属性

本标准属于推荐性标准。

十、贯彻标准的要求和措施建议

在本标准通过审核、批准发布之后,由相关部门组织力量对本标准进行宣贯,

在行业内进行推广。建议本标准自发布6个月之后开始实施。

十一、废止现行相关标准的建议

无。

十二、其它应予说明的事项

无。

6

《基因检测服务中微生物组数据共享规范》

编制说明

一、工作简况

1.1任务来源

2021年6月11日,由深圳市生命科技产学研资联盟批准《基因检测服务中

微生物组数据共享规范》立项。本标准由深圳华大生命科学研究院、深圳华大智

造科技股份有限公司、深圳华大基因股份有限公司、兰州大学第二医院、北京量

化健康科技有限公司、北京知因新生活细胞生物科技有限公司、深圳生命科技

产学研资联盟、深圳华大基因科技有限公司等单位的专家组成标准起草工作组,

共同完成标准的制定工作。

1.2编制背景、目的和意义

随着高通量测序技术日渐成熟以及成本的迅速降低,相关组学研究进展迅猛。

促进微生物组学在医疗检测,健康管理等领域的广泛应用,国内外出现诸多基于

微生物组检测的健康管理类产品。

微生物组数据处理涉及数据生产,分析,存储,传输和应用等多个环节。微

生物组的快速发展也伴随出现不同的产业分工,存在数据多中心多节点间交互传

输的情况,如数据所有者和算法提供方分离,数据分析端与应用端分离等业态。

而目前微生物组的生物信息分析中产生大量格式不统一、非结构化或半结构化的

数据,不利于各节点间的数据分享及交互。目前的现状是在微生物组数据生产过

程中,会出现元数据记录不全等问题,下游数据应用端难以还原数据生产环境及

追溯质量控制条件。此外,数据分析端与应用端的数据交互还多以文本拷贝等形

式进行,时效性不佳,不利于下游基于互联网的解读应用开发,也不利于数据审

核机制的建立及进行必要的数据安全管控。

本标准旨在规范微生物组在数据交换中的数据格式及元数据,以便下游应用

开发,降低沟通成本和减少歧义,促进产业分工及数据分享。建立数据交换标准

可提升微生物组数据的可应用性,打通数据分析、数据分享的信息壁垒。

1

1.3简要编制过程

1.3.1前期准备

本标准起草工作组通过查阅大量国内外文献和多方调研学习,从以下几个方

面做了前期准备工作:

(1)2020年12月,开始调研国内外相关标准、专家论著、期刊研究、技

术规范和国际通用微生物组数据格式等文件材料;

(2)调研微生物组的数据处理规范;

(3)结合实际使用场景,调研实际生产环节中,微生物组数据实际交换及

传输形式。

(4)2020年12月,根据前期调研资料加以整理分析,初步确定标准框

架。

(5)2021年1月,经过起草工作组内部讨论,初步确定标准编制的原则

和标准的框架内容,起草了标准讨论稿。

1.3.2标准立项

2021年6月11日,深圳市生命科技产学研资联盟批准《基因检测服务中微

生物组数据共享规范》的立项。

1.3.3起草阶段

2021年6月,通过邮件等方式将标准讨论稿发送给各起草单位的专家。从

微生物组数据共享和交换流程、元数据的规范化定义、格式标准要求等标准内容

进行了多次沟通讨论,进一步完善了标准讨论稿。

2021年7月8日,召开标准研制推进会。主要讨论标准的范围扩大、定义

修改、技术内容调整等,进一步对标准讨论稿进行修订,形成标准草案。

1.3.4征求和处理意见阶段

2021年8月13日至9月13日,起草工作组将征求意见稿发送给各单位的

专家,就征求意见稿进行讨论,征求意见和建议。同时,将征求意见稿投放在网

络上,广泛征求生物信息、基因测序等各领域人士的意见和建议。

2

二、制标原则/依据和主要内容

2.1制标原则/依据

2.1.1标准制定原则

本标准以现行法律法规的规定和相关标准为基础,与现行国家标准和行业标

准相衔接

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论