高通量动植物基因型分型平台技术规范_第1页
高通量动植物基因型分型平台技术规范_第2页
高通量动植物基因型分型平台技术规范_第3页
高通量动植物基因型分型平台技术规范_第4页
高通量动植物基因型分型平台技术规范_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS07.080

CCSA20T/CAGDRS

团体标准

T/CAGDRSXX—2024

高通量动植物基因型分型平台技术规范

Technicalspecificationforthehigh-throughputanimalandplant

genotypingplatform

征求意见稿

(征求意见稿和送审稿阶段,需给出以下内容“在提交反馈意见

时,请将您知道的相关专利连同支持性文件一并附上。”)

2024-XX-XX发布2024-XX-XX实施

中国农业绿色发展研究会发布

T/CAGDRSXX—2024

高通量动植物基因型分型平台技术规范

1范围

本文件规定了高通量动植物基因型分型平台的平台架构、自动化系统搭建、核酸提取、文库构建、

基因测序、数据分析、数据质量与安全、运行维护等。

本文件适用于高通量动植物基因型分型平台建设与运行。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T26237.14-2023信息技术生物特征识别数据交换格式第14部分:DNA数据

GB/T33681.1—2017高通量基因测序样本预处理方法第1部分:动物组织样本预处理

GB/T33767.14-2023信息技术生物特征样本质量第14部分:DNA数据

GB/T35537—2017高通量基因测序结果评价要求

GB/T35890—2018高通量测序数据序列格式规范

GB/T37864—2019生物样本库质量和能力通用要求

GB/T37874—2019核酸提取纯化方法评价通则

3术语和定义

下列术语和定义适用于本文件。

3.1

基因型genotype

个体一个或多个基因组座上等位基因的组成。

注:本文件中特指SNP或STR基因座的等位基因组成。

3.2

测序sequencing

测定氨基酸或核苷酸序列的过程。

3.3

高通量测序high-throughputsequencing

能够一次并行对大量核酸分子进行平行测定的技术。

3.4

文库library

1

T/CAGDRSXX—2024

通过生物来源的、人工合成的或克隆技术等所得到的一个重建分子群,如基因组文库、互补DNA

文库等。

3.5

核苷酸nucleotide

构成核酸的基本单位,由三部分组成:五碳糖、磷酸和环状的含氮碱基。根据五碳糖的不同,将

核酸分为脱氧核糖核酸(DNA)和核糖核酸(RNA)两大类。

3.6

碱基base

一类含氮原子的有机杂环化合物,是组成嘌呤和嘧啶的主要成分,是拼出遗传密码的“字母”。

注:DNA中的碱基主要由腺嘌呤(Adenine,A)、鸟嘌呤(Guanine,G)、胞嘧啶(Cytosine,C)和胸腺嘧啶

(Thymine,T);RNA中的碱基主要由腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和尿嘧啶(Uracil,U)。

3.7

碱基识别basecalling

测序过程中从荧光信号或其他测序反应产生的信号转换成碱基序列信息的过程。

3.8

FASTQ格式FASTQformat

基于文本的、保存生物序列(通常是核酸序列)和其测序质量信息的、每四行表示一条序列的标

准格式。

3.9

单核苷酸多态性singlenucleotidepolymorphism

由单个核苷酸改变所引起的脱氧核糖核酸序列多态性。

3.10

自动化automation

自动化是指机器设备、系统或过程(生产、管理过程)在无人或较少人的直接参与下,按照人类

设定的要求,进行自动处理、自动检测、信息处理、分析判断和操纵控制,实现预期目标的过程。

3.11

联调integrationtest

子系统之间的集成测试,主要验证各子系统之间接口及系统整体功能的正确性。

4平台架构

2

T/CAGDRSXX—2024

核酸提取模块文库构建模块基因测序模块数据分析模块

样品信息管理系自动化管理、条

测序芯片加载仪分布式计算集群

统码系统

自动移液工作集群管理及调度

高通量样品研磨高通量测序仪

站、分液器软件系统

自动化移液工作测序服务器&测

储板、冰箱

站序伴侣

琼脂糖凝胶电泳机械臂

自动离心机、撕

浓度测定膜机、封膜机、

PCR仪

自动化酶标仪、

片段检测仪

图1高通量动植物基因型分型平台架构

4.1用于核酸提取的模块

血液类样品(如拭子、血卡、血液等),宜采用封闭式的核酸提取设备,双移液泵,移液通量≥9,

具备外排式高效过滤系统,内置紫外灯,移液精度5μlCV≤±5%,10μlCV≤±1%,20μlCV≤±0.8%,

采用磁珠法进行提取。其余类型的组织样品(如叶片、种子、肌肉等),宜采用自动化工作站进行核酸

提取,气压泵或液压泵,移液通量≥96,板位数≥28,移液精度5μlCV≤±5%,10μlCV≤±1%,20μl

CV≤±0.8%,采用磁珠法进行提取。

4.2用于文库构建的模块

日建库通量500样品以下,宜选择单台自动化文库构建系统,板位数≥24,配备微孔板抓手、96孔

板磁力架、自动化PCR仪、温度控制、板式振荡器等模块;若搭建全自动文库制备生产线,宜采用多台

套设备整合的自动化设计方案。根据文库构建通量需求,综合考虑整合系统性能与造价,进行自动化文

库构建系统搭建。

4.3用于基因测序的模块

宜选择高通量测序主流机型,具备PE150测序模式,单次测序芯片数量可可灵活调整,不同测序通

道可轮动上机操作。宜选择自带高性能服务器可自动完成碱基识别的测序仪,如测序上机频率高,还应

选择测序仪伴侣设备,协助测序仪快速完成碱基识别、数据临时存储及中转传输等。

4.4用于数据分析的模块

宜选用高性能分布式存储计算集群进行生信分析,应包含管理节点、备份节点、计算节点、存储节

点等节点部署。提供web可视化管理页面,可实现计算资源统一分配和调度、集群的全面监控、作业的

多样化提交和管理。

3

T/CAGDRSXX—2024

5自动化系统搭建

5.1设备仪器连接

5.1.1设备电源

根据自动化设备的电源要求,通过电源线将其与电源之间进行连接。

5.1.2设备通讯

根据自动化设备不同的通讯协议,通过串口、网口和USB等通讯方式将其与中控电脑进行连接。

5.2设备仪器联调联动

5.2.1设备整合

通过自动化软件和驱动对各个设备进行整合连接,以实现数据传输、控制命令传递等功能。

5.2.2位置校准

通过校准板对移液工作站和机械手的位置进行校准。

5.3软件开发

5.3.1驱动开发测试

针对整合的设备的驱动程序进行开发测试,开放驱动程序的端口,从而实现自动化软件对设备进行

驱动。

5.3.2自动化程序开发

根据不同实验的SOP,将其设计转化为自动化软件的程序,包括整体流程架构设计、功能模块切分

和数据流程等。

5.4硬件调度与管理

通过自动化软件对硬件进行实时规划调度和管理。

5.5自动化整合设备性能

表1自动化整合设备性能

序号设备名称性能参数供电工作温度工作湿度

单个微孔板存储模块应可存放≥280块标准带盖

相对湿度

微孔板或相应转换数量的深孔板AC220V

1储板模块19~25℃20%~80%(无

支持随机存取(±10%)

冷凝)

支持自动化整合

支持随机存取相对湿度

AC220V

2冰箱温度控制范围≥4℃-25℃19~25℃20%~80%(无

(±10%)

支持自动化整合冷凝)

4

T/CAGDRSXX—2024

表1自动化整合设备性能(续)

序号设备名称性能参数供电工作温度工作湿度

应配备≥4个可协同移动的关节

相对湿度

复合速度≥500mm/s,重复性(在所有方向上)≤AC220V

3机械手19~25℃20%~80%(无

0.3mm(±10%)

冷凝)

支持自动化整合

应内置激光条码扫描功能,可以扫描样品侧面的相对湿度

AC220V

4条码器条形码19~25℃20%~80%(无

(±10%)

支持自动化整合冷凝)

≥96通道阵列式移液/加样工具

机械臂定位重现性可达50μm(X、Y、Z轴所有

三个方向)

灵活多通液体处理量程为1-200μl,1-5μl,Cv≤6%,5-相对湿度

AC220V

5道液体工200μl,Cv≤3%19~25℃20%~80%(无

(±10%)

作站系统兼容200μl、100μl、50μl、10μl带滤芯、冷凝)

大吸头等多种一次性吸头

抓扳手应具备断电保护功能,突发断电不掉板

支持自动化整合

≥8个独立通道,通道间距可自动调节

采用液体置换式的移液技术相对湿度

多功能液AC220V

61μl移液误差应≤±1%,CV值≤4%19~25℃20%~80%(无

体工作站(±10%)

5μl移液CV值≤3%冷凝)

支持自动化整合

支持自动感应热盖,自动下压;配置电动反应模AC220V19~25℃相对湿度

块、自动仓门实现自动进出样本(±10%)20%~80%(无

支持96通量PCR扩增,扩增体积范围≥15-100ul冷凝)

7PCR仪最大升降温速率≥4.0℃/s

稳定梯度范围≥30-99.9℃

温度均一性≤±0.3℃,温度精准度≤±0.1℃

支持自动化整合

可自动化封膜,适用于各种微孔板,包括PCR板、AC220V19~25℃相对湿度

深孔板、储存板、酶标板等(±10%)20%~80%(无

封膜温度范围≥:30-200℃冷凝)

8封膜机

封板速度:每块板封膜时间≤8s

自动待机,无需开关

支持自动化整合

可根据微孔板封膜形式自动调整以达到最好撕

膜效果相对湿度

AC220V

9撕膜机每小时撕除≥200张封膜,可撕横置或直置板,19~25℃20%~80%(无

(±10%)

内置撕膜完成确认功能冷凝)

支持自动化整合

5

T/CAGDRSXX—2024

表1自动化整合设备性能(续)

序号设备名称性能参数供电工作温度工作湿度

具备自动孔板离心功能,速度≥3000RPM,兼容

所有符合ANSI标准的96、384、1536孔微孔

相对湿度

板式离心板、PCR专用微孔板等AC220V

1019~25℃20%~80%(无

机最大有效装载量(每个离心腔)≥250g(±10%)

冷凝)

最大平衡许可误差≤10克

支持自动化整合

应用于常规微孔板的洗板及分液工作

应具备快速连续分液能力,分液量程应覆盖范围

≥3-3000ul

分液准确性:≤±3%

分液精确性:≤3%CV

相对湿度

洗板速度:≤96孔板(96道分液头)13秒AC220V

11分液器19~25℃20%~80%(无

分液速度:≤96孔板10uL/孔3秒,≤384孔板(±10%)

冷凝)

5uL/孔6秒

液体传送:正压式蠕动泵

流速:低、中、高速,应可根据样品类型自由选

支持自动化整合

激发/检测范围:≥455-650nm/510-715nm

光源:≥4个单色高强度长寿命LED光源,工作

寿命≥100000小时,终身免维护

检测器:高灵敏度光电倍增管,检测灵敏度高,

相对湿度

能检测到单拷贝DNA模板AC220V

12酶标仪19~25℃20%~80%(无

动态范围:≥10个数量级(±10%)

冷凝)

检测样品量≥96个样品,样品反应体系范围≥

15-100µl

控制系统:通过电脑软件控制

支持自动化驱动整合

采用毛细管电泳原理或微流体芯片原理,可应用

于DNA、RNA等核酸的电泳分析,能进行全自

动的核酸片段大小测定相对湿度

片段检测AC220V

13兼容普通单个0.2mlPCR管、常规8联管、12联19~25℃20%~80%(无

仪(±10%)

管、96孔微孔板冷凝)

分辨率:对<500bp的DNA片段,可达1-4bp的

分辨率,200bp片段可达2bp的分辨率

6核酸提取

6.1样本管理

6

T/CAGDRSXX—2024

6.1.1组织样本管理

宜选取无病虫斑、无发黄枯萎、无霉变、无腐烂、无污染物的新鲜组织进行采集。生物样本的前处

理过程、获取、保存、销毁、运输等操作应符合GB/T37864—2019的要求。

6.1.2样本信息管理

样本应具统一命名规则,每个样本要具有唯一编号。实验开始前,应将样本按命名规则进行统一编

号,然后录入系统,该样本信息在基因型鉴定平台上流转过程中,实验过程和数据分析过程中均应遵循

样本命名规则,避免样本信息产生错误。

6.2核酸提取

不同组织样本类型采用不同的提取设备和方法进行提取。血液类样品(如拭子、血卡、血液等),

宜采用封闭式的核酸提取设备,采用磁珠法进行提取。其余类型的组织样品(如叶片、种子、肌肉等),

宜采用自动化工作站进行核酸提取,采用磁珠法进行提取。提取操作应符合GB/T33681.1—2017、GB/T

37874—2019的要求。

6.3核酸质量控制

核酸提取完成后,进行核酸浓度和核酸片段大小检测。核酸质量应符合GB/T35537—2017的要求

方可进行文库构建。

7文库构建

7.1文库构建

将质量合格DNA进行片段化,将片段两端连上接头,通过PCR扩增后,进行文库片段选择,形成待

测序文库。如果是进行目标区域的靶向测序,还需要用制备好的探针将待测序文库进行杂交捕获,得到

靶向区域的文库,再进行一轮PCR扩增获得最终待测序文库。

7.2文库质控

测序文库分别进行浓度、片段大小的检测,文库浓度≥10ng/μL,文库片段大小主峰在300-500bp

为合格文库。

8基因测序

8.1信号采集

以测序文库为模板,四种带有荧光基团的游离核苷酸dNTP作为底物,在测序酶的作用下,底物核

苷酸与文库模板进行配对与结合,核苷酸结合的荧光基团发出荧光,通过高清摄像头拍摄照片,采集荧

光信号。

8.2信号转换

7

T/CAGDRSXX—2024

对拍摄的照片进行处理分析,进行碱基识别,得到测序原始数据数据(rawdata),输出为FASTQ

格式的数据文件。

9数据分析

9.1数据质量控制

9.1.1数据质量分析

利用生物信息软件对产生的FASTQ格式文件进行数据量、数据质量和完备性进行统计分析,常用的

生信软件有FASTP、FASTQC。应根据GB/T33767.14—2023的要求对DNA测序数据的准确性进行判断,

满足要求则判定为符合质量要求,否则判定为不符合质量要求。

9.1.2测序数据过滤

将符合质量要求的原始数据转化为纯净数据(cleandata),纯净数据的文件仍是FASTQ格式,应

符合GB/T35890—2018的要求,且不应包含测序建库接头序列。

注:接头序列是一段已知的短核苷酸序列,用于连接未知的目标测序片段。

9.2基因型分型

9.2.1序列比对

将经过过滤的纯净数据与目标参考序列进行比对,确定相对位置关系的比对文件。比对过程中每个

短序列应分配一个比对质量值表示映射质量分数,已表明比对过程的可信度;测序深度和覆盖度通过参

考序列的参考基因组位置次数和范围来计算,比对数据准确率应不低于95%。DNA比对数据的格式宜为

SAM/BAM格式。,应符合GB/T33767.14—2023的要求

注1:SAM/BAM格式:基于文本的储存核算序列及其测序质量和序列比对相关的信息,其头部为注释信息,主体部分

以每一行表示一条序列且每行以制表符分隔的标准格式,BAM格式是SAM格式的二进制压缩格式。

注2:比对质量值:比对到错误位置的概率的整数映射,用来衡量比对正确的概率,通常以数字值直接表示。

9.2.2变异检测

基于序列比对结果,利用生信分析工具确定个体基因组中的SNPs、InDel和SVs等变异,输出GVCF

文件。常用的生信分析工具有GATK、FreeBayes等。

在群体研究中,利用生信分析工具整合突变群体的变异信息,主要是SNPs信息,输出VCF文件。

常用的生信分析工具有GATK、samtools、vcftools等。

9.2.3基因型鉴定

基因型鉴定是对vcf文件由适用的分型软件进行SNP分型得到的数据。

SNP分型数据应包含但不限于样本编号、SNP名称和基因型;基因型以ACGT表示,未得到基因型或

无法明确判定基因型的记为“NA”。

对基因型数据的准确性、完备性和可溯性等指标进行统计分析。基因分型数据准确率应不低于98%。

根据GB/T33767.14—2023的要求对序列比对结果分析产生的基因型数据进行判断,满足全部要求

则判定为符合质量要求,否则判定为不符合质量要求。

8

T/CAGDRSXX—2024

10数据质量与安全

10.1数据质量

数据具备准确性、完备性、可溯性,应符合GB/T26237.14—2023的要求。

10.2数据安全

10.2.1数据采集安全

应对采集的数据进行质量检测,保证数据的高质量、完整性,同时防止采集数据过程中的数据污染。

10.2.2数据传输安全

数据传输前应进行文件压缩,常用的压缩方式为gzip。数据传输前后应进行MD5值校验,以确保

传输数据的完整性。

10.2.3数据存储安全

数据存储应进行文件压缩,常用压缩方式为gzip,为方便数据管理和查阅同一个项目的数据还应

进行打包压缩,常用方式为tar。数据存储应进行备份、加密和监控,不同备份应在不同的存放地点进

行保管。

10.2.4数据处理安全

数据的使用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论