TCI 085-2022 便携式纳米孔测序数据的获取、处理、传输、储存与分析的技术标准_第1页
TCI 085-2022 便携式纳米孔测序数据的获取、处理、传输、储存与分析的技术标准_第2页
TCI 085-2022 便携式纳米孔测序数据的获取、处理、传输、储存与分析的技术标准_第3页
TCI 085-2022 便携式纳米孔测序数据的获取、处理、传输、储存与分析的技术标准_第4页
TCI 085-2022 便携式纳米孔测序数据的获取、处理、传输、储存与分析的技术标准_第5页
已阅读5页,还剩31页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS!11.040CCS!C30/49团 体 标 准"#$% +,-./0123 >?@ABCDETheTechnicalStandardforPortableNanoporeSequencing:DataAcquisition,Processing,Transmission,StorageandAnalysisHI JKLMMNOBPQRHIT/CI085-2022S T围 1件 1义 1序 4理 4理 4理 5⽚ 6计 6⼯ 6⼯ 7件 7求 7求 8求 8求 8求 8备 8程 9则 9则 障 制 性 性 离 志 理 缩 缩 式 T/CI085-2022输 输 于输 输 性 性 具 析 析 台 库 台 II鏈 鏈T/CI085-2022U V本⽂件按照GB/T1.1-2020《标准化⼯作导则第1部分:标准化⽂件的结构和起草规则》起草。某些内容可能涉及专利,本⽂件的发布机构不承担识别这些专利的责任。本⽂件由东南⼤学和中移(成都)信息通信科技有限公司联合提出。本⽂件由中国国际科技促进会归⼝。成都本⽂件是⾸次发布。III鏈 鏈T/CI085-2022+,-./0123 6789:8;<8=>?@ABCDEWX本⽂件规定了便携式纳⽶孔基因测序的要求,实验⽅法,数据的获取,处理(检测、加密、压缩),传输,分析等内容。* YWZ[\]^本包括所有的修改单适⽤于本⽂件。GB/T30989-2014⾼通量基因测序技术规程YY/T1723-2020⾼通量基因测序仪GB/T25069信息安全技术术语GB/T27990-2011⽣物芯⽚基本术语C_`ab下列术语和定义适⽤于本⽂件de12 fghg igjkghlmhf和胸腺嘧啶或者尿嘧啶等碱基的组成或排列顺序。[来源:YY/T1723-2020]12no pqrskfqtkp su fghg igjkghlmhf单次测序可获得序列信息的基因⽚段数量或可测定的脱氧核糖核酸和核糖核酸数量(以碱基表示)。[来源:GB/T30989-2014]1鏈 鏈T/CI085-2022vw trsxg探针是指能识别特定碱基序列的、经过⼈⼯标记的⼀⼩段单链核酸分⼦,即⼀段与被测定的核苷酸序列(靶序列)互补的带标记的单链核苷酸。[来源:GB/T30989-2014]zd{| x}ig l}~~mhf测序过程中从电信号转换成序列信息的过程。Ÿ0Ä^ pr}hi~sl}pmsh gÅghptrspgmh h}hstsrg igjkghlmhfDNA或RNADNARNA序列。Üá./012 is~mà)ip}pg h}hstsrg igjkghlmhf针杂交进⾏核酸序列靶向区分。âäZ lshumàghpm}~mpã使信息不泄露给未授权的个⼈、实体、进程不可⽤或不泄露的性质。[来源:GB/T25069-2022]3âç à}p} trspglpmsh采取管理或技术措施,防范未经授权访问数据。2鏈 鏈T/CI085-2022[来源:GB/T25069-2010]3éèZ à}p} mhpgfrmpã数据没有遭受以未授权⽅式所作的更改或破坏的特性。[来源:GB/T25069-2010]êä ghlmtqgrëghp#ghlrãtpmsh对数据进⾏密码变换以产⽣密⽂的过程。⼀般包含⼀个变换集合,该变换使⽤⼀套算法和⼀套输⼊参量。输⼊参量通常被称为密钥。[来源:GB/T25069-2010]íìîï xmslqmt能够并⾏处理和分析样品中⽣物或化学信息的微型器件。[来源:GB/T27990-2011]ñóòîï ëmlrsu~kmàml lqmt[来源:GB/T27990-2011]trspgmh h}hstsrg lqmt息的微型器件。Üá./0îïis~mà)ip}pg h}hstsrg lqmt息的微型器件。+,-./12 tsrp}x~g h}hstsrg igjkghlmhfSanger“纳⽶孔3鏈 鏈T/CI085-2022DNA或RNA分⼦就从纳⽶孔从带负电荷的“顺式”侧驱动到带正电荷的“反式”yô2便携式纳⽶孔测序包括以下阶段:蛋⽩纳⽶孔和固态纳⽶孔的芯⽚设计和加1所示。ö+,-./012DEóôõúö( 12ù:ÉÑ./012ù:4鏈 鏈T/CI085-2022纳⽶孔。图2.⽣物蛋⽩纳⽶孔测序原理示意图(来源于维基百科)Üá./012ù:在绝缘膜的两侧充满盐溶液如氯化钾溶液引起电信号变化图象。5鏈 鏈T/CI085-2022图.和将核(b),使得电流发⽣明显变化,因此,可在测序数据中判定核酸过孔事件的电流幅值及持续事件等特征(d)。Ç 12îïîïûü†°¢纳⽶孔芯⽚结构设计上必须包含三个部分:ê£α-β桶区可插⼊到脂双分⼦层中形成跨膜通道。6鏈 鏈T/CI085-2022ê£Ö 12®©•¶RNA酶等对核在整个提取操作过程中应采⽤安全有效的防护措施。具体要求应符合GBSN/TSN/T提取核酸的⽅法要符合核酸提取纯化⽅法评价通则GB/T的GB/T。T/SZAS过程中的要求。将提取的核酸样品或DNARNAGB/T准。提取核酸的质量要求包括:Qubit浓度:若ng/ul则按照进⾏测序,若ng/ul则按照进⾏测序;Nanodrop质量:;推荐使⽤Agilent核酸的⽚段⻓度≥1Kb。7T/CI085-2022DNA6个⽉或在则在T/SZAS标准。D•¶Fast5byte,Fastqbyte。。纳⽶孔测序仪需要能够⾄少⼩时稳定⽆故障连续运⾏,正常蛋⽩孔的以上孔才能运⾏。≥10kHz。当DNA通过纳⽶孔时电信号采样时间建议以获得测序速度与测序准确性两个核⼼指标最优为佳。D•¶⽤于DNA测序的纳⽶孔测序仪采集电信号时信噪⽐⾄少⽐SNRΔI为设备运⾏过程中膜两侧电压产⽣的电流噪⾳的均⽅根)⽤于DNA测序的固态纳⽶孔测序仪中测序芯⽚上的各个固态孔之间差异≤±5%,使⽤固态纳⽶孔测序仪检测⼤量扩增的单段样本DNA序列,⽐较不同孔电信号的均⼀性。设备⻓时间运⾏循环检测同⼀份样本库中提取出的DNA°™\•¶A给出了便携式基因测序设备的使⽤条件。J¨Ü£Æ•¶B给出了便携式基因测序设备的实验室⼯作条件。8T/CI085-202212Ø•T±`°™实验室通⽤离⼼机,应符合的要求。PCR。的要求。的要求。的要求。冰箱温度的调节范围为。' +,-./012óô+,-ÉÑ./012nc便携式蛋⽩纳⽶孔测序流程必须包含以下三个部分:(DNAcDNA或RNA)⽚段两端连上接头和标签,形成待测序核酸样品的测序⽂库;测序信号的分析:对得到的测序信号进⾏处理分析,通过碱基识别将Fast5电信号⽂件解码为Fastq⽂件(核苷酸碱基序列信息)。(DNA、cDNA或RNA)提⾼clamprecordingtechnique)进⾏放⼤和⽣Fast5⽂⽤GUPPY等软件进⾏basecalling,⽣成Fastq⽂件。在使⽤基因组快速PCR法进⾏蛋⽩纳⽶孔测序时,⾸先将打断后的待测序的核酸(DNAcDNA或RNA)PCR9T/CI085-2022通过蛋⽩孔;最后收集过孔时的电信号变化,通过GUPPY等软件,对采集得到的信号进⾏碱基识别(basecalling)分析。PCR去除碱基修氢盐转化需要PCR,从⽽可以保存DNA和RNA+,-Üá./0ߥ12nc便携式固态纳⽶孔杂交测序流程必须包含以下三个部分:将待测序的核酸(DNAcDNA或RNA)对得到的测序信号进⾏处理分析。浓度应低于1ng/µLDNAT/SZASA/D变换,从⽽获得abfå 3µ_â‚如验证码或⼝令验证机制等T/CI085-2022可查的告警信息。3âäZ解密操作应采⽤国家密码⾏政主管部⻔认可的密码算法。密算法获得明⽂保证数据的可⽤性。3éèZ9.3.1应能够对本地测序数据进⾏完整性校验,校验数据的完整性是否被破坏,防⽌数据被刻意的篡改删除或插⼊。当检测到数据完整性被破坏时,应向管理员提供可查的告警信息。3µ_ºº⽤户对其他⽤户数据的⾮法访问。所有⽤户的操作⽇志。¿¡3¬ƒƒ:¬ƒID如仪器编号等reads中重利⽤数11T/CI085-2022KarpLevenshteinDistanceindexFastqBow)是对这⼏种策略的综合。QUIP使⽤时注意数据可信程度和压缩率的平衡。¬ƒ固态纳⽶孔数据压缩针对检测装置输出的原始电信号⽂件通常以abf格式存储),数据由元数据和各采样点的序列电流值组成。的⽅式来进⾏压缩。固态纳⽶孔测序数据⽂件5如算法与哈夫曼编码的压缩算法结合可以极⼤的缩减数据T/CI085-2022序数据进⾏压缩与解压缩处理后对数据进⾏完整性⽐对,确保压缩算法的保真性。经过对上述采集的数据进⾏压缩测试,压缩率达到89%以上,压缩时间在5s左右。3;<-3;<延时传输能⼒以及商⽤的CPE终端,切⽚和动态专⽹技术能够保证这些要求的满⾜和便捷实现。云端计算平台根据设备参数、所属应⽤场景及优先级等条件,对⽹络资前者持续发送数据给后者。3;<设备通过卫星互联⽹或卫星专⽹,与云端计算平台建⽴连接,系统应能13T/CI085-2022云端计算平台根据设备参数、所属应⽤场景及优先级等条件,对⽹络资前者持续发送数据给后者。3;<设备通过WLAN与云端计算平台建⽴连接,系统应能对WLAN连接的确保只有授权⽤户能够进⾏数据传输。云端计算平台根据设备参数、所属应⽤场景及优先级等条件,对⽹络资前者持续发送数据给后者。14T/CI085-2022建⽴连接,并继续数据传输。3;<只有授权⽤户能够进⾏数据传输。云端计算平台根据设备参数、所属应⽤场景及优先级等条件,对⽹络资前者持续发送数据给后者。3éèZ在数据传输过程中采⽤国家密码⾏政主管部⻔认可的加密算法对数据的当监测到传输过程数据完整性受损时需要从本地备份重新发送数据。3âäZ确保数据不会在传输过程中被⾮法读取。./0123@Aóô†£÷+,-ÉÑ./012íì]îÿ@A15T/CI085-2022便携式蛋⽩纳⽶孔测序⽣信分析的常规流程及⼯具如图4过碱基识别得到的FastqEPI2ME平台OxfordNanoporeTechnologies商业软件或开源分析⼯nanopack(/wdecoster/nanopack)等⼯具。16T/CI085-202217T/CI085-2022图4.便携式蛋⽩纳⽶孔测序常规⽣物信息学软件分析⼯具便携式蛋⽩纳⽶孔测序主要采⽤以下代表性⼯具:GUPPYMetrichor软件OxfordNanoporeTechnologies商业软件)Bonito(/nanoporetech/bonito)BasecRAWller(/)Chiron(/haotianteng/Chiron)DeepNano(/vboza/deepnano/src/master/)Flappie(/nanoporetech/flflappie)Nanocall(/mateidavid/nanocall)便携式蛋⽩纳⽶孔测序主要采⽤以下⼯具进⾏质检:MinKNOWnanoQC(/wdecoster/nanoQC)NanoPlt/wdecoster/NanoPlot进⾏质检的可视化绘图;在进⾏质检后,⼀般会使⽤Filtlong(/rrwick/Filtlong)对于质量不合格的序列进⾏过滤和剪切。序列⽐对通常分为格式转换和序列⽐对两个步骤:格式转换或者是序列的截取:samtools(/samtools)seqkit(/shenwei356/seqkit/releases)seqtk(/lh3/seqtk)序列⽐对:Minimap2(/lh3/minimap2)(/lh3/bwa.git)GraphMap(/isovic/graphmap)Kart(/hsinnan75/Kart)LAMSA(/hitbc/LAMSA)LAST(http://last.cbrc.jp/)NanoPipe(http://bioinformatics.uni-muenster.de/)NGMLR(/philres/ngmlr)18T/CI085-2022便携式蛋⽩纳⽶孔测序进⾏组装时经常使⽤以下软件:Miniasm(/lh3/miniasm)Wtdbg2(/ruanjue/wtdbg2)Flye(/fenderglass/Flye)Canu(/marbl/canu/releases)Cobbler(/bcgsc/RAILS)HINGE(/HingeAssembler/HINGE)LINKS(/bcgsc/LINKS)(/xiaochuanle/MECAT)Medaka(https://nanoporetech.github.io/medaka/index.html)NanoPipe(http://bioinformatics.uni-muenster.de/tools/nanopipe2/index.hbi)Nanopolish(/jts/nanopolish)npScarf(/mdcao/npScarf)PBJelly(/projects/pb-jelly/)Racon(/isovic/racon)RAILS(/bcgsc/RAILS)(/ruanjue/smartdenovo)便携式蛋⽩纳⽶孔测序对组装好的序列进⾏优化时经常使⽤medaka(https://nanoporetech.github.io/medaka/index.html),在进⾏评估时使⽤(/)。组装好完整的序列之后,我们可以进⾏SNP(singlenucleotidepolymorphism,单核苷酸多态性SV(structure分析,主要采⽤以下⼯具:nanopolish(/jts/nanopolish.git)nanosv(/mroosmalen/nanosv)ngmlr(/philres/ngmlr)Sniffles(/fritzsedlazeck/Sniffles/releases)Clair(/HKU-BAL/Clair)HapCUT2(/vibansal/HapCUT2)Medaka(https://nanoporetech.github.io/medaka/index.html)NanoPipe(http://bioinformatics.uni-muenster.de/tools/nanopipe2/index.hbi)Nanopolish(/jts/nanopolish)PBHoney(/projects/pb-jelly/)19T/CI085-2022Snifflfles(/fritzsedlazeck/Snifflfles)WhatsHap(https://whatshap.readthedocs.io/en/latest/)ont-tombo(/nanoporetech/tombo)进⾏甲基化分析kraken2(/DerrickWood/kraken2)分析Metaphlan3.0(/biobakery/MetaPhlAn/wiki/MetaPhlAn-3.0)进⾏微⽣物的物种丰度分析NCBI的Ref,Nt数据库、Genbank数据库、SWISS-PROT数据库等。对于涉及重要⽣物信息的机密⽣物信息资源例如关系到国家安全的)或者需要快速分析的数据例如对单⼀物种数据需⾃建库⽤于分析。pipeline可以将多个⼯具链接在⼀起。⽬前主流的⽣物信息学workflowmanager如下:Galaxy(/galaxyproject/galaxy)KNIME(/)Snakemake(/snakemake/snakemake)Nextflow(/nextflow-io/nextflow)GenPipes(/c3g/GenPipes)bPipe(/ssadedin/bpipe)Pachyderm(/pachyderm/pachyderm)SciPipe(/scipipe/scipipe)Luigi(/spotify/luigi)pipeline使⽤这些管道进⾏信息分析,或者重⽤这些pipelines进⾏进⼀步开发。nf-core(https://nf-co.re/)snakePipes(/maxplanck-ie/snakepipes)Snakemake-Workflow(/snakemake-workflows/)GenPipes(/mugqic/genpipes/src)20T/CI085-2022GalaxyCommunity(/community/)BioWDL(https://biowdl.github.io/)KNIMEHub(/)@A⽩纳⽶孔类似的直接测序任务,故根据特定测序任务的要求,固态纳⽶孔测序采否存在和探针序列互补的核酸序列。图5.便携式固态纳⽶孔测序分析流程便携式固态纳⽶孔测序分析流程可分为如下三步:DNA通过纳⽶孔的所有事件发21T/CI085-2022DNAeventsDNA不是以线性构象通过纳⽶孔发⽣)DNADNA⽶孔时导致对⽅电流变化明显⼤于单链DNADNA过孔事件⽣了杂交反应;种类和丰度的确定。stem/acquisition-and-analysis-software/pclamp-software-suite)EasyElectrophysiology()OpenNanopore(https://www.epfl.ch/labs/lben/79460-en-html/)Transalyzer(https://ceesdekkerlab.nl/research/downloads/)MOSAIC(/usnistgov/mosaic)EventPro(/eventpro.html)AutoNanopore(/bellstwohearted/AutoNanopore)3Ÿ†⁄¤‹Ÿ建议使⽤InnoDBCPU内存缓存⻚优化使得资源利⽤率更⾼。22T/CI085-2022建议使⽤UTF-8Event。建议禁⽌存储⼤⽂件或者⼤照⽚。⼤⽂件和照⽚存储在⽂件系统,URI存储在数据库中。IP连接数据库。名称后加-s标识,备库在名称后加-ss标识;线上从库:dj.xxx-s.db;线上备库:dj.xxx-sss.dbidx_xxxuniq_xxx。插⼊性能,可以避免pagedeleteNOTNULL的列使索引/索引统计/MySQLnull这种类型MySQL数据库字段设计时建议禁⽌使⽤TEXTBLOB字段建⽴索引会⼤⼤降低数据库性能。数据。23T/CI085-2022建议禁⽌使⽤SELECT读取不需要的列会增加CPUIONET消耗;使⽤SELECT*容易在增加或者删除字段后出现程序BUG。建议禁⽌使⽤INSERTINTOt_xxxVALUES(xxx),建议显示指定插⼊的列属性。建议禁⽌使⽤属性隐式转换。SELECTuidFROMt_userWHEREphone索引。WHERE条件的属性上使⽤函数或者表达式。%!=、<>、!<、!>、NOTIN、NOTLIKE等,会导致全表扫描。建议禁⽌⼤表使⽤JOIN表,消耗较多内存与SQL本标准以“肺部微⽣物数据库”以“肺部微⽣物数据库”为例,其具体模块包括:FastqBlast其具体的物种分类界⻔纲⽬科属种。6所示为⼀个肺部微⽣物数据库的架构图示例。24T/CI085-2022图6.肺部微⽣物数据库架构示例›fi./012@A⁄¤‹运⾏基于互联⽹或者⼩型增值应⽤时,通常采⽤开放的服务器架构Unix服务器是更适⽤的选择。SAN会具有更强的适⽤性。25T/CI085-2022⼀个不错的解决⽅案。排的作⽤。⼀过程中,平台应具备相应的计算分析⼯具,在⽤户从前端⻚⾯上传数据完毕后MQ7所示为⼀个纳⽶孔测序数据计算分析平台的架构图示例。26T/CI085-2022图7.便携式纳⽶孔基因测序计算分析平台架构示例27T/CI085-2022附 录 A(规范性附录)测序设备推荐使⽤条件便携式蛋⽩纳⽶孔测序仪进⾏基因测序的正常⼯作条件如下:便携式蛋⽩纳⽶孔测序芯⽚的贮存条件如下:4℃

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论