版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中华人民共和国国家计量技术规范高通量基因测序仪校准规范2026-04-02发布2026-10-02实施高通量基因测序仪校准规范归口单位:全国生物计量技术委员会主要起草单位:中国计量科学研究院中国测试技术研究院参加起草单位:深圳华大智造科技有限公司本规范委托全国生物计量技术委员会负责解释本规范主要起草人:张永卓(中国计量科学研究院)王晶(中国计量科学研究院)董莲华(中国计量科学研究院)周李华(中国测试技术研究院)杨杰斌(中国测试技术研究院)参加起草人:蒋慧(深圳华大智造科技有限公司)刑楚填(深圳华大智造科技有限公司)I (1)2引用文件 3术语 5计量特性 6校准条件 6.1环境条件 6.2校准用标准物质和试剂 6.3校准用设备及分析软件 7校准项目和校准方法 7.1测序片段总数重复性 7.3碱基识别质量百分比 7.4平均碱基错误率 7.6比对率重复性 7.7序列覆盖率重复性 7.8测序一致序列准确率 7.9序列相对丰度偏差 8校准结果表达 9复校时间间隔 附录C序列相对丰度偏差测量结果的不确定度评定示例 附录DGC含量偏差测量结果的不确定度评定示例 ⅡJJF1071—2010《国家计量校准规范编写规则》、JJF1001—2011《通用计量术语及定义》和JJF1059.1—2012《测量不确定度评定与表示》共同构成支撑本规范制定工作的基础性系列规范。本规范的校准方法及计量特性等主要参考了GB/T30989—2014《高通量基因测序技术规程》、GB/T40226—2021《环境微生物宏基因组检测高通量测序法》、YY/T本规范为首次发布。1高通量基因测序仪校准规范1范围本规范适用于高通量基因测序仪(单次测序长度≤1000bp)的校准,不适用于桑格(Sanger)测序技术为原理的基因测序仪和纳米孔技术为主要原理的单分子测序仪的校准。2引用文件本规范引用了下列文件:GB/T40226—2021环境微生物宏基因组检测凡是注日期的引用文件,仅注日期的版本适用于本规范;凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本规范。3术语GB/T30989—2014、GB/T40226—2021、YY/T1723—2020界定的以及下列术3.1高通量基因测序high-throughputgenesequencing能够一次并行对大量核酸分子进行平行序列测定的技术。3.2高通量基因测序仪high-throughputgenesequencer基于片段化的DNA,依赖独立反应体系进行克隆扩增,能一次对几十万条以上核酸序列(DNA)分子并行序列测定的仪器。[来源:YY/T1723—2020,3.7,有修改]通过生物来源的、人工合成的或克隆技术等所得的一个重建分子群,如基因组文库、互补DNA文库、噬菌体展示肽文库等。将DNA样品随机打断后,在其两端连接带特定序列的接头,在接头之间的序列称标签,所有不同的标签的集合即为标签文库。一类含氮原子的有机杂环化合物,是组成嘌呤和嘧啶的主要成分,是拼出遗传密2[来源:GB/T30989—2014,3.16]在DNA4种碱基中,鸟嘌呤和胞嘧啶所占的比率。3.7测序片段reads高通量测序技术产生的短核苷酸序列。常为几十到数百个碱基。3.8测序读长readlengthofgenesequencing单次运行可以读取的质量合格的序列片段长度,通常以碱基数量表示。[来源:YY/T1723—2020,3.4,有修改]3.9基因测序通量throughputofgenesequencing单次测序可获得序列信息的基因片段数量或可测定的脱氧核糖核酸和核糖核酸(以碱基表示)数量。[来源:GB/T30989—2014,3.21]3.10碱基识别basecalling测序过程中从荧光信号或电学信号转换成序列信息的过程。[来源:GB/T30989—2014,3.26]3.11碱基识别质量qualityofbasecalling衡量碱基被正确识别的概率。通常以数字值直接表示。碱基识别质量与碱基识别错误率之间的关系可用公式(1)表示:式中:Q——碱基识别质量;P——碱基识别错误率。[来源:GB/T30989—2014,3.29]测序数据中,碱基识别质量值为20的碱基识别准确率为99%,或者错误率为1%。[来源:GB/T40226—2021,3.5]测序数据中,碱基识别质量值为30的碱基识别准确率为99.9%,或者错误率为[来源:GB/T40226—2021,3.6]3.14碱基识别错误率inaccuracyofbasecalling单次测序错误碱基数占碱基总数的比例。3[来源:GB/T30989—203.15测序覆盖率coveragerateofsequencing待测样本的核苷酸序列检测结果覆盖于参考序列上的比例(测序覆盖率=覆盖区域长度÷参考序列总长度)。3.16测序深度depthofcoverage待测样本中某个指定的核苷酸被检测的次数。3.17平均覆盖深度averagedepthofcoverage测序深度的平均值。[来源:GB/T30989—20比对到参考序列上的片段数目除以总测序数据的片段数目。3.19序列相对丰度sequencerelativeabundance某一指定序列在总样本中所占的相对比例。序列相对丰度可用公式(2)表示:N——序列相对丰度;n——比对到目标序列的片段数与目标的长度的比;i——第i个序列。[来源:GB/T40226—2021,3.2,有修改]3.20参考数据库referencedatabase已经测序、分析或完全已知的序列数据的集合。高通量测序,也称为大规模并行测序(massivelyparallelsequencing,MPS)或下一代测序(nextgenerationsequencing,NGS),有效解决一代测序(Sanger测序)成本高、通量低、对人力需求高等问题,可一次对几百万到几十亿条核酸分子进行序列测定。目前高通量测序的平台主要有基于桥式PCR扩增结合边合成边测序、乳液PCR扩增结合半导体合成测序、DNA纳米球滚环扩增结合联合探针锚定聚合技术等技术原理的测序仪。高通量测序仪(以下简称测序仪)主要由主机、基因测序仪控制软件组成,其中4主机包括主体架构、操作系统主机、光学系统、XYZ平台、芯片平台、气液系统、电子控制系统、试剂存储系统、电源系统、显示系统等组成(详见图1)。光学系统光学系统芯片平台XYZ平台电路操作系统主机电子控制系统气液系统显示系统电源系统气液路图1测序仪结构示意图5计量特性测序仪的计量特性,如表1所示。表1测序仪的校准项目序号12345比对率6比对率重复性7892测序数据量至少占被校准测序仪最大通量的1%或满足相关标准物质最低分析数据6校准条件6.1环境条件6.1.1环境温度:(10~30)℃。6.1.2相对湿度:≤80%,无冷凝水。6.1.3室内应具备良好的防尘措施,测序仪应远离振动、电磁干扰。注:上述条件与制造商的产品规定不一致时,以产品规定为准。56.2校准用标准物质和试剂6.2.1标准物质:校准时应采用来源稳定、溯源信息完备、参考序列信息已知的片段化DNA序列有证标准物质。该标准物质应至少包含两条参考序列,每条参考序列长度≥10kbp且不具有影响校准性能评估的特征序列。参考序列相对丰度范围应在40%~60%之间,其扩展不确定度≤15%(k=2)。6.2.2配制校准用标准物质所需超纯水:电阻率不小于18.2MΩ·cm(25℃)。6.3校准用设备及分析软件6.3.1移液器:最大量程为10μL、200μL、1000μL,检定合格。6.3.2分析软件:原始数据分析使用FastQC、Fastp、Trimmomatic等;比对分析使用BWA、Bowtie、Bamstats、Samtools等;数据统计分析使用SAS、SPSS等。7校准项目和校准方法将测序仪开机预热30min,确保仪器达到正常工作状态后,按照测序仪上机流程对标准物质进行测序,重复测定3次,将下机数据使用分析软件处理,与参考序列比对并进行统计分析,按照下面的校准方法开展校准。7.1测序片段总数重复性通过下机软件分析获得每次测序的总片段值,根据公式(3)用总片段的相对标准偏差作为测序片段总数的重复性。式中:RSDreads—测序总片段的相对标准偏差,以百分数表示;Rmax——3次测定结果的最大值;Rmin——3次测定结果的最小值;R—3次测定结果的平均值;7.2GC含量偏差测序获得GC的碱基数和总的碱基数,根据公式(4)计算测序GC含量。重复测定3次,分别获得GC含量百分比,根据公式(5)和公式(6)计算GC含量偏差。6式中:GC%——测序碱基是G和C的碱基数占总碱基数的比例;nGc——测序碱基是G和C的碱基数;△GC%——GC含量偏差;GC%—测序GC含量结果平均值;GC%s——GC含量标准值;GC%,——第i次测序GC含量;n——测量次数。7.3碱基识别质量百分比测序数据通过下机软件分析获得每次测序碱基识别准确率为99%和99.9%的碱基数量以及总碱基数,根据公式(7)和公式(8)分别计算测序Q20、Q30的结果。式中:Q20——测序碱基识别准确率为99%的碱基含量占比,以百分数表示;Q30——测序碱基识别准确率为99.9%的碱基含量占比,以百分数表示;NQ20碱基——碱基识别准确率为99%的碱基数;NQ30碱基——碱基识别准确率为99.9%的碱基数;7.4平均碱基错误率公式(10)计算平均碱基错误率。式中:P——平均碱基识别错误率,以百分数表示;Q——所有碱基识别质量的平均值;Q——第i个碱基识别质量值。7.5比对率测序获得的原始数据,通过比对软件与参考序列进行比对,根据公式(11)计算7测序比对率。式中:R比对率——测序比对率,以百分数表示;nmap——比对到参考序列上的片段数目;N总reads——总测序数据的片段数目。7.6比对率重复性获得3次测序数据的比对率,根据公式(12)计算测序比对率的重复性。式中:RSD比对率——测序比对率的重复性,以百分数表示;Rmax—3次测定比对率结果的最大值;Rmin——3次测定比对率结果的最小值;R比对率——3次测定比对率结果的平均值;7.7序列覆盖率重复性测序获得的原始数据,通过比对软件与参考序列进行比对分析,获得覆盖率。根据公式(13)和公式(14)计算测序覆盖率重复性。式中:RSD覆盖率——测序覆盖率的重复性,以百分数表示;3次测定覆盖率结果的最小值;L覆盖率—3次测定覆盖率结果的平均值;L总长——参考序列总长度。7.8测序一致序列准确率测序获得的原始数据,通过比对软件与参考序列进行比对分析,根据公式(15)计算测序一致性序列准确率。8式中:AC——测序一致序列准确率;MS——指定目标区域错配碱基数;MB——指定目标区域碱基数。7.9序列相对丰度偏差测序获得的原始数据,经比对后进行统计分析,根据公式(2)获得目标序列相对丰度,根据公式(16)计算目标序列相对丰度偏差。式中:N—3次测序目标序列相对丰度平均值,%;N——目标序列相对丰度标准值,%。8校准结果表达校准记录应详尽地记载测量数据和计算结果,推荐的校准记录格式见附录B。各测量结果的测量不确定度应按JJF1059.1的要求评定,不确定度评定示例见附录C。经校准的测序仪应出具校准证书,校准证书应符合JJF1071—2010中5.12的要求。9复校时间间隔由于复校时间间隔的长短是由测序仪的使用情况、使用者、测序仪本身质量等诸因素所决定的,因此送校单位可根据实际使用情况自主决定复校时间间隔,建议不超过1年。9附录A校准原始记录参考格式客户名称器具名称型号/规格出厂编号生产厂商客户地址校准日期校准环境条件及地点温度湿度其他基础信息读长类型设备最大通量测序试剂型号数据量123片段数l23三、碱基识别质量及平均碱基错误率123123比对率l23123123附录B校准证书(内页)参考格式序号校准项目校准结果12GC含量偏差(GC%)不确定度:(k=2)345比对率6比对率重复性789不确定度:(k=2)序列相对丰度偏差测量结果的不确定度评定示例C.1测量模型相对丰度偏差可由公式(C.1)给出:△N=N-N式中:N——3次目标相对丰度测定结果的算术平均值,%;N₃——标准物质的相对丰度标准值,%。C.2不确定度来源不确定度来源包括:a)测序仪测量重复性引入的标准不确定度u(N);b)标准物质引入的标准不确定度u(N)C.3标准不确定度的评定C.3.1测量重复性引入的标准不确定度u(N)实际校准时在重复性条件下连续测量3次,以3次测量的算术平均值作为结果,计算其实验标准偏差s和标准不确定度u(NN)。其中,式中:Sn——实验标准偏差,%;Nmax——3次测定结果的最大值,%;N.——3次测定结果的最小值,%;结果见表C.1。NN1232.1%C.3.2标准物质引入的标准不确定度u(Ns)由标准物质引入的不确定度分量u(N)可以根据标准物质证书提供的扩展不确定度U(N)和包含因子k根据公式(C.4)计算:式中:u(Ns)——U(N)——标准物质引入的标准不确定度;标准物质证书提供的扩展不确定度;k——标准物质证书提供的包含因子。经计算得u(Ns)=2.6%。C.4合成标准不确定度u△由公式
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼儿园教师信息技术应用能力评估研究-基于幼儿园信息化教学应用调查数据分析
- 2026年江西省综合评标专家库交通行业评标专家考试练习题及答案
- 阜新市广播电视编辑记者资格考试(广播电视业务)能力提高训练试题库(2025年)
- 菏泽市评标专家住建类实务题(2025年)
- 2026年吉林广播电视播音员主持人资格考试(广播电视播音主持业务)复习题库含答案
- 广东省茂名市新闻记者考试(新闻采编实务)复习题库含答案(2025年)
- 2025年广播电视编辑记者资格考试(广播电视业务)能力提高训练试题库(湖南湘西州)
- 【地理 云南版】2025年高考云南卷地理高考真题文档版(无答案)
- 2025-2030年自愈合混凝土技术企业制定与实施新质生产力战略分析研究报告
- 新形势下酒店客房床行业顺势崛起战略制定与实施分析报告
- 尼康coolpix4500使用说明书
- 物种互作关系研究-洞察及研究
- 非营业性演出管理办法
- 优抚政策培训课件下载
- 2025年河北省中考化学试卷真题(含答案解析)
- 军事伪装道路施工技术专题
- 2025年高考数学全国一卷试题真题及答案详解(精校打印)
- 农村建别墅可行性研究报告
- 踝泵运动技术规范
- 成人癌性疼痛护理团体标准
- 实验室生物安全应急预案
评论
0/150
提交评论