服务内容和要求_第1页
服务内容和要求_第2页
服务内容和要求_第3页
服务内容和要求_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、服务内容和要求对10份细菌DNA样品细菌完成图测序及数据分析。对130株细菌进行全基因组DNA框架图测序,获得基因组序列,后期通过生物信息学分析找到每株菌株所含有的功能基因。(一)细菌DNA完成图测序技术参数1. Illumina Hiseq建库测序流程:Illumina Hiseq测序保证每个样品至少100X的数据量    (1)基因组DNA收集:完成基因组DNA抽提后,利用1%琼脂糖凝胶电泳检测收集基因组DNA;    (2) 基因组DNA片段化:将基因组DNA打断为300-500 bp;    (3) 文库构建:在DNA片段两端

2、连接A&B接头,筛选,PCR扩增;    (4) Illumina Hiseq测序:将扩增好的文库上机测序。2. 单分子测序建库测序流程:Nanopore测序保证每个样品至少100X的数据量    (1) DNA纯化与检测:利用Qubit3.0检测基因组DNA浓度; (2)单分子测序建库:1)将基因组DNA处理成6k左右的片段,2)DNA损伤修复和末端修复,磁珠纯化;3)接头连接,磁珠纯化;    (3) Qubit文库定量,上机测序。3.数据质控标准:(1)过滤reads尾部质量值20以下的碱基;(2)去除含N的reads;

3、(3)根据PE reads之间的overlap关系,将成对reads拼接(merge)成一条序列,最小overlap长度为10bp,拼接序列的overlap区允许的最大错配比率为0.2,筛选不符合序列;(4)根据序列首尾两端的barcode和引物区分样品,并调整序列方向,barcode允许的错配数为0,最大引物错配数为2。(5)单分子测序:细菌基因组测序组装100%覆盖(0gap)4.结果交付交付要求:1、交互分析结果:分析模块分析大类分析内容一、基因组组装基因组组装及结果评估组装获得高质量的基因组序列二、基因组结构研究1.编码/非编码基因预测准确定位变异位点2.重复序列分析分析基因组重复序列

4、结构3.基因岛预测预测基因组内基因岛结构三、基因基本功能注1.常见功能数据库注释(NR、GO、KEGG、COG、SwissProt、Pfam)通过常见权威数据库解释编码基因功能2.全基因组功能圈图展示(完成图)全面总览基因组组分情况3.基因组甲基化修饰分析(完成图)总览基因组甲基化修饰情况四、菌株致病相关研究1.分泌系统效应蛋白、病原与宿主互作、分泌蛋白、次级代谢产物基因簇从胞外分泌、宿主互作等机制解释菌株致病性2.动物病原数据库注释(VFDB、ARDB)动物毒性及耐药性相关基因3.植物病原数据库注释(CAZy)纤维降解及糖类代谢相关基因五、个体深入变异解析1.基因组间共线性分析基因组一对一共

5、线性比较寻找基因组间同源序列2.基因组间变异检测以共线性区域为基础全面解析基因组间变异信息六、群体进化历史解读1.Core-pan基因解析构建Core-pan基因集合单拷贝基因用于进化分析2.进化树构建、ANI、cgMLST构建菌株间进化关系解析菌株起源传播规律  2、分析参数要求:平台可以进行多参数调节(5种分类水平、20种以上距离算法,多种呈图配色、自由分组,分组合并等)1、 项目周期:样本质检合格后35个工作日/批次(二)细菌DNA框架图测序技术参数1、测序要求使用Illumina Novaseq测序平台进行测序,测序读长为2X150bp,进行细菌基因组DNA序列测定。由于本项

6、目是框架图测序,因此所建文库为350bp小片段文库,测序质量Q20 95%、Q30 90%。2、测序深度为每个样本不低于100X的测序深度。3、在收到每批样本并质检合格后,保证每一批次样本在30个自然日内完成项目内容。总计560株样本需在40个工作日内完成项目内容。4、要求操作人员有严格的培训和评估并且有严格的流程管理。 5、数据分析过程要求5.1数据质控及产出统计5.2框架图初步组装5.3框架图组装结果情况的评估5.4框架图基因组组分分析(1)编码基因预测(2)重复序列(3)非编码RNA预测(4)基因岛(5)前噬菌体(6)CRISPR5.5 通用基因功能注释(NR、GO、COG、KEGG、P

7、fam、SwissProt)5.6 病原细菌致病性和耐药性分析(适用于病原菌)(1)分泌系统效应蛋白预测(革兰氏阴性菌)(2)病原与宿主互作数据库(PHI)注释(3)细菌致病菌毒力因子(VFDB)注释(4)耐药基因(ARDB、CARD)注释(5)信号肽、跨膜结构及分泌蛋白预测(6)次级代谢产物基因簇注释(7)膜转运蛋白数据库(TCDB)注释5.7 细菌群体多样性分析(1)ANI分析(2)群体系统进化树分析(3)群体PCoA分析(三)验收标准 1、每个样品的测序总数据量达到1G以上。2、每个样品的测序深度不低于100X的测序深度。3、原始数据的测序质量Q20 95%、Q30 90%。4、采用SO

8、AP denovo,SPAdes和ABySS三个软件同时进行组装,并优化到最优组装结果。5、框架图基因组组分分析(1)编码基因预测:使用GeneMarkS软件对新测序的基因组进行编码基因预测。(2)重复序列:通过RepeatMasker软件进行散在重复序列预测,TRF(Tandem Repeats Finder,)搜寻DNA序列中的串联重复序列。(3)非编码RNA预测tRNA:通过tRNAscan-SE软件对tRNA进行预测;rRNA:一是通过与近缘参考序列的rRNA库比对,二是用rRNAmmer软件预测;sRNA:首先进行Rfam database的比对注释,接着用cmsearch程序确定最

9、终的sRNA。(4)基因岛:基于序列组成,采用IslandPath-DIOMB软件预测基因岛,其通过检测序列中二核苷酸偏向性(phylogentically bias)和移动性基因(mobility genes,如转座酶或整合酶)以判定基因岛以及潜在的水平基因转移。(5)前噬菌体:通过phiSpy软件预测样品基因组上的前噬菌体。(6)CRISPR:利用CRISPRdigger对样品基因组进行CRISPR预测。6 通用基因功能注释,包括:NR、GO、COG、KEGG、Pfam、SwissProt。7 病原细菌致病性和耐药性分析(1)分泌系统效应蛋白预测(革兰氏阴性菌)使用SignalP、TMHM

10、M工具进行预测,检测是否含有信号肽及跨膜结构,综合预测蛋白序列是否是分泌蛋白。(2)病原与宿主互作数据库(PHI)注释该数据库中的每个基因都包含核酸和氨基酸序列,以及感染宿主过程中预测的蛋白功能的详细描述。(3)细菌致病菌毒力因子(VFDB)注释使用 Diamond 软件,把目标物种的氨基酸序列,与VFDB数据库进行比对,把目标物种的基因和其相对应的毒力因子功能注释信息结合起来,得到注释结果。(4)耐药基因(ARDB、CARD)注释使用Diamond软件,把目标物种的氨基酸序列,与ARDB数据库进行比对,把目标物种的基因和其相对应的耐药功能注释信息结合起来,得到注释结果。(5)信号肽、跨膜结构

11、及分泌蛋白预测使用信号肽预测工具 SignalP 进行预测,检测是否含有信号肽及跨膜结果,综合预测 蛋 白序列是否是分泌蛋白。 (6)次级代谢产物基因簇注释采用antiSMASH程序对基因组进行预测。(7)膜转运蛋白数据库(TCDB)注释TCDB,全称是Transporter Classification Database,转运蛋白分类数据库,是膜转运蛋白,包括离子通道(ion channels)的分类系统(TC system)。TCDB数据库转移系统以5个级别进行分类。8.细菌群体多样性分析(1)ANI分析将其中一个基因组序列依次打断成 1020bp 的片段,将这些片段与另一基因组进行 blastn 比对,选出每个片段最好的比对结果。进一步筛选 id

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论