服务内容和要求_第1页
服务内容和要求_第2页
服务内容和要求_第3页
服务内容和要求_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、服务内容和要求(一) 服务内容 对560株细菌进行全基因组DNA序列框架图测定,获得基因组序列,后期通过生物信息学分析找到每株菌株所含有的功能基因。(二)服务要求1、测序要求使用Illumina Novaseq测序平台进行测序,测序读长为2X150bp,进行细菌基因组DNA序列测定。由于本项目是框架图测序,因此所建文库为350bp小片段文库,测序质量Q20 95%、Q30 90%。2、测序深度为每个样本不低于100X的测序深度。3、在收到每批样本并质检合格后,保证每一批次样本在30个自然日内完成项目内容。总计560株样本需在40个工作日内完成项目内容。4、要求操作人员有严格的培训和评估并且有严

2、格的流程管理。 5、数据分析过程要求5.1数据质控及产出统计5.2框架图初步组装5.3框架图组装结果情况的评估5.4框架图基因组组分分析(1)编码基因预测(2)重复序列(3)非编码RNA预测(4)基因岛(5)前噬菌体(6)CRISPR5.5 通用基因功能注释(NR、GO、COG、KEGG、Pfam、SwissProt)5.6 病原细菌致病性和耐药性分析(适用于病原菌)(1)分泌系统效应蛋白预测(革兰氏阴性菌)(2)病原与宿主互作数据库(PHI)注释(3)细菌致病菌毒力因子(VFDB)注释(4)耐药基因(ARDB、CARD)注释(5)信号肽、跨膜结构及分泌蛋白预测(6)次级代谢产物基因簇注释(7

3、)膜转运蛋白数据库(TCDB)注释5.7 细菌群体多样性分析(1)ANI分析(2)群体系统进化树分析(3)群体PCoA分析(三)验收标准 1、每个样品的测序总数据量达到1G以上。2、每个样品的测序深度不低于100X的测序深度。3、原始数据的测序质量Q20 95%、Q30 90%。4、采用SOAP denovo,SPAdes和ABySS三个软件同时进行组装,并优化到最优组装结果。5、框架图基因组组分分析(1)编码基因预测:使用GeneMarkS软件对新测序的基因组进行编码基因预测。(2)重复序列:通过RepeatMasker软件进行散在重复序列预测,TRF(Tandem Repeats Find

4、er,)搜寻DNA序列中的串联重复序列。(3)非编码RNA预测tRNA:通过tRNAscan-SE软件对tRNA进行预测;rRNA:一是通过与近缘参考序列的rRNA库比对,二是用rRNAmmer软件预测;sRNA:首先进行Rfam database的比对注释,接着用cmsearch程序确定最终的sRNA。(4)基因岛:基于序列组成,采用IslandPath-DIOMB软件预测基因岛,其通过检测序列中二核苷酸偏向性(phylogentically bias)和移动性基因(mobility genes,如转座酶或整合酶)以判定基因岛以及潜在的水平基因转移。(5)前噬菌体:通过phiSpy软件预测样

5、品基因组上的前噬菌体。(6)CRISPR:利用CRISPRdigger对样品基因组进行CRISPR预测。6 通用基因功能注释,包括:NR、GO、COG、KEGG、Pfam、SwissProt。7 病原细菌致病性和耐药性分析(1)分泌系统效应蛋白预测(革兰氏阴性菌)使用SignalP、TMHMM工具进行预测,检测是否含有信号肽及跨膜结构,综合预测蛋白序列是否是分泌蛋白。(2)病原与宿主互作数据库(PHI)注释该数据库中的每个基因都包含核酸和氨基酸序列,以及感染宿主过程中预测的蛋白功能的详细描述。(3)细菌致病菌毒力因子(VFDB)注释使用 Diamond 软件,把目标物种的氨基酸序列,与VFDB

6、数据库进行比对,把目标物种的基因和其相对应的毒力因子功能注释信息结合起来,得到注释结果。(4)耐药基因(ARDB、CARD)注释使用Diamond软件,把目标物种的氨基酸序列,与ARDB数据库进行比对,把目标物种的基因和其相对应的耐药功能注释信息结合起来,得到注释结果。(5)信号肽、跨膜结构及分泌蛋白预测使用信号肽预测工具 SignalP 进行预测,检测是否含有信号肽及跨膜结果,综合预测 蛋 白序列是否是分泌蛋白。 (6)次级代谢产物基因簇注释采用antiSMASH程序对基因组进行预测。(7)膜转运蛋白数据库(TCDB)注释TCDB,全称是Transporter Classification Database,转运蛋白分类数据库,是膜转运蛋白,包括离子通道(ion channels)的分类系统(TC system)。TCDB数据库转移系统以5个级别进行分类。8.细菌群体多样性分析(1)ANI分析将其中一个基因组序列依次打断成 1020bp 的片段,将这些片段与另一基因组进行 blastn 比对,选出每个片段最好的比对结果。进一步筛选 identity 大于等于 30%,alignment 长度大于等于 70%的片段,这些结果identity 的平均值即为 ANI 值。(2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论