基于基因组学的日本血吸虫序列分析平台的构建及应用.doc_第1页
基于基因组学的日本血吸虫序列分析平台的构建及应用.doc_第2页
基于基因组学的日本血吸虫序列分析平台的构建及应用.doc_第3页
基于基因组学的日本血吸虫序列分析平台的构建及应用.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于基因组学的日本血吸虫序列分析平台的构建及应用 作者:刘稳升, 胡斐, 吕志跃, 郑焕钦, 袁衡新, 吴忠道【摘要】 【目的】 构建基于基因组学的日本血吸虫序列分析平台。【方法】 基于工作站和Linux操作系统,利用公开的日本血吸虫或相关资源,收集有关生物信息学序列分析工具,并自行编写相关软件实现多种资源的有机整合。【结果】 构建了本地化的日本血吸虫序列分析平台,在此基础上,自主设计了日本血吸虫EST序列的电子延伸系统、基于日本血吸虫EST数据库的同源全长cDNA序列检索系统和序列自动注释系统等。【结论】 所构建的序列分析平台不仅可以完成常规的序列分析工作,还可成功地完成EST序列的电子延伸,同源全长cDNA序列的检索以及序列的自动注释,它可对大规模日本血吸虫序列进行快速、方便、高效的分析,为充分利用血吸虫基因组开展疫苗研究和新药开发提供了有效的技术手段。 【关键词】 日本血吸虫; 基因组; 序列分析系统 J SUN Yat-sen Univ(Med Sci), 2007, 28(3):348-352 继人类基因组计划(Human Genome Project,HGP)之后,血吸虫基因组计划(Schistosome Genome Project,SGP)于1992年正式启动,并得到了美国基因组研究所(The Institute for Genomic Research,TIGR)的技术支持,1994年WHO/UNDP/TDR和多个国家的实验室参与了此项计划,其最终目标是找到新的候选疫苗分子和治疗药物以及完全的基因组图谱。1999年,在WHO/Word Bank/UNDP血吸虫基因组网络会议上,确定了WHO资助SGP的主要内容,包括曼氏血吸虫新基因的发现、日本血吸虫新基因的发现、物理图谱的制作、cDNA微型矩阵的制作、线粒体基因的测序以及生物信息学的研究,也确定了未来80%的TDR基因组资助奖金将用于后基因组计划。经过多年的努力,在cDNA文库、EST序列分析、基因差异表达的研究、基因组文库和基因组图谱、血吸虫信息学和数据库管理等多方面取得了重要进展1-3。目前,WHO血吸虫基因组协作组是最广泛的国际合作组织之一,其成员国美国、英国、埃及、巴西等多参与曼氏血吸虫基因研究计划,而中国重点开展日本血吸虫基因组的研究工作, 研究单位包括中国南方基因组中心,中国疾病预防控制中心寄生虫病预防控制所和中山大学中山医学院等。最近,我国在日本血吸虫功能基因组和蛋白质组的工作取得了阶段性重大成果4。2006年5月17日,上海市生命科学与生物技术数据中心向全世界公布了由我国自主测序的日本血吸虫基因组工作框架图,共计300多万条的DNA序列5,为全球科学工作者提供服务。由于血吸虫基因组计划的实施,综合利用现阶段的大量生物信息,并从中快速挖掘有用信息,应用于血吸虫病的免疫诊断、疫苗研发和新药靶点筛选等已成为可能。为此,本课题组在前期工作基础上,开展了本项研究工作,旨在有力推动我国血吸虫病的科学研究和防治技术创新。 1 材料与方法 1.1 工作站的配置 1.1.1 硬件配置 工作站为DELL Precision workstation 670, 处理器为双Intel?誖 XeonTM,主频2.80 GHz, 内存为DDR DRAM 2.0 G, 硬盘为 SATA 146 G。 1.1.2 软件配置 操作系统为RedHat Enterprise Linux AS 4; 应用软件包括Apach网络服务器,MySQL网络数据库系统, Perl 和PHP等相关软件。 1.2 核酸及蛋白质序列数据库 通过互联网访问公开数据库,在许可的条件下下载数据信息,并进行相关的解压缩、安装,构建序列分析的本地化数据库。现将本实验室收集的主要序列分析数据库列表如表1。 1.3 核酸及蛋白质序列分析工具 通过互联网,下载相关基于GNU通用许可证(GPL)的,可免费使用的生物信息学分析软件或通过与软件作者联系,取得相关的软件,应用于学术研究。本实验平台所安装的软件主要包括综合序列分析软件包Staden package7,EMBOSS8;两序列比对分析软件包BLAST 9,FASTA 10;多序列比对软件包ClustalW11,DIALIGN-T12;序列组装拼接软件Phrap,CAP313;重复序列屏蔽工具RepeatMasker14;基因预测软件GenScan15;序列进化分析软件Phylip16;综合蛋白序列分析平台InterProScan17。 1.4 自主设计三大序列分析系统 1.4.1 日本血吸虫EST序列的电子延伸系统 构建该系统所需的生物信息学相关软件包括:同源性检索的Blast软件包,序列类组装拼接的Phrap软件包或CAP3拼接程序,数据库采用日本血吸虫数据库。系统设计方法数据流图如图1。 1.4.2 基于日本血吸虫EST数据库的同源全长cDNA序列检索系统 构建该系统所需的生物信息学相关软件包括:电子延伸系统的所需软件,如有需要还可以对待分析的序列进行预处理,包括载体序列的去除(Phrap软件包中cross-match)和重复序列的屏蔽(RepeatMasker)。系统设计数据流图如图2。 1.4.3 序列自动注释系统的构建 构建该系统所需的生物信息学相关软件包括:Blast软件包,InterProScan软件包(包含HMMPfam, scanregexp, blastprodom等15个数据库检索或序列分析的程序),相关的数据库包括非冗余蛋白质序列数据库(nr),非冗余核酸序列数据库(nt),以及 Interpro平台数据库17,18(包括PROSITE、PRINTS、Pfam、Gene3D、PANTHER、ProDom和Smart等10多个数据库的内容,涵盖了UniprotK数据库中蛋白质序列的77.6%)(http:/www.ebi.ac.uk/interpro/release_notes.html)。系统设计数据流图如图3。 2 结 果 2.1 日本血吸虫序列分析平台实现的基本功能 由表1的数据资源和所列的生物信息学分析工具搭建的序列分析平台,可完成大多数日本血吸虫序列分析的常规任务(具体可参考相关安装软件的使用文档,说明书或 2.4 序列自动注释系统的组成与应用 此系统主要由nr检索模块、nt检索模块以及InterPro检索平台三部分构成。其nr检索模块主要完成对待分析序列在非冗余蛋白序列数据库中相似性序列的检索,nt检索模块主要完成对待分析序列在非冗余核酸序列数据库中相似性序列的检索,InterPro检索平台则是由InterProScan程序完成待分析序列在InterPro数据库中的相似性检索,三者都将相关信息赋与待分析序列,进行序列的注释。对所建立的系统,本课题组已经过初步测试,对每一感兴趣的序列进行注释,均可在非冗余蛋白质序列数据库,非冗余核酸序列数据库,InterPro数据库的检索中得到对应的结果文件,其结果显示,系统运行状态良好。在此基础上,我们还利用上面获得的515条日本血吸虫假想全长cDNA 序列作为待注释的序列,进行结构和功能的分析,旨在获得其相关生物学信息,为血吸虫病疫苗候选分子及药物作用靶标的筛选提供进行生物学实验的依据。 3 讨 论 HGP初,美国科学家Venter等提出了用EST技术来进行基因组研究的设想,称为EST计划。Adams22等第一次应用EST技术从人脑组织中获得了337个未知基因,在此后的一年里,Adams23等继续发展了EST技术,开始大规模EST自动化测序,获得2375条EST序列,并将此技术从结构基因组学扩展到功能基因组学和比较基因组学。此后,利用EST进行基因的研究得到了飞速的发展,但EST自身的局限(仅代表一个完整基因的一部分,同时公共数据库中EST测序中存在错误等)及cDNA全长序列难以获得等问题,成了制约新基因发现的瓶颈。从生物信息学原理出发,基于公共数据库中的EST序列进行电子延伸,已成为众多研究者关注的焦点。目前虽可网上进行EST的电子延伸服务,但在使用过程中存在数据安全,响应不及时等问题,因此,本实验组开展了本地化电子延伸系统的构建工作。初步应用本平台已对本实验组获得的552条EST进行电子延伸,其中487条得到了不同程序的延伸。 同源全长cDNA序列检索系统为本课题组所特有,它可针对特定的序列,在日本血吸虫EST数据库中进行虚拟cDNA的查找,对发现日本血吸虫相对应的基因起到了积极的作用,对2226条人类信号转导分子序列对日本血吸虫的EST数据库进行同源全长cDNA序列的检索,其

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论