生物信息学及其在寄生虫遗传变异和进化分析上的应用_第1页
生物信息学及其在寄生虫遗传变异和进化分析上的应用_第2页
生物信息学及其在寄生虫遗传变异和进化分析上的应用_第3页
生物信息学及其在寄生虫遗传变异和进化分析上的应用_第4页
生物信息学及其在寄生虫遗传变异和进化分析上的应用_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物信息学及其在寄生虫遗传变异和进化分析上的应用李娟 2009128010OUTLINE生物信息学的来源及基本概念生物信息学的来源及基本概念 生物信息学的研究内容及数据库资源生物信息学的研究内容及数据库资源生物信息学在寄生虫遗传变异和进化分析上生物信息学在寄生虫遗传变异和进化分析上的具体应用的具体应用Introduction to Bioinformatics一、生物信息学的来源 人类 基因组计划的实施 带动大量模式生物测序工作的展开生物信息学应时代要求而生从数据的汪洋大海中淘出对人类有用的相关信息对数据搜集、管理、处理、分析和释读海量的生物学数据涌现Introduction to Bioinformatics三种科学文化的融合三种科学文化的融合生物学家生物学家(生物学问题生物学问题 )数学物理学家数学物理学家计算机科学家计算机科学家(基础理论问题基础理论问题 )工程师工程师(技术应用)(技术应用)Introduction to Bioinformatics二、生物信息学的准确概念二、生物信息学的准确概念它是一门交叉科学 , 它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义 。U. S. Department of energy, office of health and environ -mental research, human genome program, national institutes of health (United States) , national center for human genome research. Understanding our genetic inheritance : The U. S.human genome project : the first five years, FY1991 - 1995生物信息学自诞生以来,大致经历了以下三个阶段 :前基因组时代 : 标志性工作包括生物数据库的建立、检索工具的开发以及 DNA 和蛋白质序列分析 ; 基因组时代 : 标志性工作包括基因寻找和识别、网络数据库系统的建立和交互界面的开发 ; 后基因组时代 : 标志性工作是大规模基因组分析、蛋白质组分析以及各种数据的比较和整合。 一方面是实验数据即核苷酸和氨基酸序列的获得、处理、贮存以及在互联网的传输、共享。 另一方面是数据的搜索、分析和注解,从而诠释数据中所蕴含的生物学意义。 由此引发生物信息学的研究重点主要体现在基因组学( Genomics)和蛋白组学( Proteomics)两个方面上。 Introduction to BioinformaticsIntroduction to Bioinformatics三、生物信息学的研究内容三、生物信息学的研究内容新基因的发现与鉴定完整基因组的比较研究大规模基因功能表达谱的分析生物大分子的结构模拟与药物设计非编码区信息结构分析遗传密码起源和生物进化的研究library of Bioinformatics三、生物信息学的数据库资源三、生物信息学的数据库资源 二级数据库二级数据库 在一级数据库、实验数据和理论分析的基础上,针对不同的研究内容和需要,对生物学知识和信息的进一步整理得到的数据库。 人类基因组图谱库 GDB、转录因子和结合位点库TRANSFAC、蛋白质序列功能位点数据库Prosite等。 一级数据库一级数据库 直接来源于实验获得的原始数据,只经过简单的归类、整理和注释。 一级核酸数据库: GenBank数据库、 EMBL数据库、 DDBJ数据库 一级蛋白质序列数据库: SWISS-PROT库、 PIR库 一级蛋白质结构数据库: PDB库、 SCOP库、 CATH库library of Bioinformatics一级数据库简介一级数据库简介1、核酸、核酸 (DNA)序列数据库序列数据库世界三大核酸序列数据库(公共序列数据库, Public Sequence Database)GenBank( 美国)EMBL(欧洲 )DDBJ(日本 )EMBLGenBank DDBJlibrary of Bioinformatics GenBank( 美国国家生物技术信息中心, NCBI) 1980s NIH(National Institute of Health) Los Alamos National Lab NCBI(National Center for Biotechnology Information) NLM(National Library of Medicine) / 汇集并注释了所有公开的核酸以及蛋白质序列。library of Bioinformatics EMBL(欧洲分子生物学实验室, EMBL) 1982 European Molecular Biology Laboratory EBI( European Bioinformatics Institute) http:/www.ebi.ac.uk/library of Bioinformatics DDBJ(日本国家遗传学研究所, NIG) 1984 Databank of Japan NIG(National Institute of Genetics) http:/www.ddbj.nig.ac.jp/searches-e.htmllibrary of Bioinformatics2、蛋白质序列数据库、蛋白质序列数据库SWISS PROT(欧洲 )PIR(美国 )library of BioinformaticsSWISS PROT1. 瑞士日内瓦大学医学生物化学系和欧洲生物信息学研究所 (EBI)合作维护( 1986年);2. 数据库包括了从 EMBL翻译而来的蛋白质序列,这些序列经过检验和注释;3. 数据记录包括两部分:序列注释 (结构域、功能位点、跨膜区域、二硫键位置、翻 译后的修饰、突变体等 )4. 数据存在滞后性 TrEMBL数据库的建立SWISS-PROT 的 网址: /sprotTrEMBL的网址: http:/www.ebi.ac.uk/trembl/index.htmllibrary of BioinformaticsPIR(protein information resource)1. 是一个集成了关于蛋白质功能预测数据的公共资源的数据库,其目的是支持基因组 /蛋白质组研究。 2. PIR还包含以下信息:( 1)蛋白质名称、蛋白质的分类、蛋白质的来源;( 2)关于原始数据的参考文献;( 3)蛋白质功能和蛋白质的一般特征,包括基因表达、翻译后处理、活化等;( 4)序列中相关的位点、功能区域。3. PIR提供三种类型的检索服务:( 1)基于文本的交互式查询,用户通过关键字进行数据查询。( 2)标准的序列相似性搜索,包括 BLAST、 FASTA等。( 3)结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索等。 网址: /library of Bioinformatics3、蛋白质结构数据库、蛋白质结构数据库PDB( protein data bank)1. 目前最主要的蛋白质分子结构数据库;2. 1970年代建立,美国 Brookhaven国家实验室维护管理 ;3. 1988年,由美国 RCSB(research collaboratory for structural biology)管理;4. 以文本格式存放数据,包括原子坐标、物种来源、测定方法、提交者信息、一级结构、二级结构等;5. PDBsum数据库: PDB注释信息综合数据库,具有检索、分析、可视化的功能。PDB的网址: /pdb(美国 ) PDBsum的网址: http:/www.biochem.ucl.ac.uk/bsm/pdbsumlibrary of BioinformaticsSCOP( Structural Classification of Protein)英国医学研究委员会分子生物学实验室和蛋白质工程中心开发的基于web的蛋白质结构数据库分类、检索和分析系统;SCOP的网址 : http:/scop.mrc-lmb.cam.ac.uk/scop/ CATH(class, architecture, topology, homology)英国伦敦大学开发维护 ;CATH的网址: http:/www.biochem.ucl.ac.uk/bsm/cath 二级数据库简介二级数据库简介 二级数据库是在一级数据库、实验数据和理论分析的基础上,针对不同的研究内容和需要,对生物学知识和信息的进一步整理得到的数据库。一级库和二级库间并没有明显的界限。 二级数据库的形式:大多以 web界面为基础,以文字信息、表格、图形、图表等方式显示数据库内容;library of Bioinformatics基因组信息二级数据库基因组信息二级数据库E. coli基因组数据库基因组数据库德国 Pastear研究所建立。除具有浏览、检索、搜寻功能外,还对环状基因组实现可视化。 TransFac的网址 : /Colibri/TransFac(真核生物基因转录调控因子数据库真核生物基因转录调控因子数据库 )德国生物工程研究所开发维护,始建于 1988年。包括顺式调控位点、基因、转录因子、细胞来源、分类和调控位点核苷酸分布 6个子库。TransFac的网址 : library of Bioinformatics蛋白质序列二级数据库蛋白质序列二级数据库Prosite (蛋白质序列功能位点数据库蛋白质序列功能位点数据库 )始建于 1990年初,由瑞典生物信息学研究所 SIB负责维护。基于对蛋白质家族中同源序列多重序列比对得到的保守区域,这些区域通常与生物学功能相关。数据库包括两个数据库文件:数据文件 Prosite; 说明文件PrositeDoc。Prosite的网址 : /prosite/ library of Bioinformatics蛋白质结构二级数据库蛋白质结构二级数据库DSSP (Definition of Secondary Structure of Proteins)蛋白质二级结构构象参数数据库DSSP的网址 : http:/www.cmbi.kun.nl/gv/dssp/ FSSP (Families of

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论