生物信息学技术_第1页
生物信息学技术_第2页
生物信息学技术_第3页
生物信息学技术_第4页
生物信息学技术_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1生物信息学技术尹铁球2 生物信息学概论生物信息学概论 生物信息学的定义生物信息学的定义 生物信息学研究的范畴生物信息学研究的范畴3一、生物信息学的定义一、生物信息学的定义生物信息学是结合了生物学和信息技术,利用生物信息学是结合了生物学和信息技术,利用计算机和互联网技术,分析海量的并且还在快计算机和互联网技术,分析海量的并且还在快速积累的生物数据,从中获取生物科学新知识速积累的生物数据,从中获取生物科学新知识的一门新的交叉科学。的一门新的交叉科学。Half day on the web,half month in the lab.saves you- Alan BleasbyBioinform

2、atics56人类基因组计划的意义人类基因组计划的意义人类基因研究的意义在于它可以人类基因研究的意义在于它可以支持和推动生命科学中支持和推动生命科学中一系列重要的基础性研究一系列重要的基础性研究。如基因组遗传语言的破译,。如基因组遗传语言的破译,基因的结构与功能关系,生命的起源和进化,细胞发育、基因的结构与功能关系,生命的起源和进化,细胞发育、生 产 、 分 化 的 分 子 机 理 , 疾 病 发 生 的 机 理 等 。生 产 、 分 化 的 分 子 机 理 , 疾 病 发 生 的 机 理 等 。为推动医学长足进步带来前所未有的机遇为推动医学长足进步带来前所未有的机遇,基因诊断、,基因诊断、基

3、因疗法和基因药物的开发,有可能成为未来医学发展基因疗法和基因药物的开发,有可能成为未来医学发展的重要分支。的重要分支。人类基因组计划的进一步成功将人类基因组计划的进一步成功将促进生命科学与信息科学促进生命科学与信息科学、材料科学的融合、材料科学的融合,从而带动一批高技术产业的发展,从而带动一批高技术产业的发展7二、生物信息学研究的范畴二、生物信息学研究的范畴第一、各种生物数据库的建立和管理; 第二、研究高效率的统计工具,分析算法, 发展方便、快捷的分析程序; 第三、从海量的原始生物数据中发掘新知识。8 重要生物信息中心重要生物信息中心 重要生物信息数据库重要生物信息数据库第一节第一节 生物信息

4、数据库生物信息数据库2009-4-28数据库的建设和发展数据库的建设和发展GenomicGenomicExperimentalData WarehousePrepareddataPatternsKnowledgeExpert KnowledgeOften not explicitly implemented10 NCBI GenBankEBI EMBLNIG DDBJ核酸生物信息中心核酸生物信息中心&数据库数据库11重要生物信息中心重要生物信息中心&数据库数据库 美国国家信息中心美国国家信息中心 (National Center of Biotechnology Informa

5、tion, NCBI)的的GenBank (http:/ / /web/GenBank/index.html); 欧洲分子生物学室验室欧洲分子生物学室验室(European Molecular Biology Laboratory-European Bioinformatics Institute, EMBL-EBI) 的的EMBL (http:/ www.ebi.ac.uk/databases/index.html); 日本日本 DNA数据库数据库 (DNA Data Bank of Japan, DDBJ) (http:/ / www.ddbj.ni

6、g.ac.jp/ ) 12 最重要的蛋白质氨基酸序列数据库是瑞士的最重要的蛋白质氨基酸序列数据库是瑞士的SWISS- PROT (/sprot/); 蛋白质数据库蛋白质数据库PIR(Protein Information Resource),包含包含 所有序列已知的自然界中野生型蛋所有序列已知的自然界中野生型蛋 白质的信息白质的信息 (); PDB蛋白质结构数据库:收集由蛋白质结构数据库:收集由X射线衍射和核磁共振射线衍射和核磁共振 技术测定的蛋白质大分子三维结构技术测定的蛋白质大分子三维结构(http:/w

7、/pdb)。蛋白生物信息中心蛋白生物信息中心&数据库数据库http:/http:/14数据库查询与检索15第二节第二节16数据库检索工具数据库检索工具 Entrez检索工具:检索工具:Entrez是美国国家生物技术信息中心是美国国家生物技术信息中心(NCBI)提供的集成检索工具)提供的集成检索工具 /Entrez/ SRS(Sequence Retrieval System)检索工具:是欧洲)检索工具:是欧洲 分子生物学网分子生物学网EMBnet的主要数据库检索工具,可以从的主要数据库检索工具,可以从 EMBne

8、t的主页进入。的主页进入。 DBGET/LinkDB检索工具:是日本京都工具大学建立的检索工具:是日本京都工具大学建立的 GenomeNet数据库,该数据库主要针对代谢途径。数据库,该数据库主要针对代谢途径。 http:/www.genome.ad.jp/dbget/dbget_manual.html。17数据库检索工具数据库检索工具NCBI网页的网页的Entrez界面界面文献检索文献检索文献检索文献检索 PubMed是美国国家医学图书馆是美国国家医学图书馆(NLM)下下属的国家生物技术信息中心属的国家生物技术信息中心(NCBI)开发的、开发的、基于基于WWW的医学数据库查询系统。的医学数据库

9、查询系统。PubMed的网址:的网址:/pubmed特点:收录范围广、内容全、检索途径多、检特点:收录范围广、内容全、检索途径多、检索体系完备,可少部分获取原文。索体系完备,可少部分获取原文。文献检索文献检索核酸数据分析核酸数据分析21第三节第三节22OUTLINE 核酸序列的基本分析核酸序列的基本分析 核酸序列的比对分析和功能预测核酸序列的比对分析和功能预测 开放阅读框的分析开放阅读框的分析 引物设计引物设计 向数据库提交序列向数据库提交序列23一、核酸序列的基本分析一、核酸序列的基本分析 核酸序列的分子量、碱基组成、碱基分布等基本分析:核

10、酸序列的分子量、碱基组成、碱基分布等基本分析: BioEdit (/BioEdit/bioedit.html) DNAMAN (http:/ 限制性酶切分析限制性酶切分析 :限制性酶数据库:限制性酶数据库(Restriction Enzyme DataBase,REBASE) (http:/ ; http:/ 测序峰图的查看、核实与修改测序峰图的查看、核实与修改 :Chromas,BioEdit,DNAMAN 测序结果需要识别与去除测序时使用的载体序列测序结果需要识别与去除测序时使用的载体序列 : VecScreen ( http:/www.ncb

11、/VecScreen.html) 24一、核酸序列的基本分析一、核酸序列的基本分析对核酸序列进行电子基因定位对核酸序列进行电子基因定位 :利用序列标签位点利用序列标签位点(Sequence Tagged Site, STS); 利用利用UniGene数据库进行基因电子定位数据库进行基因电子定位; 直接利用基因组序列进行基因电子定位。直接利用基因组序列进行基因电子定位。 25 NCBI网页的网页的Map Viewer界面界面程序名称查询序列搜索的数据库BLASTN核酸核酸BLASTP蛋白质蛋白质BLASTX核酸的六读框蛋白质TBLASTN蛋白质核酸的6个读框TBLAST

12、X核酸的6个读框核酸的6个读框26二、核酸序列的比对分析和功能预测二、核酸序列的比对分析和功能预测BLAST (Basic Local Alignment Search Tool)是)是基本局域联配搜索工具;基本局域联配搜索工具;Blast 功能有:功能有:2728NCBI网页的网页的BLAST界面界面29303132NCBI网页的网页的BLAST2 SEQUENCES界面界面333435二、核酸序列的比对分析和功能预测二、核酸序列的比对分析和功能预测 FASTA:根据用户提交的单个序列进行:根据用户提交的单个序列进行 数据库搜索比对的程序。数据库搜索比对的程序。 网上服务器和电子邮件服务:网

13、上服务器和电子邮件服务: http:/www.ebi.ac.uk/ mailto: fastaebi.ac.uk http:/www.fasta.genome.ad.jp mailto: fastanig.ac.jp36二、核酸序列的比对分析和功能预测二、核酸序列的比对分析和功能预测进行多序列联配进行多序列联配 :ClustalW: http:/www.ebi.ac.uk/clustalw/index.html, /soft/molbio/align/clustal/, ftp:/ftp.ebi.ac.uk/pub/software/dos

14、/clustalw。ClustalX: CluastalW程序的程序的UNIX版本,它使用版本,它使用X窗口图形界面,窗口图形界面, ftp:/ftp.ebi.ac.uk/pub/software ftp:/ftp-igbmc.u-strassbg.fr/pub/clustalX。对联配结果进一步编辑,形成适于发表的形式,可用的软件有:对联配结果进一步编辑,形成适于发表的形式,可用的软件有:SeaView: ftp:/biom3.univ-lyon1.frBOXSHADE: /software/box_form.html)CINEMA: http:

15、/www.bioinf.man.ac.uk/dbbrowser/cinema2.1/cinema2hdr.html37第五节第五节 核酸序列分析核酸序列分析三、开读框的分析三、开读框的分析GT-AG法则法则:外显子与内含子之间的连接区序列高度保守,如大部分内含子5端起始的两个碱基是GT,3端最后两个碱基是AG。 基因识别软件,常用的有:ORF Finder (/gorf/gorf.html )GRAIL (/grainbin/ )GeneFinder (http:/genomic.sanger.ac.

16、uk )Glimmer (/labs/compbio/glimmer.html/ )GenScan (/genscan.html )GeneLang (/genlang/)38用用GeneFinde进行开放阅读框分析进行开放阅读框分析39用用GeneFinde进行开放阅读框分析进行开放阅读框分析40四、引物设计四、引物设计Primer Premier软件软件:http:/ Primer5软件软件:/cgi-bin/p

17、rimer/primer5Oligo、Vector NT、Omiga等等41五、向数据库提交核酸序列五、向数据库提交核酸序列 向向EMBL提交数据的网络表格可参见:提交数据的网络表格可参见: http:/www.ebi.ac.uk/subs/emblsubs.tml 向向GenBank数据库提交核酸序列可联网进行数据库提交核酸序列可联网进行 /GenBank/index.html 也可用也可用Sequin软件制作好序列提交文件,向软件制作好序列提交文件,向NCBI 发送发送E-mail()提交提交

18、4243第六节第六节 蛋白质序列分析蛋白质序列分析 蛋白质基本性质分析蛋白质基本性质分析 蛋白质功能预测蛋白质功能预测 蛋白质结构预测蛋白质结构预测 蛋白质分子进化分析蛋白质分子进化分析44一、蛋白质基本性质分析一、蛋白质基本性质分析 蛋白质的氨基酸组成、分子量、等电点等方面的分析蛋白质的氨基酸组成、分子量、等电点等方面的分析 : OMIGA、DNAMAN、BioEdit、MacVector等等 蛋白质疏水性分析蛋白质疏水性分析 :ProtScale, /cgi-bin/protscale.pl 预测跨膜区预测跨膜区 : http:/genome.cbs

19、.dtu.dk/services/TMHMM-2.0/ /software/TMPRED_form.html http:/www.emblheidelberg.de/services/sander/predictprotein ftp:/ftp.biochem.ucl.ac.uk。4546474849用用TMHMM 软件预测的软件预测的SARS-CoV 的的E蛋白的跨膜区蛋白的跨膜区50第六节第六节 蛋白质序列分析蛋白质序列分析一、蛋白质基本性质分析一、蛋白质基本性质分析预测信号肽:预测信号肽:http:/genome.cbs.dtu.dk/ser

20、vices/SignalP/ 蛋白质亚细胞定位蛋白质亚细胞定位 :http:/predict.sanger.ac.uk/nnpsl/51预测信号肽预测信号肽52预测信号肽预测信号肽53蛋白质亚细胞定位蛋白质亚细胞定位54蛋白质亚细胞定位蛋白质亚细胞定位55二、蛋白质功能预测二、蛋白质功能预测蛋白质序列分析和功能预测的一般流程蛋白质序列分析和功能预测的一般流程 56二、蛋白质功能预测二、蛋白质功能预测磷酸化位点、糖基化位点,特殊的结构区(磷酸化位点、糖基化位点,特殊的结构区(motif)的分析:)的分析:PROSITE: /prosite/BLOCKS:

21、/blocks/PFAM: http:/www.sanger.ac.uk/software/pfam/PESCAN: http:/www.isrec.isb-sib.ch/software/pfscanInterProScan: http:/www.ebi.ac.uk/interpro/scan.htmlSMART: http:/smart.embl-heidberg.de/ 57三、蛋白质结构预测三、蛋白质结构预测 蛋白质的立体结构数据库蛋白质的立体结构数据库PDB(Protein Data Bank): (/microbio/rasmol) PDBFinder (http:/www.sander.embl-heideberg.de/pdbfinder) 蛋白质分子模型数据库蛋白质分子模型数据库(Molecular Modeling Database); 三维结构显示程序三维结构显示程序Cn3D (http:/www.ncb

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论