生物信息学第一章绪论PPT课件_第1页
生物信息学第一章绪论PPT课件_第2页
生物信息学第一章绪论PPT课件_第3页
生物信息学第一章绪论PPT课件_第4页
生物信息学第一章绪论PPT课件_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物信息学bioinformaticsbioinformatics本章主要内容:本章主要内容:生物信息学学科发展简况生物信息学学科发展简况生物信息学研究内容生物信息学研究内容本课程主要内容本课程主要内容第一章 绪论什么是生物信息学?什么是生物信息学?u 信息科学领域和生命科学领域的一门新信息科学领域和生命科学领域的一门新兴的、应用型兴的、应用型交叉学科交叉学科,它综合运用,它综合运用生生物学、计算机科学和数学物学、计算机科学和数学等多方面知识等多方面知识与方法,来阐明和理解大量生物数据所与方法,来阐明和理解大量生物数据所包含的生物学意义,并应用于解决生命包含的生物学意义,并应用于解决生命科学研

2、究和生物技术相关产业中的各种科学研究和生物技术相关产业中的各种问题。问题。u 生物信息学是信息科学领域和生命科学领域生物信息学是信息科学领域和生命科学领域的一门新兴的、应用型交叉学科。的一门新兴的、应用型交叉学科。 u 以计算机为主要工具,以大量生物数据库以计算机为主要工具,以大量生物数据库(500)和分析软件为基础)和分析软件为基础 u 依赖于因特网依赖于因特网 u 为人类揭示生命的奥秘提供了一条新的途径为人类揭示生命的奥秘提供了一条新的途径 生物信息学生物信息学 (bioinformatics) computational biology biology with computer 199

3、1ddbj 核苷酸数据库核苷酸数据库1986genbank 和和 embl核苷酸数据库核苷酸数据库 19821、发展简况、发展简况swiss-prot蛋白质数据库蛋白质数据库1986国际人类基因组测序计划启动国际人类基因组测序计划启动1990blast分析方法分析方法1990national center for biotechnology information (ncbi) of national institute of health (nih)1988最先收集的是蛋白质序列最先收集的是蛋白质序列 margret dayhoff 和她的同事和她的同事 protein sequence a

4、tlas1960sprotein information resource (pir)u生物信息学学科的迅速发展在生物信息学学科的迅速发展在90年代年代vhuman genome project (hgp) v10年时间完成了人类基因组草图(年时间完成了人类基因组草图(draft sequence) 30亿个碱基对亿个碱基对 对对3万多个基因进行了注释万多个基因进行了注释 2、生物信息学基本方法和技术、生物信息学基本方法和技术u 建立生物数据库建立生物数据库 v 各种公共数据库各种公共数据库 v 本地化数据库本地化数据库 u 数据库检索数据库检索 v 各种数据检索工具的开发和使用各种数据检索工

5、具的开发和使用 entrez 检索体系检索体系 blast 检索体系检索体系 u 生物大分子序列分析生物大分子序列分析 v homologous sequence analysis(同源序列分析)(同源序列分析) v multiple sequence alignment 多序列对位(对齐)多序列对位(对齐)排列排列 v evolution analysis(进化分析进化分析) phylogenetic prediction(系谱分析系谱分析) 进化进化方式方式分析分析 进化进化位点位点分析分析 分析结果:分析结果:xa26家族进化模式家族进化模式 分析结果与分析结果与xa26蛋白的功能相蛋白

6、的功能相符合符合 pkv 基因组分析基因组分析 序列拼接序列拼接 序列注释序列注释 v基因功能、结构分析基因功能、结构分析 v蛋白质功能、结构分析蛋白质功能、结构分析 v蛋白质三维结构预测蛋白质三维结构预测 v蛋白质修饰蛋白质修饰 u统计模型统计模型 vhidden markov model(hmm,隐马尔可夫模型),隐马尔可夫模型) 基因识别和药物设计基因识别和药物设计 vmaximum likelihood model(最大似然模型)(最大似然模型) 序列进化分析序列进化分析 u数学算法数学算法 v自动序列拼接自动序列拼接 v外显子预测外显子预测 v同源序列比较同源序列比较 u 收集、整理

7、、储存、加工、发布和收集、整理、储存、加工、发布和分析生物学数据分析生物学数据 3、生物信息学的研究内容、生物信息学的研究内容 u 发展新的数理和信息科学的技术和发展新的数理和信息科学的技术和方法用于管理和分析生物数据方法用于管理和分析生物数据(生物工作者)(生物工作者)(数理和信息(数理和信息科学工作者)科学工作者)4、生物信息学的应用、生物信息学的应用 u 基础研究和教学基础研究和教学 v 分子生物学研究的重要手段之一分子生物学研究的重要手段之一 v 生命科学的教学生命科学的教学 u 药物开发药物开发 v 新药筛选新药筛选 v 药靶设计药靶设计 v 分子药理学研究分子药理学研究 u疾病诊断

8、疾病诊断 v利用疑难病症的病原利用疑难病症的病原dna序列诊断疾病序列诊断疾病 v遗传病遗传病 u其他其他 v环境监测环境监测 v食品安全检测食品安全检测 v海关检测海关检测 5、因特网的域名(、因特网的域名(domain name) )规定规定 u 三级或四级域名三级或四级域名 四级域名四级域名.三级域名三级域名.二级域名二级域名.顶级域名顶级域名 u 华农一台名为华农一台名为bioinformatics 主机的域名主机的域名 6、本课程主要内容、本课程主要内容 利用国际上共享的数据库和分析软件利用国际上共享的数据库和分析软件 u 检索数据库检索数据库 v 序列的结构和功能和分析序列的结构和

9、功能和分析 v 比较基因组学比较基因组学(comparative genomics)分析分析 v 物种进化分析物种进化分析u 分析和解释实验数据(核苷酸和蛋白质序列)分析和解释实验数据(核苷酸和蛋白质序列) v 文字数据的检索文字数据的检索 v 序列(序列(dna、蛋白质)数据的检索、蛋白质)数据的检索 v 其他(三维结构、网络图等)数据的检索其他(三维结构、网络图等)数据的检索7、上机操作、上机操作 初步了解初步了解internet上上 的数据库和分析工具的数据库和分析工具 internet 上的自教课程上的自教课程 /education

10、http:/www.ebi.ac.uk/2can xa26 家族进化77 80 6577 64 62 6264 6510 kb 10 kb 1.7 kb repeat (96% identity)7.3 kb invert repeat (95% identity)nrka2 nrkf2 nrkc1 nrkc2nrkd2 nrkb2 nrkf3mrkd(mrkb)mrkcmrka xa26明恢明恢63(籼稻)(籼稻)明恢明恢63(籼稻)(籼稻)465 bp repeat (94% identity)9rkd 9rke 9rkf 9rkg 9rkc 9rkh 9rka 9rkbcentromer

11、etelomere78 80 8063 69 669rkd 9rke 9rkf 9rkg 9rkc 9rkh 9rka 9rkbcentromeretelomeretelomere78 80 8063 69 6678 79 7962nrkd1 nrke nrkb1 nrkf1nrka178 79 7962nrkd1 nrke nrkb1 nrkf1nrka178 80 8063 69 66trkdtrke trkbtrk f trkgtrkctkri trkj3.6 kb duplication(99% identity)trkatkrh?78 80 8063 69 66trkdtrke tr

12、kbtrk f trkgtrkctkri trkj3.6 kb duplication(99% identity)trkatkrh?日本晴(粳稻)日本晴(粳稻)特青(籼稻)特青(籼稻)93-11(籼稻)(籼稻)95% identity97% identity98-100% identity95% identity97% identity98-100% identityparalogorthologparalogorthologplant physiol. 140:998-1008 (2006)iiikinase domainamrkbnrkb1nrkb29rkbtrkbmrkanrka2nrk

13、a19rkatrka9rketrkenrkemrkdnrkd2nrkd19rkdtrkd9rkctrkcmrkcnrkc2trkhnrkc19rkftrkfnrkf2nrkf1nrkf3trkgtrkj9rkgxa21100100999799919510010095100991007998100781009910010096941000.1 dintronnrkd1trkd9rkdnrkd2nrke9rketrkemrkd9rkbtrkbnrkb2mrkbnrkb1mrkanrka19rkanrka2trka9rkctrkcmrkcnrkc1nrkc29rkhtrkh9rkftrkfnrkf1

14、nrkf2nrkf3trkg9rkgtrkj878088100100801008846999998989910077100979310088751009941100730.1 iiiiiilrr domainbiiilrr domainbmrkbnrkb1nrkb29rkbtrkbnrke9rketrkenrka2mrkanrka19rkatrkanrkd29rkdtrkdmrkdnrkd19rkctrkcmrkcnrkc1nrkc29rkgtrkgnrkf39rkftrkfnrkf1nrkf2xa211001001001001001009910010010075859854931009399

15、10098100805510010097580.10.1icomplete coding regionc9rkatrkanrka1mrkanrka29rkbtrkbnrkb2mrkbnrkb19rketrkenrkemrkdnrkd2nrkd19rkdtrkd9rkctrkcmrkcnrkc1nrkc29rkgtrkgnrkf39rkftrkfnrkf1nrkf2xa21100100100100100991001001001009799100100100711009310010010081100681001001001000.10.1iixa26 家族进化i: a, b, d and e me

16、mbersii: c, f, g, h and j membersuevolution by birth-and-deathprocessdndsdnds=0.30dn=0.06ds=0.70dn=0.33ds=0.38dn=0.14ds=0.73dn=0.63ds=0.49dn=0.43ds=0.55dn=0.24ds=0.32dn=0.17ds=0.55dn=0.12xx(l)x(l)xxmotif of lrr domainremaining region of lrr domainregion between lrr and kinasekinase domainiii0.00.20.

17、0.81.01.20.00.81.01.20.00.81.01.20.00.81.01.20.00.81.01.21.4dsdsdsdndsdnds=0.30dn=0.06ds=0.70dn=0.33ds=0.38dn=0.14ds=0.73dn=0.63ds=0.49dn=0.43ds=0.55dn=0.24ds=0.32dn=0.17ds=0.55dn=0.12xx(l)x(l)xxmotif of lrr domainremaining region of lr

18、r domainregion between lrr and kinasekinase domainiii0.00.81.00.81.01.20.00.81.00.81.01.20.00.81.01.20.00.81.01.20.00.81.01.20.00.81.00.81.01.20.00.81.01.20.00.81.01.20.00.20

19、.1.21.4dsdsdsxa26 家族进化u家族成员之间的差异主要存在于家族成员之间的差异主要存在于lrr结构域的结构域的xx(l)x(l)xx motif1. v tal e e lpn vplqg elssh 2. lgnisf l filnltn tgltg svpnk 3. igrlrr l elldlgh namsg g ipaa 4. ignltr l qllnl q q f nqlyg pipae 5. lqgl h h s l g s s mnl r r h h nyltg s s ipdd 6. lfnntpll tylnvgn nslsg lip g

20、g c 7. igslpi l q h h l n n fq a a nnltg avppa 8. ifnmsk l s t t isl i i s s ngltg pipg n n t 9. sfslpv l r w w f a a i s s k k nnffg qip l l g 10. laacpy l qviam p p y y nlfeg vlp p p w 11. lgrltn l d a a i s s lg g g nnfdag pipt e e 12. lsnltm l t v v ldlt t t cnlt g n n ipad 13. ighlgq l s w w lh

21、la m m nqltg pipas 14. lgnlss l a i i l l l l k k g g nlldg slpst 15. vdsmns l tata v d d v t t ennlhgd l n n fls t t 16. vsncrk l s t t l q q md l l nyitg i lpdy 17. vgnlss q q l k w w f t t l s s n n nkltg tlpat 18. isnlta l e v v i d l s s h nqlr n n aipes 19. im t ien l q w w ldls g nslsg fipsn 20. tallrn i v k k lfl e e s

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论