生物信息学功能基因组学_第1页
生物信息学功能基因组学_第2页
生物信息学功能基因组学_第3页
生物信息学功能基因组学_第4页
生物信息学功能基因组学_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTC第七章第七章 基因组分析基因组分析Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTC基因组基因组 转录组转录组蛋白质组蛋白质组化学生物

2、学化学生物学Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 1. 基因组的结构与内容基因组的结构与内容r 2. 基因组注释基因组注释r 3. 比较基因组学比较基因组学r 4. 基因基因/蛋白质的功能预测蛋白质的功能预测Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr (1) 基因的结构基因的结构r (2) mRNA:可变剪切:可变剪切r (3)

3、 蛋白质:翻译后修饰蛋白质:翻译后修饰r (4) 相互作用网络:基因、蛋白质、小分子之间相互作用网络:基因、蛋白质、小分子之间的相互作用的相互作用r (5) 非编码区非编码区| a. 功能元件功能元件: 转录因子结合位点;启动子转录因子结合位点;启动子| b. Non-coding RNA: MicroRNA| c. 转座子转座子| d. 重复片段重复片段| e. 伪基因伪基因 (Pseudogene)Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformat

4、ics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTC基因组大小基因组大小 & 基因数基因数Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 1. 基因数量的变化,无法解释生物学功能、调控机基因数量的变化,无法解释生物学功能、调控机理以及物种多样性和复杂性的巨大变化理以及物种多样性和复杂性的巨大变化r 2. 当前解释:蛋白质组的多样性和复杂性当前解释:蛋白质组的多样性

5、和复杂性 - 物种的物种的多样性和复杂性;多样性和复杂性;10,000,000种蛋白质分子种蛋白质分子r 3. 两种观点:两种观点:| a. 转录后层面,转录后层面,mRNA剪切,产生拼接异构体剪切,产生拼接异构体| b. 蛋白质层面,蛋白质序列上一个或多个位点上发生的蛋白质层面,蛋白质序列上一个或多个位点上发生的翻译后修饰翻译后修饰Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBio

6、informatics, 2008-2009, Semester 1, USTCisoform 1isoform 2isoform 3mRNA Splicing转录后层面:转录后层面:mRNA SplicingBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCPhosphorylationSumoylationPalmitoylationAcetylationUbiquitination蛋白质层面:翻译后修饰蛋白质层面:翻译后修饰Bioinformatics, 2008-2

7、009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTC蛋白质蛋白质-蛋白蛋白质相互作用质相互作用网络网络Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCG1/S检验点:检验点:有调控方向有调控方向Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr a. 功能元件功能元件: 转录

8、因子结合位点;启动转录因子结合位点;启动子子r b. Non-coding RNA: MicroRNAr c. 转座子转座子r d. 重复片段重复片段r e. 伪基因伪基因 (Pseudogene)Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCCRM: cis-regulatory modulesBi

9、oinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCGal4pKruppelBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr Exon splicing enhancer (ESE) and silencer (ESS) r Intron splicing enhancer (ISE) and silencer (ISS)Bioinformatics, 2

10、008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 1. 不翻译成蛋白质,具有重要的调控功能不翻译成蛋白质,具有重要的调控功能r 2. 分类:分类:|a. transfer RNA (tRNA) |b. ribosomal RNA (rRNA)|c. snoRNAs, |d. microRNAs, |e. siRNAs|f. piRNAs: 与与piwi相互作用的相互作用的RNA |g. long ncRNAs: Xist|Bioinformatics, 2008-2009, Semester 1, US

11、TCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr snoRNAs: Small nucleolar RNAs; 介导介导其他其他RNA分子的化学修饰,例如甲基化分子的化学修饰,例如甲基化Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 1. 长度长度21-2

12、3bpr 2. 调控基因的表达调控基因的表达r 3. pre-miRNA: 70bpBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 转座子:在基因组中能够移动位置的转座子:在基因组中能够移动位置的DNA序列序列Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr (1) 基因组序列的拼装基因组序列的拼装r (2) 基因预测基因预测r (3) 可变剪

13、切的预测可变剪切的预测r (4) 非编码的功能元件的预测非编码的功能元件的预测Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBio

14、informatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 直接的,序列高度匹配直接的,序列高度匹配|同一或近缘物种中,与同一或近缘物种中,与EST,cDNA, 蛋白质蛋白质等序列完美或近似完美的匹配等序列完美或近似完美的匹配r 间接的,基于统计学的间接的,基于统计学的a.序列比对序列比对 (Homology)b.从头预测从头预测(ab initio)c.以上两种方法的结合以上两种方法的结合Bioinformatics, 2008-2009, Semester 1, USTCBioin

15、formatics, 2008-2009, Semester 1, USTC5335 1-100 Mbp 5335 1-1000 kbp exons (cds & utr) / introns( 102-103 bp) ( 102-105 bp)Polyadenylation sitepromoter (103 bp)enhancers (101-102 bp)other regulatory sequences ( 101-102 bp)Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Seme

16、ster 1, USTCr 1. ORF (Open Reading Frame): 从从AUG开始,至开始,至stop codon终止终止r 2. Codon Usage: CAI r Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCKulp, D., PhD Thesis, UCSC 2003Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 将

17、将EST, cDNA序列比对到基因组上序列比对到基因组上Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr (1) 有功能的通常保守有功能的通常保守r (2) 例:例:SUMO底物的预测:底物的预测:|a. SUMO化位点存在化位点存在-K-X-E模体模体|b. 核定位信号核定位信号 (NLS)|c.

18、人和小鼠中,人和小鼠中,SUMO化位点应当保守化位点应当保守|d. 功能分析:功能分析:Gene Ontologyr (3) 分析结果:分析结果:|a. 2,683个人个人-小鼠保守的小鼠保守的SUMO化底物化底物|b. SUMO化的功能:参与转录调控、信号转导等化的功能:参与转录调控、信号转导等Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 1. 描述基因描述基因/蛋白质的功能蛋白质的功能r 2. 三类术语三类术语(Term):|a. Cellular compon

19、ent: 在哪里?在哪里?|b. Biological process: 干什么?干什么? |c. Molecular function:我是谁?:我是谁?Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinfo

20、rmatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr In human proteome: r DNA binding (GO:0003677): 2, 255 r Transcription factor activity (GO:

21、0003700): 1, 102 r regulation of transcription, DNA-dependent (GO:0006355): 2, 174r In SUMO Substrates: r DNA binding (GO:0003677): 530 r Transcription factor activity (GO:0003700): 304 r regulation of transcription, DNA-dependent (GO:0006355): 510r 因此,可以估计因此,可以估计1/4 1/3的转录因子受到的转录因子受到SUMO化的调控化的调控Bio

22、informatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr (1) 一级序列的比较:相似的序列具有相似一级序列的比较:相似的序列具有相似的功能的功能r (2) 保守的功能结构域:保守的功能保守的功能结构域:保守的功能r (3) 三级结构的比较:相似的结构具有相似三级结构的比较:相似的结构具有相似的功能的功能r (4) 蛋白质相互作用的预测蛋白质相互作用的预测Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2

23、009, Semester 1, USTCr 1. 同源物的鉴定:不同物种中的直系、旁系同源物的鉴定:不同物种中的直系、旁系同源物的预测同源物的预测r 2. 主要工具:主要工具:BLASTBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 1. 保守的功能结构域:保守的功能保守的功能结构域:保守的功能r 2. 常用工具:常用工具:工具工具网址网址Interprohttp:/www.ebi.ac.uk/interpro/Pfamhttp:/pfam.sanger.ac.uk

24、/SMARThttp:/smart.embl.de/PROSITE/prosite/ProDomhttp:/prodom.prabi.fr/prodom/current/html/home.phpCDD/Structure/cdd/wrpsb.cgiBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTC

25、Bioinformatics, 2008-2009, Semester 1, USTCr 1. Ubiquitin: 泛素,主要负责蛋白质的降解泛素,主要负责蛋白质的降解r 2. SUMO:小的类泛素蛋白质,基因转录:小的类泛素蛋白质,基因转录 & 信号通路信号通路r 3. 催化反应通路的分子机制相似催化反应通路的分子机制相似r 4. 序列相似性:不显著!序列相似性:不显著!Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-

26、2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCSUMOUbiquitinBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 1. 基因组信息基因组信息 (Genomic information)|A. Gene fusi

27、on and fission|B. Conservation of gene order/bidirectional pairs|C. Phylogenetic profiler 2. 关联的序列特征关联的序列特征 (Correlated sequence signatures)r 3. mRNA co-expressionr 4. Literature miningBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCABABQuery proteinLinked proteinRosetta proteinMarcotte EM et al., Science 1999, 285:751-753; Enright AJ et al., Nature, 1999, 402:86-90Genome AGenome BBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCGene order pairsBidirectional transcribed gene pairsDan

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论