版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTC第七章第七章 基因组分析基因组分析Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTC基因组基因组 转录组转录组蛋白质组蛋白质组化学生物
2、学化学生物学Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 1. 基因组的结构与内容基因组的结构与内容r 2. 基因组注释基因组注释r 3. 比较基因组学比较基因组学r 4. 基因基因/蛋白质的功能预测蛋白质的功能预测Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr (1) 基因的结构基因的结构r (2) mRNA:可变剪切:可变剪切r (3)
3、 蛋白质:翻译后修饰蛋白质:翻译后修饰r (4) 相互作用网络:基因、蛋白质、小分子之间相互作用网络:基因、蛋白质、小分子之间的相互作用的相互作用r (5) 非编码区非编码区| a. 功能元件功能元件: 转录因子结合位点;启动子转录因子结合位点;启动子| b. Non-coding RNA: MicroRNA| c. 转座子转座子| d. 重复片段重复片段| e. 伪基因伪基因 (Pseudogene)Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformat
4、ics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTC基因组大小基因组大小 & 基因数基因数Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 1. 基因数量的变化,无法解释生物学功能、调控机基因数量的变化,无法解释生物学功能、调控机理以及物种多样性和复杂性的巨大变化理以及物种多样性和复杂性的巨大变化r 2. 当前解释:蛋白质组的多样性和复杂性当前解释:蛋白质组的多样性
5、和复杂性 - 物种的物种的多样性和复杂性;多样性和复杂性;10,000,000种蛋白质分子种蛋白质分子r 3. 两种观点:两种观点:| a. 转录后层面,转录后层面,mRNA剪切,产生拼接异构体剪切,产生拼接异构体| b. 蛋白质层面,蛋白质序列上一个或多个位点上发生的蛋白质层面,蛋白质序列上一个或多个位点上发生的翻译后修饰翻译后修饰Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBio
6、informatics, 2008-2009, Semester 1, USTCisoform 1isoform 2isoform 3mRNA Splicing转录后层面:转录后层面:mRNA SplicingBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCPhosphorylationSumoylationPalmitoylationAcetylationUbiquitination蛋白质层面:翻译后修饰蛋白质层面:翻译后修饰Bioinformatics, 2008-2
7、009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTC蛋白质蛋白质-蛋白蛋白质相互作用质相互作用网络网络Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCG1/S检验点:检验点:有调控方向有调控方向Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr a. 功能元件功能元件: 转录
8、因子结合位点;启动转录因子结合位点;启动子子r b. Non-coding RNA: MicroRNAr c. 转座子转座子r d. 重复片段重复片段r e. 伪基因伪基因 (Pseudogene)Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCCRM: cis-regulatory modulesBi
9、oinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCGal4pKruppelBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr Exon splicing enhancer (ESE) and silencer (ESS) r Intron splicing enhancer (ISE) and silencer (ISS)Bioinformatics, 2
10、008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 1. 不翻译成蛋白质,具有重要的调控功能不翻译成蛋白质,具有重要的调控功能r 2. 分类:分类:|a. transfer RNA (tRNA) |b. ribosomal RNA (rRNA)|c. snoRNAs, |d. microRNAs, |e. siRNAs|f. piRNAs: 与与piwi相互作用的相互作用的RNA |g. long ncRNAs: Xist|Bioinformatics, 2008-2009, Semester 1, US
11、TCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr snoRNAs: Small nucleolar RNAs; 介导介导其他其他RNA分子的化学修饰,例如甲基化分子的化学修饰,例如甲基化Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 1. 长度长度21-2
12、3bpr 2. 调控基因的表达调控基因的表达r 3. pre-miRNA: 70bpBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 转座子:在基因组中能够移动位置的转座子:在基因组中能够移动位置的DNA序列序列Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr (1) 基因组序列的拼装基因组序列的拼装r (2) 基因预测基因预测r (3) 可变剪
13、切的预测可变剪切的预测r (4) 非编码的功能元件的预测非编码的功能元件的预测Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBio
14、informatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 直接的,序列高度匹配直接的,序列高度匹配|同一或近缘物种中,与同一或近缘物种中,与EST,cDNA, 蛋白质蛋白质等序列完美或近似完美的匹配等序列完美或近似完美的匹配r 间接的,基于统计学的间接的,基于统计学的a.序列比对序列比对 (Homology)b.从头预测从头预测(ab initio)c.以上两种方法的结合以上两种方法的结合Bioinformatics, 2008-2009, Semester 1, USTCBioin
15、formatics, 2008-2009, Semester 1, USTC5335 1-100 Mbp 5335 1-1000 kbp exons (cds & utr) / introns( 102-103 bp) ( 102-105 bp)Polyadenylation sitepromoter (103 bp)enhancers (101-102 bp)other regulatory sequences ( 101-102 bp)Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Seme
16、ster 1, USTCr 1. ORF (Open Reading Frame): 从从AUG开始,至开始,至stop codon终止终止r 2. Codon Usage: CAI r Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCKulp, D., PhD Thesis, UCSC 2003Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 将
17、将EST, cDNA序列比对到基因组上序列比对到基因组上Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr (1) 有功能的通常保守有功能的通常保守r (2) 例:例:SUMO底物的预测:底物的预测:|a. SUMO化位点存在化位点存在-K-X-E模体模体|b. 核定位信号核定位信号 (NLS)|c.
18、人和小鼠中,人和小鼠中,SUMO化位点应当保守化位点应当保守|d. 功能分析:功能分析:Gene Ontologyr (3) 分析结果:分析结果:|a. 2,683个人个人-小鼠保守的小鼠保守的SUMO化底物化底物|b. SUMO化的功能:参与转录调控、信号转导等化的功能:参与转录调控、信号转导等Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 1. 描述基因描述基因/蛋白质的功能蛋白质的功能r 2. 三类术语三类术语(Term):|a. Cellular compon
19、ent: 在哪里?在哪里?|b. Biological process: 干什么?干什么? |c. Molecular function:我是谁?:我是谁?Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinfo
20、rmatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr In human proteome: r DNA binding (GO:0003677): 2, 255 r Transcription factor activity (GO:
21、0003700): 1, 102 r regulation of transcription, DNA-dependent (GO:0006355): 2, 174r In SUMO Substrates: r DNA binding (GO:0003677): 530 r Transcription factor activity (GO:0003700): 304 r regulation of transcription, DNA-dependent (GO:0006355): 510r 因此,可以估计因此,可以估计1/4 1/3的转录因子受到的转录因子受到SUMO化的调控化的调控Bio
22、informatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr (1) 一级序列的比较:相似的序列具有相似一级序列的比较:相似的序列具有相似的功能的功能r (2) 保守的功能结构域:保守的功能保守的功能结构域:保守的功能r (3) 三级结构的比较:相似的结构具有相似三级结构的比较:相似的结构具有相似的功能的功能r (4) 蛋白质相互作用的预测蛋白质相互作用的预测Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2
23、009, Semester 1, USTCr 1. 同源物的鉴定:不同物种中的直系、旁系同源物的鉴定:不同物种中的直系、旁系同源物的预测同源物的预测r 2. 主要工具:主要工具:BLASTBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 1. 保守的功能结构域:保守的功能保守的功能结构域:保守的功能r 2. 常用工具:常用工具:工具工具网址网址Interprohttp:/www.ebi.ac.uk/interpro/Pfamhttp:/pfam.sanger.ac.uk
24、/SMARThttp:/smart.embl.de/PROSITE/prosite/ProDomhttp:/prodom.prabi.fr/prodom/current/html/home.phpCDD/Structure/cdd/wrpsb.cgiBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTC
25、Bioinformatics, 2008-2009, Semester 1, USTCr 1. Ubiquitin: 泛素,主要负责蛋白质的降解泛素,主要负责蛋白质的降解r 2. SUMO:小的类泛素蛋白质,基因转录:小的类泛素蛋白质,基因转录 & 信号通路信号通路r 3. 催化反应通路的分子机制相似催化反应通路的分子机制相似r 4. 序列相似性:不显著!序列相似性:不显著!Bioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-
26、2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCSUMOUbiquitinBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCr 1. 基因组信息基因组信息 (Genomic information)|A. Gene fusi
27、on and fission|B. Conservation of gene order/bidirectional pairs|C. Phylogenetic profiler 2. 关联的序列特征关联的序列特征 (Correlated sequence signatures)r 3. mRNA co-expressionr 4. Literature miningBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCABABQuery proteinLinked proteinRosetta proteinMarcotte EM et al., Science 1999, 285:751-753; Enright AJ et al., Nature, 1999, 402:86-90Genome AGenome BBioinformatics, 2008-2009, Semester 1, USTCBioinformatics, 2008-2009, Semester 1, USTCGene order pairsBidirectional transcribed gene pairsDan
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 园林古建筑结构加固技术方案
- 公司流程文档管理与归档方案
- 2025四川绵阳科技城新区投资控股(集团)有限公司(含所属公司)人力资源需求外部招聘暨市场化选聘应聘人员复试(第三批次·第二部分)笔试历年难易错考点试卷带答案解析
- 2025四川广安发展建设集团有限公司子企业市场化选聘职业经理人拟录用对象查看详情笔试历年备考题库附带答案详解
- 2025内蒙古苏尼特国有资产管理有限责任公司招聘笔试历年备考题库附带答案详解
- 2025云南大口马牙国际旅行社有限公司招聘合同制工作人员重启笔试历年难易错考点试卷带答案解析
- 2026黑龙江哈尔滨新区第十八幼儿园招聘笔试模拟试题及答案解析
- 2026年大庆市红岗区机关事业单位人才引进20人笔试参考题库及答案解析
- 2026河南安阳市融媒体中心(集团)招聘10人考试备考题库及答案解析
- 2026年性格和综合素质测试题及答案
- 机场跑道照明系统方案
- 电子技术基础练习题库(含参考答案)
- 统编版四年级下册语文《绿》 课件完整版
- 量子计算与量子通信
- 破产管理人保密制度
- 2024年业主门窗合同协议书模板
- 药品法律法规知识竞赛考试题库(含答案)
- 动静脉采血技术课件
- 盐城中南大有境、宝龙广场调研报告
- 探索2-个人信息资源的防护措施-课件-苏科版(2023)初中信息技术七年级下册
- 医院健康教育与健康促进培训课件
评论
0/150
提交评论