




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、真核生物基因在染色体上分布的非随机性(综述)于 鹏 2003级博士生 专业:免疫学 导师:马大龙教授近年来随着基因组数据的积累,越来越多的证据表明真核生物的基因在染色体上不是随机分布的,至少一部分基因倾向于以簇(cluster)的形式分布于染色体上。下文就这个领域的研究进展加以介绍。一、 真核基因非随机分布的证据1全基因组研究开展之前的零星证据在基因组序列大规模获取之前,在真核生物中已经发现了一些基因簇的例子, 如Hox 与 globin 基因家族,通常认为这是基因组局部复制的结果,即串联重复(tandem duplicate)。另外一个典型的例子是印迹基因(imprinted gene)的成
2、簇存在 1。2 全基因组研究提供的证据1)共表达(co-expression)基因的成簇现象全基因组水平的转录研究尤其是采用microarray技术研究发现,在真核生物中广泛存在共表达(co-expression)现象,而且共表达的基因有成簇存在的趋势。共表达最早的例子出现在对酵母细胞有丝分裂的研究过程中。Cho et al 发现在酵母细胞中,具有细胞周期依赖性表达模式(cell-cycle-dependent expression)的基因中有25%的基因位于在同一细胞周期中表达基因的附近区域,这些共表达基因形成的簇很少超过10个基因,总长约几个kb 2。随后在线虫中也发现了类似的共表达现象,
3、不过成因有所不同,是通过多个基因形成操纵子(operon)来实现的。线虫是目前发现的极少数具有操纵子结构的真核生物之一。与原核的操纵子不同,线虫的操纵子基因转录形成一条长的多顺反子(polycistronic)mRNA前体, 而后被降解成单个小mRNA再转入翻译阶段。约15%的线虫基因是位于操纵子中, 每个操纵子大小与酵母中的共表达基因簇类似,一般不超过10个基因 3,4。多细胞真核生物中也发现存在共表达的基因簇。与前两者相比,基因簇的大小显著增加。例如在果蝇中,45%睾丸组织特异性表达的基因可以形成无间断的基因簇,每个簇最少包括4个基因 5。如果将限制条件放松,允许共表达的基因间有其它基因的
4、插入,则簇的大小可以显著增加。Spellman 与 Rubin 6 采用10kb的滑动窗口考察果蝇染色体的转录情况,发现20%的基因落在共表达基因簇中,每个基因簇包括约10-30个基因,大小约为125kb。拟南芥中发现的基因簇跨越大约20个基因 7,8,9。在哺乳动物中,共表达的基因簇大小甚至可以达到1M的水平10。Yutaka et al 11 对酵母、线虫、果蝇、小鼠、大鼠、人类的mRNA表达数据做了比较分析,证实共表达现象在真核生物中是普遍存在的,在10kb范围内的基因尤其可能发生共表达。发现共表达基因的成簇现象后,人们自然会问是否共表达的基因具有功能相关性。通常考察的方法是看共表达的基
5、因是否位于同一代谢途径,编码蛋白是否存在相互作用,或是否位于基因标准注释体系GO (gene ontology)的同一分类下。在酵母中,许多共表达基因簇中的成员在功能上具有相关性11,12,而在其它高等生物中如人中,这种相关性不明显11。这可能是由于两方面的原因造成的,一方面可能这些共表达基因真的不存在功能关联,而另一方面也可能是由于目前对基因功能注释数据不足。Homin K. Lee 13 对人类的基因芯片数据做了大规模的比较研究,他们的结果表明,两个基因在越多的样本中存在共表达,则越可能存在功能上的关联性。虽然共表达与功能相关性之间还不能建立必然的联系,但至少可以为基因功能注释提供一定的线
6、索。2)功能相关基因的成簇趋势Lee 与 Sonnhammer 14 利用代谢途径数据库KEGG ( KYOTO ENCYCLOPAEDIA OF GENES AND GENOMES) 的数据,考察了人、线虫、果蝇、拟南芥基因组中功能相关基因的分布情况。他们的方法是首先定义一个聚类得分(clustering score)的计算公式。 对一条代谢途径计算对应的聚类得分。随后在基因组内随机取200组基因,每组基因数与该代谢途径包含的基因数相等,而且每组中基因两两不重复。计算200组数据的聚类得分,作为随机情况下聚类得分的分布。以该分布中3/4分位数(third quartile)到中位数的距离作为
7、阈值,如果考察代谢途径的聚类得分显著高于此阈值,则表示该途径包含的基因不是随机分布。基因间距离打分公式:基因位于同一染色体上 pair score= 基因组内染色体平均长度/两基因间距离基因位于不同染色体上pair score=基因组内染色体平均长度/两基因所在染色体长度的平均值总聚类得分 clustering score = 结果表明在所有考察的代谢途径中,酵母中有98%的代谢途径包括的基因有聚集的趋势,果蝇中最低占30%,人类中比例为65%,随机抽取基因构成的代谢途径中仅有11%有成簇趋势。凡是有成簇趋势的代谢途径的聚类得分都远远高于规定的阈值(15倍左右)。文章中还对基因组中任意两基因间
8、的距离做了计算,人类任意两基因的距离为62.79MB, 标准差为14.1M, 以20M (62.79-3×14.1 P<0.01)距离作为基因间距离的阈值,同一代谢途径内的基因也比随机情况更加靠近。 3)基因的规则分布(regular spacing )Képès 15 研究发现在酵母中,受同一转录因子调控的基因在染色体上呈规律的分布,很可能与染色体的高级结构的规律性对应。二、 基因非随机分布的机制从上面的证据可以看出,真核生物基因组内的基因分布不是随机的,存在很多共表达的基因簇。在不同生物中这类基因簇的大小不尽相同,从几kb到1Mb都有存在。对不同尺度的基
9、因簇,有不同的机制来实现同一簇中基因的共表达。1 一级结构调控早期的转录研究认为基因的转录仅仅是由其上游启动子序列控制的,即 promoter-drives-expression 模型。这一模型过于简单,现在的研究已远远突破这种认识。该模型可以对一些小范围内的共表达情况做出解释。例如串联重复基因(tandem duplicate gene)因为具有类似的启动子,所以表达情况类似。另外在酵母2,16,17和人类18,19中存在一定数目的双向启动子(bidirectional promoter),可以引起两侧基因的共表达。符合这一模型的极端例子是共表达的多个基因发生融合用以合成一种蛋白产物。 2染
10、色体高级结构的调控 最近的研究表明基因的转录直接受染色体高级结构的影响,其中主要的两个因素是基因所处染色体区域的状态和该区域在核内的位置。1)染色体状态(chromosome state)染色体处于凝集状态即异染色质(heterochromatin)状态时,转录因子不能结合,不能引发转录。只有当染色体处于松弛状态,才可能发生转录。目前认为染色体状态的改变是通过对构成染色体骨架的核心组蛋白(core histone)的修饰完成的20。特异的组蛋白修饰蛋白控制着染色体的打开或是关闭,而且这种控制可以在染色体上延伸相当长的距离,直到遇到边界元件(boundary element)为止21,22(见图
11、1)。组蛋白的修饰由多种类型,主要的有甲基化/去甲基化,乙酰化/去乙酰化等等。组蛋白的甲基化或是去乙酰化可以使组蛋白与染色体紧密结合,使转录因子无法结合而无法起始转录,反向修饰则激活转录。有些修饰是可以长期保持,比如对组蛋白上的赖氨酸的甲基化修饰,需要缓慢地替换组蛋白或是DNA复制来消除。而通过对组蛋白乙酰化酶(histone acetylase) 和去乙酰化酶(histone deacetylase)活性的调节,可以实现对组蛋白状态的迅速调节,而且可以组织特异性地发挥作用 23,24。例如在人类中,锌指蛋白基因的特异性阻遏元件 RE-1 转录沉默因子(REST , silencing tra
12、nscription factor)通过招募组蛋白去乙酰化酶,可以特异性地抑制非神经组织中锌指蛋白基因的转录。但是染色体区域处于打开状态只是满足转录起始的基本条件,打开区域的基因是否转录还依赖于其它因素,比如启动子的甲基化状态、是否有合适的转录因子,以及其它顺式作用元件(cis-element)的影响。2)染色体的三维结构与核内位置前文提到Képès 15 发现在酵母中受同一转录因子调控的基因在染色体上规则分布,这与描述染色体高级结构影响基因转录的“active chromoatin hub”模型26符合。该模型认为染色体上相隔一定距离的的同一类顺式作用元件通过与共同的反式
13、作用因子结合而将染色体分隔成一系列规则大小的拓扑环结构(见图1),只有在靠近这些顺式元件附近的基因才能表达,而远端的基因不表达。Akashi et al 25对造血干细胞的研究了表明干细胞中大部分的染色体区域是处于打开的状态,对应分化的全能性。而随着分化过程的进行,特定的染色体区域被关闭,细胞也就分化成不同类型,为上述的模型提供了支持。另外染色体在核内所处的位置也影响着基因的转录。在酵母中将基因移至核的边缘会导致基因沉默27。许多物种中分裂间期的染色体都处于特异的、相对紧凑的核内位置,而且基因含量高的染色体更倾向于分布于核的中央28,29。所有这些都暗示核内的三维位置与基因表达之间存在关联关系
14、。有观点认为核内定位对共表达基因的进化可能存在选择作用,可能产生两种影响:一种是使共表达基因在一条染色体上形成基因簇,rRNA基因被认为是这方面的代表;另一种影响是使不同染色体上的相关基因在空间上定位于相近的区域从而具有共同表达的潜力,tRNA 基因在染色体上不形成基因簇,但在核内相关,属于此种情况30。真核生物核内具有10-30个主要的结构区域,在这些区域mRNA代谢因子高度聚集,染色体的基因高密度区段与这些结构区域有密切的联系31,32。这些区域可能与共表达基因形成的基因簇相对应。SC35 结构域被认为是核内结构域的代表,Shopland et al 31 认为它是许多基因簇的功能中心,如
15、果染色体只是打开而没有与SC35结构域结合,则转录会受到限制。三、 基因非随机分布的成因与维持共表达甚至功能相关基因的成簇化,在进化中有一定的选择(selection)优势。在原核生物中,功能相关的基因形成operon, 有利于编码的蛋白产物迅速形成复合物,从而更加稳定、毒性更小,或是利于蛋白相互作用 33。真核生物染色体处于高度凝集状态,基因转录时,需要解开大段的DNA区域,功能相关的基因在一维或是三维结构上聚集在一起,可以减少解开螺旋的消耗。但基因最初如何聚在一起,可能是选择作用的结果,也可能是随机出现的结果。例如最初两个功能不相关的基因,通过偶然事件靠近在一起,后来可以在进化中变得功能相
16、关。即我们不能根据现在观察到的共表达基因成簇的现象来回推最初这些基因之间是否存在连锁关系34,35,36。但是在基因簇形成后,选择作用起到了维持基因簇的作用。例如在酵母中共表达的基因对在线虫中仍然保持较好的共表达关系37。但是基因簇中成员的精确位置和方向性并没有很好的保守性14,显示对这方面可能不存在选择作用。四 总结综上所述,真核生物基因分布的非随机化已经得到了确认,一个新的更加规则的基因组结构模型展现在我们面前:至少在一定程度上,基因组可以被划分为一系列结构单元(block),基因的表达调控是以这些结构单元为基本单位进行的,同一单元内的基因具有共调控(共表达/共抑制)的潜力34。 图1 基
17、因转录的不同层次调控a. 一级结构调控 promoter-drives expressionb. 通过组蛋白修饰的调控c. “active chromoatin hub” model, 染色体上的顺式作用元件通过与反式作用因子结合形成规则大小的拓扑环,靠近环连接处的基因可能共表达,远端基因不表达d. 核内位置对表达的影响,位于核中央的基因易于表达参考文献1. Reik, W. & Walter, J. Genomic imprinting: parental influence on the genome. Nature Rev. Genet. 2, 2132 (2001).2. Ch
18、o, R. J. et al. A genome-wide transcriptional analysis of the mitotic cell cycle. Mol. Cell 2, 6573 (1998).3. Blumenthal, T. et al. A global analysis of Caenorhabditis elegans operons. Nature 417, 851854 (2002).4. Lercher, M. J., Blumenthal, T. & Hurst, L. D. Co-expression of neighboring genes i
19、n Caenorhabditis elegans is mostly due to operons and duplicate genes. Genome Res. 13, 238243 (2003).5. Boutanaev, A. M., Kalmykova, A. I., Shevelyou, Y. Y. & Nurminsky, D. I. Large clusters of co-expressed genes in the Drosophila genome. Nature 420, 666669 (2002).6. Spellman, P. T. & Rubin,
20、 G. M. Evidence for large domains of similarly expressed genes in the Drosophila genome. J. Biol. 1, 5 (2002).7. Williams, E. J. B. & Bowles, D. J. Co-expression of neighbouring genes in the genome of Arabidopsis thaliana. Genome Res 14, 1085-1094 (2004). 8. Birnbaum, K. et al. A gene expression
21、 map of the Arabidopsis root. Science 302, 19561960 (2003).9. Zhu, T. Global analysis of gene expression using GeneChip microarrays. Curr. Opin. Plant Biol. 6, 418425 (2003).10. Lercher, M. J., Urrutia, A. O. & Hurst, L. D. Clustering of housekeeping genes provides a unified model of gene order
22、in the human genome. Nature Genet. 31, 180183 (2002).11. Fukuoka, Y., Inaoka, I. & Kohane, I. S. Inter-species differences of co-expression of neighboring genes in eukaryotic genomes. BMC Genomics 5, 4 (2004).12. Cohen, B. A., Mitra, R. D., Hughes, J. D. & Church, G. M. A computational analy
23、sis of whole-genome expression data reveals chromosomal domains of gene expression. Nature Genet. 26, 183186 (2000).13. Homin K. Lee, Amy K. Hsu, Jon Sajdak, Jie Qin, and Paul Pavlidis Coexpression Analysis of Human Genes Across Many Microarray Data Sets Genome Res. 14, 1085-1094 (2004).14. Lee, J.
24、M. & Sonnhammer, E. L. L. Genomic gene clustering analysis of pathways in eukaryotes. Genome Res. 13, 875882 (2003).15. Képès, F. Periodic epi-organization of the yeast genome revealed by the distribution of promoter sites. J. Mol. Biol. 329, 859865 (2003).16. Cohen, B. A., Mitra, R. D
25、., Hughes, J. D. & Church, G. M. A computational analysis of whole-genome expression data reveals chromosomal domains of gene expression. Nature Genet. 26, 183186 (2000).17. Kruglyak, S. & Tang, H. Regulation of adjacent yeast genes. Trends Genet. 16, 109111 (2000).18. Wright, K. L. et al. C
26、oordinate regulation of the human Tap1 and Lmp2 genes from a shared bidirectional promoter. J. Exp. Med. 181, 14591471 (1995).19. Trinklein, N. D. et al. An abundance of bidirectional promoters in the human genome. Genome Res. 14, 6266 (2004).20. Strahl, B. D. & Allis, C. D. The language of cova
27、lent histone modifications. Nature 403, 4145 (2000).21. Turner, B. M. Cellular memory and the histone code. Cell 111, 285291 (2002).22. Labrador, M. & Corces, V. G. Setting the boundaries of chromatin domains and nuclear organization. Cell 111, 151154 (2002).23. Robyr, D. et al. Microarray deace
28、tylation maps determine genome-wide functions for yeast histone deacetylases. Cell 109, 437446 (2002).24. Lunyak, V. V. et al. Co-repressor-dependent silencing of chromosomal regions encoding neuronal genes. Science 298, 17471752 (2002).25. Akashi, K. et al. Transcriptional accessibility for genes o
29、f multiple tissues and hematopoietic lineages is hierarchically controlled during early hematopoiesis. Blood 101, 383389 (2003).26. de Laat, W. & Grosveld, F. Spatial organization of gene expression: the active chromatin hub. Chromosome Res.11, 447459 (2003).27. Andrulis, E. D., Neiman, A. M., Z
30、appulla, D. C. & Sternglanz, R. Perinuclear localization of chromatin facilitates transcriptional silencing. Nature 394, 592595 (1998).28. Cremer, T. & Cremer, C. Chromosome territories, nuclear architecture and gene regulation in mammalian cells. Nature Rev. Genet. 2, 292301 (2001).29. Tana
31、be, H. et al. Evolutionary conservation of chromosome territory arrangements in cell nuclei from higher primates. Proc. Natl Acad. Sci. USA 99, 44244429 (2002).30. Thompson, M., Haeusler, R. A., Good, P. D. & Engelke, D. R. Nucleolar clustering of dispersed tRNA genes. Science 302, 13991401 (2003).31. Shopland, L. S., Johnson, C. V., Byron, M., McNeil, J. & Lawrence, J. B. C
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 商务发展过程中常见的试题及答案
- 声音表现的层次感与乐理知识的结合试题及答案
- 捣蛋鬼试题及答案
- 建筑施工安全行业标准试题及答案
- 医疗AI培训提升专业素养与伦理意识
- 安全工程师如何提升施工现场的安全合规性试题及答案
- 家具设计中的品牌传播策略考题试题及答案
- 幼儿园数学分组活动试题及答案
- AI技术下的数据驱动决策的伦理考量
- 老龄教育课程改革与创新:2025年教学模式创新实践报告
- 宫颈炎的护理查房
- 超市生鲜采购流程制度完整
- 2022年山东省青岛一中自主招生化学模拟试卷一(附答案详解)
- 表C.1.1 工程概况表(例)
- 项目进度计划排期表EXCEL模板
- 供应商质量事故索赔单
- 内蒙古鄂尔多斯达拉特经济开发区(达拉特产业园区块)区域性地震安全性评价报告
- 集体备课 初中英语情态动词讲解 练习及答案
- 突发公共卫生事件流行病学-课件
- 马拉松体检表
- 利巴韦林注射液生产工艺验证方案
评论
0/150
提交评论