(通信与信息系统专业论文)两种真核模式生物核小体定位研究.pdf_第1页
(通信与信息系统专业论文)两种真核模式生物核小体定位研究.pdf_第2页
(通信与信息系统专业论文)两种真核模式生物核小体定位研究.pdf_第3页
(通信与信息系统专业论文)两种真核模式生物核小体定位研究.pdf_第4页
(通信与信息系统专业论文)两种真核模式生物核小体定位研究.pdf_第5页
已阅读5页,还剩116页未读 继续免费阅读

(通信与信息系统专业论文)两种真核模式生物核小体定位研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

两种真核模式生物核小体定位研究 专业名称 研究方向 博士生 指导教师 通信与信息系统 生物信息学 丰继华 戴宪华教授 摘要 本文由三部分组成,主要研究了酵母和果蝇核小体定位问题。在第一部分中, 根据现有酵母核小体定位数据间普遍存在着不一致性,推断出核小体在活体细胞 内是动态分布的。计算分析进一步表明,核小体在基因组范围内的动态变化规律 主要体现在基因的转录起始位点( t s s ) 周围。本文通过引入逻辑运算成功提取 了独立核小体定位实验数据集间的一致性和差异性,发现并验证了酵母基因组中 主要存在着两种形式的核小体分布:动态核小体和稳定核小体。在此基础上,对 基因的主要转录属性和核小体分布特征进行了相关分析和聚类,得出了动态核小 体并不对转录构成障碍这一重要结论。定量分析表明,在基因转录起始位点下游 的+ l 核小体内存在一个调控敏感位点,喻示着酵母在进化中对染色质环境做了 优化。其次,在观察有、无t a t a 盒基因上的两种核小体分布时,发现二者存在 着明显差异。最后根据热冲击后核小体位置变化,发现了两种核小体滑动模式。 综合以上结论,本文提出酵母基因组在适应环境过程中,同时在硬遗传物质 和软遗传物质两个方面进行了协同进化。 在第二部分中,本文对果蝇胚胎期核小体定位做了全面研究。观察到果蝇胚 胎期不同表达模式基因上的核小体在占据方式上存在着显著差异,并且这种差异 与基因表达程度相关。统计分析揭示了不同属性基因上核小体分布差异与+ l 核 小体位置无关,而是取决于+ 1 和+ 2 核小体之间的连接d n a 长度。通过比较表达 基因与沉默基因上r n a 聚合酶i i 的浓度变化,揭示了聚合酶i i 在表达基因的核小 体定位中起到了关键作用。此外,在研究含组蛋白变异体的核小体分布时,观察 到两类基因的h 2 a z 核小体占据强度也存在着显著差异,因而从另一个角度提供 了聚合酶i i 对核小体定位有着重要影响的佐证。据此,本文建立了一个代表两类 基因上核小体定位分布的解释模型。根据果蝇胚胎期表达基因与沉默基因在d n a 弯曲能力、转录因子结合位点( t f b s ) 分布以及d n a 与核小体亲和性上存在的差 异,本文认为果蝇在。硬遗传方面同样留下了进化印迹( f o o t p r i n t ) 。最后本 文引入l a s s o 算法对果蝇核小体定位成因进行了回归分析。 在第三部分中,本文对酵母和果蝇的核小体定位及相关因素作了跨物种间的 横向比较。内容不仅包括了两个物种中不同性质核小体的分布特征,而且还包括 了它们各自的d n a 物理特性、聚合酶i i 以及转录因子结合位点的分布。分析结果 表明,核小体定位在物种问既有广泛的保守性,又有显著的差异性,而这种差异 主要体现在生物进化程度与核小体定位复杂程度是高度相关的。最后通过总结两 个物种间核小体定位的相似性,本文从全新角度提出了一个代表真核生物共性的 通用核小体组装模型。 关键词:核小体组蛋白转录起始位点( t s s ) t a t a 盒转录因子结合位点( t f b s ) n 。 一一 - c o m o a r a t i v es t u d yo i - n u c l e o s o m ep o s i t i o n i n gi nt h e t w oe u k a r y o t i cm o d e l m a j o r : o r g a n i s m s c o m m u n i c a t i o na n di n f o r m a t i o ns y s t e m r e s e a r c hd i r e c t i o n :bi o i n f o r m a t i c s n a m e :j i h u af e n g s u p e r v i s o r :x i a n h u ad a i ,p r o f e s s o r a b s t r a c t t h i s p a p e rm a i n l y s t u d i e dt h en u c l e o s o m e p o s i t i o n i n g i nt h e y e a s t s a c c h a r o m y c e sc e r e v i s i a ea n dt h ef r u i t f l yd r o s o p h i l am e l a n o g a s t e r t h ep r e s e n t d i s s e r t a t i o nm a i n l yc o n s i s t so ft h r e ep a r t s i nt h ef i r s tp a r t ,a c c o r d i n gt ot h e d i s a g r e e m e n t sb e t w e e nt h e s ec r o s s - p l a t f o r me x p e r i m e n t a ld a t a s e t s ,w es p e c u l a t e dt h a t t h en u c l e o s o m e sa r ed y n a m i cd i s t r i b u t i o ni nv i v o a f t e ra n a l y z i n gt h ed a t a ,w ef o u n d t h a ti nw h o l eg e n o m et h ed y n a m i cd i s t r i b u t i o no fn u c l e o s o m e sp r e s e n t sar e g u l a r a r r a n g e m e n t , w h i c h i st h ec e n t r a l i z e dr e f e c t i o no fn u c l e o s o m e p o s i t i o n i n g s u r r o u n d i n gt r a n s c r i p t i o ns t a r ts i t e ( t s s ) b yu s i n gl o g i co p e r a t i o n ,w es u c c e s s f u l l y o b t a i n e dt h ea g r e e m e n ta n dd i s a g r e e m e n t sb e t w e e nt h e s ed a t a s e t sa n df i r s td e t e r m i n e d t h e r ea r em a i n l yt w ok i n d so fn u c l e o s o m ed i s t r i b u t i o n si ny e a s t :t h ed y n a m i ca n dt h e s t a b l eo n e o nt h eb a s i so fa b o v er e s u l t s ,w ei n v e s t i g a t e dt h er e l a t i o n s h i pb e t w e e n n u c l e o s o m e sa n dt r a n s c r i p t i o n a lp r o p e r t i e su s i n gc o r r e l a t i o na n a l y s i sa n dk - m e a n c l u s t e r t h e n , w ec o n f i r m e dt h a t t h ed y n a m i cn u c l e o s o m e sd on o ts e r v ea s t r a n s c r i p t i o nb a r r i e r s b yq u a n t i t a t i v ea n a l y s i so f t h ed i s t a n c e sb e t w e e nt h ed y 7 a do f + l n u c l e o s o m e sa n dt s s ,w ef o u n das e n s i t i v er e g u l a t i o np o 缸i nt h eu p s t r e a mb o r d e ro f t h e + 1n u c l e o s o m e ,s u g g e s t i n gt h a tt h ey e a s tg e n o m eh a se v o l v e da no p t i m u m c h r o m a t i nc o n f o r m a t i o nf o rg e n er e g u l a t i o n o nt h eo t h e rh a n d ,w eo b s e r v e dt h a tt h e 1 1 1 + ln u c l e o s o m ep o s i t i o n sd i f f e ri nt a t a c o n t a i n i n ga n dt a t a - f r e e p r o m o t e r s f i n a l l y , a c c o r d i n gt on u c l e o s o m ep o s i t i o n sc h a n g i n ga f t e rh e a ts h o c k , w ef o u n dt w o n u c l e o s o m a ls l i d i n gm o d e l s t a k e nt o g e t h e r , w ec o n c l u d e dt h a tt h ey e a s ta l w a y s n e e d sc o e v o l u t i o nb e t w e e nt h e h a r d w a r e a n dt h e s o f t w a r e i ng e n o m e w i d e i nt h es e c o n dp a r t ,t h ep a p e rc o m p r e h e n s i v e l ys t u d i e dt h en u c l e o s o m ep o s i t i o n i n g i nd r o s o p h i l ae m b r y o w ef i r s to b s e r v e dt h a tt h eg e n e sw i t hv a r i a b l ee x p r e s s i o n p a t t e r n sh a v es i g n i f i c a n t l yd i f f e r e n tn u c l e o s o m eo c c u p a n c y , w h i c hd i r e c t l ya s s o c i a t e d w i t ht h el e v e lo fg e n ea c t i v i t y s t a t i s t i c a la n a l y s i sc o n f i r m e dt h a tg e n ec l u s t e r sd i f f e r i nt h en u c l e o s o m ed i s t r i b u t i o n sd u et ot h el e n g t ho fl i n k e rd n ab e t w e e n + la n d + 2 n u c l e o s o m e sr a t h e rt h a n + ln u c l e o s o m ep o s i t i o n s w ec o n f i r m e dt h a tp o li i p l a y sa n i m p o r t a n tr o l ei nt h en u c l e o s o m ep o s i t i o n i n go fe x p r e s s i o ng e n e si nt e r m so fi t s c o n c e n t r a t i o nd i s t r i b u t i o na tt h ep r o m o t e r s o nt h eo t h e rh a n d ,w h e ne x p l o r i n gt h e d i s t r i b u t i o n so fn u c l e o s o m ew i t hh i s t o n ev a r i a n t s ,w ed e t e c t e dh 2 a zn u c l e o s o m e o c c u p a n c ya l s od i f f e ri nt w ok i n d so fg e n ec l u s t e r s ,s u g g e s t i n gt h a ti x i is i g n i f i c a n t l y i m p o s e so nt h en u c l e o s o m ep o s i t i o n i n g b a s e do no u rr e s u l t s ,w ee s t a b l i s h e dam o d e l , w h i c hr e p r e s e n t st h en u c l e o s o m ed i s t r i b u t i o n si nt w og e n ec l u s t e r s s i m i l a rt ot h e o b s e r v a t i o ni ny e a s t ,d r o s o p h i l aa l w a y sp r e s e r v e st h e e v o l v i n gf o o t p r i n ti ni t s h a r d w a r e ,w h i c hm a i n l ye m b o d i e si nt h eb e n d a b i l i t yo fd n a ,t f b sd i s t r i b u t i o na n d t h ea f f i n i t yo fn u c l e o s o m e s f i n a l l y ,w eu s e dl a s s oa l g o r i t h mt oa n a l y z et h ef a c t o r s t h a tc a ni n f l u e n c ed r o s o p h i l an u c l e o s o m ep o s i t i o n i n g i nt h et b j r d p a r t ,w ec o m p a r e dn u c l e o s o m ep o s i t i o n i n ga n dr e l a t e d f a c t o r s b e t w e e nt h et w os p e c i e s w ea n a l y z e dt h ed n ap r o p e r t i e s ,p o li ia n dt f b s d i s t r i b u t i o n so ft w os p e c i e sa sw e l la st h e i rn u c l e o s o m ed i s t r i b u t i o n s t h er e s u l t s s u g g e s t e dt h a ta l t h o u g ht h ec o n s e r v e dn u c l e o s o m ep o s i t i o n se x i s ti nt w os p e c i e s ,t h e s i g n i f i c a n td i f f e r e n c e sa r ee v i d e n t , w h i c hr e f l e c t st h a tt h ed e g r e eo fe v o l u t i o ni s h i 曲l yc o r r e l a t e dw i t hn u e l e o s o m a lp o s i t i o n i n gc o m p l e x i t y f i n a l l y , b a s e do nt h e c o m m o nf e a t u r eo ft w os p e c i e s ,w ep r e s e n t e dan o v e lm o d e lf o rn u c l e o s o m ea s s e m b l y f o re u k a r y o t i co r g a n i s m s i v k e yw o r d s :n u c l e o s o m eh i s t o n e ,t r a n s c r i p t i o ns t a r ts i t e ( t s s ) ,t a t ab o x , t r a n s c r i p t i o nf a c t o rb i n d i n gs i t e ( t f b s ) v 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下, 独立进行研究工作所取得的成果。除文中已经注明引用的内容 外,本论文不包含任何其他个人或集体已经发表或撰写过的作品 成果。对本文的研究做出重要贡献的个人和集体,均已在文中以 明确方式标明。本人完全意识到本声明的法律结果由本人承担。 学位论文作者签名:辛继华 h期:2 olo 年乡月弓e t 学位论文使用授权声明 本人完全了解中山大学有关保留、使用学位论文的规 定,即:学校有权保留学位论文并向国家主管部门或其指定 机构送交论文的电子版和纸质版,有权将学位论文用于非赢 利目的的少量复制并允许论文进入学校图书馆、院系资料室 被查阅,有权将学位论文的内容编入有关数据库进行检索, 可以采用复印、缩印或其他方法保存学位论文。 学位论文作者签名:辛多凄年 日期:2 o lo 年乡月弓日 1 1 研究背景及意义 1 1 1 引言 第1 章绪论 1 9 5 3 年,f r a n c i sc r i c k 和j a m e sw a t s o n 在英国的自然杂志上发表了关 于d n a 分子结构的文章,标志着分子生物学作为一门独立学科的诞生,同时也 标志着基因组时代的来临。d n a 分子双螺旋结构的发现,是人类历史上最伟大 的发现之一。 随着分子生物学研究的迅猛发展,人类对于基因组的结构和功能已有了深 刻的认识,已经可以部分地诠释基因在生命活动中的作用。但是作为承载基因进 化和完成遗传操作的染色质( c h r o m a t i n ) ,却有着非常紧密的组织结构,使得染 色质中大部分基因不仅在空间上彼此不相接触,而且在功能上还处于沉默状态。 事实上,处于活性状态的基因只占基因组中的很少一部分。那么,染色质究竟拥 有什么样的基本结构呢? 其中基因的活性状态和非活性状态在结构上又有何不 同呢? 染色质呈现的整体高压缩比( p a c k i n gr a t i o ) 提示人们,基因组d n a 不可 能是以简单折叠方式包装成染色质这样紧密而有序的最终状态,很可能是以分级 组装的方式进行包装的。 1 1 2 染色质包装的基本单元 真核细胞中的d n a 与相关蛋白质的结合称作染色质。在所有的真核生物中, 染色质的基本亚基都是相同的。这些亚基又称为核小体( n u c l e o s o m e ) 。核小体 由四种核组蛋白( h 2 a 、h 2 b 、8 3 和h 4 ) 各两份拷贝所形成的八聚体构成,d n a 贝u 缠 绕在这些组蛋白颗粒表面形成“念珠”状的重复结构。 细胞中大多数d n a 被包装进核小体,每个核小体含有大约1 4 7 b p ( b p 为d n a 长 度单位) 的包装d n a 。核小体之间的d n a 称为连接d n a ( 1 i n k e rd n a ) 。但无论是在 分裂间期细胞核中的常染色质或异染色质里,还是在有丝分裂期的染色体中,核 小体都是其中不变的组分。 d n a 通过包装进核小体,压缩了大约6 倍,形成染色体的第一级组织结构n 1 。 这种蛋白质- d n a 复合物在细胞中有两个重要功能:( 1 ) 压缩d n a 以适应细胞核空 间的大小;( 2 ) 限诗i l j d n a 的易接近性。细胞则广泛利用后一种功能来调控许多针 对d n a 的操作,其中一个关键步骤就是对基因表达进行精细的调节。 真核生物基因的表达调控是当前分子生物学最前沿的研究领域之一。由于 蛋白质一蛋白质、蛋白质- d n a 之间的相互作用,以及一些复杂大分子复合物的形 成,导致真核生物的转录调控是一个多级的复杂过程。核小体作为真核生物染色 体中基因调控的重要级,是表观遗传机制的重要组成部分。因此,知道核小体 在基因组里的精确位置是理解核小体如何通过自身定位调控d n a 复制和转录的 前提。 1 1 3 核小体在细胞中的重要功能 核小体在细胞中担负着两个主要功能,即压缩d n a 和限制d n a 的易接近性。 实现这两个功能的前提是核小体能够在特定的染色质区域中形成。尽管d n a 和组 蛋白之间的相互作用非常广泛,但却没有碱基特异性。这种相互作用特点暗示了 d n a 最终能否被包装进核小体只取决于其盘绕组蛋白的能力。核小体的原子结构 显示了d n a 盘绕在圆盘状的组蛋白核心外大约1 7 圈乜3 1 。此外,这种结构还进 一步揭示了组蛋白n 端尾所在的位置及其指导d n a 进出核小体的详细路径h 1 。 一旦d n a 包装成核小体,它就有能力形成更为复杂的高级结构来进一步压 缩d n a 。第五种组蛋白h 1 的出现有助于这个过程的完成嘲。h 1 通过与包装在核 小体上的d n a 结合后起到了一种类似于封条的作用,使得d n a 更加紧密地盘绕在 组蛋白八聚体上,形成一种更为压缩的3 0 n m 纤丝染色质结构1 。这个结构比起 单独形成核小体更具抑制性。当前的实验证据表明,一旦染色质形成了3 0 h m 纤 丝结构,参与转录的酶或蛋白质与d n a 的结合的能力就会受到极大的抑制。 另一方面,组蛋白n 端尾的化学修饰同样可以改变染色质的易接近性订1 。修 饰的种类主要包括赖氨酸的乙酰化和甲基化,以及丝氨酸的磷酸化阻。1 们。研究表 明,组蛋白n 端尾的乙酰化通常发生于基因表达的活跃区域阳1 。这些化学修饰既 可以改变核小体自身的特性,也可作为蛋白质的结合位点,从而调节染色质的易 接近性n 。同时这些修饰也会招募具有相同修饰作用的酶,对相邻的其它核小体 2 进行类似的修饰。这个过程确保了染色体复制时,父代中那些被修饰过的核小体 染色质区域得到稳定地传承n 刳。 作为表观遗传学研究的一个重要方向,基因组d n a 在复制期间组蛋白修饰 的传承机制直是研究者共同关注的问题n 3 1 。复制后的d n a 处于未包装状态的时 间极短,新的核小体会立即被组装。现在已经知道,d n a 在复制时需要一种特殊 的组蛋白伴侣分子将h 3 一h 4 四聚体和h 2 a h 2 b 二聚体护送到复制叉( r e p l i c a t i o n f o r k ) 。在d n a 复制过程中,核小体暂时解体,其中组蛋白h 3 - h 4 四聚体和h 2 a - h 2 b 二聚体会被随机分配到子代当中的任何一个。一般认为,每个新生的d n a 双螺旋 链中会含有一半旧的和一半新的组蛋白。因此,两组染色体在遗传过程中都得到 了部分上一代修饰过的组蛋白,这些修饰过的组蛋白今后可以作为“模板 ,使 邻近的组蛋白发生相似的修饰口4 1 。因此,我们将这一现象称之为子代染色质的初 始化过程。 在核小体中,d n a 与组蛋白的结合是动态的,并允许其它d n a 结合蛋白间歇 地靠近核小体上的d n a n 叼。因此在生物体细胞内,核小体一方面可以让d n a 产生 强烈扭曲,从而阻止大多数d n a 结合蛋白的接近。另一方面核小体重塑复合体又 能通过移动核小体来增加核小体d n a 与其它蛋白质的易接近性。现在已经知道了 核小体有三种可能的运动方式:( 1 ) 组蛋白八聚体沿d n a 的滑动;( 2 ) 组蛋白八 聚体从一条d n a 链完整的转移到另一条d n a 链;( 3 ) 常规组蛋白置换为变异体后, 核小体与d n a 通过更精细的重构来改变二者之间的亲和性,从而产生重新定位 c 1 6 。因此,当核小体为配合染色质行使其调控功能而固定出现在基因组的某些 特定区域时,被称之为“定位一。 1 1 4 核小体定位的基本观点 尽管染色质生物学对组蛋白上的各种翻译后修饰( p t m s ) 越来越关注,但 是沿d n a 排列的核小体具体位置仍然极为重要。与裸露的d n a 相比,缠绕在核小体 上的包装d n a 不容易被蛋白质结合,迫使这些带有重要遗传功能的蛋白质要么与 核小体竞争结合位点,要么只能结合到核小体之间的连接d n a 上。因此,基因组 中核小体的存在极大的限制了其它蛋白质与自身目标位点的结合,使得关键位置 上的核小体具有一种转录可塑性( t r a n s c r i p t i o n a lp l a s t i c i t y ) ,它们有可能 3 同时具备激活和抑制基因转录的能力n 7 馆1 。 一个关键的问题是:核小体的定位是由d n a 结合蛋白或特殊的d n a 序列所 指导的,还是随机分布的? 学术界现在基本形成了两种代表性观点:一种认为基 因组已经进化出了内在的核小体位置编码口帕,因而核小体位置是由基因组指导 的;而另一种观点则认为核小体是以热力学原理为基础,通过竞争而产生的一种 统计定位跚1 ,这种定位机制并不依赖于d n a 的编码组合瞳。但是,从现有的证据 看,二者都有不足以完整地解释核小体的整个定位过程。有鉴于此,我们认为真 实的情况应该是统计定位和内在编码定位在生物基因组中同时存在,只是它们在 不同区域的作用范围和表现程度不同,并且与细胞的生理状态密切相关。事实上, 现在根据不同的观点建立起来的定位模型,也只能够部分预测或解释活体内的核 小体定位。 尽管分子生物信息学研究近年来热点不断转换,但核小体定位研究却一直 保持着长盛不衰的势头。部分原因在于随着研究的深化,人们发现的问题要远远 多于解决了的问题。因此,深入研究核小体沿d n a 定位的规律,对于我们理解担 负遗传基本功能蛋白质的作用及其与d n a 结合的机理显得至关重要。 1 1 5 研究对象的选取 当前来自制药企业和政府机构的资助极大地促进了生物信息学的发展。这 些研究的目标都非常明确,即以改善人类的健康为宗旨。这就需要先了解分子在 人体内是如何工作的,但直接以人体为研究对象在实践中却会遇到诸多实际和伦 理困境。因此,往往采用能够模拟人体生理和生化过程的模式生物进行研究。 采用模式生物进行研究的理论基础源自于物种1 自j 基本生命过程的保守性, 即从一个生物得到的知识可能外推到包括人在内的另外一个生物上。例如单细胞 生物可以用来研究基本的细胞生化过程,避免了研究多细胞生物体内组织和器官 分化所带来的复杂性。 但是,采用同样的方式却不能用单细胞生物的代谢来解释控制多细胞生物 所需要的每一个过程。每种生物都具有其独特性。因此,对过度外推模式生物得 到的结论必须保持谨慎。具体选择哪种模式生物更好,要视需要回答的问题而定。 4 每个模式生物各有利弊。为此,有必要在两个以上不同模式生物中做平行实验。 为了全面揭示真核生物核小体的定位特点,我们分别选取一个单细胞生物 和一个多细胞生物作为研究对象。在具体物种的选取上主要考虑了以下几个因 素:( 1 ) 能否获得准确、可靠的原始实验数据;( 2 ) 选取的生物是否具有代表性; ( 3 ) 选取的生物之间是否有适当的进化距离。 通过对现有实验数据和实验条件进行综合考察后,本文最终选取了在遗传 研究上最具代表意义的两个模式生物:酿酒酵母( s c e r e v i s i a e ) 和黑腹果蝇( d m e l a n o g a s t e r ) 作为研究对象,希望通过比较分析这两种生物的核小体定位数据, 得出一些有生物学意义的结论。 在以上两种生物的全基因组核小体定位数据中,以酵母的最为丰富,共有 七组之多啪瑚。2 7 1 。但是迄今为止,果蝇在特定组织发育阶段的全基因组核小体定 位数据却有一组啪1 。因此,针对定位数据本身的特点,我们对上述生物的核小体 定位研究在方法上也有所侧重。 在生物代表性上,酿酒酵母和黑腹果蝇都是理想的模式生物,对它们的遗 传研究也比较彻底。就真核生物而言,酿酒酵母可作为简单的单细胞真菌类代表, 而黑腹果蝇则代表了具有复杂行为的多细胞昆虫类。 在生物分类学上,这两个物种分属两个进化程度不同的门类:它们是单细 胞真菌类( 门) 和多细胞的节肢蜕皮动物门。 1 2 相关领域的研究现状 1 2 1 核小体定位的基本研究方法 在核小体研究方法上,主要包括两大领域:( 1 ) 对全基因组核小体的位置 确定;( 2 ) 研究核小体与基因组的相互作用( 图1 1 ) 。 在确定核小体位置的研究中,又可分为通过实验测定核小体位置和利用计 算模型预测核小体位置。实验测定核小体位置主要使用到两种平台,一种是微阵 列平台【2 9 1 ,另一种是并行测序平台【3 2 1 。计算模型的方法主要是在实验数据有 限、难以获取的情况下,根据部分实测数据在定位因素与核小体位置间建立数学 模型预测核小体位置啪3 制。这两种方法各有利弊。利用模型预测可以确定并定量 5 分析核小体在定位过程中所依赖的因素,从而为建立全局调控系统网络奠定基 础。其次,与具体生物实验相比,模型预测显然具有成本低、使用灵活的优点。 而另一方面,对活体进行实验的优点是数据可信度高,能够直接客观地反应出体 内核小体的真实分布情况。近年来随着大规模测序技术的普及、成本的降低,通 过生化实验直接测量生物体细胞内的核小体位置逐渐成为了主流。 对核小体定位与基因组调控的研究,也可分为两个方向。一个是根据核小 体在基因组的具体位置,反过来研究与之相关的基因表达同这些核小体形成的关 系【3 5 】;而另一方面则关注于核小体的化学修饰在高级染色质的形成和对基因调 控产生的影响 8 , 9 , 3 6 , 3 7 】。 总之,核小体的研究方法之间并没有严格意义上的界线,他们往往在研究 材料上互相借鉴,在研究范围上彼此交叉,逐步形成了一个以染色质分子生物学 和表观遗传学为基础的核小体定位学分支。 图1 - 1 核小体研究方法概述 6 1 2 2 酵母核小体定位的研究现状 分子生物学中有一个著名的说法:基础问题可以在最简单和最容易获得的 系统中得以回答。因此,长期以来,分子生物学家把精力集中在少数几种所谓的 模式生物上。单细胞真核生物酵母( s c e r e v i s i a e ) 作为模式实验系统有许多 明显的优势,具体表现在以下几个方面:( 1 ) 酵母中单倍体和双倍体细胞同时存 在,便于用来进行遗传研究和分析:( 2 ) 在酵母中容易产生精确的可控制突变: ( 3 ) 酵母有一个相对较小、已经进行了深入研究的基因组;( 4 ) 酵母生长形态 的改变容易观察嘲瑚1 。 早在十九世纪六十年代,法国著明的微生物学家巴斯德路易斯( l o u i s p a s t e u r ) 就在实验中鉴别出酵母是发酵的催化剂。早期的研究最终导致了第一 个酶的发现,并随之建立了近现代生物化学实验体系。二十世纪三十年代,研究 者开始了酿酒酵母的遗传学方向的研究,使得利用遗传学和生物化学方法来解决 生物学基本问题成为了可能s 比起其他生物,酿酒酵母是一种研究得最清楚的单细胞真核生物。研究者 们很早就注意到了这种生物的特点:它们的基因组非常紧凑;基因数目也比较少; 在实验室里可以迅速繁殖。尽管酵母细胞比较简单,但却具备了所有真核生物细 胞的主要特征。因此1 0 0 多年来人们对酿酒酵母进行了大量的研究。 尽管酿酒酵母的遗传学研究取得了丰硕成果,积累了大量的实验材料,但 在表观遗传学方面,尤其是对核小体定位展开深入研究的时间并不长。现阶段对 酵母核小体定位的研究,在方法上仍可分为实验和预测两类。实验定位是利用微 球菌酶剪切核小体连接d n a ,然后通过与基因组c d n a 微阵列( m i c r o a r r a y s ) 杂交或直接利用高通量并行d n a 测序( p a r a l l e l d n as e q u e n c i n g ) 技术在全 基因组范围测定核小体位置 2 0 , 2 2 - 2 7 , 4 0 , 4 1 】;另一类是预测定位,主要是根据实验提 取的部分核小体包装d n a 样本,对序列的核酸组合进行统计分析或结合比较基 因组学方法,建立数学模型对核小体位置进行预测1 9 3 4 1 。 由于酵母基因组本身相对较小,随着新出现的高通量测序技术成本不断下 降,并逐渐在实验室得到普及后,近来用实验方法直接测定核小体位置已经成为 研究的主要手段。y u a n 等人在2 0 0 5 年首先应用交叠覆盖微阵列( t i l i n gm i c r o a r r a y s ) 技术测定了酵母部分基因组上的核小体位置h 。2 0 0 7 年,l e e 等人嘲1 又利用高分 7 辨率微阵列技术第一次完成了酵母全基因组的核小体位置测定。同年, w h i t e h o u s e 等人乜2 1 也完成了高分辨率的酵母全基因组核小体位置测量,并首次 测定了在遗传干扰条件下酵母核小体的占位率。同样是在2 0 0 7 年,在高通量并 行测序技术迅速普及的背景下,a l b e r t 等人隆7 1 用该方法结合免疫沉淀反应技术 ( c h i p c h i p ) 成功完成了首个酵母全基因组中含有组蛋白变异体h 2 a z 的核小 体定位图谱。接下来的2 0 0 8 年,s h i v a s w a m y 1 、m a v r i c h 、f i e l d 2 6 1 和k a p l a n 嘲 等人也分别利用并行测序方法测定了酵母全基因组的核小体位置,其中 s h i v a s w a m y 等人甚至还给出了热冲击条件下的核小体定位数据。值得一提的是, k a p l a n 等人在研究中设计了一个体外人工系统来模拟核小体重建,首次给出了 代表d n a 包装亲和性的体外重建核小体定位数据。 在核小体预测领域,最具有代表性的是2 0 0 6 年s e g a l n 鲫等人提出的基于基 因组编码的核小体定位预测模型。同年,i o s h i k h e s 等人口钔又利有比较基因组的 方法,提出了自己的核小体定位预测模型。随后,p e c k h a m 等人则在2 0 0 7 年利 用已知核小体包装序列训练了一个支持向量机( s v m ) ,建立了一个基于机器学习 的核小体定位预测模型1 。2 0 0 9 年,上述提到的k a p l a n 等人在同一项研究中利 用他们得到的核小体体外实验数据进一步发展并完善了s e g a l 等人早期提出的 定位预测模型瞵1 。尽管上述预测模型在很多方面取得可喜的成果和重要结论,但 总体预测准确率并不令人满意。因此,研究人员在分析预测准确率不高的原因时, 开始提出了核小体动态分布假说n 5 4 2 1 。 其次,在对酵母核小体位置形成机理的认识上也普遍存在两种观点。一种 观点认为,核小体对d n a 序列的偏好性并不是定位的主要因素,基因组是在反 式作用下,通过与a t p 水解相关的核小体重塑复合体完成对核小体定位的,并 且这一作用远远超过了核小体对序列偏好,它可将核小体移动到任何需要的位置 上【4 3 ,删。然而,另一种相反的观点则认为,重建复合体自身不能决定核小体移 动的最终目的地。相反,重建复合体可能允许核小体迅速地尝试选取不同的位置, 这导致了核小体与d n a 特定位点上的结合蛋白为抢占基因组位置而展开竞争, 最终达到热力学平衡。在此观点中,核小体的定位是在顺式调控下,通过序列的 内在偏好性完成的【1 9 ,2 5 ,3 4 1 。 然而迄今为止,无论是对酵母核小体的预测,还是对酵母核小体位置成因 8 的研究都没有形成一个统一的理论框架,这方面的工作还有待不断的深化和完 善。 1 2 3 果蝇核小体定位的研究现状 黑腹果蝇( d m e l a n o g a s t e r ) 在生物化学研究中一直占据着中心位置。当 前对遗传基本原理的理解,包括基因的本质、遗传世系和重组都来自对果蝇的研 究h 引。当二十世纪七十年代发明了重组d n a 技术后,使得研究者第一次在首个多 细胞生物中将分子损伤与表型变异联系了起来n 们。经过三十多年的努力,果蝇的 研究为我们理解生物体内用于控制发育的中心调控原理提供了原型。其中三位杰 出的先驱还为此获得了1 9 9 5 年诺贝尔生理学奖。果蝇研究中鉴定出的许多信号 通路( 如n o t c h ,w n t 和h e d g e h o g ) 现已被证实与人类主要疾病有关。这些疾病 包括了癌症、心血管病、内分泌疾病和神经失调h 。同样地,果蝇研究还发现了 许多直接关系到人类健康的基本生理过程,包括先天免疫响应、干细胞的分化与 维持、细胞和器官的极化与生长控制机制等。另一方面,对研究以昆虫为主要传 播媒介的流行性疾病,果蝇也是一个非常理想的模型。例如常见的疟疾 ( a n o p h e l e sg a m b i a e ) 、登革热( a e d e sa e g y p t i ) 以及西尼罗河热( c u l e x p i p i e n s ) 。对于理解复杂的遗传本质,果蝇同样是一个非常好的模式生物,它提 供了一个深入了解基因与基因之间、基因与环境之间的相互作用模型,并且许多 成果都可以用于人类自身的研究。 然而,对果蝇核小体的研究尚在初始价段,尤其是全基因组的核小体定位 研究数据非常少。与单细胞的酵母不同,多细胞生物由于存在着不同的器官组织 和大量已分化了的细胞类型,要分别对这些具有独特功能和染色质状态的细胞进 行核小体定位是非常困难的。因此如何在多细胞生物中提取不同发育阶段和不同 组织中的核小体,成为摆在研究者面前的难题。 2 0 0 7 年,t o m a n c a k 等人n 胡在研究中发现,果蝇在胚胎发育过程中涉及到非 常多的细胞类型。尽管在各种细胞中不同基因子集之间存在着截然不同的表达模 式脚瑚1 ,但是其总体上的基因表达谱却在卵细胞受精后到成体的各个发育阶段呈 现出关联性。这个现象表明,果蝇基因组在胚胎发育阶段可能存在着一个共用的 9 指令集,它负责调控一些处在常态表达的管家基因( h o u s e k e e p i n gg e n e ) ,因而 表现出一种广泛表达模式( b r o a de x p r e s s i o np a t t e r n ) 旧1 。这些在时间和空间 上本来都是独立表达的基因却在胚胎中呈现出表达相似性,喻示着果蝇在胚胎期 各个细胞系中的核小体极有可能具有相同的组织形式。 正如预期的那样,m a v r i c h 等人呦1 在2 0 0 8 年首次公布的果蝇胚胎期全基 因组核小体定位数据证实了这一猜测。他们的数据中包括了一组高分辨率的 h 2 a z 核小体位置数据和一组中分辨率的总体核小体占位率数据。研究结果证实 了核小体在果蝇胚胎中不同类型细胞里有着大体相似的组织排列形式,表明果蝇 胚胎的染色质环境仍保留了大量原始单细胞真核生物的特征,这为研究带来了极 大方便。例如,在果蝇胚胎中活化基因的转录起始位点周围和酵母样仍然保留 了一1 核小体、核小体缺失区域( n f r ) 和+ 1 核小体这种常规组织排列形式。但它 们之间同时也存生着明显的物种间差异,譬如与酵母明显不同的是:在一1 核小 体位置上,果蝇通常没有组蛋白发生变异的h 2 a z 核小体啪1 。 此外,在对染色质重塑复合体的研究中,h a r t l e p p 等人嘞1 发现c h r a c 复合 体不但能影响d n a 的易接近性,而且还是一个进化上保守的核小体重塑因子,它 能促进组蛋白八聚体在d n a 上的滑动。同时m i t o 等人嫡订在对果蝇核小体组蛋白 置换研究中还发现,在果蝇的同源异型基因族( h o m e o t i cg e n ec l u s t e r s ) 的顺 式调控域上出现了明显的组蛋白置换峰值,并在相当广泛的区域内逐级减弱,这 表明在果蝇体细胞内,为了确保顺式调控元件的易接近性,可能维持着一个对核 小体位置进行不问断微调的过程。 综上所述,现有的研究表明,果蝇作为一个多细胞模式生物,其胚胎期的 核小体定位与单细胞生物有一定相似性。但同时也必须保持清醒,即作为一种多 细胞生物,我们对其染色质结构的了解还处在一个初级阶段。细胞类型的多样性 必然会给核小体研究带来前所未有的挑战。但有一点可以肯定,果蝇核小体位置 在体内也应当是动态的,其动态程度可能会超出以往我们在单细胞生物酵母中所 观察到的那样。 1 0 1 3 本文主要研究内容 本文主要研究了酵母和果蝇核小体的定位问题。解决了现有酵母核小体定 位数据不一致的问题,发现了酵母体内两种不同性质核小体分布,提出了核小体 在主体上是动态分布的观点;讨论了果蝇胚胎中不同转录类型基因上核小体占位 的周期性问题,提出了染色质结构进化与基因进化的协同问题。最后,本文全面 比较了两个物种在核小体定位上的异同。论文的内容一共分为五个章节,下面我 们将简单地介绍各章的内容: 第一章是本文的绪论部份,它分为两个小节:第一节介绍

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论