真核基因表达与调控.ppt_第1页
真核基因表达与调控.ppt_第2页
真核基因表达与调控.ppt_第3页
真核基因表达与调控.ppt_第4页
真核基因表达与调控.ppt_第5页
已阅读5页,还剩165页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基因的表达与调控(下),真核基因表达调控的一般规律,张建勇 山东理工大学生命科学学院,分子生物学,真核基因表达调控,特征:在特定的时间和特定的细胞中激活特定的基因,从而实现“预定”、有序的、不可逆转的分化、发育过程,使生物的组织和器官保持正常功能。,什么是调控基因表达的信号? 基因的调控主要是在哪一步?(转录、mRNA的成熟或蛋白质合成) 不同水平基因调控的分子机制是什么?,核小体:a.无调控蛋白时,基因表达减少。b.修饰改变核小体,让DNA结合蛋白与DNA的结合易于进行。 重复序列和内含子。 DNA与蛋白质结合,构象的变化,调节序列的增多。 转录和翻译的间隔,RNA的合成与转运,RNA的剪接和加工。,1、影响真核基因表达调控的因素,2、真核基因表达的调节特点,(1)多层次 (2)无操纵子和衰减子 (3)个体发育复杂 (4)受环境影响较小,染色体 基因结构的激活 转录起始 转录物加工 向胞质转运 mRNA 的翻译(产物加工),3、分两大类,1.瞬时调控或可逆调控: 相当于原核生物对环境的变化作出的反应,象某种底物或激素水平升降时,或细胞周期不同阶段酶活性的调节。 2.发育调控或不可逆调控: 调控发生的主要水平: 转录水平调控 转录后水平调控:RNA加工成熟过程的调控 翻译水平的调控 蛋白质加工水平的调控,一、真核生物的基因结构与表达活性,单顺反子 结合组蛋白和非组蛋白 重复序列和内含子 DNA片段重排和增加基因拷贝数 基因调节区的位置和大小 空间间隔 有剪接成熟的过程,1、基因家族,真核细胞中许多相关的基因常按功能成套组合,被称为基因家族(gene family) 家族成员可以成簇存在,或者分散在不同的染色体中(或两者都有)。 基因簇(Gene cluster) 少则可以是由重复产生的两个相邻相关基因所组成,多则可以是几百个相同基因串联排列而成。,基因簇通过重复和变异形成,多数重复都在基因第一个拷贝附近产生第二个拷贝。有时这些拷贝保持联系,进一步重复可以产生相关基因的一个基因簇。 突变可以在一个拷贝中积累而不会使自然选择向不利的方向进行。然后这个突变的拷贝可以进化形成一种新功能,也许和第一个拷贝在不同时期或地点表达,也许获得不同的活性。,(1)简单多基因家族,串连方式前后相连。E.coli中有七个拷贝,每个拷贝中tRNA基因的种类、数量和部位发生变化。,原核生物,前体为45S 100处被甲基化(2-OH) 需要snoRNAs的参与(核仁小RNA,研究热点,由内含子编码。反义snoRNA指导rRNA核糖甲基化。),snRNA,snRNA(核小RNA):指任何一个限制在核内的小分子RNA,一些snRNA在涉及剪接过程,另一些涉及RNA 合成反应。 核内RNA (U1, U2, U4, U5, U6 )与核蛋白组成snRNPs 剪接装置中的snRNPs和大量的附加蛋白,常称为剪接因子,非编码RNA: non-coding RNA(ncRNA) 能被转录但不编码蛋白质且具有特定功能的RNA分子。DNA序列中专门转录成非编码RNA的部分称为RNA基因或非编码RNA基因。,ncRNA,tRNA、 rRNA,siRNAs、 microRNAs、piRNAs,小分子ncRNA,大分子ncRNA: Xist、Evf、Air、CTN、PINK lincRNAs (大型插入性非编码RNA),snoRNA、snRNA、scRNA、gRNA、 pRNA、tmRNA、RNase P RNA、 Signal recognition particle RNA,(guide RNA),(small cytoplasmic RNA),(small nuclear RNA),(transfer-messenger RNA),(small nucleolar RNA),(packaging RNA),(核酶),(2)复杂多基因家族,复杂多基因家族一般由几个相关基因家族构成,基因家族之间由间隔序列隔开,作为独立的转录单位。,(3)发育调控的多基因家族,血红蛋白基因基本结构 但在生物个体发育的不同阶段,却出现不同形式的和亚基。,哺乳动物血红蛋白类-珠蛋白基因家族、类-珠蛋白基因家族都是由功能基因和假基因形成的一个基因簇。 :16chr :11chr,人类中,和是两条类似链,、和是类似链。这些链在不同的发育阶段表达。 在基因家族中,基因的排列顺序是它们在发育阶段的表达顺序。 无功能基因是指没有编码蛋白质能力的基因,没有活性的原因很多,可能是由于在转录或翻译(或两种中都有)过程中有缺失。它们被称为假基因(Pseudogenes),用符号表示。,在脊椎动物-珠蛋白的基因簇中普遍存在基因和假基因,小鼠的基因簇有7 个基因:2个早期胚胎表达基因;1个晚期胚胎表达基因,2 个成体表达基因,剩下2 个为假基因。鸡和兔的-珠蛋白基因簇有4 个成员。,当前的珠蛋白基因簇是从一个原祖珠蛋白基因进化而来的,植物的豆血红蛋白(Leghemoglobin)基因可代表此基因的原始结构 一些“原始”鱼类仅有珠蛋白链 非洲爪蟾 (X. laevis) 珠蛋白基因的结构是一个连锁的 - 对的内部重复 和珠蛋白基因的分开一定是由于哺乳动物/鸟类祖先的基因发生转座的结果,我们可以把一个编码区的核苷酸序列分为潜在的置换位点(Replacement sites) 和沉默位点(Silent sites)。 置换位点上的突变应该引起相应氨基酸的趋异,基因的趋异,两个核酸或蛋白质之间的差异可以用趋异度(Divergence) 表示,即差异的位点的百分比。,人-珠蛋白基因置换位点的多样性使我们能够再现其进化历史,图中树状进化图解释了一系列珠蛋白基因逐渐分离过程。,Sequence divergence is the basis for the evolutionary clock,假基因,假基因:它们具有与功能基因非常类似的序列,但这些序列不能翻译成有功能的蛋白质。 假基因与功能基因一样的结构:有相当于外显子和内含子的序列。 基因表达过程中的突变,会使这些基因失去活性。 突变几种形式:如消除起始转录的信号,阻止在外显子-内含子的连接点进行剪接或过早的终止翻译。,假基因是进化的死角,许多系统中(包括珠蛋白、免疫球蛋白和组织相容性抗原)有些假基因只当作活性基因的失活形式。在这些系统中,假基因位于基因簇附近,往往中间还夹杂着活性基因,突变成为新的功能基因或成为失去功能的假基因等过程,在基因簇中不断地进行。,大多数基因家族都有一些假基因。通常假基因在总基因数目中只占一小部分。 我们所看到的那些基因都是在目前种群中幸存下来的基因,其他一些假基因在过去可能早已被清除。 假基因的清除可以通过突然发生的序列缺失,或通过某个位点上累积突变,只是假基因不再被认作原有序列家族的一员而发生的(这可能是一切不被清除掉的假基因的最终归宿)。,2、真核基因的断裂结构,在各级生物中都存在断裂基因(Interrupted genes)。在低等真核生物的基因中断裂基因仅占很小的一部分,但是在高等真核生物基因组中绝大部分都是断裂基因。,剪接需要在内含子与外显子结合处产生断裂,然后将外显子末端相连。从图中的放大演示可以看到RNA加工的基本流程。,外显子,DNA序列中外显子部分可能还不到10 少数基因如组蛋白及型、型干扰素基因,根本没有内含子。 不清楚内含子的功能。 断裂基因的结构形式为编码区域提供了进行重组的潜在位点,有利于基因的进化。,边界顺序,连接区的保守序列几乎存在于所有高等生物基因中,表明可能存在共同的剪接加工机制。 线粒体和酵母tRNA基因中不存在类似保守序列,还有其它加工剪接过程。,外显子与内含子的可变调控,组成型剪接:一个基因的转录产物通过组成型剪接只能产生一种成熟的mRNA分子,编码一个多肽。 选择性剪接:hnRNA通过不同的剪接方式,产生不同的mRNA,并翻译成不同的蛋白。,选择性剪接,二、真核生物基因表达多层次的调控,染色体水平的调控 染色体丢失等 染色质水平调控 异染色质化 组蛋白的影响 DNA水平的调控 DNA的甲基化与去甲基化 基因的扩增 基因的重排 转录水平的调控 转录起始和加工的调节 翻译的调控 细胞周期的调控,(一)染色质水平调控,染色质的丢失:不可逆 异染色质化 组蛋白的影响,1、异染色质化,异染色质(Heterochromatin)是用以描述染色体区域的术语,这类区域永久性的卷曲并呈惰性,致密。与代表大多数基因组的常染色质不同。 异染色质经常位于着丝粒和端粒上。 哺乳动物细胞中50%的基因组是以异染色质形式存在 异染色质中也有少量基因,活性基因转移到异染色质区,该基因通常会被关闭。,染色质结构对转录的影响,遗传物质的结构状态与其活性是相对应的。在S 期晚期被复制;异染色质不被转录。这表明遗传物质的压缩状态是与其失活相关联的。 活性基因包含在常染色质内,所以定位在常染色质上是基因表达的必要而非充分条件。,染色质结构对转录的影响,常染色质解旋,形成自由DNA,导致结构基因暴露,促进转录因子与启动区DNA结合,诱发基因转录。 用DNA酶I处理各种组织的染色质时,处于活跃状态的基因比非活跃状态的DNA更容易被酶所降解。 含有一个或几个DNA酶I超敏感位点,大多位于基因5端启动区。,(1)灯刷染色体的伸展状态,灯刷染色体在特别长的减数分裂期内形成,可能会存在几个月!此期间,染色体在光镜下可看到染色体呈现向外伸出的灯刷伸展状态存在。 表达的染色体呈高度伸展状态,灯刷染色体是二价体,姐妹染色单体几乎完全分离,它们之间仅由几个交叉相连。,染色体在某些位置上染色线以突环(Lateral loop)的形式伸出,形状很像灯刷。 突环被核糖核蛋白围绕,包含一些新生RNA 链。一个转录单位能被定义为沿突环移动的RNP的长度。 突环是被活跃转录突出的DNA片段。,突环成对伸展,且都源于同一姊妹染色单体。在轴线上突环是连续的。 转录时核小体伸展和压缩状态时可逆的。 进行转录,遗传物质需要从其更加紧密的包装状态变为相对松散的开放状态。,(2)转录破坏多线染色体的结构,条带的线性排布代表基因的线性排布。 果蝇基因的总数似乎多于带的数目,大多数带中可能有多个基因。,这种染色体与间期染色质或分裂期染色体相比,遗传物质呈充分伸展状态。,多线染色体的一个内在特征是活性位点能够直接观察。有些带暂时形成一个涨泡(称为Balbiani环),染色体物质从轴上突出出来。 涨泡(Buff)的本质是什么?在组成涨泡区域里,染色体纤维从其正常包装状态解螺旋,纤维连续地染色体轴伸出。涨泡经常从单个带里解放出来。,昆虫(C. tentans 摇蚊 )唾腺的IV 染色体有三个巴尔比亚尼环。,涨泡状态与基因表达相关。 在组成涨泡区域里,染色体纤维从其正常包装状态解螺旋,纤维连续地染色体轴伸出。 涨泡是RNA 合成的位置。,灯刷和多线染色体这些性质表明了一个普遍的结论,为进行转录,遗传物质需要从其更加紧密的包装状态变为相对松散的开放状态。,2、组蛋白的影响,核小体的转录阻遏作用。 组蛋白的转录阻遏作用。 H1的转录阻遏作用:能稳定核小体的结构。竞争性结合DNA上某些位点,转录因子抗H1。H1能引导核小体进一步压缩。,2、组蛋白的影响,组蛋白密码子(histone code)假说:组蛋白尾部(N端)不同形式的修饰可以被“阅读”,具有一定的内涵(打开或关闭基因)。 修饰:乙酰化(激活),甲基化(激活或抑制),Methylation of histone or of DNA usually turns a gene off. Acetylation of histone usually turns a gene on. Phosphorylation - were not sure what that does.,修饰需要特定的酶,组蛋白乙酰转移酶、组蛋白脱乙酰化酶和组蛋白甲基转移酶。 机制:a.修饰改变了组蛋白的电荷分布,影响了DNA高级结构的形成。 b.提高调节蛋白与修饰位点的结合(核小体会被释放),提高了DNA的易接近性。,乙酰化的生物功能,促进基因转录活性:电荷分布改变,影响核小体结构。 促进转录起始复合物的装配:修饰后与DNA结合能力下降。 去乙酰化导致基因沉默:,(二)DNA水平上基因表达调控,DNA模板发生规律性的变化,从而控制基因的表达和生物的发育。 DNA发生永久性的变化:成熟的红细胞与前体细胞 DNA水平的调控:基因丢失、扩增、重排和移位、甲基化等。 基因组发生了改变。,DNA水平的调控,基因扩增(gene amplification):增加基因的拷贝数 非洲爪蟾卵母细胞rRNA基因,扩增4000倍,1012个核糖体 药物:诱导抗药性基因的扩增;肿瘤细胞:原癌基因拷贝数异常增加 基因重排(gene rearrangement): 如免疫球蛋白基因重排,多样性 重排可能会产生在特定环境中需要表达的新基因 重排可能会关闭一个基因而打开另一基因。 基因转换 DNA的甲基化,1、基因扩增,基因扩增:指某些基因的拷贝数专一性大量增加的现象,可使细胞在短期内产生大量的基因产物以满足生长发育的需要,是基因活性调控的一种方式。 例如:非洲爪蟾的rRNA基因。 例如:果蝇卵壳蛋白基因的扩增。,rRNA基因,核糖体RNA是最主要的转录产物,在真核和原核生物中它们构成了细胞RNA总量的大约8090%。 rRNA基因数目变动很大,从大肠杆菌的7个到低等真核生物的100200个,高等真核生物中有几百个。大的和小的编码rRNA的基因(分别存在于核糖体大亚基和小亚基中)经常串联排列(唯一例外的是酵母线粒体)。,rDNA,在大多数真核生物的细胞核中,rRNA基因包含在一些串联基因簇中。有时把这些区域称为rDNA 判断一个串联基因簇的重要特征是它能产生一个环状的限制图谱。,核仁(Nucleolus),细胞核中rRNA合成的区域具有特殊的形态:它有一个纤维状核心,外面包被着一层颗粒状皮层。这个纤维状核心是以DNA 为模板转录rRNA 的区域,而颗粒状皮层是由装配了rRNA 的核糖核蛋白颗粒形成的。整个区域称为核仁(Nucleolus),核仁组织区(Nucleolar organizers),特殊的染色体区域与核仁相联,这些区域称为核仁组织区(Nucleolar organizers)。 核仁组织区相当于一个串联重复的rRNA基因簇。 串联重复rRNA基因的浓缩及其强烈转录造成了核仁的特殊形态。,2、基因重排,基因重排:将一个基因从远离启动子的地方移到距它很近的位点从而启动转录。 例如:免疫球蛋白基因(B淋巴细胞) T-细胞受体基因(T淋巴细胞),(1)免疫反应,免疫反应是白细胞:B 淋巴细胞、T 淋巴细胞和巨噬细胞(Macrophage)的职责。 淋巴是根据产生它们的组织命名的。在哺乳动物中,B淋巴细胞在骨髓中成熟,而T淋巴细胞在胸腺中成熟。 每一类淋巴细胞产生蛋白质来特异性应答的机制都是DNA 重排(重组)。,免疫应答典型的特征是无论在什么时候遇到抗原,机体都能产生相应的抗体。对于每个不能预料的抗原,机体是如何产生那些能够特异性识别这些抗原的抗体呢? 通常情况下,哺乳动物能够产生106108种不同的抗体。每一种抗体都是免疫球蛋白四聚体,有两个轻链(L)和两个重链(H)组成。如果任何一个轻链都能够和任何重链组合,那么产生106108种不同的抗体需要103104个不同的轻链和重链。,(2) 免疫球蛋白的基本结构,四肽链结构:所有Ig的基本单位都是四条肽链的对称结构。两条重链(H)和两条轻链(L)。每条重链和轻链分为氨基端和羧基端。,根据氨基酸排列顺序的不同分为可变区(V)和恒定区(C)。,Table Each immunoglobulin family consists of a cluster of V genes linked to its C gene(s).,在这里,基因的意义是一段编码免疫球蛋白一部分肽链(轻链或重链)的DNA序列。 V 基因编码可变区,C基因编码恒定区,它们都不能单独的表达。 构建一个能够表达的真正的轻链或重链基因,一个V 基因必须和一个C 基因连接起来。在这个系统中,我们用基因片段而不用基因来指这些单位。,轻链和重链相对应的区域结合产生免疫球蛋白中不同的结构域(Domain): 可变结构域(V)是由轻链和重链的可变区结合而成。V 区负责对抗原的识别。 恒定区的数量比可变区数量少很多,典型情况下对于特殊的蛋白质链只有110个C区。,编码轻链的基因和编码重链的基因,其组合方式是一样的: 许多V 基因片段中的一个和几个C基因片段中的一个连接。 这种体细胞基因的重组(Somatic recombination)发生在B淋巴细胞中。数量巨大的可变V基因片段是免疫球蛋白多样性的主要原因。,(3)轻链基因的重排与连接,Lambda型轻链 V基因片段包含前导序列(Leader) ,它被一个内含子和V 基因片段分开。 C 基因片段由J片段和恒定区(C)组成,中间被一个内含子分开。 V片段和C片段的连接时,实际上是V-JC 连接。,轻链基因的重排与连接,Kappa型轻链 V与J的重排和连接:是通过之间的识别序列来完成的。形成的茎环结构被切除,形成连续的VJ片段。 V与J重排是随机的和不精确的,造成重排后的多样性。,(4)重链基因的重排与连接,重链的结构包含一个附加片段:D 片段(Diversity,负责多样性的) V基因与D、J片段组合,能产生4000个不同的V区,都能与CH结合。 CH基因簇:有10个基因,在同一细胞内只有一个基因得到表达,3、酵母的交配型转换,酿酒酵母既能够以单倍体(Haploid)繁殖也能以双倍体(Diploid)繁殖。 两种状态的改变是通过接合(单倍体孢子融和产生双倍体)和孢子形成(双倍体有丝分裂产生单倍体孢子)进行的。,酵母的交配型转换,带有MATa 等位基因的细胞为a类型。相反,携带MAT等位基因的细胞为型。类型相反的细胞能够接合;同型的则不能接合。 当双倍体是杂合子时,才能发生重组并能产生单倍体孢子。,HML负责MAT类型,HMRa负责MATa 型。这些基因和MAT位于同一条染色体上,HML位于左边,HMR位于右端。,当沉默的基因座取代了活跃的基因座时,酵母的接合型就会发生改变,相同类型基因座之间互相易位,接合型不变。,HO内切酶能够在MAT基因一个24bp序列( Y)的右端切开。酶切产生一个4 个碱基的粘末端,内切酶不能作用于突变的MAT基因座,24bp 的大部分或者全部对内切酶的识别是必须的。对内切酶来说,这个靶序列相对很大。,供体位点和受体位点区域的转换反应与普通的反应类似,主要与单链DNA 相互作用,酶切后是重组的一系列步骤;酶切后的步骤所需要的酶和普通重组酶相同。 就像复制型转座,供体位点没有受到影响,但在受体上序列却发生了变化,酵母能改变接合型,携带显性基因HO,能改变接合型,甚至一代就能改变一次。携带隐性基因HO的菌株具有稳定的接合型,改变得频率约为10-6。 HO引起酵母基因型的改变。无论开始是什么类型,几代之后,就会产生这两种接合型的细胞,最后导致产生MATa/MAT型的双倍体占据整个种群。,4、DNA甲基化与基因活性的调控,DNA甲基化(DNA methylation): 甲基化(methylated)程度高:基因表达降低; 去甲基化(undermethylated):基因表达增加 DNA甲基化的作用:改变染色质结构、DNA构象、DNA的稳定性及DNA与蛋白质的相互作用,从而控制基因表达。,(1)DNA的甲基化,DNA甲基化广泛存在。 甲基化类型:5甲基胞嘧啶(5mC),N6甲基腺嘌呤(N6mA)和7甲基鸟嘌呤(7mG)。 5甲基胞嘧啶(5mC)主要出现在CpG序列、CpXpG、CAA/TGG和GATC中。,CpG岛,哺乳动物基因组中5%的C为甲基化(mC),mC主要存在于CpG二核苷酸序列中。 CpG二核苷酸序列常成簇聚集并零散地分布于人基因组中,形成CpG岛(CpG islands)。人基因组中约每10Kb就有一个CpG岛 CpG岛常与基因相连(可作为寻找基因的标记)。,甲基化酶,日常型甲基转移酶:主要在甲基化母链(模板链)指导下使处于半甲基化的DNA双链分子上与甲基胞嘧啶相对应的胞嘧啶甲基化。催化特异性极强,速度快。 从头合成甲基转移酶:催化未甲基化的CpG成为mCpG,不需要母链指导,速度慢。,去甲基化酶(Demethylase)则去除甲基。,这样的位点称为完全甲基化位点(Fully methylated)。这些位点在复制时,每个子代双链有一条链甲基化而另一条未甲基化,这样的位点称为半甲基化位点(Hemimethylated)。,识别,限制性内切酶Hpa II 和Msp I 都识别CCGG序列,Msp I 无论是否甲基化均能切割,但Hpa II只能切未甲基化的位点。,甲基基团的分布可用限制酶来检测。,(2)DNA甲基化抑制基因转录的机制,基因中,甲基化状态在大多数位点都是恒定的,但另一些位点是可变的。这些位点中的一部分被甲基化,而另一些位点不被甲基化。 在基因不表达的组织中有少数位点被甲基化,在基因具有活性的组织中却未被甲基化。活性基因被称为低甲基化基因(Undermethylated gene)。,甲基集团的缺失与基因的表达有关。然而在推测甲基化状态是如何提供控制基因表达方式时存在一些困难。 例如,果蝇中没有任何DNA甲基化。激活和失活染色质之间的其它区别和显现甲基化的物种中情况一样。所以在果蝇中,脊椎动物中的任何甲基化作用均被一些其它机制取代。,甲基化达到一定程度会导致B-DNA向Z-DNA的过渡。 Z-DNA结构收缩,螺旋加深,与蛋白因子结合的元件缩入大沟而不利于转录的起始。,启动子附近的甲基化阻止转录发生,是影响启动子活性的几种调控之一。,基因5末端的甲基化与表达直接相关。许多基因在被表达时5端不甲基化,尽管3端仍被甲基化。 -珠蛋白基因中,在起点区域的甲基化(-22 到+90bp 之间)抑制转录。,(3)DNA甲基化提高突变率,5-mC脱氨后生成胸腺嘧啶(T),不易被识别和矫正。造成基因表达的紊乱。 转录所需要的是(活性基因中的三种改变): 在启动子附近建立了一个超敏位点。(实际上是一段长约200bp的DNA序列特异暴露的染色质区域,甲基化程度较低,富含HMG14,HMG17蛋白。一般在转录起始附近或者相关部位。) 含转录区的结构域中核小体变得对DNAaseI更加敏感。 相同DNA结构域低甲基化。,(4)DNA甲基化与X染色体失活,X染色体失活是发育过程中独特的调节机制,哺乳动物,雌性两条X 染色体中的一条完全没有活性。与在雄性中基因表达水平情况相同。 果蝇,雄性单条X 染色体的表达水平是雌性的两倍。 秀丽隐线虫(C.elegans),雌性每条X 染色体的表达水平是雄性的一半。,剂量补偿平衡两性中X染色体相关基因的表达,雌性中X 染色体的失活服从n-1 规律: 通常雌性有2X 染色体,但在偶然染色体不分离的情况下,能产生3X 或更大的基因型,仅有一个X染色体保持活性。 这表明一个通常的模型,即特殊的事件被限定在一条X染色体上,并且保护它不受其它染色体失活的影响。,X染色体失活中心,X 染色体上的单一基因座足以导致失活。称为X染色体失活中心(X-inactivation center,Xic)。 一个450kb的克隆区域包含所有的Xic 特性。定位在Xq13区(Barr氏小体)。 当此序列作为转基因被插入常染色体,常染色体将被失活(在细胞培养系统中)。 失活染色体高度甲基化。,Xic是一个顺式作用座位,包含计数X染色体和失活除一个以外所有X染色体的必须信息。 Xic包含一个基因,称为Xist,它仅在非活性X染色体中表达。该基因的活动与染色体上其它被关闭的基因座相反删除Xist能阻止X染色体被失活。,含有8个外显子,基因中存在多个串联重复序列。 基因产物是功能性RNA分子,不含ORF,含有大量终止密码子,不编码蛋白质只存在于细胞核。,Xist表达的沉默对活性X是必须的。删除DNA甲基化酶基因则阻止Xist的沉寂,可能是因为Xist启动子的甲基化对转录中止是必须的。 Xist的甲基化,(三)真核基因转录水平的调控,已发现基因具有两种结构状态,从而证实了第一层面确实存在。“活化”结构的产生是基因表达所必须的第一步。 活性基因的转录在起始阶段受RNA 聚合酶和启动子间相互作用的调控。,基因结构的激活 转录起始 转录物加工 向胞质转运 mRNA 的翻译,转录水平的调控,顺式作用元件 反式作用因子,顺式作用:不转变为任何其他形式的DNA序列,只在原位发挥DNA序列的作用,仅影响与其在物理上相连的DNA。(同一染色体上的DNA序列直接调控其他邻近基因的表达) 顺式作用元件:是指对基因表达有调节活性的DNA序列,其活性影响与其自身同处在一个DNA分子上的基因;这种序列通常不编码蛋白质,多位于基因傍侧或内含子中。,反式作用:游离的基因产物扩散至目标场所的过程。反式作用因子的编码基因与其识别或结合的靶序列一般不在同一个DNA分子上。(DNA通过其产物(mRNA或蛋白质)间接调节基因的表达。) 反式作用因子:通过直接结合或间接作用于DNA、RNA等核酸分子,对基因表达发挥不同调节作用(激活或抑制)的各类蛋白质因子。,核心启动子成分 , 如 TATA 框 ; 上游启动子元件(UPE),如 CAAT框 ,GC框 ; 远端调控区 :如增强子,减弱子、沉默子,酵母的UAS( upstreamactivator sequences)等。 特殊细胞中的启动子成分 :如淋巴细胞中的 Oct (octamer)和B。 转录模板,1、顺式作用元件,增强子,特征: 增强效应十分明显 增强效应与其位置和取向无关 大多为重复序列,核心序列:(G)TGGA/TA/TA/T(G) 增强效应有组织和细胞特异性 没有基因专一性 受外部信号的调控,2、RNA聚合酶II,由1012个亚基组成 最大亚基的羧基末端有七个氨基酸残基(Tyr-Ser-Pro-Thr-Ser-Pro-Ser)组成的多磷酸化位点重复序列,称为羧基端结构域(CTD),TFII,通用转录因子(General transcription factors)。通用转录因子又称为TFX。 TFD结合到TATA序列 TFA 可以激活TBP TFB结合TATA盒的下游 TFF、TFE和TFH,RNA 聚合酶从启动子上释放,进入转录延伸阶段。TFH是一个特别的因子,在延伸中也发挥作用。 TFH有多种酶活性:ATP酶、螺旋酶和RNA聚合酶的CTD尾磷酸化激酶活性;它还涉及DNA的损伤修复。 CTD磷酸化可能是释放聚合酶、起始转录所必需的。,RNA聚合酶II指导的基因转录过程,反式作用因子可以分为4类: RNA聚合酶亚基 通用反式作用因子,识别启动子的核心成分,如TBP; 特殊组织与细胞中的反式作用因子,如淋巴细胞中的Oct-2; 与应答元件(response elenents)相结合的反式作用因子。,应答元件,应答元件(response element)是位于基因上游能被反式作用因子识别和结合,调控基因专一性表达的DNA序列。 如热激应答元件(heat shock response element,HSE)、金属应答元件(metal response element,MRE)、糖皮质激素应答元件(glucor-ticoid response element,GRE)和血清应答元件(serum response element,SRE)等。 基因对这种因子产生反应,应答元件含有短重复序列,不同基因中应答元件的拷贝数不相等。 应答元件通常位于转录起点上游200bp内。应答元件也有位于启动子或增强子内。如HSE位于启动子内,GRE则在增强子内。 各种应答元件的作用原理是相同的:特定的蛋白因子识别应答元件并与其结合,调控基因的表达。,反式作用因子,广泛被研究的是识别TATA区的TF IID,识别CAAT区的CTF,识别GC区的SP1,以及识别热激蛋白启动区的HSF。 基因受位于启动子或增强子上被特异性蛋白质识别的序列调控。蛋白质可以作为一个转录因子参与RNA 聚合酶的起始。 活性蛋白质只有在基因将被表达时才存在。,控制转录因子活性的机制有多种,可以是蛋白质合成,蛋白质共价修饰,配体结合,也可以是影响转录因子与DNA 结合甚至是将蛋白与DNA隔离的各种抑制剂。,转录因子和调控蛋白需要两种能力,它们能识别位于增强子、启动子的特异靶序列或其它影响特定基因的调控元件。 与DNA结合之后,转录因子或正调控蛋白通过与转录复合物的其它成分结合来行使功能。,3、反式作用因子中的DNA结合域,通过比较许多转录因子的序列,发现有多种共同基序(Motif)类型负责与DNA结合。这些基序通常很短。 基序还通过与转录复合体的蛋白质之间的相互作用激活转录。 基序(motif):在许多蛋白质分子中,二个或三个具有二级结构的肽段,在空间上相互接近,形成一个具有特殊功能的空间结构。一个基序总有其特征性的氨基酸序列,并发挥特殊的功能。,(1)螺旋转角螺旋,螺旋转角螺旋(Helix-turn-helix):最早在噬菌体阻遏蛋白质的DNA 结合域发现的。 此类结构的相关形式还存在于“同源域(Homeodomain)”中。这是在果蝇发育调控基因编码的几种蛋白质序列中发现的。它也存在于哺乳动物转录因子基因中。,Helix-Turn-Helix,三个螺旋被两个转角分开 C端Helix为DNA结合必需,其它两个Helix参与形成二聚体 作用于DNA链的大沟 LacO的R蛋白,涉及酵母交配型的a1和a2蛋白,真核生物中的Oct-1和Oct-2,Sample of Helix-Turn-Helix,Interaction between the l repressor dimer and DNA. Each l repressor contains a helix-turn-helix motif. One of helices fits into the major groove of DNA. PDB ID = 1LMB,(2)同源域蛋白,同源框(Homebox)是一段60个氨基酸组成的结构域序列,该结构域存在于许多甚至所有真核生物的蛋白质中。其名称来源于它最早是在果蝇的同源异形基因座(Homeotic loci)中发现的(它们的基因决定身体结构的特性)。 同源结构域(Homoedomain)识别(或至少普遍存在)与发育调节有关的基因。,三种同源框,果蝇触角足基因(Antp)、锯齿(En 基因)和哺乳类因子Oct-2 则代表了一组关系较远的转录因子。同源结构域氨基酸残基从1-60 被标出,开始于N 端的臂,三个螺旋区分别位于10-22,28-38,42-58。 同源率8090,同源框的螺旋3 结合到DNA的大沟上,螺旋1、2 露在双螺旋之外。螺旋3 与磷酸骨架和特异性碱基同时接触,其N 端的臂位于小沟中,也结合在DNA上。,C末端存在螺旋-转角-螺旋的结构: 具有转录调控功能,(3)锌指结构,锌指基序(Zinc finger motif):包含一个DNA结合域(DNA-binding domain)。在因子TFIIIA中发现,该因子是RNA聚合酶III转录5S rRNA基因所必须的。在其它几种转录因子中也发现了该结构。在类固醇受体中也发现了此结构的一种形式。 锌指结构家族蛋白分类:锌指、锌钮和锌簇。,锌指的共有序列为Cys-X2-4-Cys-X3-Phe-X5-Leu-X2-His-X3-His 。Zn位于由保守的Cys和His残基所组成的四面体内。指身包含约23个氨基酸,指间由78个氨基酸相连。Cys2/His2锌指,分类:经典的“锌指”蛋白质和类固醇受体。,锌指的C 末端都形成螺旋与DNA结合;N末端形成-折叠(图的下部分并末显示折叠和锌离子的位置)。三个螺旋恰好适合大沟的一圈;每个螺旋都与DNA两个特异序列接触(如箭头所示)。据推测,每个锌指C 末端的非保守氨基酸负责识别特异的靶位点。,类固醇受体(Steroid receptor):每个受体与一个特定类固醇结合而被激活。与其它受体如甲状腺素(Thyroid)受体或视黄酸(Retinoic acid)受体相同,都是同一转录因子超家族中的一员。 类固醇受体含有另一种类型的锌指。同源序列为:Cys-X2-Cys-X13-Cys-X2-Cys。Cys2/Cys2锌指 具有Cys2/Cys2锌指的蛋白质通常都含非重复的锌指,相反Cys2/His2锌指则串联重复。,类固醇受体的第一个锌指控制着DNA结合特异性(相关位置用红色表示),第二个锌指控制着二聚体化特异性(相关位置用蓝色表示)。 从第一个锌指放大图来看,锌指是以GRE(糖)为靶序列还是以ERE(雌)为靶序列取决于底部的两个氨基酸。,(4)碱性-亮氨酸拉链,结构:羧基端35个氨基酸形成螺旋,每隔6个氨基酸就有一个亮氨酸残基,导致第七个亮氨酸都在螺旋的同一方向出现。 二聚体的形式出现,两个蛋白螺旋上的亮氨酸一侧是形成拉链型二聚体的基础。,碱性-亮氨酸拉链,在一个双元亮氨酸拉链基序中,当两个相邻拉链的疏水面以互相平行的方向作用时,所产生的二聚体化作用会将各自的碱性区连在一起。,这种结构是如何与DNA 的结合相关的呢? 每个拉链蛋白质中邻近亮氨酸重复的区域都是高度碱性的,能成为结合DNA 的一个位点。两个亮氨酸拉链形成一个丫形结构,其中,拉链形成干,两个碱性区对称地形成DNA结合臂。这就解释了为什么这些蛋白质的靶序列是无间隔的反向重复序列。,(5)螺旋-环-螺旋,基序序列:羧基端100200个氨基酸的序列中含有两个双亲性的螺旋,两螺旋被一个连接区(环)分开。 环的作用可能仅仅是使两个螺旋区自由独立的作用。 特点:存在结合DNA的螺旋区和形成蛋白质二聚体的能力。 这种蛋白通过两个螺旋相应表面的疏水残基的相互作用,可形成同源二聚体和异源二聚体。,Basic-Helix-Loop-Helix,大多数HLH 蛋白质在HLH基序附近有一个非常碱性的、对DNA结合非常重要的区域。 碱性HLH(bHLH protein) 。bHLH又分为两类 A类是可以广泛表达的蛋白,包括哺乳动物的E12/E47(可和免疫球蛋基因增强子中的元件结合)和果蝇da(daughterless,性别控制的总开关基因)的产物; B类是组织特异性表达的蛋白,包括哺乳动物的MyoD( 肌浆蛋白myogen)基因的转录因子,果蝇的AC-S(achaete-scute 无刚毛基因的产物),当两个亚单位都是HLH(DNA 结合型HLH,含有碱性区)时, HLH 二聚体可以结合DNA,但只要一个亚单位缺乏碱性区,二聚体就不能与DNA结合。,4、转录活化结构域,活化其他调控因子和RNA聚合酶。 并不是每个转录因子都直接与DNA结合。 特点: 带负电荷的螺旋结构 富含谷氨酰胺的结构 富含脯氨酸的结构,两个结合域的关系,DNA 结构域将蛋白质带到正确的位置。精确地将它与DNA 结合。结合是无关紧要的,但是一旦它能在那里存在,转录激活结构域就能发挥作用。,转录起始的调控,反式作用因子的活性调节 合成后即有活性:需要时合成,可迅速降解 共价修饰:磷酸化-去磷酸化,糖基化 配体结合:如激素与受体的结合 蛋白质与蛋白质相互作用:二聚体 反式作用因子与顺式作用元件的结合 反式作用因子间的相互作用,(四)真核基因转录调控的主要模式,蛋白质磷酸化、信号转导及基因表达 激素及其影响 热激蛋白诱导的基因表达 金属硫蛋白基因的多重调控,不用修剪的草,荷尔蒙控制细胞发育,是植物生长的指挥控制系统,改变指挥链将会使植物以特定方式生长。 植物类固醇激素油菜素内酯是控制植物生长的关键因素。没有它们,植物就是长不大的侏儒,并且不能繁殖后代。 自然,1、激素及其影响,类固醇激素以及一般代谢性激素的调控作用都是通过启动基因转录而实现的。 糖皮质激素通过使其受体与增强子结合实现基因调控,增强子为启动子行使功能所必需。,常见的激素种类,肾上腺(Adrenal gland)可分泌30多种类固醇 ,主要的两组是糖皮质(Glucocorticoid)激素和盐皮质(Mineralocorticoid)激素。 生殖激素如雄激素(Androgen)和雌激素(Esdrugen)。 维生素D 是骨骼发育所必须的。 甲状腺激素调控动物的基础代谢率 视黄酸(维生素A)是一种形态建成因子(Morphogen),负责小鸡翼芽发育过程中前后轴的生长。,受体,游离受体的位置还不完全清楚,它们可能在核与胞质之间形成平衡。 但当激素结合到受体上时,蛋白质转变成活性形式,对非特异DNA 的亲合力增加了10 倍。激素-受体复合物通常位于核内。 一般认为激素结合域妨碍了DNA结合区及转录调控区发挥作用,只有与激素结合后,才能打破这种障碍。,中心的DNA结合域在各种类固醇受体都有较强的相关性,且在其它受体中也被证实。 序列的保守性可能反映了结合到DNA的共同需求,而其差异则决定不同靶序列的选择。,类固醇受体是如何激活转录的?,不直接作用于基本转录机构,而是通过一个共激活复合体(Coactivating complex)行使功能。共激活体有各种活性,包括共同组分CBP/p300,其功能是通过乙酰化来修饰组蛋白。,2、热激蛋白诱导的基因表达,能与某一类蛋白因子结合,从而控制基因特异表达的DNA上游序列称为“应答元件(Response element)”。 例如热激应答元件(Heat shock response element,HSE)、糖皮质激素应答元件(Glucocorticoid response element,GRE)、血清应答元件(Serum response element,SRE)等。,应答元件与细胞内专一的转录因子相互作用,协调相关基因转录。,Response elements identify genes under common regulation,佛波酯是一类能促进肿瘤生长的有机化合物。,热休克蛋白,热休克蛋白(heat shock protein,HSP)是指细胞在应激原特别是环境高温诱导下所生成的一组蛋白质。HSP又称应激蛋白(stress protein, SP)。 生成:热激因子(HSF)与hsp70基因的TATA 区上游60bp处的HSE结合,诱发转录起始。,基因结构特点,hsp70基因中没有内含子,而人hsp90、果蝇hsp82、人hsp27、鸡hsp108和泛素等只有少量内含子。 保证它们一旦起始转录不需要剪接就可以产生成熟mRNA以适应hsp大量快速表达的需要。,机制,正常环境,HSF是单体,无DNA结合能力,hsp70参与维持HSF单体形式。 热激或环境胁迫,变性蛋白与hsp70结合,HSF形成三体,能与HSE结合,促进基因转录。 HSF还会迅速被磷酸化。 Hsp70大量表达。 胁迫消失,出现游离的hsp70,又与HSF结合。,3、金属硫蛋白基因的多重调控,金属硫蛋白质(Metallothionein,MT)基因:多余重金属离子的螯合蛋白。 MT 蛋白质保护细胞免受过多重金属损伤。它与重金属结合,并将其排出细胞。 受重金属离子(镉)或糖皮质激素的诱导而高效表达。 金属硫蛋白(metallothionein)基因则是单一基因受多种不同的调控机制的调控。不同元件中的任何一种,无论位于启动子内,还是位于增强子内,都能单独激活基因表达,这是调控的通用原理。,Response elements identify genes under common regulation,人类金属硫蛋白(MT)基因调控区的启动子含有对金属诱导应答的序列,增强子含有对糖皮质激素应答的序列。 基础水平的组成型表达还需要两个基础水平元件(Basic level element,BLE), 适用于启动子的常规转录。,初始转录物通过5端加帽(Capping) ,3 末端多腺苷化(Polyadenylation)进行修饰。内含子从割裂基因的转录产物中去除。成熟RNA从核内运输到胞质。 在核RNA水平上进行序列选择完成基因表达调控,可以发生在任何一个阶段,但证据最充分的是剪接(Splicing)中的变化。 基因是通过可变剪接(Alternativesplicing)方式表达的,可变剪接调控控制着蛋白质产物的类型。,四、转录后水平上的基因调控,RNA加工成熟 翻译水平的调控,(一)RNA的加工成熟,rRNA和tRNA的加工及化学修饰: rRNA的化学修饰主要是甲基化。 mRNA的加工成熟: 前体RNA(hnRNA)的剪接。 剪接发生在核内,与其它一些修饰同时进行,以产生成熟的RNA。 核内RNA 内含子的去除和RNA 的自我剪接。,转录后水平的调控,5端加帽(cap)和3端多聚腺苷酸化(polyA)的调控意义 使mRNA稳定,在转录过程中不被降解 mRNA的选择剪接(alternative splicing)对基因表达的调控 外显子选择(optional exon)、内含子选择(optional intron)、互斥外显子、内部剪接位点 mRNA 运输的控制,转录后加工的多样性,按转录方式分为两类: 简单转录单位:编码产生一个多肽,加工方式简单。 复杂转录单位:编码组织和发育特异性蛋白,含有数量不等的内含子,原始转录产物能加工成两个或两个以上的mRNA。,1、简单转录单位,三种形式: 组蛋白基因。无内含子,无poly (A) ,转录终止信号是回文结构。 酵母蛋白质基因。无内含子,不需要剪接,但需

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论