基因组组的结构与功能_第1页
基因组组的结构与功能_第2页
基因组组的结构与功能_第3页
基因组组的结构与功能_第4页
基因组组的结构与功能_第5页
已阅读5页,还剩133页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章 基因组的结构与功能 中心法则 TheCentralDogma 转录 翻译 逆转录 复制 DNA RNA 蛋白质 DNA通过基因表达 决定了蛋白质的结构 功能 DNA通过复制 将基因信息代代相传 RNA参与DNA遗传信息的表达 RNA也可作为某些病毒遗传信息的载体 基因 基因是核酸分子中贮存遗传信息的遗传单位 是指贮存有功能的蛋白质多肽链或RNA序列信息及表达这些信息所必需的全部核苷酸序列 基因和蛋白的关系 5 AGCCGACTATGTCGAAGCTT GCTTGACTATAAGACA 3 3 TCGGCTGATACAGCTTCGAA CGAACTGATATTCTGT 5 转录调控区贮存RNA或蛋白质结构信息区转录终止区 大部分生物中构成基因的遗传物质是DNA 但有一部分生物 RNA病毒 是以RNA作为构成基因的遗传物质 基因的基本结构 基因组 细胞或生物体中 一套完整单倍体的遗传物质的总和 包括一种生物所需的全套基因及其间隔序列 称为基因组 人类基因组包括 22条染色体 X Y两条性染色体及胞浆线粒体上遗传物质 基因组的结构主要指不同的基因功能区域在核酸分子中的分布和排列情况 基因组的功能是贮存和表达遗传信息 基因组的结构和功能是密切相关的 第一节 病毒基因组 一 病毒基因组核酸的主要类型 正股 序列与mRNA相同的链负股 序列与mRNA互补的链 一 双链DNA病毒 SV40病毒 基因组DNA DNA复制 基因组DNA或通过逆转录完成复制 少数 见三 二 单链DNA病毒 M13噬菌体 基因组DNA DNA复制 基因组DNA 三 DNA RNA病毒 HBV 基因组DNA 转录 RNA 逆转录 基因组DNA 四 双链RNA病毒 呼肠孤病毒 基因组RNA RNA复制 基因组RNA 五 单链 RNA病毒 脊髓灰白质炎病毒 基因组RNA RNA复制 基因组RNA 六 单链 RNA病毒 疱疹性口炎病毒 VSV 基因组RNA RNA复制 基因组RNA 七 RNA DNA病毒 逆转录病毒 基因组RNA 逆转录 cDNA 转录 基因组RNA 二 病毒基因组的结构与功能的特点 一 基因组核酸可以是任何一种类型的核酸 但一种病毒的基因组只是一种核酸 二 不同病毒基因组的核酸大小差别很大 三 基因常常成簇排列 没有间隔序列或间隔序列很小 功能上相关的基因排列在一起 四 病毒的基因都是单拷贝 基因组多为单倍体 五 病毒基因组有重叠基因 六 病毒基因组的编码序列平均约 90 但差异很大 七 病毒基因有连续的 有不连续的 八 病毒基因组含有不规则的结构基因1 几个结构基因的编码区无间隔 因此有些结构基因没有翻译起始序列 2 gene mRNA 有的mRNA没有5 端的帽结构 有翻译增强子 3 有的结构基因转录后产物本身没有翻译起始 需要在转录后进行加工 剪接 成为有翻译功能的mRNA 三 典型病毒基因组举例 一 SV40病毒基因组 双链DNA病毒 1 SV40病毒基因的结构特征2 SV40病毒基因的表达和复制 1 SV40的基因表达启动子 增强子 2 RNA的选择剪切形成不同的mRNA 不连续基因 一个基因产生不同的蛋白质 初级转录物 3 病毒基因组的复制T抗原控制病毒的复制 启动晚期转录 1 HBV基因组结构 1 双链 DNA病毒 2 二条链长短不一 3 重叠基因 二 HBV基因组 DNA RNA病毒 2 HBV基因组复制 1 cccDNA 共价双链闭环状DNA 的生成 2 转录生成 RNA 3 合成 链DNA和 链DNA 4 形成子代病毒 三 脊髓灰白质炎病毒基因组 单链 RNA病毒 1 基因组的特征 mRNA 2 基因组信息表达的特点 RNA5 pUUNNNNN NNNAAAAAAAn3 VPg蛋白形成后 可以共价结合两个U 成为病毒RNA复制的引物 3 基因组复制特点 UUp 引导合成负链RNA RNA3 AANNNNNNN NNNUUUUUUUp 5 pUU 新合成的 RNA的poly A 尾不是另外加上去的 而是直接复制出来的 引导合成正链RNA RNA3 AANNNNNNN NNNUUUUUUUp 5 pUU 引导合成正链RNA 合成的 RNA实际上有三种用途 作为mRNA翻译病毒蛋白质 作为模板复制 RNA 作为子代病毒的RNA 加上蛋白质后包装成病毒颗粒 四 逆转录病毒基因组 RNA DNA病毒 1 基因组结构特征 1 帽子结构和多聚A尾 2 编码区 3 非编码区 调控区 重复序列R区 引物结合区 U区 DLS 和C区 A 编码区 所有逆转录病毒均含有3个基本结构基因 gag 病毒衣壳蛋白pol 肽链内切酶 一个逆转录酶 一个与前病毒整合相关的酶env 包膜蛋白 B 非编码区 与基因组复制和基因表达有关 A R区 两端的重复序列 与cDNA合成有关B 引物结合区 primerbindingsite PB C U区 U3含强启动子 起始转录RNA U5与转录终止和加polyA有关D DLS C区 DLS 两条病毒 RNA链结合位点 包装信号 RNA装入病毒颗粒C 调控区 2 前病毒基因的转录 1 病毒基因组的形成 转录 U3有强启动子 5 端的U3是病毒RNA的启动子 启动病毒RNA的转录 3 端的U3可作为下游基因的启动子 R和U5之间有加polyA信号的序列 由5 端的U3提供启动子 从U3和R区分界处开始转录 直到RNA转录到3 端的R和U5之间时 RNA在R和U5交界处断裂 在RNA的3 端加polyA RNA5 端的PB 区与来自宿主细胞的tRNA结合 两个相同的 RNA又以平行的二聚体结构在二聚体结合位点 DLS 以氢键相连 最后 包装蛋白把病毒基因包装起来 形成病毒颗粒 2 mRNA翻译 gag基因的转录与翻译全长RNA能直接作为gag基因的mRNA 进行翻译 有90 的mRNA只翻译出gag多蛋白质 经肽链加工裂解成为病毒的衣壳蛋白 pol基因的翻译RNA序列中有干扰gag基因终止密码子的序列 约有10 的mRNA在翻译过程中可以越过gag基因的终止密码子 一直翻译到pol基因的终止密码子 形成更大的多蛋白质 经翻译后加工裂解 形成病毒的衣壳蛋白 逆转录酶和一种与前病毒整合有关的酶 integrase 整合酶 env基因的转录与翻译一部分全长mRNA经过转录后剪接 使env基因的编码区与病毒RNA的5 端帽结构连接在一起 从而形成env基因的mRNA 翻译出病毒包膜的糖蛋白 第二节 原核基因组 一 原核生物基因组结构与功能的特点 1 原核生物基因组通常由一条环状双链DNA分子组成 原核生物的基因组DNA虽与蛋白结合 但不形成染色体结构 只是习惯上将之称为染色体 染色体DNA在细胞内形成一个致密区域 即类核 nucleoid 类核无核膜将之与胞浆分开 在染色体DNA中含有许多基因 2 基因组中只有1个复制起点 启动子 promoter 操纵元件 operator 结构基因 终止子 terminator 3 原核基因的基本结构特点 结构基因 structuregene 4 操纵子结构操纵子 operon 是指数个功能上相关联的结构基因串联在一起 构成信息区 连同其上游的调控区 包括启动子和操纵区 以及下游的转录终止信号所构成的基因表达单位 所转录的RNA为多顺反子 多顺反子 单顺反子 启动子是RNA聚合酶结合的区域 操纵区是特异阻遏蛋白结合区 操纵子的转录通常受一个调节基因所表达的阻遏蛋白的控制 核糖体蛋白的操纵子 大肠杆菌核糖体有50余种蛋白 其基因是组合在数个操纵子中 如 S10 L3 L4 L23 L2 L22 S19 S3 L16 L29 S17 operon L10 L7 L12 operon S13 S11 S4 L17 RNA聚合酶的亚单位 5 结构基因无重叠现象 基因组中的任何一段DNA顺序不会用于编码两种蛋白质 6 基因序列是连续的 无内含子 7 编码区在基因组中所占的比例 约占50 远远大于真核基因组 但又远远小于病毒基因组 非编码区主要是一些调控序列 8 基因组中重复序列很少 编码蛋白质的结构基因多为单拷贝 但编码rRNA的基因往往是多拷贝的 9 具有编码同工酶的基因 isogene 这是一类结构上不完全相同 而功能相同的基因 例如在大肠杆菌中含有2个编码乙酸乳酸合成酶同工酶的基因 和2个编码分支酸变位酶同工酶的基因 10 细菌基因组中存在着可移动的DNA序列 包括插入序列和转座子 沙门菌鞭毛素基因的调节 二 染色体外的遗传物质 质粒 一 质粒的定义质粒 plasmid 是细菌细胞内携带的染色体之外的环状DNA分子 是共价闭合的环状DNA分子 covalantclosedcircularDNA cccDNA 可以独立于细菌染色体而进行复制 1 质粒的大小小型质粒 15kb小型质粒易于通过转化作用进入细菌 大型质粒只能通过细菌的接合作用从一个细菌传递到另一个细菌 二 质粒的主要特性 2 质粒的复制质粒与染色体拷贝数之比 10为低拷贝数质粒 10为高拷贝数质粒 质粒的复制是自主调节的 不受染色体复制调节因素的影响 复制调控系统由质粒上的复制起点 ori 质粒的rep基因和cop基因构成 低拷贝数质粒也称为严谨型质粒 自身产生的复制阻遏作用较强 分子量较大 高拷贝数质粒或称为松驰型质粒 分子量小 3 质粒的不相容性 利用相同复制系统的质粒不能共存于同一个宿主细胞内 这种特性称为质粒的不相容性 两个具有相同或密切相关复制起始位点和调控机制的质粒不能共存于同一个宿主细胞内 两个带有ColE1复制调控系统的质粒不能共存于同一个细胞内 pMB1和ColE1是两个密切相关的复制调控系统 带有pMB1和ColE1复制调控系统的质粒也是不相容的 但ColE1和pMB1与带有pSC101或p15A复制调控系统的质粒则是完全相容的 可以共存于同一个细胞内 4 质粒与宿主细胞的关系 1 质粒是作为附加的遗传物质存在于细菌细胞内 其复制和遗传均独立于宿主细胞染色体 2 质粒的存在通常不是宿主细胞所必须的 3 质粒的复制和转录均依赖于宿主细胞的酶和蛋白质 4 在特定的条件下 质粒编码的蛋白质 酶 可以赋予宿主细胞生存优势 5 质粒的功能质粒的功能主要通过质粒本身携带的基因编码蛋白质而表现出来 携带质粒的宿主细胞可表现出相应的表型 1 性质粒 2 抗生素抗性 3 产生毒素的质粒 如大肠杆菌素 4 降解复杂的有机化合物作为能源 5 产生限制和修饰酶 6 质粒的转移性在自然条件下 有些质粒可以通过细菌的接合作用在细菌细胞间传递 基因工程中常用的质粒载体缺乏转移所需的基因 mob基因 不能通过接合作用在细胞间传递 但可采用人工方法转化到细菌细胞中 三 转位因子 转位因子 transposableelement 即可移动的基因成分 是指能够在一个DNA分子内部或两个DNA分子之间移动的DNA片段 在细菌中 则指可在质粒和染色体之间或在质粒和质粒之间移动的DNA片段 转位也是DNA重组的一种形式 一 转位因子的种类1 插入序列 insertionsequence IS 1 IS由一个转位酶基因和两侧的反向重复序列组成 2 插入到新的位点后 两侧为顺向重复序列 3 插入可以是正向 也可以是反向插入 2 插入到新的位点后 两侧为顺向重复序列 3 插入可以是正向 也可以是反向插入 2 转座子 transposon Tn 1 结构基因的两侧含2个相同的插入序列 复合型转座子 2 数个基因与2个反向重复序列 不含IS 图3 7 3 可转座的噬菌体 transposablephage 1 插入部位两侧有短的顺向重复序列 2 一个拷贝留在原位 新合成的拷贝插入新的部位 3 Mu噬菌体末端不含反向重复顺序 二 转位作用的机理1 复制型转位机理共联体生成和解离 靶序列切割与复制 1 转座酶将转座子序列双链的相反极性端同时切开单链切口 同时 在靶点序列两侧各一条单链上造成一切口 2 供体上转座因子的游离端与靶位点DNA上错开切割的突出端分别连接 3 在宿主DNA聚合酶的作用下进行复制 新的转座成分通过半保留复制完成并伴有两个复制子的融合 即形成 共整合体 4 此 共整合体 是以转座成分的正向重复序列相连接的 5 tnpR基因编码的解离酶作用于共整合体中转座因子的内解离区 切割 重组 5 tnpR基因编码的解离酶作用于共整合体中转座因子的内解离区 使共整合体发生解离 产生各含有一个Tn拷贝的供体DNA分子和受体DNA分子 2 非复制型转位作用 转位酶将供体DNA的转座因子两侧各切断一条单链 将靶序列的2个游离末端连接 随后并没有复制过程 而是由转位酶将供体DNA转座因子的另一端也切断 因此在供体DNA上留下一个致死性缺口 转座子的两条游离单链在靶位点退火接合 DNA聚合酶填平缺口 由转座子介导的转座 第三节 真核生物基因组 一 真核生物基因组的结构与功能的特点 一 真核基因的基本结构 1 结构基因 内含子和外显子真核生物的结构基因是不连续的 编码序列被非编码序列打断 在编码序列之间的序列称为内含子 intron 编码序列称为外显子 extron 2 顺式调控元件 1 启动子 真核生物的启动子是由TATA盒 上游启动子元件和转录起始位点组成 启动子 promoter 启动子是RNA聚合酶特异性识别和结合的DNA序列 启动子有方向性 位于结构基因转录起始点的上游 本身并不被转录 2 上游启动子元件上游启动子元件是TATA盒上游的一些特定的DNA序列 反式作用因子可与这些元件结合 通过调节TATA因子与TATA盒的结合 RNA聚合酶与启动子的结合及转录起始复合物的形成 转录起始因子与RNA聚合酶结合 来调控基因的转录效率 3 反应元件一些信息分子的受体被细胞外信息分子激活后 能与特异的DNA序列结合 调控基因的表达 这种特异的DNA序列实际上也是顺式元件 由于能介导基因对细胞外的某种信号产生反应 被称为反应元件 responseelements 反应元件都具有较短的保守序列 这些元件通常位于启动子附近和增强子内 有不少是回文序列 糖皮质激素反应元件 5 AGAACAXXXTGTTCT 3 3 TCTTGTXXXACAAGA 5 雌激素反应元件 5 AGGTCAXXXTGACCT 3 3 TCCAGTXXXACTGGA 5 甲状腺素反应元件 5 AGGTCATGACCT 3 3 TCCAGTACTGGA 5 4 增强子增强子 enhancer 是一段DNA序列 其中含有多个能被反式作用因子识别与结合的顺式作用元件 反式作用因子与这些元件结合后能够调控 通常为增强 邻近基因的转录 增强子一般位于转录起始点上游 100 300bp处 但在基因之外或某些内含子中也有增强子序列 5 加尾信号在结构基因的最后一个外显子中有一个保守的AATAAA序列 此位点下游有一段GT丰富区 或T丰富区 这两部分序列共同构成poly A 加尾信号 二 基因家族 genefamily 基因家族是指核苷酸序列或编码产物的结构具有一定程度同源性的一组基因 基因家族中个基因之间的关系 1 家族中各基因的核苷酸序列完全一样这些基因家族也被称为单纯多基因家族 如rRNA tRNA基因家族 和复合多基因家族 如组蛋白基因家族 低等生物的5 8SrRNA基因 28SrRNA基因 18SrRNA基因 高等生物的5 8SrRNA基因 28SrRNA基因 18SrRNA基因 1 家族中各基因的核苷酸序列完全一样这些基因家族也被称为单纯多基因家族 如rRNA tRNA基因家族 和复合多基因家族 如组蛋白基因家族 tRNA基因 人类基因组约有1300个tRNA基因 编码50多种tRNA 每一tRNA约有10个到几百个基因拷贝 同种tRNA往往串联在一起形成基因簇 但基因间有非转录间隔区分隔 常常比结构基因长近10倍 2 家族中各基因的核苷酸序列高度同源 珠蛋白和 珠蛋白基因家族 2 1 2 1 G A 这些基因家族的各个成员在DNA分子上的排列顺序按照发育的不同阶段的先后次序排列 因而称为受发育控制的复合多基因家族 人类生长激素基因家族 包括人生长激素 hGH 人胎盘促乳素 hCS 和催乳素 prolactin 它们之间同源性很高 hGH和hCS之间 蛋白质氨基酸序列有85 的同源性 mRNA序列上有92 的同源性 3 家族中各基因编码的蛋白质具有高度的同源性 但基因的核苷酸序列可能不同 如src基因家族 src abl fes fgr fps fym kck lck lyn ros tkl yes 蛋白激酶同源结构域 250个氨基酸残基 此家族中各基因的DNA序列没有明显的同源性 4 家族中各基因编码的蛋白质中具有很小的保守基序 conservedmotif 如DEADbox基因家族 DEADbox Asp Glu Ala Asp此家族中各基因的DNA序列没有明显的同源性 但所有的表达产物都有解旋酶的功能 都具有同样的保守基序 DEAD盒 DEAD是酶活性的关键结构 5 基因超家族基因超家族 genesuperfamily 是指一组由多基因家族及单基因组成的更大的基因家族 它们的结构有程度不等的同源性 因此它们可能都起源于相同的祖先基因 但是它们的功能并不一定相同 这一点正是与多基因家族的差别所在 这些基因在进化上也有亲缘关系 但亲缘关系较远 故将其称为基因超家族 免疫球蛋白超基因家族 表达产物都具有免疫球蛋白样的结构域结构 2微球蛋白 MHC 类抗原的 链 类抗原的 链和 链 Thy1 CD4 CD8等与免疫有关的分子 以后又陆续发现了许多免疫系统内和与免疫无关的家族成员 丝氨酸蛋白酶基因超家族 丝氨酸蛋白酶家族的基因产物都有一个特殊的功能区 具有酶的功能 功能区中丝氨酸是活性中心的关键氨基酸残基 现有很多新成员加进去 如载脂蛋白 apolipoprotein 它们只是转移胆固醇蛋白颗粒中的成分而不具备任何水解蛋白质的酶功能 三 假基因假基因 pseudogenes 是多基因家族中的成员 因碱基顺序发生某些突变而失去功能 不能表达或表达异常的无生物活性的多肽 这些DNA顺序在相应基因名称之前加 表示 likeglobingenefamily 2 1 2 1 假基因DNA中的突变可以影响基因表达的任何一个环节 转录起始信号消失 顺式元件缺失或突变 mRNA不能正常剪接 剪接位点缺失或突变 翻译提前终止 突变产生终止密码子 likeglobingenefamily 2 1 2 1 与 序列一样 只有3个点突变 其中密码子6的GAG TAG发生无义突变 假基因普遍存在于真核生物中 在哺乳动物基因组中 约1 4基因为假基因 四 非编码序列非编码序列在基因组 95 编码序列小于DNA总量的5 真核生物基因组非常大 即使只有5 的编码序列 其基因数量也可达到原核生物基因组的基因数量的几十倍 五 真核生物基因组中的转座子在真核基因组中 编码序列在染色体中的位置相对比较稳定 但一些中度重复序列往往是可移动的 有些可移动成分的结构与原核基因组的转位因子相似 是通过DNA介导的 而另外一些中度重复序列的转移成分则与一般细菌中的转移成分不同 要先转录成RNA 再逆转录生成cDNA 然后重新整合到基因组中 这种逆转录旁路的转移成分称为逆转录转座子 retroposon 六 重复序列重复序列中 除了编码rRNA tRNA 组蛋白及免疫球蛋白的结构基因外 大部分是非编码序列 它们的功能主要与基因组的结构稳定性 组织形式 以及基因表达的调控有关 目前已经发现一些重复序列的特征与遗传病有密切联系 因此可以通过测定某些特定重复序列的重复次数而协助遗传病的诊断 根据出现频率的不同可将DNA序列分为三类 1 高度重复序列在基因组中的重复次数 1052 中度重复序列在基因组中的重复次数为101 1053 单拷贝序列在整个基因组中仅出现一次或少数几次 七 端粒以线性染色体形式存在的真核基因组DNA的末端都有一种特殊的结构 称为端粒 telomere 该结构是一段DNA序列和蛋白质形成的一种复合体 仅在真核细胞染色体末端存在 端粒的DNA序列相当保守 其DNA一般由多个串联在一起的短寡核苷酸 5 8bp 序列构成 G rich链由端粒酶合成 C rich链通过正常DNA合成过程中随从链的合成方式进行合成 需RNA引物 碱基对成分因种属而异 重复次数在不同生物中变化较大 如小鼠的端粒DNA达150kb 人类的端粒DNA约5 15kb 端粒功能主要有保护线性DNA的完整复制 保护染色体末端及决定细胞的寿命等 二 人类基因组中重复顺序1 反向重复顺序 5 GGAAGGTGCGAA TTCGCACCTTCC 3 3 CCTTCCACGCTT AAGCGTGGAAGG 5 5 GGAAGGTGCGAA AAGCGTGGAAGG 3 3 CCTTCCACGCTT TTCGCACCTTCC 5 5 AAGCTT 3 3 TTCGAA 5 回文序列 2 串联重复顺序 1 编码区串联重复顺序如5SrRNA基因 组蛋白基因等 2 非编码区串联重复顺序非编码区串联重复顺序通常存在于间隔DNA和内含子内大卫星DNA 小卫星DNA 微卫星DNA 1 大卫星DNA总长度 100kb到几个Mb根据浮力密度分为 型及 卫星DNA重复单位 and 5bp AT rich 25 48bp 171bp about68bp 卫星DNA存在于异染色质区域 这些区域缠绕紧密 无活性 异染色质主要存在于着丝粒 在有丝分裂和减数分裂中形成着丝点 控制染色体的运动 2 小卫星DNA variablenumbertandemrepeat VNTR总长度 0 1 20kb 重复单位 9 70bp 端粒DNA TTAGGG n总长度 2 20kb 3 微卫星DNA重复单位 1 5bp 重复数目 10 60 总长度 150bp AC n TG n AGC n 3 散在重复顺序 1 SINEs shortinterspersednuclearelements Alu家族 逆转录转座子 在基因组中的重复数 3 5 105Alu顺序之间的间隔 3 5kb 2 LINEs longinterspersednucleare

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论