第三章-基因和基因组结构.ppt_第1页
第三章-基因和基因组结构.ppt_第2页
第三章-基因和基因组结构.ppt_第3页
第三章-基因和基因组结构.ppt_第4页
第三章-基因和基因组结构.ppt_第5页
免费预览已结束,剩余77页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章基因和基因组结构 第一节基因与基因组的概念 基因的概念基因的命名基因的结构基因组与C值矛盾 第二节病毒基因组 第三节 细菌的基因组 细菌染色体基因组结构的一般特点大肠杆菌染色体基因组的结构和功能 第四节真核生物基因组及其组分 真核生物基因组的特点真核生物基因组组分真核生物DNA序列组织基因家族 第一节基因与基因组的概念 是遗传信息的物理和功能单位 包含产生一条多肽链或功能RNA所必需的全部核苷酸序列 基因 基因结构研究的历史 从遗传学史的角度看 基因概念大致分以下几个阶段 泛基因 或前基因 遗传学的奠基人孟德尔 GregorJohannMendel1822 1884 19世纪60年代初 孟德尔对具有不同形态的豌豆作杂交实验 在解释实验中每种性状的遗传行为时 用A代表红花 a代表白花 表明生物的某种性状是由遗传因子负责传递的 遗传下来的不是具体的性状 而是遗传因子 遗传因子是颗粒性的 在体细胞内成双存在 在生殖细胞内成单存在 孟德尔所说的 遗传因子 是代表决定某个性状遗传的抽象符号 基因的两个基本属性 基因是世代相传的 基因是决定遗传性表达的 现在所说的 基因是生物体传递遗传信息和表达遗传信息的基本物质单位 实际上就是孟德尔所阐明的基因观 1926年 摩尔根的巨著 基因论 出版 从而建立了著名的基因学说 基因是染色体上的实体 基因象链珠 bead 一样 孤立地呈线状地排列在染色体上 基因是 功能突变交换 三位一体 的 Threeinone 最小的不可分割的基本的 遗传单位 1957年 本泽尔 SeymourBenzer 以T4噬菌体为材料 在DNA分子水平上研究基因内部的精细结构 提出了顺反子 cistron 概念 对经典的基因概念的第一次重要修正与发展 顺反子假说 Theoryofcistron Cistron是基因的同义词 在一个顺反子内 有若干个突变单位突变子 在一个顺反子内 有若干个交换单位交换子 基因是一个具有特定功能的 完整的 不可分割的最小的遗传单位threeinoneoneinone 基因内可以较低频率发生基因内的重组 交换 onegene oneenzymeonegene onepeptideonegene onefunction Lac Operon Lactose 操纵子理论 基因功能的表现是若干基因组成的信息表达的整体行为 IPOZYA z y a 根据其是否具有转录和翻译功能可以把基因分为三类 编码蛋白质的基因 它具有转录和翻译功能 包括编码酶和结构蛋白的结构基因以及编码调节蛋白的调节基因 只有转录功能而没有翻译功能的基因 包括tRNA基因和rRNA基因 不转录的基因 它对基因表达起调节控制作用 包括启动子和操纵基因 启动子和操纵基因有时被统称为控制基因 基因主要位于染色体上 还有染色体外遗传物质 基因概念的发展 移动基因DNA能在有机体的染色体组内从1个地方跳到另一个地方 它们能从1个位点切除 然后插入同一或不同染色体上的另一个位置 移动基因机构简单 由几个促进移位的基因组成 基因的跳动能够产生突变和染色体重排 进而影响其他基因的表达 断裂基因真核蛋白质编码基因的核苷酸序列中间插入有与编码无关的DNA间隔区 使1个基因分隔成不连续的若干区段 重叠基因一些噬菌体和动物病毒 不同基因的核苷酸序列有时是可以共用的 内含子 intron 位于基因内部 不编码基因产物的序列 在成熟mRNA中被切除 外显子 exon 一个基因不包括内含子的任何编码序列 其mRNA相应区域可翻译成蛋白 外显子和内含子中发生突变的概率是相同的 但是内含子的突变率总是高于外显子 为什么 b 增加变异机率 有利于生物的进化 1977年Sanger在研究 X174时发现的 X174是一种单链DNA病毒 宿主为大肠杆菌 因此 又是噬菌体 它感染大肠杆菌后共合成11个蛋白质分子 总分子量为25万左右 相当于6078个核苷酸所容纳的信息量 而该病毒DNA本身只有5375个核苷酸 最多能编码197kDa蛋白质 实际上编码263kDa蛋白质 如 B和A E和D其读码结构互不相同 一个基因完全在另一个基因内部 如 K和C TAATG D终止密码子 J起始密码子 部分重叠 两个基因共用少数碱基对 如 D和J 基因的命名 大肠杆菌和其它细菌基因座的命名统一用斜体 用三个英文缩写字母表示 表型第一个字母大写 用正体 基因型三个字母都小写 用斜体 肩上的符号用以表示野生型 突变型 抗性或敏感性 酵母三个字母表明基因功能 而后的数字表示不同基因座 线虫用三个小写字母表示突变表型 如存在多个基因座 用连字符后接数字表示 果蝇突变表型的描述可以由1 4个字母表示 表型野生型Gal 突变型Gal 或Gal 基因型野生型gal 突变型gal 或galLacZampr 啤酒酵母基因GAL4 CDC28 蛋白质 GAL4 CDC28 非洲粟酒酵母基因gal4 cdc2 蛋白质 Gal4 Cdc2 基因unc 86 ced 9 蛋白UNC 86 CCED 9 基因white w tailless tll hedgehog hh 而蛋白为White Tailless Hedgehog 植物虽然没有惯用法适用于所有植物 但大多数用1 3个小写字母表示 Arabidopsis基因用果蝇的方法命名但需要用大写字母 例如 基因AGAMOUS AG 蛋白AGAMOUS 没有惯用法 大多数用1 3个小写字母表示 脊椎动物一般以1 4个小写字母和数字表示其基因功能 例如 基因sey myc 蛋白Sey Myc人类方法如脊椎动物但需大写 例如基因MYC ENO1 蛋白MYC ENO1 对于基因产物的命名以前没有统一的规定 现在基本上都统一用正体 或全部大写 或第一个字母大写 如Gal或GAL 基因组 基因组就是一个物种中所有基因的整体组成 基因组有两层意义 遗传物质和遗传信息 要揭开生命的奥秘 就需要从整体水平研究基因的存在 基因的结构与功能 基因之间的相互关系 基因组 genome 是细胞或生物体的一套完整单倍体的遗传物质总和 包括不同染色体上全部基因和基因间的DNA 分为核基因组 核外基因组 原核生物包括 染色体基因组 质粒 真核生物包括 单倍染色体基因组 细胞器基因组 质粒 生物体的一个特征是一个单倍体基因组的全部DNA含量总是相对恒定的 通常称为该物种的C值 真核生物基因组的C值 是指生物单倍体基因组中DNA的含量 以pg表示 C值的资料表明 在不同的门中C值的变化是很大的 相对比较简单的单细胞真核生物象啤酒酵母 其基因组就有1 75 107bp大约是细菌 E Coli 基因组的3 4倍 最简单的多细胞生物秀丽隐杆线虫其基因组有8 107bp 大约是酵母的4倍 Cvalueparadoxofnucleotide A生物体进化程度与大C值不成明显正相关 B亲缘关系相近的生物间大C值相差较大 C一种生物内大C值与小c值相差极大 生物进化的C值矛盾 Cvalueparadoxofnucleotide ThetotalamountofDNAinthegenomeofhaploidisacharacteristicofeachlivingspeciesknownasitsMaximumCvalue 单倍体基因组总DNA的含量叫作C值 最大C值MaximumCvalue ThetotalamountofDNAforencodingthegenesinformationistermeditsMinimumcvalue 编码基因信息的总DNA含量叫作c値 最小C值Minimumcvalue C值矛盾 C值和生物结构或组成的复杂性不一致的现象 主要表现为 C值不随生物的进化程度和复杂性而增加 亲缘关系密切的生物C值相差很大 高等真核生物具有比用于遗传高得多的C值 第二节病毒基因 病毒基因组核酸的主要类型 双链DNA多数动物病毒 如腺病毒 疱疹病毒 痘病毒 环形 线形 单链DNA动物病毒中仅微小病毒为单链病毒 噬菌体中仅含单链DNA RNA病毒基因组所携带的遗传信息一般在同一条链上 序列与mRNA相同的为正股 与mRNA互补的为负股 双链RNA以负链RNA为模板转录出mRNA如呼肠孤病毒及噬真菌体 单链负股RNA 单链正股RNA如逆转录病毒 病毒基因组的结构特点 与细菌相比 病毒基因组很小 而且大小相差较大 可以由DNA组成 也可以由RNA组成 每种病毒颗粒中只含有一种核酸 或为DNA或为RNA 两者一般不共存于同一病毒颗粒中 基因重叠 大部分是用来编码蛋白质的 只有非常小的一份不被翻译 DNA序列中功能上相关的蛋白质的基因或rRNA的基因往往丛集在基因组的一个或几个特定的部位 形成一个功能单位或转录单元 噬菌体 细胞病毒 的基因是连续的 而真核细胞病毒的基因是不连续的 具有内含子 噬菌体 研究得最为详尽的双链DNA噬菌体 48 5kb 46基因 分5部分 头部 尾部 调控 免疫区 复制和晚期调控区 X174噬菌体 单链环状DNA 5 4kb 11个基因 3转录单位 重叠基因5 4kb1795氨基酸197kDa蛋白质实际上 263kDa蛋白质 基因之间的间隔区很小如 H A间隔63个核苷酸 SV40病毒基因组 无包膜 直径45nm 双链环状DNA DNA长5243bp 基因是不连续的 两个区域 转录方向相反 第三节 细菌的基因组 细菌 属于原核型细胞的一种单胞生物 形体微小 结构简单 无成形细胞核 也无核仁和核膜 沙门氏干菌 博德氏菌 梭狀干菌 大肠干菌 螺旋菌 葡萄球菌 细菌的染色体基因组通常仅由一条环状双链DNA分子组成 染色体相对聚集在一起 形成一个较为致密的区域 称为类核 只有一个复制起点 具有操纵子结构 在大多数情况下 结构基因在细菌染色体基因组中都是单拷贝 和病毒的基因组相似 不编码的DNA部份所占比例比真核细胞基因组少得多 在DNA分子中具有各种功能的识别区域如复制起始区OriC 复制终止区TerC 转录启动区和终止区等 具可移动的DNA序列 没有基因重叠现象 在基因或操纵子的终末往往具有特殊的终止顺序 它可使转录终止和RNA聚合酶从DNA链上脱落 细菌染色体基因组结构的一般特点 含有3500个基因 已被定位的有900个左右 在这900个基因中 有260个基因已查明具有操纵子结构 定位于75个操纵子中 在已知的基因中8 的序列具有调控作用 大肠杆菌基因组 类核的结构 第四节真核生物基因组及其组分 真核生物在细胞结构 功能上远远比原核生物复杂 具有细胞核结构 能进行有丝分裂 细胞质内存在线粒体或同时存在叶绿体等多种细胞器的生物 真核生物的基因组比较庞大 具有多个复制起始点 一个基因组包括若干个染色体 一般不呈环状 真核生物的基因组DNA与蛋白质结合形成染色体 储存于细胞核内 真核细胞被核膜分隔成细胞核和细胞质 在基因表达中 转录和翻译在时间和空间上被分隔 不偶联 真核生物基因组存在着许多重复序列 重复序列单位长度不一 重复程度各异 真核生物的蛋白质基因一般以单拷贝形式存在 存在着可移动的DNA序列 大多数真核生物编码蛋白质的基因为断裂基因 真核生物基因组的特点 真核生物基因组组分 核内染色体DNA 核外细胞器DNA 线粒体DNA 叶绿体DNA 质粒 核内染色体DNA 断裂基因 真核生物基因组的序列类型 基因家族和基因簇 真核生物DNA序列类型 真核生物基因组是十分复杂的 不像原核生物多由单一序列组成 而是由各种重复序列和单一序列组成 根据DNA序列出现频率的不同 可分为不同的类型 单拷贝序列低度重复序列中度重复序列高度重复序列 单拷贝序列 单拷贝顺序在单倍体基因组中只出现一次或数次 因而复性速度很慢 单拷贝顺序在基因组中占50 80 如人基因组中 大约有60 65 的顺序属于这一类 单拷贝顺序中储存了巨大的遗传信息 编码各种不同功能的蛋白质 一个细胞中大约只有1 104种不同蛋白质 其中80 是维持生命所必需的基本蛋白质 一般讲生物体所有细胞都共同具有的蛋白质称为持家蛋白 低度重复序列 低度重复序列是指在基因组中含有2 10个拷贝的序列 如酵母tRNA基因 人和小鼠的珠蛋白基因等 假基因 一种类似于基因序列 其核苷酸序列同其相应的正常功能基因基本相同 但却不能合成功能蛋白的失活基因 缺乏与功能的调控区 使其不能进行正常的转录 即使能转录 但由于突变或缺失等 引起mRNA加工缺陷 使mRNA翻译提前终止 产生无功能的肽链 中度重复序列 中度重复序列的特点 长度300 7000bp 数十到十万个拷贝 占总DNA的10 40 有编码序列 也有非编码序列 重复单位序列相似 但不完全一样 散在分布于基因组中 序列的长度和拷贝数非常不均一 中度重复序列一般具有种属特异性 可作为DNA标记 中度重复序列可能是转座元件 长散在重复序列 longinterspersedrepeatedsegments LINES 长度 1000bp 可达7Kb 拷贝数104 105 如人LINE1 广泛存在于基因组内 生物学功能不清 短散在重复序列 Shortinterspersedrepeatedsegments SINES 长度105 如人Alu家族 Kpn 组氨酸基因簇 45SRNA及各种tRNA家族等 中度重复序列的分类 LINE1 长6500bp左右在基因组中约6万个拷贝由RNA多聚酶II转录的 属于一种转座因子 l00copy rRNA基因簇 重复单元28S 18S 5 8s rRNA Alu家族 长约300bp 占人基因组的3 6 由RNA多聚酶III转录的在基因组中30万个拷贝在170bp处有一AluI的酶切位点 AGCT AG CT 两侧7 21bp正向重复 由两个130bp的串联重复顺序组成 在二聚体的右半部有31bp插入序列 可能参与hnRNA的加工与成熟与遗传重组及染色体不稳定性有关有形成Z DNA的能力 可能具有转录调节作用 Alu家族的功能 高度重复序列 在大多数高等真核生物基因组中 重复次数可达106以上的DNA序列 人类基因组高等重复序列占20 左右 根据重复单位的数目多少以及结构特点分为3类 卫星DNA序列小卫星DNA序列微卫星DNA序列 卫星DNA序列 图小鼠DNA经CsClMI度梯度离心显示出主带和卫星DNA带 转引自Russell 1992 将基因组DNA切成较小片段以后 用氯化铯密度梯度离心时 真核生物大部分DNA形成主带 有些高度重复DNA由于碱基组成的不同 在离心管中常常单独形成一条或几条小带 位于主带的旁侧 这部分高度重复序列就称为卫星DNA 卫星DNA序列 由非常短的序列重复多次 有数百万个拷贝 串联成长长的一大簇集中在异染色质区 特别是着丝粒和端粒附近 通常不转录 可能与染色体折叠压缩和配对分离有关 小卫星DNA序列 一般由15bp左右的串联重复序列组成 位于邻近染色体末端的区域 也有一些分散在基因组的多个位置上 一般没有转录活性 小卫星DNA序列具有极强的个体特异性 因此可以用于DNA指纹图谱分析 微卫星DNA序列 又称短串联重复 shorttandemrepeat STR 或简单重复序列 simplesequencerepeats SSR 重复单位2 6bp 长度 150bp 两侧为特异的单拷贝序列 人基因组中每l0kbDNA序列至少一个STR序列 常染色质区 共显性 高度多态性 SSLP 简单序列长度多态性 CA n 50 000 100 000拷贝 新一代遗传标记 人类基因组研究 肿瘤 遗传病 基因家族和基因簇 基因簇 基因家族的各成员紧密成簇排列成大段的串联重复单位 定位于染色体的特殊区域 基因家族 一组功能相似且核苷酸序列具有同源性的基因 可能由某一共同祖先基因 ancestralgene 经重复 duplication 和突变产生 超基因家族 由基因家族和单基因组成的大基因家族 结构上有程度不等的同源性 但功能不同各基因 如免疫球蛋白家族 基因家族 真核生物的rRNA基因家族 tRNA基因 组蛋白基因家族 rRNA基因 真核生物rRNA基因的重复次数多真核生物有四种rRNA 18S 28S 5S 5 8S 基因组中18S 28S和5 8SrRNA基因在同一转录单位 5SrRNA在低等真核生物 如 酵母 中也和18S 18SrRNA在同一转录单位 而在高等生物中 5SrRNA是单独转录 而且其在基因组中的重复次数高于18S和28SrRNA基因rDNA区 染色体的核仁组织区 nucleolusorganizerregion rRNA

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论