基因组与比较基因组学(2).ppt_第1页
基因组与比较基因组学(2).ppt_第2页
基因组与比较基因组学(2).ppt_第3页
基因组与比较基因组学(2).ppt_第4页
基因组与比较基因组学(2).ppt_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章 基因组与比较基因组学 1 目录 v第一节 人 类 基 因 组计划 v第二节 DNA的鸟枪法序列分析技术 v第三节 比较基因组学(Comparative genomics)及功能基因组学研究 20世纪纪人类类科技发发展史上的三大创举创举 v1940年代第一颗原子弹爆炸; v1960年代人类首次登上月球; v1990年代提出并基本完成的人类基因组计 划( Human Genome Project,HGP) 3 DNA 双螺旋结构的发现者之一、美国国家卫生研究院( NIH)人类基因组研究所第一任所长J.D.Watson 1990年在 Science上撰文指出,与人类登月计划相比,HGP的资 金投入少,但它对人类生活的影响却可能更深远。 4 随着这个计划的完成,DNA分子中储藏的有关人类生 存和繁衍的全部遗传信息将被破译,它将不仅帮助我们理 解人类如何作为健康人发挥正常生理功能,还将最终揭开 基因在癌症、早老性痴呆症、精神分裂症等严重危害人类 健康的疾病中的作用。 事实上,对人类自身更深入的了解是人类活动最重要 的组成部分,因为任何自然科学研究,都没有比人类尽快 找出解决自身所面临的人口膨胀、粮食短缺、环境污染、 疾病危害、能源资源匮乏、生态平衡破坏、生物物种消亡 等一系列难题更为重要、更为迫切。 5 1860至1870年 奥地利科学家孟德尔根据豌豆杂交实验提出遗传因子 概念,并总结出孟德尔遗传定律。 1909年 丹麦植物学家和遗传学家约翰逊首次提出“基因”这一名词, 用以表达孟德尔的遗传因子概念。 1944年 3位美国科学家分离出细菌的DNA(脱氧核糖核酸),并发 现DNA是携带生命遗传物质的分子。 1953年 美国人沃森(Watson)和英国人克里克(Crick)通过实验 提出了DNA分子的双螺旋模型。 1969年 科学家成功分离了第一个基因。 基因及基因组研究大事记: 6 1990年10月 被誉为生命科学“阿波罗登月计划”的国际人类基因组计 划启动。 1998年 一批科学家在美国罗克威尔(Rockville)组建塞莱拉遗传公 司,与国际人类基因组计划展开竞争。 1998年12月 一种小线虫完整基因组序列的测定工作宣告完成,这是 科学家第一次绘出多细胞动物的基因组图谱。 1999年9月 中国获准加入人类基因组计划,负责测定人类基因组全 部序列的1%。中国是继美、英、日、德、法之后第6个国际人类基 因组计划参与过,也是参与这一计划的唯一发展中国家。 1999年12月1日 国际人类基因组计划联合研究小组宣告,完整破译 出人体第22对染色体的遗传密码,这是人类首次成功地完成人体染 色体完整基因序列的测定。 2000年4月6日 美国塞莱拉公司宣布破译出一名实验者的完整密码, 但遭到不少科学家的质疑。 2000年4月底 中国科学家按照国际人类基因组计划的部署,完成了 1%人类基因组的工作框架图。 2000年5月8日 德、日等国科学家宣布,已基本完成了人体第21对 染色体的测序工作。 2000年6月26日 科学家公布人类基因组工作草图,标志着人类在解 读自身“生命之书”的路上迈出了重要一步。 2000年12月14日 美英等国科学家宣布绘出拟南芥基因组的完整图 谱。这是人类首次全部破译出一种植物的基因序列。 2001年2月12日 中、美、日、德、法、英6国科学家和美国塞莱拉 公司联合公布人类基因组图谱及初步分析结果。 科学家首次公布人 类基因组草图“基本信息”。 8 第一节 人类基因组计划 9 v一、人类基因组计划的科学意义 v二、遗传图的绘制 v三、物理图(Physical Map) v四、转录图(Expression Profiling) v五、人类基因组的序列图(Human Genome Sequence) 11 基因控制着细胞中的蛋白质合成,控制着生物的各种 遗传性状。基因组是生物体内遗传信息的集合,是某个特 定物种细胞内全部DNA分子的总和。人体是一个多细胞体 系,每个细胞中都包含46条两两配对的染色体,每23条染 色体构成一个染色体组。大约有30亿对核苷酸,编码了5- 6万个基因,人类基因组中携带了有关人类个体生长发育 、生老病死的全部遗传信息。从整体上看,不同人类个体 的基因是相同的,因此,我们说“人类只有一个基因组”, 人生来是平等的。当然,不同的人可能拥有不同的等位基 因,这一点决定了人与人之间个体上的差异。 各种遗传病的发生,都源于基因的突变。突变是 基因在分子结构上的改变,这种DNA分子结构的改变 会导致基因功能的异常,从而导致遗传病。例如人类2 号染色体长臂某段DNA分子的改变,就会导致并指畸 形的产生。至于一些复杂的疾病,如高血压、冠心病 、糖尿病、癌等,则可能涉及多个基因的突变。 一、人类基因组计划的科学意义 (1)确定人类基因组中约5万个编码基因的序列及其在 基因组中的物理位置,研究基因的产物及其功能。 (2)了解转录和剪接调控元件的结构与位置,从整个基 因组结构的宏观水平上理解基因转录与转录后调节。 (3)从整体上了解染色体结构,包括各种重复序列以及 非转录“框架序列”的大小和组织,了解各种不同序列在 形成染色体结构、DNA复制、基因转录及表达调控中的 影响与作用。 14 15 (4)研究空间结构对基因调节的作用。有些基因的表达 调控序列与被调节基因从直线距离上看,似乎相距甚远, 但若从整个染色体的空间结构上看则恰恰处于最佳的调节 位置,因此,有必要从三维空间的角度来研究真核基因的 表达调控规律。 (5)发现与DNA复制、重组等有关的序列。DNA的忠实 复制保障了遗传的稳定性,正常的重组提供了变异与进化 的分子基础。局部DNA的推迟复制、异常重组等现象则导 致疾病或者胚胎不能正常发育,因此,了解与人类DNA正 常复制和重组有关的序列及其变化,将对研究人类基因组 的遗传与进化提供重要的结构上的依据。 (6)研究DNA突变、重排和染色体断裂等,了解疾病的 分子机制,包括遗传性疾病、易感性疾病、放射性疾病甚 至感染性疾病引发的分子病理学改变及其进程,为这些疾 病的诊断、预防和治疗提供理论依据。 (7)确定人类基因组中转座子、逆转座子和病毒残余序 列,研究其周围序列的性质。了解有关病毒基因组侵染人 类基因组后的影响,可能指导人类有效地利用病毒载体进 行基因治疗。 (8)研究染色体和个体之间的多态性。这些知识可被广 泛用于基因诊断、个体识别、亲子鉴定、组织配型、发 育进化等许多医疗、司法和人类学的研究。此外,这些遗 传信息还有助于研究人类历史进程、人类在地球上的分布 与迁移以及人类与其他物种之间的比较。 17 此外,工业基因组学、环境基因组学、药物基因组学、 疾病基因组学等分支学科也在不断发展。 人类基因组研究包括遗传图(Genetic Map)绘制、 物理图(Physical Map)构建、测序、转录图( Expression Profiling)绘制和人类基因组的序列图及基因 鉴定等方面的工作。 通过多年来的发展,基因组学(genomics)作为一门 专门学科,已应运而生。它涵盖以下几个方面: 结构基因组学,着重遗传图、物理图、测序等研究 功能基因组学,包括以转录图为基础的功能制图(基因组表达图) 比较基因组学,包括对不同进化阶段生物基因组的比较研究,也 包括不同人种、族群和群体基因组的比较研究 18 遗传图也称连锁图,是指基因或DNA标志在染色体上 的相对位置与遗传距离,后者通常以基因或DNA片段在 染色体交换过程中的分离频率厘摩(cM)来表示。遗传 图的绘制是人类基因组研究的第一步,即以染色体上某一 点为遗传标记,以与之相伴遗传的特征为对象,经连锁分 析,将编码该特征的基因定位于染色体特定位置。cM值 越大,两者之间距离越远。 二、遗传图的绘制 通过遗传图分析,我们可以大致了解各个基因或DNA 片段之间的相对距离与方向,了解哪个基因更靠近着丝粒 ,哪个更靠近端粒等。遗传距离是通过遗传连锁分析获得 的,研究中所使用的DNA标志越多,越密集,所得到的遗 传连锁图的分辨率就越高。 经典的遗传标记是可被电泳或免疫技术检出的蛋白质 标记,如红细胞ABO血型位点标记,白细胞HLA位点标记 等。例如,在ABO血型基因中,位于9号染色体长臂3区4 带(9q34)的基因IA,决定抗原A的存在,表现A型血性状 。由于ABO血型的广泛存在,所以可用它作遗传标记。 当在某一家庭中,观察到了指甲髌骨综合征与A型 血相伴遗传时,科学家就认为,这种病的致病基因NP与 IA基因相连锁,也位于9q34区段。进一步的观察发现, 这个家庭的后代中,有1/10为A型血而无指甲髌骨综合 征,这表明基因IA和NP发生了交换,交换率(重组率) 为1/10。这时就可说,基因IA和NP相距较近,连锁图上 的距离为10厘摩(重组率1即为1厘摩)。 21 酵母遗传分析中最常用的生物化学标签 标 签 表 现 型 筛 选 方 法 ADE2培养基中需加入腺苷酸 只能在加入腺苷酸的培养基上生长 CAN1对刀豆氨酸有抗性 能在含有刀豆氨酸的培养基上生长 CUP1对铜 离子有抗性 能在含有铜离子的培养基上生长 CYH1对环 己酰亚 胺有抗性 能在含有环己酰亚 胺的培养基上生长 LEU2培养基中需加入亮氨酸 只能在加入亮氨酸的培养基上生长 SUC2能进行蔗糖发酵 能在以蔗糖作为唯一碳源的培养基上生长 URA3培养基中需加入尿嘧啶 只能在加入尿嘧啶 的培养基上生长 22 如果只用已知定位的少数几个基因作遗传标记,由于 遗传标记的数目太少,很难绘制完整的连锁图。DNA技术 的建立为人类提供了大量新的遗传标记。 第一代DNA遗传标记 是RFLP(Restriction Fragment Length Polymorphism,限制性片段长度多态性)。DNA 序列上的微小变化,甚至1个核苷酸的变化,也能引起限 制性内切酶切点的丢失或产生,导致酶切片段长度的变化 。由于核苷酸序列的改变遍及整个基因组,特别是进化中 选择压 力不是很大的非编码序列之中,RFLP的出现频率 远远超过了经典的蛋白质多态性。而且,只要选择得当 ,生物体内出现共显性RFLP及RAPD分子标记的频率较 高。 第二代DNA遗传标记 利用了存在于人类基因组中的大 量重复序列,包括重复单位长度在15-65个核苷酸左右的 小卫星DNA(minisatellite DNA),重复单位长度在2-6 个核苷酸之间的微卫星DNA(microsatellite DNA),后 者又称为简短串联重复(STR、STRP或SSLP,short tandem repeat polymorphism或者simple sequence length polymorphism)。 STRP有两个最突出的优点,即作为遗传标记 的“ 多态性”与“高频率”。STR的存在,为遗传图 的绘制提供 了大量可用的遗传标记 。采用聚合酶链反应(PCR)技 术,以STR两侧的基因作定点标记的完整连锁图 ,已于 1996年绘成,相邻标记间 的平均距离仅0.7厘摩。 23 第三代DNA遗传标记 ,可能也是最好的遗传标记 ,是分散于基因组中的单个碱基的差异。这种差异包 括单个碱基的缺失和插入,但更常见的是单个核苷酸 的替换,即单核苷酸的多态性(SNP,single nucleotide polymorphism)。 “遗传图”的建立为人类疾病相关基因的分离克隆奠 定了基础。拥有5000多个遗传学位点,相当于把整个人 类基因组划分为5000多个小区,并分别设置了“标牌”。 这些标牌将在搜索功能基因的过程中发挥独特的作用。 把多态性的疾病基因位点(该位点至少包括“正常” 及“致病” 两个等位基因)与上述遗传标记进 行分析比较 时,如果在家系中证实该 基因与某个标记不连锁(重组 率为50%),表明该基因不在这一标记附近;如果发现 该基因与某个标记有一定程度的“连锁”(重组率小于 50%但大于0),表明它可能位于这个标记附近;如果该 基因与某标记间 不发生重组(重组率等于0),我们就 推测该标记 与所研究的疾病基因可能非常接近。 25 26 遗传图所表现的,是通过连锁 分析确定的各基因间的相对位置; 物理图则表现染色体上每个DNA片 段的实际顺序。物理图是指以已知 核苷酸序列的DNA片段(序列标签 位点,sequence-tagged site, STS)为“路标”,以碱基对(bp, kb,Mb)作为基本测量单位(图 距)的基因组图。 三、物理图(Physical Map) 现在的测序技术还不能对整个DNA分子进行序列 测定,因此须先将它切成一个个大小不同的片段,然 后将这些片段连起来,构成连续的序列。切割的工具 ,是一类限制性内切核酸酶,它能识别DNA中的特定 序列,并在该位点对DNA链进行切割。有一类稀有的 限制性内切核酸酶,由于DNA中这样的序列比较少, 所以用它可将DNA分子切割成约100万碱基大小的大片 断。这样的片段有利于排序,不过必须用脉冲场凝胶 电泳法,才能将它们分开。 28 这些大片段在进行DNA分子克隆时,也不能通过细 菌质粒或噬菌体的运载而在大肠杆菌中进行克隆,因为 它们太大,而必须用一种特殊的载体-酵母人工染色体( YAC),将片段导入酵母,在酵母细胞中克隆。YAC中 的DNA大片段是靠序列标记位标(STS)来识别的。STS 是一段200500碱基对的已知序列,在染色体上有一定 的位置,所以用STS作位标可将不同YAC克隆排列成邻接 克隆群(contig)。 其他载体还有BAC(细菌人工染色体)、P1(噬菌 体人工染色体)、粘粒(cosmid)、细菌质粒等。现在 ,人类基因组24条染色体的YAC、BAC、P1邻接克隆群 均已建立,精度约100碱基对的物理图也基本绘成,并已 开始进行大规模测序。 29 30 生物的性状,包括疾病,都由蛋白质决定。所有蛋 白质都是由mRNA(信使核糖核酸)编码的,而mRNA 又由DNA转录而来。人类基因组中仅15的DNA 是编码序列(基因);成人各种组织中又只有约10的 基因表达为蛋白质。所以,建立转录图,或从mRNA逆 转录而来的cDNA图,是分离、定位和克隆基因的关键 。这里,表达序列位标(EST)具有重要意义。 四、转录图(Expression Profiling) EST是长约100300碱基对的cDNA片段,是表 达基因的一部分。EST由于序列较短,很难定位,只 有筛到较长的基因片段(超过1000碱基对),才能用 荧光原位杂交(FISH)法在染色体上定位。 EST可用工业化的程序生产,只要分离到某一发 育阶段某一组织的mRNA,就可用逆转录法,从 mRNA合成相应的cDNA片段,即EST。用它作探针 ,就可从基因组文库中筛到全长的基因序列。截止到 1998年2月,已发现约92万条EST,转录图的制作有 了良好的开端,但这已属后基因组计划的工作。 32 人类基因组的核苷酸序列图其实是分子水平上最高层 次的、最详尽的物理图。测定总长约1米、由30亿个核苷 酸组成的全序列当然是人类基因组计划中最明确、最艰 巨的任务(图10-10)。 因为人类所拥有的基因位点都是相同的,不同种族 、不同个体的基因差异(人类基因组的多样性)以及“正 常”与“疾病”基因的差异,只是同一位点上的等位基因的差 异,所以,现在的人类基因组全序列来自一个“代表性人 类个体”(其所有权在法律上不属于任何供体)。 五、 人类基因组的序列图 (Human Genome Sequence) 该序列在理论上代表了全人类的基因组信息, 事实上也可被用于任何族群、任何个体的基因分析和 诊断。人类基因组计划所提供的这四张图,特别是人 类核酸序列图,蕴藏了决定我们生、老、病、死的所 有遗传信息,必将成为人类认识自我、改造自我的用 之不绝的知识源泉,为21世纪现代生物学和医学的迅 速发展奠定基础。 DNA的鸟枪法序列分析技术 第二节 34 v一、基因组DNA大片段文库的构建 v二、鸟枪法基因组序列分析技术及其改良 一、基因组DNA大片段文库的构建 以YAC克隆为基础建立的邻接克隆群,由于DNA片 段太大,不适于测序,需另外几种载体克隆的配合。 BAC可运载约30万碱基对的片段,P1可运载约10万碱 基对的片段,粘粒可运载约4万5万碱基对的片段, 细菌质粒则可运载约1万碱基对的DNA片段。这几类载 体的运用,使YAC克隆的DNA大片段可先分解成相应克 隆的小片段,便于测序。 一次测序一般只能测定1000碱基对,然后用已知 序列的下游部分合成引物,进行另一次测序,如此一步 步地“步行”,逐步完成较大片段的测序。因此,需先用 质粒建立许多克隆,构成质粒文库,再对这些质粒克隆 进行测序,然后用电脑搭配成邻接克隆群。 由于自动化和电脑的应用,现在一天已可进行10万 个测序反应。现已完成的1.8亿碱基对的测序,约占人 类基因组的56。华盛顿大学、贝勒医学院等机构 ,均已完成几百万到几千万碱基对的测序,错误率仅万 分之一,测序速度和准确性已大大提高。 38 二、鸟枪法基因组序列分析技术及其改良 第一,建立高度随机、插入片段大小为2kb左右的基因 组文库。克隆数要达到一定数量,即经末端测序的克隆片 段的碱基总数应达到基因组5倍以上。 第二,高效、大规模的末端测序。对文库中每一个克隆 ,进行两端测序,TIGR在完成流感嗜血杆菌的基因组时, 使用了14台测序仪,用三个月时间完成了必需的28,463个 测序反应,测序总长度达6倍基因组。 全基因组鸟枪法测序的主要步骤是: 第三,序列集合。TIGR发展了新的软件,修改了序 列集合规则以最大限度地排除错误的连锁匹配。 第四,填补缺口。有两种待填补的缺口,一是没有 相应模板DNA的物理缺口,二是有模板DNA但未测序 的序列缺口。他们建立了插入片段为15-20kb的文库 以备缺口填补。 41 42 随着所测基 因组总量增大, 所需测序的片段 大量增加,各个 片段重叠或一个 连续体的概率是 2n2-2高等真核生 物(如人类)基 因组中有大量重 复序列,导致判 断失误。 鸟枪法测序的缺点 43 (1) Clone contig法。首先用稀有内切酶把待测基 因组降解为数百kb以上的片段,再分别测序。 (2) 靶标鸟枪法(direted shotgun)。首先根据染色 体上已知基因和标记的位置来确定部分DNA片段的 相对位置,再逐步缩小各片段之间的缺口。 对鸟枪法的改进 45 比较基因组学(Comparative genomics)及功能基因组学研究 第三节 v一、通过基因组数据进行全局性分析 v二、通过基因组数据进行比较基因组学研究 v三、功能基因组学研究 基因组的序列主要可被分为三类: 由于生物在进化上是相互关联的,对一种生物的研 究可以为其它生物提供有价值的信息。 (一)通过比较确知其生理功能的 ; (二)在数据库中有相匹配的蛋白质序列,但并不知道 其功能的; (三)在现有数据库中找不到任何相匹配的蛋白质序列 的新基因。 48 比较基因组学的威力就在于它能根据对一种生 物相关基因的认识来理解、诠释甚至克隆分离另一种生 物的基因。 远缘基因组间的比较为认识生物学机制的普遍 性,寻找研究复

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论