基因组学及基因组工程.ppt_第1页
基因组学及基因组工程.ppt_第2页
基因组学及基因组工程.ppt_第3页
基因组学及基因组工程.ppt_第4页
基因组学及基因组工程.ppt_第5页
已阅读5页,还剩120页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章 基因组学与基因组工程,Genomics and Genomics Engineering,1 基因组学概况 2 基因组图谱的构建 3 功能基因组学 4 主要生物基因组研究进展 5 基因组工程 6 生物芯片,1 基因组学概况,基因组(genome):一个物种的一套完整遗传物质,包括核基因组和细胞质基因组。 核基因组:一个物种的单倍体所拥有的一套完整的染色体; 细胞质基因组:一套完整的细胞质中的遗传物质,其上携带的基因称为细胞质基因。 通常所说的基因组一般指的是核基因组。 研究基因组的学科就是基因组学。 cDNA基因组指的是能够转录翻译的DNA序列。,人类染色体基因组(核基因组),24条染色体, DNA 约 3 10 9 碱基对(30亿),编码基因:约有50000个,占总长的1%.,Chr. Mb,2个rRNA基因和22个tRNA基因,13个编码蛋白质基因,编码序列占93%,有许多拷贝。,CO I-III: Cty c oxidase subunites genes ; ATP 6 and 8: ATPase genes ND1-6: NADH reducase subunites genes 12SrRNA and 16SrRNA genes tRNA genes,基因组学(genomics),1986年提出,至今20年,已经发展成为遗传学中最重要的分支学科。 研究基因组结构和功能的科学。包括对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录图谱),核苷酸序列分析,基因定位和基因功能分析。,基因组学研究的最终目标,获得生物体全部基因组序列(结构基因组学) 钓鱼与涸泽而渔 鉴定所有基因的功能(功能基因组学) 明确基因之间的相互作用关系 阐明基因组的进化规律,CREDIT: JOE SUTLIFF,Science, Vol 291: 1221.,Fishing in a More Effective Way!,几个代表物种的基因组大小,基因组学的研究内容,结构基因组学(structural genomics) 功能基因组学(functional genomics),结构基因组学(structural genomics),基因定位 基因组作图 测定核苷酸序列,功能基因组学(functional genomics),又称后基因组学(postgenomics) 基因的识别、鉴定、克隆 基因结构、功能及其相互关系 基因表达调控的研究,2 基因组图谱的构建,基因组计划的主要任务是获得全基因组序列 但是,现在的测序方法每次只能测8001000bp 大量的测序片段要拼接 要知道序列在Chr上的位置才能正确拼接 基因组计划的第一个环节: 构建基因组图谱,基因组图谱,遗传图谱(genetic map):是以具有多态性的遗传标记作为“位标”,以遗传学距离为“图距”的基因组图。 物理图谱(physical map):是利用限制性内切酶将染色体切成数个片段,根据重叠序列把片段连接成染色体,确定遗传标志之间物理距离碱基对(bp)或千碱基(kb)或兆碱基(Mb)的图谱。 序列图 (Sequence map):整个物种基因组的DNA序列图(最详尽的物理图)。 转录图谱(transcription map ):由基因转录本mRNA反转录建立cDNA文库,通过cDNA克隆测序得到基因组的表达序列图谱。,遗传图谱(genetic map),采用遗传分析的方法将基因或其它 DNA序列标定在染色体上构建连锁图。,遗传标记(Genetic marker): 通常将可识别的“等位基因”称为遗传标记;,形态标记,细胞学标记,生化标记,分子标记,经典遗传学,现代遗传学,形态标记,形态性状:株高、颜色、白化症等 又称表型标记 数量少 很多突变是致死的 受环境、生育期等因素的影响,最早建立的果蝇连锁图,就是利用控制果蝇眼睛的形状、颜色,躯体的颜色、翅膀的形状等形态性状作为标记,分析它们连锁关系及遗传距离,绘制而成的。 控制性状的其实是基因,所以形态标记实质上就是基因标记。,果蝇连锁图,细胞学标记,明确显示遗传多态性的染色体结构特征和数量特征 染色体的核型 染色体的带型 染色体的结构变异 染色体的数目变异 优点:不受环境影响 缺点:数量少、费力、费时、对生物体的生长发育不利,生化标记,又称蛋白质标记 就是利用蛋白质的多态性作为遗传标记。 如:同工酶、贮藏蛋白 优点:数量较多,受环境影响小 缺点:受发育时间的影响、有组织特异性、只反映基因编码区的信息,DNA分子标记,简称分子标记 以DNA序列的多态性作为遗传标记 优点: 不受时间和环境的限制 遍布整个基因组,数量无限 不影响性状表达 自然存在的变异丰富,多态性好 多数共显性,能鉴别纯合体和杂合体,限制性片段长度多态性 (restriction fragment length polymorphism,RFLP),DNA序列能或不能被某一酶酶切,相当于一对等位基因的差异。 如有两个DNA分子(一对染色体),一个具有某一种酶的酶切位点,而另一个没有这个位点,酶切后形成的DNA片段长度就有差异,即多态性。 可将RFLP作为标记,定位在基因组中某一位置上。 人类基因组中有105个RFLP位点,每一位点只有两个等位基因。,RFLP分析,RFLP标记位共显性标记,微卫星(microsatellite)标记,微卫星又称为简单重复序列(simple sequence repeat,SSR)。 这种重复序列的重复单位很短,常常只有2个、3个或4个核苷酸 如一条染色体TCTGAGAGAGACGC 另一染色体TCTGAGAGAGAGAGAGAGACGC,就构成了多态性。,不同个体的DNA指纹图谱,利用DNA指纹进行亲子鉴定,父亲 孩子 母亲,利用DNA指纹确定罪犯,遗传图谱的构建方法,理论基础: 连锁与交换 基本方法: 两点测验法和三点测验法,植物遗传图谱的构建,选择研究材料(亲本) 构建分离群体 遗传标记检测 标记间的连锁分析,A Chromosome Map of Tomato,选择亲本,要求亲缘关系远,遗传差异大 但又不能相差太大以导致引起子代不育。 对备选材料进行多态(差异)性检测,综合测定结果,选择有一定量多态性的一对或几对材料作为遗传作图亲本。,构建作图群体,群体的类型 1)F2群体,F1,P1,P2,F2,2)BC1群体,3)RIL群体 RIL(recombinant inbred lines,重组近交系)群体是杂交后代经过多代自交而产生的一种作图群体,通常从F2代开始,采用单粒的方法建立。常自交6-7代。,4)DH群体 高等植物的单倍体是含有配子染色体的个体。单倍体经过染色体加倍形成的二倍体称为加倍单倍体或双单倍体。,5)NIL(near-isogenic line )群体 一组遗传背景相同或相近,只在个别区段存在差异的株系,称为近等基因系(Near-isogeneic linesNIL)。 多代回交后自交一次即得回交自交品系。,6) F1群体 两个杂合亲本杂交产生的复合杂交群体( CP群体),拟测交(Pseudo-testcross)群体。,遗传标记的染色体定位,利用遗传学方法或其它方法将少数标记锚定在染色体上,作为确定连锁群的参照系。 常用的方法: 单体分析 三体分析 代换系分析 附加系分析 依据染色体剂量的差异将遗传标记定位在特定染色体上。即当供体材料总DNA等量时,DNA杂交带的信号强弱与该标记位于的染色体剂量成正比。,标记间的连锁分析,利用在两个亲本间有多态性的标记分析分离群体中所有个体的基因型 根据连锁交换的情况,确定标记之间的连锁关系和遗传距离 有计算机软件可以应用,连锁图谱构建的理论是染色体的交换和重组。,重组率可用来表示遗传图距,,基因重组和连锁理论,重组型配子的最大比例为50% ,变化0-50%。,图距单位用厘摩(centi-Mergan, cM) 表示,,1cM的大小大致符合1%的重组率。,两位点存在连锁(r0.5)的概率与不连锁的概率(r=0.5)比,为确定两位点之间存在连锁,一般要求似然比大于1000,即LOD3;而否定连锁的存在,则要求似然比小于100,即LOD2。,图谱制作的统计学原理,两点测验,L(r)/ L(0.5),概率之比可用似然比统计量来表示,似然函数L(),多点测验,一个位置上所发生的交换会减少其周围另一个单交换的发生。,图距x与重组率间的关系,当r=0.2时,x=21.2cM。,交换干涉与作图函数,交换干涉,干扰的程度可用符合函数C表示。,作图函数,Kosambi作图含数:,QTL定位软件 Mapmaker/QTL1.0 Map Manager QTX QTL Cartographer Windows Cartographer MapQTL,水稻遗传图,1994年,水稻第一张高密度遗传图谱 927个位点, 1383个标记 1998年,1157个位点,2275个标记 2000年,3267个标记 高密度的遗传图谱为基因组测序和遗传研究奠定了坚实的基础。,人类遗传图谱的构建,不可能根据需要选择亲本,设计杂交组合,构建分离群体! 只能检测现存家庭连续几代成员的基因型 家系分析法 资料有限、必须借助于统计学方法,现有的人类遗传图谱,122号染色体 8个家系134个成员 X染色体,12个家系170个成员 5364个SSR标记 2335个位点 标记间的平均距离599kb,物理图谱的构建,用分子生物学方法直接检测DNA标记在染色体上的实际位置绘制成的图谱称为物理图谱。 有遗传图谱为什么还要构建物理图谱?,遗传图谱的缺陷,分辨率有限 人类只能研究少数减数分裂事件,不能获得大量子代个体;测序要求每个标记的间隔小于100kb,但实际是599kb。,精确性不够 经典遗传学认为,交换是随机发生的,但基因组中有些区域是重组热点,倒位、重复等染色体结构变异会限制交换重组。,酵母遗传图与物理图比较,A 遗传图 B 物理图,物理作图的方法,1、限制酶作图 2、依靠克隆的基因组作图 3、荧光原位杂交 4、序列标签位点作图,限制酶作图(restriction mapping),限制酶作图(restriction mapping),荧光原位杂交 (fluorescent in situ hybridization,FISH),荧光原位杂交 (fluorescent in situ hybridization,FISH),荧光原位杂交 (fluorescent in situ hybridization,FISH),荧光原位杂交 (fluorescent in situ hybridization,FISH),人类基因组物理图,1987年,RFLP图谱,403个标记,10Mb 1994年,5800个标记,0.7Mb 1996年,17000多个标记,100kb 完全适应全基因组测序的要求,遗传图与物理图的整合,有些标记既是遗传标记,又是物理标记 RFLP标记 SSR标记 某些基因序列 借助这些标记可以将遗传图和物理图整合起来,转录图谱的构建,利用EST作为标记所构建的分子遗传图谱被称为转录图谱。 表达序列标签(EST):从cDNA文库中随机条区的克隆进行测序所获得的部分cDNA的5或3端序列。一般长300500bp。,EST计划的优点,为遗传图谱的构建提高大量的分子标记 来自不同组织和器官的EST为基因功能研究提供了有价值的信息 为基因的鉴定提供了候选基因,EST计划的不足,随机测序有时无法获得低丰度表达的基因和特殊条件下诱导表达的基因,基因组测序策略,有了高密度的基因组图谱,就可以开始全基因组测序了 测序的技术飞速发展,现在可以全自动化 测序的策略有两个: 鸟枪法 克隆重叠群法,鸟枪法(shotgun sequencing),鸟枪法的优缺点,优点: 不需要高密度的图谱 速度快、简单、成本低 缺点: 拼接组装困难,尤其在重复序列多的区域 主要用于重复序列少、相对简单的原核生物基因组,克隆重叠群法(clone contig),将基因组DNA切割长度为0.1Mb1Mb的大片段,克隆到YAC或BAC载体上 然后再进行亚克隆,分别测定单个亚克隆的序列 再装配、连接成连续的DNA分子。 这是一种自上而下(up to down)的测序策略 clone-by-clone method,两种基因组测序策略,The E.coli genome,A portion of the E.coli chromosome showing genes and operons. A dot indicates the promoter for each gene or operon. Arrows and color indicate the direction of transcribtion: dark blue genes are transcribed left to right, light blue are transcribed right to left.Overlapping gene are shown in green.,完成基因组测序,仅仅是基因组计划的第一步,更重要的工作在于弄清楚: 基因组序列中所包含的全部遗传信息是什么; 基因组作为一个整体如何行使功能。 就是对基因组序列进行诠释的过程,也就是功能基因组学的研究内容。,3 功能基因组学,根据序列分析搜寻基因,查找开放阅读框(open reading frame, ORF) 开放阅读框都有一个起始密码子,ATG,还要有终止密码子。 从ATG开始,然后向下游寻找终止密码子。 起始密码子和终止密码子之间的碱基数目要能够被3整除 每一条链都有3种可能的阅读框,2条链共计有6种可能的阅读框. 计算机可以很快给出结果。,同源查询,利用已经存入数据库的基因序列与待查的基因组序列比对,从中查找可以与之匹配的碱基序列及其比例,用于界定基因。 同源查询可以部分弥补ORF扫描的不足。,同源查询的依据,有亲缘关系的物种,基因组可能存在某种程度的相似性: 存在某些完全相同的序列; ORF的排列相似,如等长的外显子; ORF指令的氨基酸序列相似; 模拟的多肽链的高级结构相似,等。,基因功能研究,1、计算机预测基因功能 依据仍然是同源性比较。同源基因拥有一个共同的祖先基因,它们之间有许多相似的序列。 种间同源基因 种内同源基因,基因功能研究,2、实验确认基因功能 基因克隆 基因敲除(knock-out) 基因的超表达 反义RNA技术 RNAi 转座子插入突变,反义RNA(antisense RNA)技术,4 主要生物基因组研究进展,20世纪人类科技发展史上的三大创举,90年代人类基因组计划,40年代第一颗原子弹爆炸,60年代人类首次登上月球,一、 人类基因组计划,1.人类基因组计划的启动 1986年,诺贝尔奖获得者R.Dulbecco(杜尔贝科)提出人类基因组计划测出人类全套基因组的 DNA 碱基序列( 3 109 bp )。 美国政府决定于 1990年正式启动HGP,预计用 15 年时间,投入 30 亿美元,完成 HGP。由国立卫生研究院和能源部共同组成“人类基因组研究所”。 逐渐地,HGP 扩展为多国协作计划,参与者包括:英、日、法、德和中国(1993年)。,1975年,获诺贝尔生理医学奖,2.人类基因组计划的进展状况 (1)截至 1998 年 10 月,完成 1.8 108bp,占计划的 6。 (2)完成一系列模式生物全基因组测定。 这些模式生物全基因组测定的完成有重大理论与现实意义。,3.DNA 测序技术飞速提高 1998年5月一批科学家在美国罗克威尔组建塞莱拉(celera)基因公司,目标是投入亿美元,到2001年绘制出完整的人体基因 图谱,与国际人类基因组计划展开竞争。,接着又有若干家公司成立,总共投入资金约几十亿美元,形成“公”“私”并进格局。,2000.6. 完成并公布人类基因组工作框架图( 90%)。,二000年六月二十六日克林顿宣布 人类基因组草图绘制完成,美国国家人类基因组研究所所长弗朗西斯柯林斯在介绍情况。,人类基因组草图基本信息,由31.65亿bp组成 含33.5万基因 与蛋白质合成有关 的基因占2%,人类基因组,2000年6月公共领域测序计划工作框架图,2001年2月15日由六国科学家在自然公布了“关于人类基因组框架图”的数据。 2001年2月16日美国的科学刊登了Celera Genomics公司的“人类基因组框架图”的数据,并从7个方面详细地介绍了他们的科研情况,并得出5项研究结论。,同时发表论文 美国 Science, Vol. 291, No. 5507 英国Nature , Vol.409, p.860,NATURE 2001, 15 February, Vol 409: 860-921.,International Human Genome Sequencing Consortium,Initial sequencing and analysis of the human genome,The Sequence of the Human Genome,SCIENCE 2001, 16 February Vol 291: 1304-1351,Celera Genomics,DNA测序胶图,2003年4月14日,人类基因组序列图亦称“完成图”(99.99%),提前绘制成功。,“炎黄一号” (07.10.11),炎黄计划(06年) 第一步 绘制中国人的基因组参考图,命名为“炎黄一号”,现已完成。 第二步 再绘制99个中国人的个体全基因组序列图,构成中国人群的遗传和多态性标准图谱,成为基因与医疗和健康的关键组成部分,简称“炎黄99”。 第三步 在上述基础上开展大众的基因与健康的预测、监测及个体化诊断和治疗,实现解读基因。,2008年1月,华大基因研究院和国际同行提出“国际千人基因组计划”。 万种微生物基因组计划,微生物的基因比人的要少得多,大约有人的千分之一左右,现在华大基因已经做了400种左右,,4.人类基因组计划的科学意义,(1)确定人类基因组中约5万个编码基因的序列及其在基因组中的物理位置,研究基因的产物及其功能。 (2)了解转录和剪接调控元件的结构与位置,从整个基因组结构的宏观水平上理解基因转录与转录后调节。,(3)从整体上了解染色体结构,包括各种重复序列以及非转录“框架序列”的大小和组织,了解各种不同序列在形成染色体结构、DNA复制、基因转录及表达调控中的影响与作用。 (4)研究空间结构对基因调节的作用。有些基因的表达调控序列与被调节基因从直线距离上看,似乎相距甚远,但若从整个染色体的空间结构上看则恰恰处于最佳的调节位置,因此,有必要从三维空间的角度来研究真核基因的表达调控规律。,(5)发现与DNA复制、重组等有关的序列。DNA的忠实复制保障了遗传的稳定性,正常的重组提供了变异与进化的分子基础。局部DNA的推迟复制、异常重组等现象则导致疾病或者胚胎不能正常发育,因此,了解与人类DNA正常复制和重组有关的序列及其变化,将对研究人类基因组的遗传与进化提供重要的结构上的依据。,(6)研究DNA突变、重排和染色体断裂等,了解疾病的分子机制,包括遗传性疾病、易感性疾病、放射性疾病甚至感染性疾病引发的分子病理学改变及其进程,为这些疾病的诊断、预防和治疗提供理论依据。 (7)确定人类基因组中转座子、逆转座子和病毒残余序列,研究其周围序列的性质。了解有关病毒基因组侵染人类基因组后的影响,可能指导人类有效地利用病毒载体进行基因治疗。,(8)研究染色体和个体之间的多态性。这些知识可被广泛用于基因诊断、个体识别、亲子鉴定、组织配型、发育进化等许多医疗、司法和人类学的研究。此外,这些遗传信息还有助于研究人类历史进程、人类在地球上的分布与迁移以及人类与其他物种之间的比较。,二、植物基因组 1.水稻基因组 1992年,我国在人类基因组计划的影响下, 执行水稻基因组作图和测序计划。1994年7月,洪国藩院士为首的科学家小组, 构建了水稻基因组库。1997年1月7日,成功地构建了高分辨率的水稻基因组物理图谱。2000年4月5日,以杨焕明为首的中国科学家在Science发表了水稻全基因组框架序列图。,2.拟南芥基因组 拟南芥菜属十字花科,拟南芥属,是一种分布很广的植物,其基因组较简单,即染色体n=5,核基因组DNA含量=1.0108碱基对。而且生命周期短,种子产量大,即一代的时间为35周,每个植株可产生无数粒细小的种子,亦有人将之称为植物中的“果蝇”。 2000年12月14日,由美英等多国科学家组成的研究小组在英国自然杂志上正式宣布,他们绘出了包含1.3亿个碱基对、约2.5万个基因的拟南芥基因的完整图谱,这是人类首次全部破译出一种植物的基因序列。,3.其它植物基因组 黄瓜、玉米、毛竹、毛果杨、葡萄、高粱、大豆、白菜等,三、动物及微生物基因组 1996年,完成酵母菌基因组测序。 1999年线虫基因组测序 2000年果蝇基因组测序 2002年小鼠基因组测序 2004年斑马鱼基因组测序 2005年家蚕基因组测序 2005年绵羊基因组测序 2005年“中-丹家猪基因组计划” 2009年大熊猫基因组测序,世界首张大熊猫基因组序列图谱(09.10.11),大熊猫基因组与狗的基因组在结构上最为接近,与人也有较大的相似性,在哺乳动物中与小鼠差异较大。大熊猫的基因组与人的基因组大小相似,大熊猫共有21对染色体,约为30亿个碱基对,包含2-3万个基因。,5 基因组工程,一、基因组工程的概念 基因组工程是指利用工程技术原理,以基因组为基础,对一类基因群进行遗传操作,从而实现基因群在受体内的整合、表达的过程。,二、基因组工程与基因工程的差异,6 生物芯片,一、概述 生物芯片技术是应现代分子生物学研究的重大需求,在学科交叉不断深入的基础上诞生的,现已成为国际上的热点研究领域。生物芯片是一种能快速并行处理多个生物样品,并对其所包含的各种生物信息进行解析的微型器件,其加工运用了微电子工业中十分成熟的光刻技术和微机电系统加工中的各类技术,由于其所处理和分析的对象是生物样品,故称为生物芯片。它具有快速、高效、并行处理及分析自动化能力,不仅广泛用于各研究领域,同时已出现更多的消费型产品进入公共卫生领域,为食品卫生、疾病预防和预后提供全新的检测手段。,二、分类 根据其应用领域的不同,生物芯片可分为四大类:基因芯片、蛋白质芯片、细胞芯片和组织芯片。,1.基因芯片 基因芯片也叫核酸芯片,是采用原位合成技术或微量点样技术,将数以百计或万计的DNA探针固着于固相支持物表面,形成二维DNA探针阵列,通过与标记过的样品杂交,然后检测杂交信号来实现对生物样品的快速、并行和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论