版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基因组学 元素周期表的发现奠定了二十世纪物理、化学研究和发展的基础元素周期表“基因组序列图”将奠定二十一世纪生命科学研究和生物产业发展的基础! “基因组”-生命科学的“元素周期表”人体解剖图奠定了现代医学发展的基础生命的奥秘蕴藏于 “四字天书”之中GCTTCTTCCTCATTTTCTCTTGCCGCCACCATGCCGCCACCA TCATTTTCTCTTGCCGCCACCATGCTTCTTCCTCATTTTCTCT CCACCATGCCGCCACCACGCCACCATGCTTCTTCCTCATCTC GCTTTCTTGCCGCCACCATGCCGCCACCGCTTCTTCCtTCTCT基因组
2、学基因组学 1 1 基因组学概述基因组学概述 2 2 基因组图谱的构建基因组图谱的构建3 3 基因组测序基因组测序4 4 功能基因组学功能基因组学基因组学概念及范畴基因组学概念及范畴 基因组基因组(genome)是德国遗传学家是德国遗传学家H. Winkler在在1920年将年将gene(基因)和(基因)和chromosome(染色体染色体)两两个词缩合而创造的一个新词,意思是指染色体上的全部个词缩合而创造的一个新词,意思是指染色体上的全部基因。几十年来,随着分子生物学的发展,其含义扩展基因。几十年来,随着分子生物学的发展,其含义扩展为在个体水平代表一个个体所有遗传性状的总和,在细为在个体水平
3、代表一个个体所有遗传性状的总和,在细胞水平代表一个细胞所有不同染色体(单倍体)的总和,胞水平代表一个细胞所有不同染色体(单倍体)的总和,在分子水平代表一个物种所有在分子水平代表一个物种所有DNA分子的总和。分子的总和。 基因组学概述基因组学概述基因组(基因组(genomegenome),又称染色体组),又称染色体组一个物种单倍体的染色体数目,一个物种单倍体的染色体数目,物种全物种全部遗传信息的总和部遗传信息的总和物种遗传信息的物种遗传信息的“总词典总词典”控制发育的控制发育的“总程序总程序”生物进化历史的生物进化历史的“总档案总档案”基因组基因组(genome) 基因组基因组(genome)是
4、德国遗传学家是德国遗传学家H. Winkler在在1920年将年将gene(基因)和(基因)和chromosome(染色体染色体)两两个词缩合而创造的一个新词,意思是指染色体上的全部个词缩合而创造的一个新词,意思是指染色体上的全部基因。几十年来,随着分子生物学的发展,其含义扩展基因。几十年来,随着分子生物学的发展,其含义扩展为在个体水平代表一个个体所有遗传性状的总和,在细为在个体水平代表一个个体所有遗传性状的总和,在细胞水平代表一个细胞所有不同染色体(单倍体)的总和,胞水平代表一个细胞所有不同染色体(单倍体)的总和,在分子水平代表一个物种所有在分子水平代表一个物种所有DNA分子的总和。分子的总
5、和。 基因组学基因组学(genomics)n就是发展和应用就是发展和应用DNA制图、测序新技术以及计算制图、测序新技术以及计算机程序,分析生命体(包括人类)全部基因组结机程序,分析生命体(包括人类)全部基因组结构及功能的科学。构及功能的科学。19861986年提出,至今年提出,至今2020年,已经发展成为遗传学中年,已经发展成为遗传学中最重要的分支学科。最重要的分支学科。对物种的所有基因进行定位、作图、测序和功能对物种的所有基因进行定位、作图、测序和功能分析分析基因组学的基础理论研究基因组学的基础理论研究基因组学是要揭示下述四种整合体系的相互关系基因组学是要揭示下述四种整合体系的相互关系: 基
6、因组作为信息载体基因组作为信息载体 (碱基对、重复序列的整(碱基对、重复序列的整体守恒与局部不平衡的关系)体守恒与局部不平衡的关系) 基因组作为遗传物质的整合体基因组作为遗传物质的整合体 (基因作为功能和基因作为功能和结构单位与遗传学机制的关系结构单位与遗传学机制的关系) 基因组作为生物化学分子的整合体基因组作为生物化学分子的整合体 (基因产物作基因产物作为功能分子与分子、细胞机制的关系)为功能分子与分子、细胞机制的关系) 物种进化的整合体物种进化的整合体 (物种在地理与大气环境中的物种在地理与大气环境中的自然选择)自然选择)基因组学研究的最终目标基因组学研究的最终目标u 获得生物体全部基因组
7、序列获得生物体全部基因组序列u 鉴定所有基因的功能鉴定所有基因的功能u 明确基因之间的相互作用关系明确基因之间的相互作用关系u 阐明基因组的进化规律阐明基因组的进化规律经典遗传学经典遗传学 在在2020世纪初,遗传学刚刚诞生的时候,遗传世纪初,遗传学刚刚诞生的时候,遗传学家的工作主要是鉴别感兴趣的基因,确定这学家的工作主要是鉴别感兴趣的基因,确定这些基因在染色体上的位置。些基因在染色体上的位置。 第一个环节:寻找自发突变体,或者利用物第一个环节:寻找自发突变体,或者利用物理、化学因素诱发突变。理、化学因素诱发突变。 第二个环节:通过连锁分析确定新基因与已第二个环节:通过连锁分析确定新基因与已知
8、基因的相互关系,绘制遗传连锁图。知基因的相互关系,绘制遗传连锁图。几个代表物种的基因组大小几个代表物种的基因组大小物种物种基因组大小/bp基因组大小/bpT4噬菌体T4噬菌体2.0102.0105 5大肠杆菌(大肠杆菌(Escherichia coli) )4.2104.2106 6酵母(酵母(Sccharomyces cerevisiae) )1.5101.5107 7拟南芥(拟南芥(Arabidopsis thaliana) )1.0101.0108 8秀丽小杆线虫(秀丽小杆线虫(Caenorhbditis elagans) )1.0101.0108 8果蝇(果蝇(Drosophila m
9、elanogaster) )1.65101.65108 8水稻(水稻(Oryza sativa) )3.89103.89108 8小白鼠(小白鼠(Mus musculus) )3.0103.0109 9人类(人类(Homo sapiens) )3.3103.3109 9玉米玉米(Zea mays) )5.4105.4109 9普通小麦(普通小麦(Triticum aestivum) )1.6101.6101010基因组学的分类 3基因组学(根据所研究的生物体种类分类)结构基因组学功能基因组学1基因组学(根据系统特征分类) 2基因组学(根据与其它学科的关系分类)基因组绘制和测序基因和基因组组织基
10、因组调节网络结构蛋白质结构特征转录组学蛋白组学代谢组学基础基因组学应用基因组学生化基因组学遗传基因组学进化基因组学生理基因组学计算基因组学生态基因组学工业基因组学农业基因组学环境基因组学医学基因组学植物基因组学动物基因组学人类基因组学微生物基因组学基因组学的研究内容基因组学的研究内容q 结构基因组学结构基因组学q 功能基因组学功能基因组学q 蛋白质组学蛋白质组学结构基因组学(结构基因组学(structural genomics) 基因定位基因定位 基因组作图基因组作图 测定核苷酸序列测定核苷酸序列功能基因组学(功能基因组学(functional genomics) 又称后基因组学(又称后基因组
11、学(postgenomics)postgenomics)q 基因的识别、鉴定、克隆基因的识别、鉴定、克隆q 基因结构、功能及其相互关系基因结构、功能及其相互关系q 基因表达调控的研究基因表达调控的研究蛋白质组学(蛋白质组学(proteomics)n鉴定蛋白质的产生过程、结构、功能和相鉴定蛋白质的产生过程、结构、功能和相互作用方式互作用方式遗传学与基因组学的里程碑 图中所示的螺旋展示了遗传学和基因组学重要进展的里程碑,从孟德尔遗传法则的发现和其在20世纪初被重新发现1开始。 DNA被确立是遗传的物质基础 2、DNA结构的确定3、遗传代码的阐明4、DNA重组技术的发展5,6、以及自动化程度日益提高
12、的DNA测序技术的建立7-10,为1990年启动人类基因组计划(HGP)奠定了基础 研究功能基因组学的挑战n阐释基因功能n鉴别和表征生命的分子机构n描绘基因调节网络n系统水平上而非单个细胞水平上对生物系统的认识n计算机上的挑战n多学科协作基因组的进化基因组的进化(1 1)基因组大小的进化)基因组大小的进化 包括基因组的含量、基因组的结构以及基因包括基因组的含量、基因组的结构以及基因的数量等几个方面。的数量等几个方面。(2 2)基因组的分子进化)基因组的分子进化 DNA DNA序列的进化:基因的不同区域进化速率序列的进化:基因的不同区域进化速率不同。内含子中碱基对趋异进化速率大于外显子;不同。内
13、含子中碱基对趋异进化速率大于外显子;编码序列中同义突变的进化速率大于非同义突变,编码序列中同义突变的进化速率大于非同义突变,非同义突变的进化速率最低。假基因的进化速率非同义突变的进化速率最低。假基因的进化速率最高。最高。 多基因家族的进化:通过基因扩增和不均多基因家族的进化:通过基因扩增和不均等交换形成多拷贝基因,在通过突变积累、基等交换形成多拷贝基因,在通过突变积累、基因重排和自然选择等因素形成多基因家族或新因重排和自然选择等因素形成多基因家族或新的基因。如珠蛋白基因家族的进化。的基因。如珠蛋白基因家族的进化。外显子混编:来自不同基因的多个外显子相互外显子混编:来自不同基因的多个外显子相互连
14、接,或基因内部的外显子重复。连接,或基因内部的外显子重复。基因水平转移:遗传物质从一个物种通过各种基因水平转移:遗传物质从一个物种通过各种方式转移到另一个物种的基因组中。如转化、方式转移到另一个物种的基因组中。如转化、转导、接合、转染等。转导、接合、转染等。范围和一般方法n结构基因组学n转录物组学n蛋白质组学n代谢物组学基因组学的发展历程年里程碑和事件参考文献1985-1988美国科学院和研究委员会讨论、辩论制定人类基因组计划(HGP)Albers,19981990人类基因组计划在美国正式开始Burris,19981995第一个自由存活生物,Haemophius influenzae 鸟枪法测
15、序完成Fleischmann,19951996芽殖酵母测序完成第一个真核生物基因组Goffeau,199619981998第一个多细胞生物秀丽线虫测序完毕微阵列和基因组学一起列入最高十项科学突破C. Elegans,1998新闻编委会,19982000全基因组鸟枪法完成果蝇的全基因组测序Adams,20002000美国前总统克林顿宣布即将完成的HGP是人类描绘最奇妙的图谱Marshall,20002000第一个模式植物拟南芥全基因组测序完成Genome Intiative2001人类基因组序列草图的两个版本分别在nature和science上发表Venter,20012002两个水稻亚种基因组
16、序列草图完成Yu,20022 基因组图谱的构建基因组图谱的构建基因组计划的主要任务是获得全基因组序列基因组计划的主要任务是获得全基因组序列但是,现在的测序方法每次只能测但是,现在的测序方法每次只能测8008001000bp1000bp大量的测序片段要拼接大量的测序片段要拼接要知道序列在要知道序列在ChrChr上的位置才能正确拼接上的位置才能正确拼接基因组计划的第一个环节:基因组计划的第一个环节: 构建基因组图谱构建基因组图谱基因组图谱基因组图谱遗传图谱遗传图谱(genetic map)物理图谱物理图谱(physical map)遗传图谱遗传图谱(genetic map) 采用采用遗传分析的方法
17、遗传分析的方法将基因或其它将基因或其它DNADNA序列标定在染色体上构建连锁图。序列标定在染色体上构建连锁图。遗传标记遗传标记q有可以识别的标记,才能确定目标的方位有可以识别的标记,才能确定目标的方位及彼此之间的相对位置。及彼此之间的相对位置。q构建遗传图谱就是寻找基因组不同位置上构建遗传图谱就是寻找基因组不同位置上的特征标记。的特征标记。q包括:包括: 形态标记形态标记 细胞学标记细胞学标记 生化标记生化标记 DNADNA分子标记分子标记多态性(多态性(polymophism)所有的标记都必须具有多态性所有的标记都必须具有多态性!v 花色:白色、红色花色:白色、红色v 株高:高、矮株高:高、
18、矮v 血型:血型:A A、B B、O O型型v 淀粉:糯、非糯淀粉:糯、非糯所有多态性都是基因突变的结果!所有多态性都是基因突变的结果!形态标记形态标记形态性状:株高、颜色、白化症等形态性状:株高、颜色、白化症等又称表型标记又称表型标记数量少数量少很多突变是致死的很多突变是致死的受环境、生育期等因素的影响受环境、生育期等因素的影响q 最早建立的果蝇连锁图,就是利用控制最早建立的果蝇连锁图,就是利用控制果蝇眼睛的形状、颜色,躯体的颜色、果蝇眼睛的形状、颜色,躯体的颜色、翅膀的形状等形态性状作为标记,分析翅膀的形状等形态性状作为标记,分析它们连锁关系及遗传距离,绘制而成的。它们连锁关系及遗传距离,
19、绘制而成的。q 控制性状的其实是基因,所以形态标记控制性状的其实是基因,所以形态标记实质上就是基因标记。实质上就是基因标记。果果蝇蝇连连锁锁图图细胞学标记细胞学标记v明确显示遗传多态性的染色体结构特征明确显示遗传多态性的染色体结构特征和数量特征和数量特征 染色体的核型染色体的核型 染色体的带型染色体的带型 染色体的结构变异染色体的结构变异 染色体的数目变异染色体的数目变异v优点:不受环境影响优点:不受环境影响v缺点:数量少、费力、费时、对生物体缺点:数量少、费力、费时、对生物体的生长发育不利的生长发育不利生化标记生化标记v 又称蛋白质标记又称蛋白质标记v 就是利用蛋白质的多态性作为遗传标记。就
20、是利用蛋白质的多态性作为遗传标记。 如:同工酶、贮藏蛋白如:同工酶、贮藏蛋白v 优点:数量较多,受环境影响小优点:数量较多,受环境影响小v 缺点:受发育时间的影响、有组织特异缺点:受发育时间的影响、有组织特异性、只反映基因编码区的信息性、只反映基因编码区的信息DNADNA分子标记分子标记简称分子标记简称分子标记以以DNADNA序列的多态性作为遗传标记序列的多态性作为遗传标记优点:优点:v 不受时间和环境的限制不受时间和环境的限制v 遍布整个基因组,数量无限遍布整个基因组,数量无限v 不影响性状表达不影响性状表达v 自然存在的变异丰富,多态性好自然存在的变异丰富,多态性好v 共显性,能鉴别纯合体
21、和杂合体共显性,能鉴别纯合体和杂合体限制性片段长度多态性限制性片段长度多态性(restriction fragment length polymorphism,RFLP)v DNADNA序列能或不能被某一酶酶切,相当于一对序列能或不能被某一酶酶切,相当于一对等位基因的差异。等位基因的差异。 v 如有两个如有两个DNADNA分子(一对染色体),一个具有分子(一对染色体),一个具有某一种酶的酶切位点,而另一个没有这个位点,某一种酶的酶切位点,而另一个没有这个位点,酶切后形成的酶切后形成的DNADNA片段长度就有差异,即多态片段长度就有差异,即多态性。性。v 可将可将RFLPRFLP作为标记,定位在
22、基因组中某一位作为标记,定位在基因组中某一位置上。置上。v人类基因组中有人类基因组中有10105 5个个RFLPRFLP位点,每一位点只位点,每一位点只有两个等位基因。有两个等位基因。RFLPRFLP分析分析RFLP标记位共显性标记标记位共显性标记微卫星微卫星(microsatellite)标记标记v微 卫 星 又 称 为微 卫 星 又 称 为 简 单 重 复 序 列 (简 单 重 复 序 列 ( s i m p l e s i m p l e sequence repeatsequence repeat,SSRSSR)。)。v这种重复序列的重复单位很短,常常只有这种重复序列的重复单位很短,常
23、常只有2 2个、个、3 3个或个或4 4个核苷酸个核苷酸v如一条染色体如一条染色体TCTGAGAGAGACGCTCTGAGAGAGACGC 另一染色体另一染色体TCTGAGAGAGAGAGAGAGACGCTCTGAGAGAGAGAGAGAGACGC,就构成,就构成了多态性。了多态性。遗传图谱的构建方法遗传图谱的构建方法 v 理论基础理论基础: 连锁与交换连锁与交换v 基本方法基本方法: 两点测验法和三点测验法两点测验法和三点测验法植物遗传图谱的构建植物遗传图谱的构建v 选择研究材料(亲本)选择研究材料(亲本)v 构建分离群体构建分离群体v 遗传标记检测遗传标记检测v 标记间的连锁分析标记间的连
24、锁分析选择亲本选择亲本 要求亲缘关系远,遗传差异大要求亲缘关系远,遗传差异大 但又不能相差太大以导致引起子代不育。但又不能相差太大以导致引起子代不育。 对备选材料进行多态对备选材料进行多态( (差异差异) )性检测,综性检测,综合测定结果,选择有一定量多态性的一对合测定结果,选择有一定量多态性的一对或几对材料作为遗传作图亲本。或几对材料作为遗传作图亲本。构建作图群体构建作图群体 遗传标记的染色体定位遗传标记的染色体定位v 利用遗传学方法或其它方法将少数标记利用遗传学方法或其它方法将少数标记锚定在染色体上,作为确定连锁群的参锚定在染色体上,作为确定连锁群的参照系。照系。v 常用的方法:常用的方法
25、: 单体分析单体分析 三体分析三体分析 代换系分析代换系分析 附加系分析附加系分析标记间的连锁分析标记间的连锁分析v利用在两个亲本间有多态性的标记分析利用在两个亲本间有多态性的标记分析分离群体中所有个体的基因型分离群体中所有个体的基因型v根据连锁交换的情况,确定标记之间的根据连锁交换的情况,确定标记之间的连锁关系和遗传距离连锁关系和遗传距离v有计算机软件可以应用有计算机软件可以应用水稻遗传图水稻遗传图v 1994 1994年,水稻第一张高密度遗传图谱年,水稻第一张高密度遗传图谱 927927个位点,个位点, 13831383个标记个标记v 19981998年,年,11571157个位点,个位点
26、,22752275个标记个标记v 20002000年,年,32673267个标记个标记v 高密度的遗传图谱为基因组测序和遗传高密度的遗传图谱为基因组测序和遗传研究奠定了坚实的基础。研究奠定了坚实的基础。人类遗传图谱的构建人类遗传图谱的构建v 不可能根据需要选择亲本,设计杂交组合,不可能根据需要选择亲本,设计杂交组合,构建分离群体!构建分离群体!v 只能检测现存家庭连续几代成员的基因型只能检测现存家庭连续几代成员的基因型v 家系分析法家系分析法v 资料有限、必须借助于统计学方法资料有限、必须借助于统计学方法现有的人类遗传图谱现有的人类遗传图谱v 1 12222号染色体号染色体v 8 8个家系个家
27、系134134个成员个成员v X X染色体,染色体,1212个家系个家系170170个成员个成员v 53645364个个SSRSSR标记标记v 23352335个位点个位点v 标记间的平均距离标记间的平均距离599kb599kb物理图谱的构建物理图谱的构建v 用用分子生物学方法分子生物学方法直接检测直接检测DNADNA标标记在染色体上的实际位置绘制成的图谱记在染色体上的实际位置绘制成的图谱称为物理图谱。称为物理图谱。v 有遗传图谱为什么还要构建物理图谱?有遗传图谱为什么还要构建物理图谱? 遗传图谱的缺陷遗传图谱的缺陷v 分别率有限分别率有限v 人类只能研究少数减数分裂事件,不能人类只能研究少数
28、减数分裂事件,不能获得大量子代个体获得大量子代个体v 测序要求每个标记的间隔小于测序要求每个标记的间隔小于100kb100kbv 实际是实际是599kb599kb遗传图谱的缺陷遗传图谱的缺陷n精确性不够精确性不够n经典遗传学认为,交换是随机发生的经典遗传学认为,交换是随机发生的n基因组中有些区域是重组热点基因组中有些区域是重组热点n倒位、重复等染色体结构变异会限制交倒位、重复等染色体结构变异会限制交换重组换重组酵酵母母遗遗传传图图与与物物理理图图比比较较A A 遗传图遗传图B B 物理图物理图物理作图的方法物理作图的方法1 1、限制酶作图、限制酶作图2 2、依靠克隆的基因组作图、依靠克隆的基因
29、组作图3 3、荧光原位杂交、荧光原位杂交4 4、序列标签位点作图、序列标签位点作图限制酶作图(限制酶作图(restriction mapping)限制酶作图(限制酶作图(restriction mapping)荧光原位杂交荧光原位杂交(fluorescent in situ hybridization,FISH)荧光原位杂交荧光原位杂交(fluorescent in situ hybridization,FISH)荧光原位杂交荧光原位杂交(fluorescent in situ hybridization,FISH)荧光原位杂交荧光原位杂交(fluorescent in situ hybrid
30、ization,FISH)人类基因组物理图人类基因组物理图v 1987 1987年,年,RFLPRFLP图谱,图谱,403403个标记,个标记,10Mb10Mbv 1994 1994年,年,58005800个标记,个标记,0.7Mb0.7Mbv 1996 1996年,年,1700017000多个标记,多个标记,100kb100kbv 完全适应全基因组测序的要求完全适应全基因组测序的要求遗传图与物理图的整合遗传图与物理图的整合v有些标记既是遗传标记,又是物理标记有些标记既是遗传标记,又是物理标记 RFLPRFLP标记标记 SSRSSR标记标记 某些基因序列某些基因序列v借助这些标记可以将遗传图和
31、物理图整借助这些标记可以将遗传图和物理图整合起来合起来3 3 基因组测序基因组测序反应所需物质:反应所需物质:DNA模板、引物、模板、引物、DNA聚合聚合 酶、酶、dNTP、缓冲液、缓冲液每个循环包括:每个循环包括:变性(变性(90)、退火()、退火(54 )、延伸()、延伸(72 )ATGCCGTAGGCCTAGC TAGGCCTAGCTCGGA ATGCCGTAGGCCTAGCTCGGA基因组基因组DNABAC文库文库根据物理图谱根据物理图谱正确定位的正确定位的BAC 或或contig用于霰弹法测用于霰弹法测序的候选克隆序的候选克隆用于霰弹法测序用于霰弹法测序的亚克隆的亚克隆测序并组装测序
32、并组装完整的基因完整的基因组序列组序列逐步克隆法(逐步克隆法(Clone by Clone) 全基因组霰弹法全基因组霰弹法 (Whole Genome Shot-gun)基因组基因组DNA 霰弹法克隆霰弹法克隆测序并进行测序并进行全基因组序全基因组序列组装列组装完整的基因完整的基因组序列组序列 BAC by BACWhole Genome Shotgun the sequencing of the human genome is likely to be the only large sequencing project carried to completion by the methods
33、 described in this issue. Maynard V. Olson , The maps: Clone by clone by clone , Nature 409, 816 - 818 (2001) “WorkingDraft”(90%; 4X)FinishedGenome(99.99%; 8X)Gap1Gap2Chromosome工作草稿(框架图)与完成图BAC by BAC The sequence of the human genomeC. Venter et al.Science 16 Feb. 291: 1304 1351, 2001人类基因组计划研究的主要成果和
34、进展表现在这人类基因组计划研究的主要成果和进展表现在这“四张图四张图”上上 遗传图谱遗传图谱 又称为连锁图谱(又称为连锁图谱(linkage maplinkage map),指),指基因或基因或DNADNA标志在染色体上的相对位置标志在染色体上的相对位置与遗传距离与遗传距离物理图谱物理图谱 以定位的以定位的DNADNA标记序列如标记序列如STSSTS作为路标,作为路标,以以DNADNA实际长度即实际长度即bp、kb、Mb为图距的为图距的基因组图谱。基因组图谱。转录图谱转录图谱 利用利用EST(expressed sequence tags 表达表达序列标签)作为标记所构建的分子遗传序列标签)作
35、为标记所构建的分子遗传图谱图谱序列图谱序列图谱 通过基因组测序得到的,以通过基因组测序得到的,以A A、T T、G G、C C为标记单位的基因组为标记单位的基因组DNADNA序列序列 物理图谱的构建物理图谱的构建大片段克隆的筛选大片段克隆的筛选霰弹法测序与霰弹法测序与“工作框架图工作框架图”的构建的构建序列的全组装与序列的全组装与“完成图完成图”构建构建物理图谱的制作物理图谱的制作 物理图谱物理图谱是以特异的是以特异的DNADNA序列为标志所展示的染色体图。序列为标志所展示的染色体图。标志之间的距离或图距以物理距离如碱基对(标志之间的距离或图距以物理距离如碱基对(base pairbase p
36、air;bpbp,Kb , Mb)Kb , Mb)表示。最精细的物理图是核苷酸顺序图,最粗略的物表示。最精细的物理图是核苷酸顺序图,最粗略的物理图是染色体组型图。理图是染色体组型图。 STSSTS图谱图谱是最基本和最为有用的染色体物理图谱之一,是最基本和最为有用的染色体物理图谱之一,STSSTS(Sequence Tagged Site)Sequence Tagged Site)本身是随机地从人类基因组上选择本身是随机地从人类基因组上选择出来的长度在出来的长度在200200300bp300bp左右的特异性短序列(每个左右的特异性短序列(每个STSSTS在基在基因组中是唯一的,因组中是唯一的,S
37、TSSTS图谱就是以图谱就是以STSSTS为路标(平均每为路标(平均每100Kb100Kb一一个),将个),将DNADNA克隆片段有序地定位到基因组上。克隆片段有序地定位到基因组上。 STS的来源的来源随机基因组序列随机基因组序列表达基因序列,如表达基因序列,如EST遗传标记序列,如微卫星标记遗传标记序列,如微卫星标记有关有关STSSTS的信息可在基因组数据库的信息可在基因组数据库GDBGDB中找到中找到 http:/gdbwww. gdb. orgq确定各确定各STS序列及其序列及其在基因组中的位置在基因组中的位置q大插入片段基因组文大插入片段基因组文库的构建(库的构建(BAC文库文库)q
38、以特定以特定STS为标记为标记筛筛 选选并定位克隆并定位克隆q含有含有STS的克隆在基的克隆在基因组中排序因组中排序基因组数据库(GDB)中至少含有24568 个STS路标信息 作为载体的基本要求 能在宿主细胞中进行独立的复制能在宿主细胞中进行独立的复制 具有多克隆位点,可插入外源具有多克隆位点,可插入外源 DNADNA片段片段 有合适的筛选标记,如抗药性有合适的筛选标记,如抗药性 大小合适,易于分离纯化大小合适,易于分离纯化 拷贝数多拷贝数多 文库的概念文库的概念 含有某种生物体全部基因的随机片段的重组含有某种生物体全部基因的随机片段的重组DNADNA克隆群体克隆群体 载体:载体:能携带外源
39、能携带外源DNADNA进入宿主细胞进入宿主细胞的工具,常用的载体有质粒载体、噬的工具,常用的载体有质粒载体、噬菌体载体、细菌人工染色体等菌体载体、细菌人工染色体等宿主:宿主:能容纳外源能容纳外源DNADNA片段的生物体,片段的生物体,常用的有大肠杆菌、酵母等常用的有大肠杆菌、酵母等NotI、SacI脉冲场凝胶电泳得200Kb左右的大片段DNA 纯化后与载体连接 电转化,将连接产物导入大肠杆菌感受态细胞插有外源DNA片段的BAC载体在含有氯霉素的固体培养基中培养每一个菌落为带有相同外源DNA片段的单克隆BAC克隆的筛选克隆的筛选“STS-PCR反反应池应池”方案方案筛筛选种子克隆选种子克隆特定的
40、特定的STS标标记记 相互间具有重叠片段的BAC克隆根据STS信息组装成contig,并定位于基因组上Contig每一个菌落为带有相同外源DNA片段的单克隆Regional mappingRegional mappingMinimal tiling path selected for sequencing.Regional mappingstSG50796stSG50796WI-21858WI-21858WI-20982WI-20982SGC-34652SGC-34652EST325005EST325005Bda37h09Bda37h09sts-N34454sts-N34454stSG-226
41、42stSG-22642stSG22463stSG22463IB262IB262SGC-100057SGC-100057SGC-11218SGC-11218SGC-77734SGC-77734 SGC-12613SGC-12613SGC-79997SGC-79997D3S4170D3S4170WI-13469WI-13469SGC-104744SGC-104744WI-7400WI-7400SGC-82788SGC-82788sts-N30615sts-N30615SGC-106678SGC-106678WI-3006WI-3006D3S4125D3S4125 stSG31571stSG315
42、71SGC-86097SGC-86097SGC-104738SGC-104738 sts-T03421sts-T03421 stSG81116stSG81116DM1-2b11sDM1-2b11sA004Q43A004Q43WI-10858WI-10858SGC-15279SGC-15279stSG3143stSG3143WI-8499WI-8499 D3S3525D3S3525D3S3630D3S3630 SGC-11976 SGC-11976 WI-6116WI-6116WI-2053WI-2053SGC-84074SGC-84074SGC-77858SGC-77858D3S3706D3S
43、3706SGC-102094SGC-102094 WI-13611WI-13611NRU18-13sNRU18-13sWI-21921WI-21921CHLC.GATA44a05CHLC.GATA44a05D3S1304D3S1304sts-T58150sts-T58150SGC-82964SGC-82964 WI-1341WI-1341D3S3591D3S3591605m01229 e21279b12299n03198p1741l18233p0137i04324k11163m22Beijing CenterMapped on 3p by sequence from other center1
44、14k09204c23728k15429p24499n06399k19106b10129j10113l1013f06600o17322f0976o22263j0830m15320c08250a15294h24140b10137g22South centerMapped on 3p by fingerprint from other center265o10717m12762o12156h01324k15283k15572b0261i09534j21166f03497i24497i24121d03121d03211k13161d20274o146i21116k05255k15812i02Nort
45、h centerMapped not on 3p by fish1120h22566o1463o01757o1626f1026f10 453a03586c02483g20507d0625c11344o05Mapped not on 3p by fish260k16263p03341o12560g03772p01344l093d22489o22794g03Beijing and South 306h05621c18438g1582o03181f22622p03320k0124b1657d0657d06470 e10STS markers 385a18416n08785a0797c1625f012
46、5f01167p17167p17277d17669 e03194c09Beijing and North210b1795 e11101a04101a0499d1099d10487j12590a20156b21End certified 710 e0410h06508a20508a20173f11173f117m247m24211b19291p2144l1444l14481o07Phase 3Phase 3731 e12731 e12811m11811m11372k09194d21245a0616k1516k15318i14318i14529b1753 e12542k24Mapped not o
47、n 3p by sequence from NCBI392m07319i18 454f24238a09238a09264h03157 e16350a17Mapped on 3p by fish673f20453f03489d19194i05? ?Sequenced BACs without mapping information93a0193a01360 e14244g03329a02611h22611h2270b0570b05135 e1674 e04124l0821j2321j23IB1403IB1403SGC-12699SGC-12699sts-F21241sts-F21241WI- 6
48、061WI- 6061stSG16459stSG16459WI-6949WI-6949 stSG15038stSG15038sts-M91858sts-M91858WI-17502WI-17502 WI-7625WI-7625WI-7071WI-7071AB000410AB000410sts-F21841sts-F21841sts-L15409sts-L15409A004Z22A004Z22stSG31652stSG31652WI-16427WI-16427stSG43815stSG43815A007593A007593WI-11598WI-11598A008O42A008O42D3S4194
49、D3S4194stSG4279stSG4279WI-14394WI-14394sts-N95054sts-N95054stSG32055stSG32055stSG15465stSG15465WI-11041WI-11041stSG47554stSG47554stSG3350stSG3350D3S3589D3S3589SGC-12045SGC-12045D3S1263D3S1263stSG47397stSG47397 SGC-84455SGC-84455 D3S3610D3S3610SGC-10790SGC-10790D3S3691D3S3691A002R42A002R42stSG50845st
50、SG50845stSG2582stSG2582WI-31307WI-31307A004X28A004X28D3S3601D3S3601A001T39A001T39stSG62586stSG62586WI-15608WI-15608sts-H83694sts-H83694stSG47347stSG47347WI-5650WI-5650WI-20823WI-20823202a21 105k13334l221087o20593j10169k17309m10813n2383m12 19 e08 203c04481h17356a0713b04449 e2125o17715i04642 e22298m15
51、224p21267l16407i02488o087f24481b18128a05380o24474f16327h1716m03470i10 398j1558i13424h06325l061016h17134k10299h13220d10220d10126l04900o2218f0358b17 1022p15193k15586c12588p09173m24572m141082a181082a18266 e23275j11270i10270i10333a0234l0634l06ctb-159n23ctb-159n23168l03ctc-237n12ctc-237n12382a21ctc-371o1
52、8ctc-371o18126l09163d23AC055767AC055767767c01502k05502k05326o24ctb-140o19ctb-140o19415k13224m20167k17167k17219m19219m19266j06438j01627c01659g04659g04AC007791AC007791263i01263i01596j09996c06338p06338p06606c06606c06ctc-243a06ctc-243a06ctc-371o18ctc-371o18357l2494a1494a14380a2270i1170i11citb-243a06citb
53、-243a06af176815ctb-177n07ctb-177n07115g03115g03109j15781a02412a07412a07429f161020a11ctb-187p01ctb-187p01622i12402p1145b16439f04105h193pterBeijing MapBAC Pooling Protocol 1,152 (plates) X 384 (wells/plate) X 1 (BAC/well) = 442,368 BAC 48X8 (板) X 384 ( 孔/板 ) X 1 ( BAC/孔 ) = 147,456 BAC Each BAC clone
54、contain 150 Kbp human insert 147,456 BAC clones 对全基因组的覆盖率: 147,456 BAC clones X 150 Kbp = 7.3728 The genome DNA 3,000,000 Kbp 共共48个个每组每组 8 个个每每8个个96孔板组成孔板组成1个个superpool,384个个96孔板组成孔板组成48个个superpools 48 superpools Column poolsColumn pools Row poolsRow pools 1 2 3 4 5 6 7 8 9 10 11 12第八板第八板第二板第二板Plate
55、 poolsPlate pools第一板第一板 plate pools,row pools,column pools的构成的构成 1 2 3 4 5 6 7 8 9 10 11 12超级池(超级池(8个个96孔板,孔板,共共768个克隆)个克隆)板池(板池(96个克隆)个克隆)行池(12个克隆)列池(列池(8个克隆)个克隆)大大减少筛选的工作量,降低成本,所得筛选结果准确可靠大大减少筛选的工作量,降低成本,所得筛选结果准确可靠 28 VS 768sheet of superpools, plate pools, row pools, column pools 一一 BAC Screening前
56、前48个样品为引物个样品为引物OGG1.51对对superpool(sp)的筛选结果的筛选结果后后48个样品为引物个样品为引物OGG1.52对对superpool(sp)的筛选结果的筛选结果 引物引物OGG1.52对应对应sp#27,34,45的的plate,row,column pools的筛选结果的筛选结果BAC clone 确定确定 (+为阳性克隆为阳性克隆) 引物引物OGG1.52的的Colony-PCR STSSTS的密度尚未达到绘制高精度物理图谱的要求,且在基因组中的分的密度尚未达到绘制高精度物理图谱的要求,且在基因组中的分布不均匀,造成很多区域没有阳性克隆覆盖布不均匀,造成很多区
57、域没有阳性克隆覆盖, ,形成空洞。因此需用指纹图形成空洞。因此需用指纹图谱(谱(FPCFPC法)或末端序列(法)或末端序列(Walking by End Sequence)Walking by End Sequence)步移等手段对种子步移等手段对种子克隆进行延伸,形成连续克隆群。利用延伸方法筛选得到的克隆称为延克隆进行延伸,形成连续克隆群。利用延伸方法筛选得到的克隆称为延伸克隆。伸克隆。 Contig 1Contig 2重叠序列重叠序列重叠序列重叠序列延伸引物延伸引物筛选到的延伸克隆筛选到的延伸克隆20 kb300 bpMolecular weightmarker every 5th lan
58、e- BAC clones 在96深孔 板中培养- Hind III 完全酶切- 1% 琼脂糖凝胶电泳 指指 纹纹 图图 谱谱 法法 (Walking by Fingerprinting database) 挑取靠近空洞的种子克隆,酶切构建其指纹图谱,在FPC数据库中进行比对,搜索含有此克隆的重叠克隆群信息,从中确定覆盖空洞区域的克隆,达到延伸目的。Hind III 完全酶切Hind III 完全酶切FPC数据库数据库中比对中比对Clone AClone BClone CCABcontig搭建中克隆的错位搭建中克隆的错位 末端序列步行法末端序列步行法 (Walking by End Seque
59、nce) 挑取靠近空洞的种子克隆进行末端测序,然后在基因组数据库中进行比对,确定专一性的序列片段作为新的STS路标。最后设计新路标的PCR引物,按照STSPCR“反应池”方案筛选新的克隆,达到延伸的目的 。克隆克隆350A18350A18序列输入序列输入 end sequence databaseend sequence database的查询结果的查询结果四、四、Clone Identification 1、STS-PCR 2、BAC end sequencing 3、Fingerprinting 4、FISH CK2CK1CK2CK113f06267l16481o07250a15204c2
60、3340j13对对1515个克隆进行个克隆进行HindIIIHindIII酶切后电泳结果酶切后电泳结果 “工作框架图工作框架图”绘制绘制根据序列与STS database进行blastn比较结果,将克隆定位末端序的比较,判定延伸在contig外的一端序列。并可及时进行walking,筛选新的克隆 霰弹法测序组装与Finishing工作流程图工作流程图 Shotgun Sequencing I :RANDOM PHASEShotgun Sequencing II:ASSEMBLYShotgun Sequencing III: FINISHINGShotgun Sequencing III: FI
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑业新质生产力跨界融合建造模式探索
- 2025年工业元宇宙技术应用人才培养探索
- 城市轨道交通运营管理电子教案5-6 车辆调车作业
- 2025年人工智能教育质量评估报告
- 气管切开患者的吸痰护理
- 智杰教育:护理礼仪与跨文化沟通
- 泌尿外科患者安全管理
- 消毒隔离与感染控制新动态
- 护理服务与医院文化
- 徐氧生物高纯气体项目可行性研究报告模板申批拿地用
- 2026河南兴豫惠民职业技能培训学校有限公司市场化招聘15人笔试参考题库及答案解析
- (二模)苏北七市2026届高三第二次调研测试英语试卷(含答案及解析)
- DB31∕T 1624-2025 机器人智能化等级评价指南
- 2026年青年干部廉洁纪律要求应知应会知识库
- 北京市2024商务部中国国际电子商务中心招聘1人笔试历年参考题库典型考点附带答案详解
- 2026年国企采购管理专干考试题库及答案
- 小额贷款消费者权益保护制度
- 危险化学品储存安全技术
- LY/T 2422-2015薇甘菊防治技术规程
- 真空预压传统式与直排式介绍ghg课件
- 工业机器人编程与实操期末试题
评论
0/150
提交评论