第2章 遗传图绘制_第1页
第2章 遗传图绘制_第2页
第2章 遗传图绘制_第3页
第2章 遗传图绘制_第4页
第2章 遗传图绘制_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、为何要绘制遗传图与物理图?为何要绘制遗传图与物理图?1)1)基因组太大基因组太大, ,必需分散测序必需分散测序, ,然后将分然后将分 散的顺序按原来位置组装散的顺序按原来位置组装, ,需要图譜需要图譜 进行指导进行指导. .2)2)基因组存在大量重复顺序基因组存在大量重复顺序, ,会干扰排序会干扰排序, , 因此要高密度基因组图因此要高密度基因组图. .3)3)遗传图和物理图各有优缺点遗传图和物理图各有优缺点, ,必须相互必须相互 整合校正整合校正. . 遗传图遗传图(Genetic Map):通过遗传学方法通过遗传学方法, 以遗传图距以遗传图距(cM) 为单位绘为单位绘制的染色体上基因或标记

2、之间相对位置的制的染色体上基因或标记之间相对位置的连锁图连锁图. 1)遗传作图(遗传作图(Genetic mapping) 采用遗传学采用遗传学分析方法将基因或其它分析方法将基因或其它DNA顺序标定在染色体顺序标定在染色体上构建连锁图。这一方法包括杂交实验,家系分上构建连锁图。这一方法包括杂交实验,家系分析。遗传图距单位为厘摩析。遗传图距单位为厘摩(cM), 每单位厘摩定义每单位厘摩定义为为1%交换率。交换率。 2)物理作图(物理作图(Physical mapping) 采用分子生采用分子生物学技术直接将物学技术直接将DNA分子标记、基因或克隆标分子标记、基因或克隆标定在基因组实际位置。物理图

3、的距离依作图方法定在基因组实际位置。物理图的距离依作图方法而异,如辐射杂种(而异,如辐射杂种(radiation hybrid)作图的计)作图的计算单位为厘镭算单位为厘镭(cR), 限制性片段作图与克隆作图限制性片段作图与克隆作图的图距为的图距为DNA的分子长度,即碱基对的分子长度,即碱基对(bp, kb)。基因组测序的基本策略是将整个基因组分基因组测序的基本策略是将整个基因组分割成一些小的片段分别测序割成一些小的片段分别测序, 然后将测序的然后将测序的片段进行组装片段进行组装, 使其回归到原来的位置使其回归到原来的位置. 为了确保分散的基因片段正确归位组装为了确保分散的基因片段正确归位组装,

4、 必必须寻找一批标记须寻找一批标记,它们在染色体上的位置是它们在染色体上的位置是已知的、唯一的、确定的已知的、唯一的、确定的, 并位于不同的测并位于不同的测序片段之中序片段之中.标记1标记2标记3 染色体上的基因和DNA顺序 均可作为路标, 路标具有 物理属性,它们由特定的 DNA顺序组成. 路标位于 染色体上的位置是固定的, 唯一的,不会更改的,因而 提供了作图的依据Locus: 座位是经典遗传学中常用的概念座位是经典遗传学中常用的概念, 系指染系指染 色体上经遗传分析确定的某个位置色体上经遗传分析确定的某个位置, 它们它们 可以是基因、可以是基因、DNA顺序或分子标记顺序或分子标记. 因此

5、因此 locus系指遗传因子在染色体所占据的位置系指遗传因子在染色体所占据的位置.Site: 位点是指基因组物理图上某一确定的位点是指基因组物理图上某一确定的DNA 顺序顺序.注注: 当当locus是指确定的是指确定的DNA顺序或基因序列时顺序或基因序列时, 也可称为也可称为site.1) 1) 第一代分子标记第一代分子标记, ,单一顺序多态性单一顺序多态性: : RFLP, AFLP, RAPDRFLP, AFLP, RAPD 2) 2) 第二代分子标记第二代分子标记, , 重复顺序多态性重复顺序多态性: : Simple sequence length Simple sequence le

6、ngth polymorphisrnspolymorphisrns, , SSLPsSSLPs Variable number of tandem repeats, Variable number of tandem repeats, VNTRVNTR Simple tandem repeats, Simple tandem repeats, STRSTR Single sequence repeats, Single sequence repeats, SSRSSR3) 3) 第三代分子标记第三代分子标记, , 单核苷酸多态性单核苷酸多态性: : Single nucleotide poly

7、morphisms, Single nucleotide polymorphisms, SNPSNP RFLP: Restriction Fragment Length Polymorphism 限制性片段长度多态性限制性片段长度多态性RFLP:restriction fragment length polymorphism, 限限制制性性片片段段长长度度多多态态性性 1978年年, 在犹他州盐湖城滑雪胜地艾尔在犹他州盐湖城滑雪胜地艾尔塔的一场例行的学术讨论中塔的一场例行的学术讨论中, 从事经典从事经典人类遗传学研究的专家与从事分子生物人类遗传学研究的专家与从事分子生物学研究的专家进行学术交流

8、学研究的专家进行学术交流. 分子生物分子生物学家从经典遗传学的研究中获得灵感学家从经典遗传学的研究中获得灵感. Botstein D, White RL, Skolnick M, Davis RW David BotsteinDavid Botstein和和Davis RW 是首先提出是首先提出RFLPRFLP想法想法的科学家的科学家. .PRINCETON, N.J. - Princeton University has PRINCETON, N.J. - Princeton University has named David Botstein, a renowned geneticist

9、,named David Botstein, a renowned geneticist,educator and pioneer of the Human Genome Project, as the new educator and pioneer of the Human Genome Project, as the new director of the Lewis-Sigler Institute for Integrative director of the Lewis-Sigler Institute for Integrative Genomics. Botstein will

10、 succeed Shirley M. Genomics. Botstein will succeed Shirley M. TilghmanTilghman, who was , who was the founding director of the institute and became president the founding director of the institute and became president of the University in 2001, and James Broach, who is interim of the University in

11、2001, and James Broach, who is interim director. Botsteins appointment will begin July 1, 2003.director. Botsteins appointment will begin July 1, 2003.Botstein D, White RL, Skolnick M, Davis RW (1980) Construction of a genetic linkage map in man using restriction fragment length polymorphisms. Am J

12、Hum Genet 32:314331 A Highly Polymorphic Locus in Human DNA Arlene R. Wyman and Ray White, MIT A locus in the human genome, not associated with any specific gene, has been found to be a site of restriction fragment length polymorphism. The polymorphism was found by hybridizing a 16-kilobase-pair seg

13、ment of single-copy human DNA, selected from the human genome library cloned in phage CH4A, to a Southern transfer of total human DNA digested with EcoRI. DNAs from a number of individuals from within Mormon pedigrees as well as random individuals have been examined. The locus is highly variable, wi

14、th at least eight alleles present, homozygotes accounting for less than 25% of the individuals examined. -PNAS | November 1, 1980 | vol. 77 | no. 11 | 6754-6758子代两个亲本基因型子代两个亲本基因型, 两个重组基因型两个重组基因型. 1) 处于染色体上的位置相对固定处于染色体上的位置相对固定; 2) 同一亲本及其子代相同位点上的多态同一亲本及其子代相同位点上的多态 性片段特征不变性片段特征不变; 3) 同一凝胶电泳可显示等位区段不同多同一

15、凝胶电泳可显示等位区段不同多 态性片段态性片段, 表现为表现为共显性共显性. 4) 需要用需要用Southern杂交检测杂交检测显示显示.1) 随机克隆筛选随机克隆筛选;2) 将其它方法获得的将其它方法获得的DNA标记标记, 如如RAPD (random amplified polymorphism DNA) 标记转换为标记转换为RFLP标记标记;3) 从从cDNA 中寻找中寻找RFLP.4) 计算机筛选计算机筛选, 即电子杂交即电子杂交.1) 这是一种筛选这是一种筛选RFLP分子标记的方法分子标记的方法. 先将先将DNA样品采用选定的限制性内切酶样品采用选定的限制性内切酶(如如EcoRI,

16、Sau3A)消化消化, 然后加上接头然后加上接头PCR引物引物.2) 接头接头PCR引物设计引物设计: 根据限制酶接头添加数个根据限制酶接头添加数个向外延伸的碱基向外延伸的碱基, 然后向然后向3方向延伸方向延伸1-3个不同个不同的碱基的碱基. 3) 选择不同的引物对扩放样品选择不同的引物对扩放样品DNA, 经聚丙烯胺经聚丙烯胺凝胶电泳分离标记的凝胶电泳分离标记的PCR产物产物.1) 可变排列的简单重复顺序可变排列的简单重复顺序, 即重复次数不一即重复次数不一, 在染色体的同一座位重复顺序拷贝数不同在染色体的同一座位重复顺序拷贝数不同;2) SSR的类型的类型: 小卫星序列小卫星序列(minis

17、atellite), 重复单位较长重复单位较长 微卫星序列微卫星序列(micrisatellite), 重复单位较短重复单位较短, 注注: 在在1-6个核苷酸之间个核苷酸之间, 是常用的分子标记是常用的分子标记.1) 1982年年Hamada等首次报道等首次报道microsatrllite现象现象 (PNAS, 79:6564, 1982)2) 1989年年Weber等从等从GenBank中发现人类基因组的中发现人类基因组的8个个位点中位点中, 有有7个位点存在个位点存在(CA)n拷贝数的变化拷贝数的变化(Am.J.Hum.Genet., 44:388, 1989).3) 现已证实人和老鼠基因

18、组中平均每现已证实人和老鼠基因组中平均每18-28 kb含有一个含有一个多态性多态性(CA)n.4) 获取方法获取方法: a) 机算机搜寻机算机搜寻; b) 用用Sau3A, RsaI, HaeIII或或AluI限制酶酶切基因组限制酶酶切基因组DNA, 构建构建DNA文库文库. 合成简合成简单寡聚重复核苷酸作为探针从库中筛选单寡聚重复核苷酸作为探针从库中筛选.5) 根据简单重复顺序两侧的序列设计引物根据简单重复顺序两侧的序列设计引物, 用同位素标用同位素标记记PCR扩增样品扩增样品, 经聚丙烯胺凝胶电泳分辩经聚丙烯胺凝胶电泳分辩.lThe majority of human sequence

19、variation is due to substitutions that have occurred once in the history of mankind at individual base pairs, SNPs. lSuch SNPs are present in the human genome about 1 in every 600 base pairs.lIt has been estimated that 5 million common SNPs, each with a frequency of 10% - 50% account for the bulk of

20、 human DNA sequence difference.lAlleles making up blocks of such SNPs in close physical proximity are often correlated, and define a limited number of SNP haplotypes, each of which reflects descent from a single, ancient ancestral chromosome.1. The haplotype patterns for 20independent globally diver

21、sechromosomes defined by 147common human chr 21 SNPs spanning 106 kb of genomic sequence.2. Each row represents an SNP.Blue box = major, yellow = minorallele. Each column represents a single chromosome.3. The 147 SNPs are divided into18 blocks defined by black lines.The expanded box on the right is

22、an SNP block of 26 SNPs over4. 19kb of genomic DNA. The 4 Most common of 7 different Haplotypes include 80% of the chromosomes, and can be distinguished with 2 SNPs.Figure 2 of Patil et alSNP检测的实验手段检测的实验手段 经典方法采用经典方法采用PCR-单链构象多态性(单链构象多态性(PCR-SSCP)分析、)分析、RFLP、dHPLC和和HA等,必须通过凝胶等,必须通过凝胶电泳等进行分析电泳等进行分析.高

23、通量检测高通量检测SNP 的技术方法,如的技术方法,如MALDI-TOF、DNA Chip以及以及DNA测序、动态特测序、动态特异等位基因杂交(异等位基因杂交(dynamic allele-specific hybridization).1)1)杂合性杂合性( (heterozygosity) ) 在一个群体中等位基因位点杂合个体占总样本在一个群体中等位基因位点杂合个体占总样本的比例的比例, ,与等位形式多少有关与等位形式多少有关. .2)2)多态性信息量多态性信息量(polymorphic information (polymorphic information content, PIC)

24、content, PIC) PIC PIC用来表示群体中某一位点多态性的程度用来表示群体中某一位点多态性的程度: : a PIC value of less than 0.25 indicating low polymorphism, a value between 0.25 and 0.5 average polymorphism and a value higher than 0.5 a highly polymorphic locus 3) 分子标记按多态性频率大小排列分子标记按多态性频率大小排列: SNPSSR RFLPPolymorphic Information Content的计

25、算的计算PIC的计算公式的计算公式(由由Bostein提出提出): PICi = 1- Pij2 lWhere PICi is the polymorphic information content of a marker i; lPij is the frequency of the jth pattern for marker i and the summation extends over n patterns (累加累加)nj=1例子例子1 PICi = 1- Pij2lMarker a has two alleles, first allele has a frequency of

26、50%, the second allele has a frequency of 50%lPICa = 1- (0.52 + 0.52) = 1- (0.25 + 0.25) = 0.5nj=1例子例子2 PICi = 1- Pij2lMarker b has two alleles, first allele has a frequency of 90%, the second allele has a frequency of 10%lPICb = 1- (0.92 + 0.12) = 1- (0.81 + 0.01) = 0.18j=1n例子例子3 PICi = 1- Pij2lMar

27、ker A has two alleles, first allele has a frequency of 30%, the second allele has a frequency of 70%lPICc = 1- (0.32 + 0.72) = 1- (0.09 + 0.49) = 0.42nj=1例子例子4 PICi = 1- Pij2lMarker D has 10 alleles, each allele has a frequency of 10%lPICd = 1- 10 x 0.12 = 1- 0.1 = 0.9nj=1系譜分析作图适合系譜分析作图适合:1) 不能按遗传规律

28、设计杂交试验的物种不能按遗传规律设计杂交试验的物种, 如如 人类人类2) 繁殖系数很低的物种繁殖系数很低的物种, 如大牲畜如大牲畜3) 世代周期很长的物种世代周期很长的物种, 如树木如树木LodLod值是基因连锁可能性的对数,用于初步判断值是基因连锁可能性的对数,用于初步判断所研究的所研究的2 2个基因是否位于同一染色体上。换个基因是否位于同一染色体上。换句话说,可以回答句话说,可以回答2 2个基因是否连锁。如果个基因是否连锁。如果LODLOD分析确定是连锁的,然后可以提供最可能的重分析确定是连锁的,然后可以提供最可能的重组频率的程度。组频率的程度。Definition of LOD scor

29、e:lLOD score: In genetics, a statistical estimate of whether two loci (the sites of genes) are likely to lie near each other on a chromosome and are therefore likely to be inherited together as a package. 人类系譜分析图人类系譜分析图 D D为显性疾病基为显性疾病基 因因,d d为隐性基因为隐性基因,M1/M2M1/M2为分为分 子标记子标记。该家系中,父亲从祖辈。该家系中,父亲从祖辈 遗传了

30、致病基因遗传了致病基因D D,基因型为双,基因型为双 杂合子杂合子D/dD/d -M1/M2 -M1/M2。母亲的基因。母亲的基因 型为隐性双纯合子。型为隐性双纯合子。6 6个子女个子女 中,中,4 4个成员的基因型未发生重个成员的基因型未发生重 (1, 3(1, 3,4,6),4,6),与双亲(与双亲(P P)相)相同。同。2 2个子女的基因型发生了重个子女的基因型发生了重组,以组,以R R标示标示(2,5)(2,5)。现在要想知道重组型基因型是来自自由。现在要想知道重组型基因型是来自自由组合还是同源染色体之间的交换组合还是同源染色体之间的交换. .1. 1. 可以设想有可以设想有4 4种可

31、能种可能, 即重组率为即重组率为0.5, 0.4, 0.3和和0.2, 0.5属于完全不连属于完全不连 锁。锁。 根据重组率可以推算不同的重组基因型源自父亲产生的四种根据重组率可以推算不同的重组基因型源自父亲产生的四种 配子配子, 它们和子女基因型的比率是一致的它们和子女基因型的比率是一致的. . 在假定的不同重组率情况下在假定的不同重组率情况下减数分裂产生的配子减数分裂产生的配子类型类型: : - - RF 0.5 0.4 0.3 0.2 RF 0.5 0.4 0.3 0.2 - - P 0.25 0.3 0.35 0.4 P 0.25 0.3 0.35 0.4 P 0.25 0.3 0.3

32、5 0.4 P 0.25 0.3 0.35 0.4 R 0.25 0.2 0.15 0.1 R 0.25 0.2 0.15 0.1 R 0.25 0.2 0.15 0.1 R 0.25 0.2 0.15 0.1 - -RF: RF: 重组型重组型; P: ; P: 亲本型亲本型, ,即父亲基因型比例即父亲基因型比例. .由家系资料由家系资料( (前图前图) )得知得知, , 子代子代4 4个亲本型个亲本型, 2, 2个重组型个重组型. .1) 第一种估计第一种估计, D和和M不连锁不连锁, 随机分配随机分配, 6个子女个子女 基因型出现的概率基因型出现的概率: L0.5 = 0.25 X 0.

33、25 X 0.25 X 0.25 X 0.25 X 0.25 = 0.000242) 第二种估计第二种估计, D和和M部分连锁部分连锁, 非随机分配非随机分配, 假假 定重组率为定重组率为0.2, 6个子女基因型出现的概率个子女基因型出现的概率: L0.2 = 0.4 X 0.1 X 0.4 X 0.4 X 0.1 X 0.4 = 0.000246 3) 同理可计算同理可计算: L0.3 =0.35 X 0.15 X 0.35 X 0.35 X 0.15 X 0.35= 0.00032 L0.4 =0.3 X 0.1 X 0.3 X 0.3 X 0.1 X 0.3= 0.00034计算可能性之

34、间的比率计算可能性之间的比率, , 即发生即发生0.2, 0.3, 0.40.2, 0.3, 0.4和和0.50.5重组率的概率和随机分配的概率之比重组率的概率和随机分配的概率之比(odds (odds ratio, ratio, 可能性比率可能性比率) ): L L0.20.2/ L/ L0.50.5 = 0.000246 / 0.00024 = 1.08 = 0.000246 / 0.00024 = 1.08 L L0.30.3/ L/ L0.50.5 = 0.00032 / 0.00024 = 1.41 = 0.00032 / 0.00024 = 1.41 L L0.40.4/ L/ L

35、0.50.5 = 0.00034 / 0.00024 = 1.33 = 0.00034 / 0.00024 = 1.33 L L0.50.5/ L/ L0.50.5 = 0.00024 / 0.00024 = 1.0 = 0.00024 / 0.00024 = 1.0 注注: :其含义是假定连锁的概率与不连锁的概率之比其含义是假定连锁的概率与不连锁的概率之比. .计算每种假设的重组率的计算每种假设的重组率的LOD score, LOD score, 即优势值即优势值, , 它是它是odds ratioodds ratio以以1010为底数的对数:为底数的对数: LODLOD0.20.2 =lo

36、g =log 1010 L L0.200.20/ L/ L0.50 0.50 = log = log 10101.08 = 0.031.08 = 0.03 LOD LOD0.30.3 =log =log 1010 L L0.300.30/ L/ L0.50 0.50 = log = log 10101.41 = 0.151.41 = 0.15 LOD LOD0.40.4 =log =log 1010 L L0.400.40/ L/ L0.50 0.50 = log = log 10101.33 = 0.121.33 = 0.12 LOD LOD0.50.5 =log =log 1010 L L

37、0.500.50/ L/ L0.50 0.50 = log = log 10101.00 = 0.001.00 = 0.00 注注: 1)当当LODLOD3 3时,可认为两个位点是连锁的。时,可认为两个位点是连锁的。 如果如果LOD LOD 2 2,两两个位点是不连锁的。如果个位点是不连锁的。如果2 2 LOD LOD 3 3,连锁关系不确定。连锁关系不确定。上述例子只是计算一个家系获得的上述例子只是计算一个家系获得的LODLOD值值, , 其中重组率其中重组率0.30.3的的LODLOD值虽然最高值虽然最高, ,为为0.150.15,但仍低于,但仍低于3.0, 3.0, 因此不足以支持两个位

38、点连因此不足以支持两个位点连锁的结论。锁的结论。 2)收集来自不同家系的资料,分别计算各自的收集来自不同家系的资料,分别计算各自的LODLOD值,然后选出各值,然后选出各自最大的自最大的LODLOD值将其累加。值将其累加。 注注: LOD值只给出连锁可能性值只给出连锁可能性, 不给出图距不给出图距.To distinguish between simple genetic and nongenetic explanations of sex-specific recombination differences in mammals, we compared recombination in m

39、eiocytes from XY sex-reversed and XO females with that in meiocytes from XX female and XY male mice. The rate and pattern of recombination in XY and XO oocytes were virtually identical to those in normal XX females, indicating that sex, not genotype, is the primary determinant of meiotic recombinati

40、on patterns in mammals. 参见参见: Sex, Not Genotype, Determines Recombination Levels in Mice The American Journal of Human Genetics, volume 77, 2005 , pages 670675. 参考: Sex-specific recombination rates and their evolution lAn evolutionary view of human recombinationlGraham Coop and Molly PrzeworskilNature Reviews Genetics 8, 23-34 , January 2007细菌基因组的遗传作图面临的主要困难在于,这类生物细菌

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论