基因组测序基本原理汇编_第1页
基因组测序基本原理汇编_第2页
基因组测序基本原理汇编_第3页
基因组测序基本原理汇编_第4页
基因组测序基本原理汇编_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、大纲I. 核酸DNA的发现以及测序历史简介II. 双脱氧化(Sanger dideoxy method)测序III.大片段的DNA测序与基因组测序的大发展VI.人类基因组V. 1000美元个体化基因组测序计划(The “$1,000 dollar genome)On WebCT- “The $1000 genome”- review of new sequencing techniques by George ChurchPart I.核酸测序原理核酸发现与测序简史MC chapter 12DNA测序的简史DNA测序的方法双脱氧法 (Sanger dideoxy) (primer extens

2、ion/chain-termination) method: 最流行也是最广为接受的方法。Maxam-Gilbert化学剪切法(chemical cleavage method): DNA is labelled and then chemically cleaved in a sequence-dependent manner. This method is not easily scaled and is rather tedious焦磷酸测序(Pyrosequencing): measuring chain extension by pyrophosphate monitoring。焦磷

3、酸测序技术是新一代DNA序列分析技术,该技术无须进行电泳,DNA片段也无须荧光标记,操作极为简便,可以快速、准确地确定DNA序列。Single stranded DNA5353Sanger 双脱氧测序原理a) 常规的PCR,粘附(Anneal)Sanger 双脱氧测序原理b) 在延伸的时候将DNA聚合酶与加入正常的dNTP,同时掺入少量的双脱氧的ddNTP53DNA聚合酶延伸方向Sanger 双脱氧测序原理5353TTTTddAddAddAddA以ddATP为例,可以看到在反应中带有T的模板被掺入的互补的ddATP随机停止。因为ddATP不能够再使其主链延伸。如何读取这些DNA片段? 同位素标

4、记同位素标记的引物 (如 32P)同位素标记的dNTPs (如35S 或者 32P) 荧光标记化学合成时带有荧光素标记的ddNTPs被掺入到反应中。每一种ddNTP都带有自身特定的荧光波长以便于观测测序结果分析目前一般采用凝胶电泳法分析-能够比较好的将每一条dNTP产生的DNA条带分离开。DNA测序胶: 老方法利用电泳或者放射自显影的方法来分析DNA序列在反应中加入不同的ddNTP得到结果带有同位素标记的引物或者ddNTP被掺入到反应中,以便于观测自动测序仪输出DNA测序的实例样本 一个带有28个DNA样品的胶图: 绿带:碱基A,,蓝带 C, 黄带G,红带 T. 越小的片段跑得越快自动测序仪h

5、ttp://sci/techresources/Human_Genome/publicat/hgn/v10n3/images/megabaces.jpg测序的趋势相对而言一般很少实验室会自己做测序,一则自身测序费用比较高,而且荧光试剂容易粹灭,同时也比较消耗时间,另外可能出现一些其它问题引起结果不成功。所以大部分的测序都是送到相关的测序中心或者公司完成:-下面这个序列就是一个自动测序仪记录的一段DNA片段Part II.大片段DNA测序与基因组测序的大发展19蜜蜂基因组是如何获得的?基因组文库的建立 目前基将基因组片段打碎建立文库。基因组文库含有某种生物体全部基因的随机

6、片段的重组DNA克隆群体。Page 22酵母人工染色体酵母人工染色体(YACs) 200-1000 kbBacteriophage P1 90 kbCosmids 40 kbBacteriophage l l 9-23 kb质粒(2-6 kb)Page 23大片段载体大片段载体Lambda phage 插入大小: 2030 kbCosmids 插入大小: 3545 kbBACs and PACs (bacterial and P1 artificial chromosomes (Viral) respectively) 插入大小: 100300 kbYACs (yeast artificial

7、 chromosomes) 插入大小: 2001,000 kbPage 24大片段插入载体大片段插入载体 Lambda 噬菌体 以及 cosmids 插入稳定 但插入片段的容量可能不足以做大规模的测序 YACs 能够插入大片段 但不太稳定,比较难实际操作Page 25BACs and PACs BACs and PACs 大规模测序通用质粒 对插入片段大小比较合适,而且容易使用 与其它正常质粒一样能够扩增和分离全基因组鸟枪法测序 但是片段比较大时,如在基因组测序时,仅仅由Sanger方法并不合适,因此Shotgun测序,将基因大片段打碎后测序。鸟枪法战略(Shotgun Strategy)又称

8、随机测序战略,是由美国塞莱拉遗传公司创始人克雷格文特尔发明,主要针对大片段的全长测序。因为整个基因组太长而每次只能测得一个500的小片断(read)。鸟枪法测序步骤 第一,建立高度随机、插入片段大小为2kb左右的基因组文库。克隆数要达到一定数量,即经末端测序的克隆片段的碱基总数应达到基因组5倍以上。 第二,高效、大规模的末端测序。 第三,序列集合。 第四,填补缺口。鸟枪法测序简要SIZE SELECTSHEAR鸟枪法测序技术LIGATE & CLONESEQUENCE550bpPage 30重叠群重叠群Contigs 重叠群是指一组相互重叠的染色体DNA序列 如何建立重叠群基因克隆? For

9、sequencing one wants to create “minimum tiling path” Contig of smallest number of inserts that covers a region of the chromosome基因组genomic DNA重叠群contig最小路径minimumtiling pathPage 31限制性酶切产生不同的重叠群限制性酶切产生不同的重叠群Contigs 通过限制性内切酶酶切 将重叠片段序列排列 直到建立一个完整的contig两种不同的全基因组鸟枪法测序序列拼接与组装 独立的测序片段(read)通过逐步把它们拼接起来形成序列

10、更长的重叠群(Contig),直至得到完整序列的过程称为重叠群装配(Scaffold)。目前DNA 序列拼接应用的主要软件是由美国华盛顿大学Phil Green实验室开发的Phred Phrap Consed系统。目前36个国家900 多个实验室都在使用上述系统。非赢利研究机构或个人可申请免费利用该系统。此外还有一序列的商业软件,如主流的基因组拼接软件(GenomeAssembly),华大基因开发的SOAPdenovo都可以做基因组的拼接,然后可以用补漏软件进行补漏,得到完整的基因组序列。基因组基因组de novo测序测序 基因组de novo测序也叫做基因组从头测序,是指不依赖于任何已知基因

11、组序列信息对某个物种的基因组进行测序,然后应用生物信息学手段对测序序列进行拼接和组装,最终获得该物种基因组序列图谱。De novo基因原理浅解 假设有原始序列:I did not know what is written in this paper.那么通过de novo分段重复测序得到了3次不同的结果。 测序结果1:id idn otkn owwh ati swr itteni nthisp aper 测序结果2: idid notkn owwha tiswrrit enin th isp ap er 测序结果3: i di dno tkno ww hati swri tteni nth i

12、spap er 将3次重叠(overlap)部分进行拼接组成contig(重叠群) idn otkn owwhidid notkn owwha dno tkno wwididnotknowwha (Contig)De novo测序原理mapping测序 通过现有的已知同源主链序列,将同源测序片段组装拼装,建立新序列。该序列与的主链类似,但不一定相同。测序实验室测序实验室39组装缺口测序缺口测序缺口- 我们如果已经知道重叠群的顺序和方向,那么可以通过跨越式测序得到缺口的序列信息。物理缺口物理缺口- 没有重叠群覆盖,同时也没有DNA测序结果 测序缺口物理缺口重复序列干扰鸟枪法测序拼接41重复序列R

13、EPEATS重复序列 真核生物染色体基因组中重复出现的核苷酸序列。这些序列一般不编码多肽,在基因组内可成簇排布,也可散布于基因组。重复序列的屏蔽软件重复序列的屏蔽软件 CENSOR是一个通过参考序列筛选查询序列中的重复序列并屏蔽同源重复序列的软件工具,其能够将所有找到的重复生成报告以及分类CENSOR也可提供离线软件包Repeat masker RepeatMasker通过已知数据库中的重复元素筛选FASTA格式的查询序列,并返回一个屏蔽之后的可以用于准备数据库检索查询序列的DNA序列。Repeat masker的离线软件包的离线软件包两种屏蔽方法的差别两种屏蔽方法的差别 Repeatmask

14、er用法类似于CENSOR,但这两个工具各自有自身的优点,在于他们的数据库选取中有差异,如果要确保数据更加可信。所以同时用两个工具或者与与其他类似的工具组合使用。48一些错配的重复序列 a b c a c b a b c d I II III I II III a b c d b c a b d c e f I II III IV I III II IV a d b e c f a collapsed tandemexcisionrearrangement人类基因组计划 人类基因组计划 (英语:Human Genome Project, HGP)是一项规模宏大,跨国跨学科的科学探索工程。其宗旨

15、在于测定组成人类染色体(指单倍体)中所包含的30亿个碱基对组成的核苷酸序列,从而绘制人类基因组图谱,并且辨识其载有的基因及其序列,达到破译人类遗传信息的最终目的。人类基因组数据库/projects/genome/guide/human//http:/hgpd.lifesciencedb.jp/cgi//index.html个体化基因组测序计划 已有的研究表明,基因或基因组变异是肿瘤发生的根本原因,利用单细胞全基因组测序技术,可以对获取的肿瘤细胞进行更为精确和

16、深入的分析,了解癌细胞的基因如何突变,以及肿瘤的来源、属于哪种基因型等,为早期检测和诊断肿瘤和肿瘤的个体化治疗提供指导。 而基因分析是个体化医疗的前提,因此个体化的基因测序技术的发展能够驱动着个体化医疗的进程。乳腺癌患者全基因组测序 2012年欧洲内科肿瘤学会(ESMO)研究者首次完成了对个体的乳腺癌患者全基因组测序以期制定个体化治疗的大型临床试验。 截至2012年9月23日,共有 402名乳腺癌患者已经完成了这项检测,还有26名患者分析正在进行中。276名患者得到了基因组检测结果,其中248例进行了完整的全基因组分析。 Andr博士说,在172例患者中发现了一个能作为抗肿瘤药物靶点的基因组改变。有趣的是,20%的患者表现出一个罕见和意料之外的基因组改变,这就更加突显了全基

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论