2013基因组学试题_第1页
2013基因组学试题_第2页
2013基因组学试题_第3页
2013基因组学试题_第4页
2013基因组学试题_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2013 基因组学试题 1. 什么是基因组 (5 分)?真核生物基因组有什么特点(15 分)? 基因组是指一种微生物(包括细菌和病毒)或其它生物体细胞中的总 DNA 或 RNA(是指逆转录病毒),包括核 DNA,细胞器 DNA(动植物线粒体 DNA 和植物叶绿体 DNA)和染色体外遗传成分(如细菌的质粒 DNA)。 结构:真核生物基因组结构特点: 真核基因组远远大于原核生物的基因组。 真核基因具有许多复制起点,每个复制子大小不一。每一种真核生物都有一定的染色 体数目,除了配子为单倍体外,体细胞一般为双倍体,即含两份同源的基因组。 真核基因都出一个结构基因与相关的调控区组成,转录产物的单顺反子,即一分子 mRNA只能翻译成一种蛋白质。 真核生物基因组中含有大量重复顺序。 真核生物基因组内非编码的顺序(NCS)占90%以上。编码序列占5%。 真核基因产断列基因,即编码序列被非编码序列分隔开来,基因与基因内非编码序列 为间隔DNA,基因内非编码序列为内含子,被内含子隔开的编码序列则为外显子。 真核生物基因组功能相关的基因构成各种基因家族,它们可串联在一起,亦可相距很 远,但即使串联在一起成族的基因也是分别转录的。 真核生物基因组中也存在一些可移动的遗传因素,这些DNA顺序并无明显生物学功能, 似科为自己的目的而级织,故有自私DNA之称,其移动多被RNA 介导,也有被DNA介 导的。 功能: (一 )真核基因表达调控的环节更多 基因表达是基因经过转录、翻译、产生有生物活性的蛋白质的整个过程。同原核生物 一样,转录依然是真核生物基因表达调控的主要环节。但真核基因转录发生在细胞核 (线粒体基因的转录在线粒体内),翻译则多在胞浆,两个过程是分开的,因此其调控增 加了更多的环节和复杂性,转录后的调控占有了更多的分量。此外,真核细胞中还会 发生基因扩增(gene amplification),基因的扩增无疑能够大幅度提高基因表达产物的量, 但这种调控机理至今还不清楚。 (二 )真核基因的转录与染色质的结构变化相关 真核基因组DNA绝大部分都在细胞核内与组蛋白等结合成染色质,染色质的结构、 染色质中NA和组蛋白的结构状态都影响转录,至少有以下现象:1.染色质结构影响基 因转录2.组蛋白的作用 3.转录活跃区域对核酸酶作用敏感度增加 4.DNA拓扑结构变 化 5.DNA碱基修饰变化 (三 )真核基因表达以正性调控为主 真核RNA聚合酶对启动子的亲和力很低,要依赖多种激活蛋白的协同作用。真核 基因调控中有负性调控元件,但并不普遍;真核基因转录表达的调控蛋白是以激活蛋 白的作用为主。真核基因组蛋白质编码的基因绝大多数是不连续的,采取逐个基因调控 表达的形式。真核基因表达调控的环节多,录后调控的方式也很多 1.真核生物基因组 DNA 与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的(即双倍 体,diploid),即有两份同源的基因组。 2.真核细胞基因转录产物为单顺反子。一个结构基因经过转录和翻译生成一个 mRNA 分子和一条多肽链。 3.存在重复序列,重复次数可达百万次以上。 4.基因组中不编码的区域多于编码区域。 5.大部分基因含有内含子,因此,基因是不连续的。 6.基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。 2. 转录组和蛋白质组有何异同之处(10 分)? 转录组和基因组水平不同,转录组是高度动态的,当细胞受到侵犯时,甚至当细 胞处于正常的生理活动如复制,分裂时,基因的转录情况也会变化很大,产生不同的 转录组。mRNA是信使RNA,携带着从基因组转录下来的遗传信息,但并不是所有的 基因都同时转录,是受转录因子控制的,而且并非所有基因组序列都能转录。原核生 物中非转录成分较少,基因组序列利用效率较高,真核生物染色体存在大量非转录成 分,一个基因转录形成的mRNA稳定性较差,转录的 RNA原始产物要经过切割、修剪、 添加、修饰和异构化形成成熟mRNA,tRNA和rRNA,其中内含子在mRNA 拼接时被切 除掉。通过选择性拼接,一个基因可以编码多条多肽链。正常的mRNA 拼接发生mRNA 内部,而在一些低等生物中还存在着奇怪的反转录 (trans-splicng)现象,拼接发生在两 条mRNA之间,即两条mRNA在剪接因子作用下,第一条剪接下来的外显子与另外一条 剪接下来的外显子拼接在一起,编码一个新的多肽。转录组只研究mRNA 转录组学研究的是某个时间点的 mRNA 总和,可以用芯片,也可以用测序。芯片是用已知的 基因探针,测序则有可能发现新的 mRNA, 蛋白组学针对的是全体蛋白,组要以 2D-Gel 和质谱为主,分为 top-down 和 bottom-up 分析 方法。理念和基因组类似,将蛋白用特定的物料化学手段分解成小肽段,在通过质量反 推蛋白序列,最后进行搜索,标识已知未知的蛋白序列。 蛋白质组(Proteome)的概念最先由 Marc Wilkins 提出,指由一个基因组(genOME),或一个细胞、组织表达的所有蛋白质 (PROTein). 蛋白质组的概念与基因组的概念有许多差别,它随着组织、甚至环境状态的不同而改变. 在转录时,一个基因可以多 种 mRNA 形式剪接,一个蛋白质组不是一个基因组的直接产物,蛋白质组中蛋白质的数目有时可以超过基因组的数目. 蛋白质组 学(Proteomics)处于早期“发育”状态,这个领域的专家否认它是单纯的方法学,就像基因组学一样,不是一个封闭的、概念化的稳 定的知识体系,而是一个领域. 转录组是 RNA 转录后的全部产物,而转录后的产物经过加工修饰(例如甲基化、拼接、加尾等)后才变成蛋白质。 相同之处就是他们的大部分结构相同。 不同之处就是一个有加工过程,一个没有。 3. 简述遗传图谱的构建方法(5 分) ,说明遗传图谱在基因组研究中的意义(10 分) 。 答:遗传图谱:某一物种的染色体图谱(也就是我们所知的连锁图谱) ,显示所 知的基因和/或遗传标记的相对位置,而不是在每条染色体上特殊的物理位置。采用遗 传学分析方法将基因或其它DNA标记按一定的顺序排列在染色体上,这一方法包括杂 交实验,家系分析。标记间的距离(遗传图距)用减数分裂中的交换频率来表示,单 位为厘摩(Centi-Morgan, cM), 每单位厘摩定义为1%交换率。遗传学图谱的解像度(分 辨率)低,大约只能达到100万碱基对(1Mb)的水平。 构建: 采用遗传学分析方法将基因或其它DNA标记按一定的顺序排列在染色体上,这一方法 包括杂交实验,家系分析。标记间的距离(遗传图距)用减数分裂中的交换频率来表 示,单位为厘摩(Centi-Morgan, cM), 每单位厘摩定义为1%交换率。 作图群体的建立 、分子标记的选择 、结果统计与数据处理 、绘制图谱 通过遗传图谱,我们可以大致了解各个基因或DNA片断之间的相对距离与方向,如哪 个基因更靠近着丝粒,那个更靠近端粒等。遗传图谱不仅是现阶段定位基因的重要手 段, 即使在人类基因组全物理图谱建立起来之后,它依然是研究人类基因组遗传与变异的 重 要手段。初步的连锁图谱是任何物种深入开展遗传学研究的基础,高密度连锁图谱可 用于数量性状位点(quantitative trait loci, QTL) 的定位,分子标记辅助选择(marker assisted selection, MAS)和比较基因组作图。 分子生物学方法帮助我们寻找DNA编码信息,但我们首先要知道,在哪里才能找到与 目的性状相关的那段DNA. 基因具有多效性,有些表型可能很难直接寻找其相关的DNA序列,遗传分析给我们提 供了一个独立的、确定与遗传性状相关联基因的位置的方法。 当关于一个基因的功能还处于假设阶段时,或者当某一特定表型与DNA的关联还处于 推断状态时,遗传分析是唯一的手段 4. 什么是物理图谱(5 分)?简述大片段文库的物理图谱如何构建(15 分)? 物理图谱(physical map)物理图谱是指有关构成基因组的全部基因的排列和间距的 信息.它是通过对构成基因组的 DNA 分子进行测定而绘制的.绘制物理图谱的目的是把 有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来.DNA 物理 图谱是指 DNA 链的限制性酶切片段的排列顺序.即酶切片段在 DNA 链上的定位.DNA 是很大的分子.由限制酶产生的用于测序反应的 DNA 片段只是其中的极小部分.这些片 段在 DNA 链中所处的位置关系是应该首先解决的问题.故 DNA 物理图谱是顺序测定的 基础.也可理解为指导 DNA 测序的蓝图.广义地说.DNA 测序从物理图谱制作开始.它是 测序工作的第一步.制作 DNA 物理图谱的方法有多种. 构建物理图谱有哪些方法?遗传图谱与物理 图谱的异同点?(20 分) 物理图谱:确定染色体 DNA 上诸如限制性内切酶切识别位点或序列标志位点(STSs)等的位置图,图距是物理长度 单位,如染色体的带区、核苷酸对的数据等。 物理图谱构建: 1)提供排好的染色体 DNA 或全基因组 DNA 的顺序; 2)提供一套密集的遗传标记和彼此间的精确距离。 3)提供一套可以直接用于染色体 DNA 或基因组 DNA 测序的 NDA 样品。 方法: 原位杂交技术细胞遗传学图谱 直接将基因或遗传标记或文库克隆通过 FISH 定位在染色体上 限制性酶切方法 限制图谱 利用限制性内切酶将染色体切成片段,再根据重叠序列确定片段间连接顺序,以及遗传标志之间物理距离碱基对 (bp) 或千碱基(kb)或兆碱基(Mb)的图谱 STS 容量法序列标签位点图谱 通过 PCR 或分子杂交将 STS 顺序定位在基因组的 DNA 区段中 克隆的指纹连接法 连续的文库图谱 1)构建一个基因组库。 2)按照这些片段在完整的染色体中的顺序和位置来排列文库中的这些随机片段。 “指纹识别”:包括将原始的克隆切割成更小的片段,然后用电泳法对这些片段根据尺寸进行排列。 寻找克隆间重叠的指纹片段,以判定克隆间是否能够连接起来 最通常的物理图的构建方法是把限制酶切的 DNA 片段,按其次序排列连接起来。作图的技术路线基本上分两类: 一类是由长到短作图,另一类则是由短到长作图。前者是将基因组 DNA 用切点很少的限制酶如 NotI 等完全田切, 得到长约 1001000kb 的 DNA 长(大)片段,估计每条染色体平均 130 个片段,按照片段上的标记把片段按次序排列, 然后再把每一长片段酶切成短片段,再把短片段排列成序。这是由长到短的作图,图比较完整但分辨力低。后一类 方法则是先将基因组 DNA 用限制酶作部份酶切,得到的短片段分别用酵母人工染色体(YAC)或粘粒(Cosmid)等作载 体加以克隆,然后根据克隆片段两端共有的序列即重迭序列两两连接,逐渐延伸成长片段。这样作图的分辨力较高, 但图不完整往往留有空缺。这是因为有些酶切产生的 DNA 片段太短,不易被克隆,以致在通过重迭序列把片段连接 时出现中断。一组相互邻接的 DNA 片段的克隆称为邻接 DNA 片段组。这两个策略可以根据研究的需要选定。 5. 第二代 DNA 测序的原理是什么(5 分)?不同基因组需要不同的测序策略,简要说 明两种策略的特点(15 分) 。 都需要费用更低、通量更高、速度更快的测序技术,第二代测序技术(Next- generation sequencing)应运而生。第二代测序技术的核心思想是边合成边测序 (Sequencing by Synthesis),即通过捕捉新合成的末端的标记来确定 DNA 的序列, 现有的技术平台主要包括 Roche/454 FLX、Illumina/Solexa Genome Analyzer 和 Applied Biosystems SOLID system。这三个技术平台各有优点,454 FLX 的测序片段 比较长,高质量的读长(read)能达到 400bp;Solexa 测序性价比最高,不仅机器的 售价比其他两种低,而且运行成本也低,在数据量相同的情况下,成本只有 454 测序 的 1/10;SOLID 测序的准确度高,原始碱基数据的准确度大于 99.94%,而在 15X 覆盖 率时的准确度可以达到 99.999%,是目前第二代测序技术中准确度最高的。虽然第二代 测序技术的工作一般都由专业的商业公司来完成,但是了解测序原理、操作流程等会 对后续的数据分析有很重要的作用,下文将以 Illumina/Solexa Genome Analyzer 测 序为例,简述第二代测序技术的基本原理、操作流程等方面。 2.基本原理 Illumina/Solexa Genome Analyzer 测序的基本原理是边合成变测序。在 Sanger 等测序方法的基础上,通过技术创新,用不同颜色的荧光标记四种不同的 dNTP,当 DNA 聚合酶合成互补链时,每添加一种 dNTP 就会释放出不同的荧光,根据捕捉的荧光 信号并经过特定的计算机软件处理,从而获得待测 DNA 的序列信息。 3.操作流程 1)测序文库的构建(Library Construction) 首先准备基因组 DNA(虽然测序公司要求样品量要达到 200ng,但是 Gnome Analyzer 系统所需的样品量可低至 100ng,能应用在很多样品有限的实验中),然后将 DNA 随机片段化成几百碱基或更短的小片段,并在两头加上特定的接头(Adaptor)。 如果是转录组测序,则文库的构建要相对麻烦些,RNA 片段化之后需反转成 cDNA,然 后加上接头,或者先将 RNA 反转成 cDNA,然后再片段化并加上接头。片段的大小 (Insert size)对于后面的数据分析有影响,可根据需要来选择。对于基因组测序来 说,通常会选择几种不同的 insert size,以便在组装(Assembly)的时候获得更多的 信息。 2)锚定桥接(Surface Attachment and Bridge Amplification) Solexa 测序的反应在叫做 flow cell 的玻璃管中进行,flow cell 又被细分成 8 个 Lane,每个 Lane 的内表面有无数的被固定的单链接头。上述步骤得到的带接头的 DNA 片段变性成单链后与测序通道上的接头引物结合形成桥状结构,以供后续的预扩 增使用。 3)预扩增(Denaturation and Complete Amplification) 添加未标记的 dNTP 和普通 Taq 酶进行固相桥式 PCR 扩增,单链桥型待测片段被 扩增成为双链桥型片段。通过变性,释放出互补的单链,锚定到附近的固相表面。通 过不断循环,将会在 Flow cell 的固相表面上获得上百万条成簇分布的双链待测片段。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论