




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章一、基因组1、基因组( genome) :生物所具有的携带遗传信息的遗传物质的总和, 是指生物细胞中所有的 DNA,包括所有的基因和基因间区域。2、基因组学 :指以分子生物学技术、计算机技术和信息网络技术为研究手段,以生物体全部基因为研究 对象,在全基因背景下和整体水平上探索生命活动的在规律及其外环境影响机制的科学。基因组学包括 3 个不同的亚领域结构基因组学 (structural genomics):以全基因组测序为目标功能基因组学 (functional genomics) :以基因功能鉴定为目标比较基因组学 (comparative genomics)二、基因组序列复杂性1、C值
2、是指一个单倍体基因组中 DNA的总量,以基因组的碱基对来表示。每个细胞中以皮克(pg ,10-12g)水平表示。C 值悖理(矛盾) ( C-value paradox) :在结构、功能很相似的同一类生物中,甚至在亲缘关系十分接 近的物种之间,它们的 C值可以相差数 10 倍乃至上百倍。C值反映了总体趋势上,随着生物结构和功能的复杂性的增加,各分类单元中最小基因组的大小随分类地 位的提高而递增。2、序列复杂性单一顺序: 基因组中单拷贝的 DNA序列重复顺序: 基因组中多拷贝的基因序列 真核生物基因组 DNA组分为非均一性,可分为 3 种类型:快速复性组分、居间复性组分、缓慢复兴组分三、基因与基因
3、家族1、基因家族:是真核基因组的共同特征,他们来自一个共同的祖先,因基因加倍和趋异,产生了许多在 DNA序列上基本一致而略有不同的成员。包括编码 RNA的基因和编码蛋白质的基因2、隔裂基因( split gene ):指基因部被一个或更多不翻译的编码顺序即含子所隔裂。3、异常结构基因分类重叠基因:编码序列彼此重叠的基因,含有不同蛋白质的编码序列。基因基因 : 一个基因的含子中包含其他基因。反义基因 : 与已知基因编码序列互补的的负链编码基因,参与基因的表达调控,可以干扰靶基因 mRNA转录与翻译。4、假基因:来源于功能基因但已失去活性或者改变原来活性功能的DNA序列 .四、基因组特征比较真核生
4、物基因组的特征 :复杂性较高的生物基因组结构松弛,在整个基因组围分布大量重复顺序(小基 因组重复序列较少,大基因组重复序列急剧扩增);含有大量数目不等的线性DNA分子,并且,每个长链 DNA都与蛋白质组成染色体结构;含有细胞器基因组(所有真核生物都具有环状的线粒体DNA,植物细胞还含有环状的叶绿体 DNA。)原核生物基因组的特征 : 原核生物基因数目比真核生物少,大小在 5 Mb 以下; 原核生物基因组结构更紧 凑; (极少重复序列 ; 重复基因的数量远远低于真核生物;不存在含子,基本都是编码序列,无断裂基 因。)第二章一、为何要绘制遗传图与物理图?1)基因组太大 ,必需分散测序 , 然后将分
5、散的顺序按原来位置组装 ,需要图谱进行指导。2)基因组存在大量重复顺序 , 会干扰排序 ,因此要高密度基因组图。3)遗传图和物理图各有优缺点 ,必须相互整合校正。二、基因组测序方法、原理及特点:1. 克隆重叠群法( clone contig method ,作图法测序):先构建遗传图,再利用几套高度覆盖的大片 段基因组文库( BAC、 PAC等)获得精细的物理图,选择合适的BAC或 PAC克隆测序,利用计算机拼装。BAC的空洞基本上都可以利用设计引物等手段填补,形成一条完整的BAC序列。然后由相互关联、部分重叠的 BAC克隆连成一个大的重叠群( Contig )。优点:通过这种方法得到的基因组
6、数据是最为准确和精细的数据,也是基因组测序的最终目标。 缺点:该方法的技术难度较高,尤其大片段基因组文库(BAC)和精细物理图构建是技术性极强的工作;此外,费用相对于鸟枪法要稍高一些,完成整个基因组测序周期也要长些。2. 全基因组鸟枪法( whole-genome shotgun method ):是随机先将整个基因组打碎成小片段进行测序, 最终利用计算机根据序列之间的重叠关系进行排序和组装,并确定它们在基因组中的正确位置。优点:速度快,简单易行,成本较低,可以在较短的时间通过集中机器和人力的方法获得大量的基因片断。缺点:最终排序结果的拼接组装比较困难,尤其在部分重复序列较高的地方难度较大。此
7、外有许多序列 片段难以定位在确切的染色体上,成为游离片断;同时又会有许多地方由于没有足够的覆盖率而形成空 缺。这些缺陷最终导致整个基因图会留下大量的空洞,也影响其准确度。三、遗传图与物理图遗传作图 ( Genetic mapping ):采用遗传学分析方法将基因或其它DNA序列标定在染色体上构建连锁图。此方法包括杂交实验,家系分析。遗传图距单位为厘摩 (cM), 每单位厘摩定义为 1%交换率。(相对位置) 物理作图 ( Physical mapping ):采用分子生物学技术直接将 DNA分子标记、基因或克隆标定在基因组 实际位置。物理图的距离依作图方法而异,如辐射杂种作图的计算单位为厘镭 (
8、cR), 限制性片段作图与 克隆作图的图距为 DNA的分子长度,即碱基对 (bp, kb) 。(绝对位置)基因是首先被使用的标记:基因十分有限,大量的基因间隔区DNA标记必须有等位型才是有用的四、遗传图标记及特点:1. 限制性片段长度多态性( restriction fragment length polymorphisms,RFLP)同一物种的亚种、品系或个体间基因组 DNA 受到同一种限制性切酶作用而形成不同的酶切图谱的现象,第一代分子标记。特点: 1) 处于染色体上的位置相对固定 ; 2) 同一亲本及其子代相同位点上的多态性片段特征不变 ; 3) 同一凝胶电泳可显示等位区段不同多态性片段
9、 , 表现为共显性 ( 可鉴定纯合子和杂合子 ); 4) 需要用 Southern 杂交检测显示。2. 简单序列长度多态性( simple sequence length polymorphisms,SSLP)第二代分子标记SSR技术的优点是:( 1)在基因组中随机分布,检测的多态性频率高;(2) PCR特异引物,重复性好(3)共显性,操作相对简单。问题是:( 1) SSR需要测序和设计引物,因而需要大量的人力、物力和时间;(2)另外其种属特异性强,开发所需的费用高昂,因此一些实验室进行了合作,共同开发微卫星引物。SSR标记的关键是引物的设计3. 单核苷酸多态性( single nucleot
10、ide polymorphisms,SNP)是指同一物种不同个体基因组DNA的等位序列上单个核苷酸存在差异的现象。其中最少一种在群体中的频率不小于1;根据 SNP在基因中的位置, SNP可分为:基因编码区 SNP、基因周边 SNP、基因间 SNP。 SNP特点:( 1)SNP由核苷酸代换产生( 2)人类基因组平均 600bp含一个 SNP( 3)人类基因组 SNP总量大 于 500 万占人类 DNA序列差异的 10% - 50% ( 4) 基因组中一些紧密连锁的 SNP可组成单倍型 (Haplotype). 单倍型中不同的 SNP位点之间不发生重组与交换 .五、遗传作图理论基础:采用一组分子标
11、记构建遗传图的方法 主要依赖于连锁分析。 基本方法:两点测验法和三点测验法六、不同模式生物连锁分析有性杂交实验、质谱分析、 DNA转移七、Lod 值是基因连锁可能性的对数,用于初步判断所研究的 2 个基因是否位于同一染色体上。八、细菌的遗传作图:部分二倍体作图法转化( transformation ):供体细胞释放的一段 DNA(通常小于 50kb ),经受体细胞摄取后整合到基 因组中,可借助抗性培养基筛选重组克隆。转导( transduction) :通过噬菌体将小片段 DNA从供体细胞转移到受体细胞。接合 (conjugation) :两个细菌形成物理接触, DNA从供体转移到受体。转移
12、DNA可以是一段也可以是整 个染色体,可达 1Mb.第三章一、为什么需要物理作图?1、遗传图谱分辨率有限:由于人类及其大多数高等真核生物来说,不可能获得巨大数量的后代,因此可 用于研究的减数分裂体就少很多,连锁分析就受限制,导致标记密度的减小,从而影响遗传作图;2、遗传图覆盖面低:由于染色体交换区域的不平衡,有些区段很少发生交换,难以获得高密度连锁图;3、遗传图分子标记的排列有时会出现差错:遗传作图依赖子代的重组及分离比,由于环境及取样误差, 有时结果会出现差异,相同的标记在连锁图上位置不一样。二、物理作图方法及原理(限制性作图、基于克隆的基因组作图、荧光原位杂交(FISH)、序列标签位点(
13、STS)1、限制性作图:将限制性酶切位点标定在DNA分子的相对位置。方法及原理:通过比较不同限制性切酶切割所产生 DNA片段大小:首先用一种酶处理样品后,电泳确定 DNA片段的大小;然后用第二种酶处理,获得第二组片段。最后用两种酶混合处理,获得第三组片段。收 集上述资料进行对比组装:两种酶切位点交替出现的区段用加减法确定其的相对位置。连续出现 2 个或 多个相同酶切位点的区段,采用部分酶解法。切点过多时可以采用末端同位素标记结合部分酶解进行绘 图。限制性作图更适合于小分子。当需要对大于 50kb 的基因组进行限制性作图时,通过选择靶DNA分子中的稀有酶切位点酶可以克服限制性酶切作图的局限性。大
14、分子 DNA分离采用特殊电泳:脉冲凝胶电泳(PFGE)、正交交变电场凝胶电泳( OFAG)E2、基于克隆的基因组作图:根据克隆的DNA 片段之间的重叠序列构建重叠群 (Contig), 绘制物理连锁图。常用大分子 DNA克隆载体:酵母人工染色体 YAC、噬菌体 P1载体、细菌人工染色体 BAC、P1 人工染色体 PAC、 F 黏粒。方法及原理: 1、基因克隆 2、构建重叠群(染色体步移法、 指纹法 )3、荧光原位杂交 FISH:指在染色体上进行 DNA杂交,以便识别荧光标记探针在染色体上位置的方法。4、序列标签位点作图 STS:通过 PCR或分子杂交将小段 DNA序列定位在基因组的 DNA区段
15、中。三、脉冲电泳 PFGE的基本原理 :将一个方向不断变换的电场,取代简单的单一电场(单向电场 ) ,使电泳中受阻的 DNA分子在电场改 变时扭转迁移方向,较小的分子比较大的分子重新排列的快,以此达到分离的目的。分辨率达到10Mb。四、重叠群:可以通过末端的重叠序列相互连接形成连续的DNA长片段的一组克隆称为重叠群 (contig)五、指纹法:1、分类:限制性带型( Restriction patterns )指纹: 用不同限制性酶消化后,经凝胶分离产生的条带。 重复顺序 DNA指纹( Repetitive DNA fingerprints): 将不同克隆的限制性片段电泳转膜后,与基因组围分布
16、的重复序列杂交形成的带型。重复顺序 DNA PCR( Repetitive DNA PCR )或分散重复顺序 PCR(interspersed repeat element PCR, IRE-PCR)指纹: 用基因组围的重复序列的互补序列做引物,扩增两个重复序列之间的单一顺序,得到的 产物带型。2、克隆指纹法的原理:如果 2 个克隆彼此重叠,它们一定含有相同的序列。3、基因组围查找重叠克隆的最好方法首推克隆指纹排序。4、指纹:指确定 DNA样品所具有的特定 DNA片段组成,一个克隆的指纹表示了该克隆所具有的指定序列 的特征,可以同其他克隆产生的同类指纹比较。六、STS作图法: 根据 STS序列
17、设计引物,扩增文库当中的克隆,能扩出条带的克隆都含有序列重叠的 插入子。( 前提:某一克隆重叠群锚定到现有的STS标记物理图上, STS是单一序列,序列已知。 )? 序列标记位点( Sequence tagged site, STS ) : 指一段短的 DNA序列 , 通常长度在 100-500bp, 易 于识别 , 在待研究的染色体或基因组中仅存有 1 个拷贝。因此当 2 个片段含有同一 STS顺序时, 可以确认这两个片段彼此重叠。合格的 STS需要具备的两个条件:1. 在染色体上的位置独一无二; 2. 序列已知,方便 PCR检测。寻找 STS的方法:1) 表达序列标签( expressed
18、 sequence tag, ETS) :来源于 cDNA克隆的小段序列。 EST来自单拷贝的基 因时可作为 STS;2) SSLP 具有多态性且通过连锁分析进行定位的SSLP很有价值,可以建立遗传图与物理图之间的联系;3) 随机基因组顺序。可通过对克隆的基因组DNA随机测序获得,或者从数据库中寻找。七、荧光原位杂交:( fluorescent in situ hybridization, FISH)指在染色体上进行 DNA杂交,以便识别荧光标记探针在染色体上位置的方法。八、作图试剂( mapping reagent) : STS作图过程中将已知的 STS定位在染色体或基因组中的 DNA区段,
19、 这些 STS标记和作图用的染色体区段以及DNA克隆。如何获得作图试剂? 1)放射杂交 2 )克隆文库辐射杂种( radiation hybrid):含有其他生物染色体片段的啮齿类动物细胞。辐射杂种群( radiation hybrid panel) :通过放射杂交产生的融合细胞群称为辐射杂种群。 辐射杂种群分为两类:全基因组辐射杂种群单染色体辐射杂种群第四章一、DNA测序两种方法过程及原理:(双脱氧链终止法更易于机械手操作,可以程序化控制;同时,化学 降解法试剂的毒性影响健康)1、双脱氧链终止法( the chain termination method ),是通过合成与单链 DNA互补的多
20、核苷酸链来读 取待测 DNA分子的顺序。基本原理 : 通过合成与单链 DNA互补的多核苷酸链,由于合成的互补链可在不同位置随机终止反应,产 生只差一个核苷酸的 DNA分子,从而来读取待测 DNA分子的顺序。目前普遍采用的测序酶为 Sequenase, 来自 T7 噬菌体2、化学降解法( chemical degradation method),是将双链 DNA分子用化学试剂处理,产生切口,用同位素标记进行测序基本原理:在选定的核苷酸碱基中引入化学基团,再用哌啶处理使 DNA 分子在被修饰的核苷酸位置降解, 形成只差一个核苷酸的降解 DNA 群体。每个单链的同一方向都结合了放射性同位素标记,显示
21、DNA 位置。DMS(硫酸二甲酯)在中性 pH 环境,主要作用于 G,被六氢吡啶作用而造成该位点上DNA链的断裂。T 胸腺嘧啶和 C 胞嘧啶,在具有六氢吡啶的条件下,导致 如果在反应体系中加入高浓度的盐,同胸腺嘧啶的反应速率便甲酸具有脱嘌呤作用。 DNA链在脱嘌呤位点 (G 和 A) 发生断裂。肼(联氨 NH2.NH2),在碱性条件下,作用于 在这个核苷酸位置上发生 DNA链的断裂。 会下降,主要作用于 C 胞嘧啶。二、双脱氧链终止法技术路线与要求:制备单链模板A.克隆于质粒中 DNA用酸或碱变性B.M13克隆单链 DNA将单链模板与一小段引物退火C.噬粒克隆 DNAD.PCR产生单链 DNA
22、加入 DNA多聚酶高酶活性、无3 -5 外切酶活性、无 5-3 外切酶活性)4 种脱氧核苷酸分别加入少量 4 种双脱氧核苷酸(ddNTP的 3C原子连接的是氢原子,不是羟基)将 4 种反应产物分别在 4 条泳道电泳 根据 4 个碱基在 4 条泳道的终止位置读出基因序列 三、双脱氧链终止法要求单链作为模板,如何制备单链模板?1. 将 DNA克隆到质粒载体中:碱变性或热变性变为单链,DNA变性后两条单链可同时双向测序但未纯化的 DNA污染干扰测序反应;2. 以 M13载体克隆单链 DNA: M13噬菌体基因组为单链 DNA,可用于克隆单链 DNA,可以作为模板进行 DNA测序;无需变性,直接测序;
23、但 3kb 时扩增时容易发生丢失与重排,只能操作小片段DNA测序。3. 以噬菌粒( phagemid)克隆 DNA:改造的质粒载体,有 2 个复制起始点(质粒自身和 M13 单链噬菌 体),在大肠杆菌细胞中产生单链噬菌粒,该系统避免了M13系统的不稳定性,可克隆片段 10kb DNA测序4. PCR 产生单链 DNA:根据测序 DNA两端序列合成 2个引物,采用 PCR法扩增样品 DNA,然后将其中一个 引物连接到很小的磁珠,利用吸磁的方法提纯扩增的单链DNA;四、基因组测序方法原理优缺点:1. 按照大分子 DNA克隆绘制的物理图分别在单个大分子DNA部进行测序和序列组装,然后将彼此相连的的大
24、分子克隆按排列次序搭建支架,最后以分子标记为向导将搭建的支架分别锚定到基因组 整合图上(作图测序);优点:缺点:2. 将整个基因组 DNA打断成小片段后克隆到质粒载体上,然后随机挑选克隆对插入片段进行测序, 并以测序的序列构建重叠群,在此基础上搭建支架,以分子标记为向导将搭建的支架分别锚定到 基因组整合图上(全基因组随机测序或鸟枪法测序)。优点: 测序速度快,并且无须提供相关的遗传图谱和物理图谱。缺点: 对于结构复杂的大基因组而言,鸟枪法的序列组装的起始阶段工作量非常大;基因组中普 遍存在的重复序列是十分棘手的问题,在序列组装时可能出现错误连接,使某些片段从原位置跳 到另一无关位置。五、间隙类
25、型: 测序后将 DNA顺序进行组装 , 会发现存在不连续的区段 ,它们产生于 :1) 因覆盖率的原因而留下的未能测序的顺序 , 仍存在于克隆文库中 , 这类间隙称为顺序间隙。解决办法 : 通过相邻已知顺序作为探针筛选已有的基因组文库2) 因克隆载体自身的限制或 DNA顺序特殊的组成等原因造成某些顺序丢失或未能克隆, 这类间隙称为物理间隙。解决办法 : 利用其它宿主菌与载体重新构建文库六、覆盖面(或深度):每个核苷酸在完成顺序中平均出现的次数,或者说完成顺序的长度与组装顺序 长度之比。在测序前,首先要考虑测序规模, P0=e- m m为覆盖面,即单倍体基因组数; e 为自然对数底数七、重要区域测
26、序1、人们对感兴趣的基因或与疾病相关的基因优先测序。如:人类主要组织相容性复合区位于第6 号染色体,与人类免疫系统有关,因而优先测序。2.EST (Expressed sequence tag)测序EST 是一种重要的基因组图分子标记 ,以 EST为探针很容易从 cDNA文库中筛选全基因 , 又可从 BAC克隆中找到其基因组的基因序列。3、浏览测序:粗略分析初步测序结果,从中寻找基因编码顺序的方法。八、名词解释1) BAC 末端序列 (BAC-end sequenced) 一个 BAC克隆插入片段两端的已测序的序列 ,不包括部顺序 . 可用于确定 BAC的排列方向以及重叠群 (contig)
27、在支架 (scaffold) 中的排列方向 .2) 重叠群 (contig) 一群相互重叠的克隆或 DNA顺序, 可以是草图顺序或精确顺序 (finished), 包括连 续的(部无间隙)或不连续的 (部含间隙 )DNA顺序,未锚定到染色体上 .3) 草图顺序 (draft sequence) 人类基因组测序计划定义为经 Phred Q20 软件认可覆盖测序克隆片段3-4 倍的 DNA顺序 . 含间隙或无间隙 , 排列方向和位置未定 .4) 精确顺序 (finished sequence) 顺序差错率 (错误碱基数 )低于 0.01%的 DNA序列, 排列方向确定 ,部 不含间隙 , 一般测序
28、覆盖率在 8-10 个单倍体基因组5) 支架 (scaffold) 一组已锚定在染色体上的重叠群 , 部含间隙或不含间隙 .九、几种生物的测序方法: 大肠杆菌基因组测序图位法 ; 流感嗜血杆菌基因组测序鸟枪法 ; 果蝇基因组测序鸟枪法 ; 人类基因组测序图位法和鸟枪法 ; 水稻基因组测序 图位法和鸟枪法。第五章、含子出现的问题:含子的出现给计算机判读基因带来不少问题,对ORF扫描的基本程序的编写要考虑以下几个问题:1 )密码子偏好;编码同一氨基酸的不同密码子称为同义密码,其差别仅在密码子的第3位碱基不同。特定种属有特征性的密码子偏爱,这些序列在编码区常常出现,非编码区只保持平均的碱基分布水平。2)外显子含子边界;上游外显子 - 含子边界序列是判断是否为编码序列之一;但常有例外,导致判读 程序编写有一定困难。3)上游调控序列。几乎所有基因(或操纵子)上游都有调控序列,它们可
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 美容院合作伙伴合同协议
- 罗湖指标房买卖合同协议
- 自建房购房合同协议书范本
- 美术老师兼职合同协议
- 自备吊车租赁合同协议
- 美发店长合同协议模板
- 美容院租赁合同附加协议
- 背靠背劳务合同协议
- 美发店转让店铺合同协议
- 能否取消拍卖合同协议
- 2024-2025下学期高二化学鲁科版期中必刷题之化学键与物质的性质
- 线上医药销售培训
- 鼻肠管的应用及护理课件
- 2025年宪法知识竞赛全套题库及答案(共150题)
- 分娩镇痛技术与管理规范
- 2025修订版《保障中小企业款项支付条例》解读学习课件
- 防汛抗洪培训课件
- 大数据发展在实现高中数学精准教学中应用分析
- 深度学习赋能:单幅图像超分辨率重建算法的探索与突破
- 【特易资讯】2025中国二手车行业出口分析及各国进口政策影响白皮书
- 2025风电机组螺栓在线监测技术规范
评论
0/150
提交评论