细胞与分子遗传学_第1页
细胞与分子遗传学_第2页
细胞与分子遗传学_第3页
细胞与分子遗传学_第4页
细胞与分子遗传学_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

细胞和分子遗传学 第一章 绪论 1. 遗传:生物信息从上代往下代传递 2. 遗传学:研究遗传规律的科学 3. 基因组 Genome : 一整套染色体上的所有遗传物质 4. 基因组学 Genomics: 研究基因组基因组的科学,包括研究分析核酸序列序列、基因成分成分、基因结构结构 和基因数目数目. 5. 细胞遗传学: 从细胞学细胞学和遗传学遗传学发展起来的交叉学科,它涉及染色体的形态、结构、数 目、功能和运动等特征,以及这些特征的各种变异变异对遗传传递、重组、表达与调控的作用 和影响,也涉及染色体外的遗传因子。以染色体遗传染色体遗传为研究核心。 6. FISH(fluorescent in situ hybridization):荧光原位杂交 7. 原位杂交:是一项利用标记的 DNA 或 RNA 探针直接在染色体、细胞或组织水平定位特 定靶核酸序列的分子细胞遗传学技术。 8. FISH 工作原理:用已知的标记单链单链核酸为探针探针,按照碱基互补的原则,与待检材料中未 知的单链单链核酸进行特异性结合,形成可被检测的杂交双链杂交双链核酸。由于 DNA 分子在染色体 上是沿着染色体纵轴呈线性排列,因而可以将探针直接与染色体进行杂交从而将特定的基 因在染色体上定位。与传统的放射性标记原位杂交相比,荧光原位杂交具有快速、检测信 号强、杂交特性高和可以多重染色等特点。 9. FISH 的应用:位点特异性探针位点特异性探针:能与染色体的特定部位杂交;已经分离出一段基因的 一小部分,若要确定这段基因位于哪个染色体确定这段基因位于哪个染色体,就准备这段基因的探针并观察该探针与哪 个染色体杂交。整个染色体探针整个染色体探针:能分别与染色体纵轴的不同序列杂交的很短的探针的 集合。用这些探针库能画出全部染色体并产生核型谱带,再进行核型分析,用于检测染色检测染色 体异常体异常 10.原位杂交的种类:GISH(Genomic in situ hybirdization)以基因组基因组为探针(整个染 色体) 。FISH(Fragment in situ hybridization)以特定的基因特定的基因为探针(基因片段) 。 mFISH (multicolor FISH)利用不同颜色的荧光素不同颜色的荧光素标记不同的探针。Fiber-FISH 利用化学方法对染色体进行线性化线性化,再以此线性化的染色体 DNA 纤维纤维为载体进行 FISH(提高分辨率) 。 第二章 基因组作图与基因定位 1. 结构基因组的研究策略:测序路线作图(遗传图和物理图) 、测序(图谱测序和随 机测序) 、组装(骨架图和空隙图) 。 2. 为何要绘制遗传图与物理图?1)基因组太大太大,必需分散测序,然后将分散的顺序按原来位 置组装,需要图谱进行指导指导. 2)每次仅能读取 1000bp,已知最小的细菌为 580kb.3)基因组存 在大量重复顺序重复顺序,会干扰排序,因此要高密度基因组图. 4)遗传图和物理图各有优缺点,必须相 互整合整合校正. 3. 遗传图与物理图:遗传作图遗传作图(Genetic mapping)采用遗传学遗传学分析方法将基因或其它 DNA 顺序标定在染色体上构建构建连锁图。包括杂交实验,家系分析。遗传图距单位为厘摩厘摩 (cM), 每单位厘摩定义为 1%交换率。物理作图物理作图(Physical mapping)采用分子生物学分子生物学技术 直接将 DNA 分子标记、基因或克隆标定在基因组实际实际位置。物理图的距离依作图方法而 异,如辐射杂种(radiation hybrid)作图的计算单位为厘镭厘镭(cR), 限制性片段作图与克隆作 图的图距为 DNA 的分子长度,即碱基对碱基对(bp, kb)。 4. 基因组测序的策略:Clone-by-clone 测序(基因克隆) 、鸟枪法测序(全基因组) 、混合 法测序。基本流程:随机酶切成小片段(不完全酶切)亚克隆(酶切片段+载体) 亚克隆测序(两端测序)组装。关键:酶选择,片段大小,数量(库大小) 。 5. 基因组路标(landmarker):染色体上的基因和基因和 DNA 顺序顺序均可作为路标, 路标具有物理属 性,他们由特定的 DNA 顺序组成. 路标位于染色体上的位置是固定固定的, 不会更改的, 因而提 供了作图的依据作图的依据。 6.RFLP(restriction fragment length polymorphism,限制性片段长度多态性):指基因型之 间限制性片段长度长度的差异(同种酶) ,这种差异是由限制性酶切位点酶切位点上碱基的插入、缺失、 重排或点突变突变所引起的。 7. RFLP 的特点:处于染色体上的位置相对固定固定; 同一亲本及其子代相同位点上的多态 性片段特征不变不变; 同一凝胶电泳可显示不同多态性片段, 表现为共显性共显性(双亲的性状同时 在 F1 个体上表现出来)一个酶切位点突变,则两条同源染色体跑出的胶共有 3 段, 下面两段相加等于上面那段. 8. 如何寻找 RFLP 标记(即酶切位点): 随机克隆筛选; 将其它方法获得的 DNA 标记, 如 RAPD (random amplified polymorphism DNA)标记转换为 RFLP 标记; 从 cDNA 中寻找 RFLP. 计算机筛选. 9. AFLP(amplified fragment length polymorphism, 放大的片段长度多态性):这是一种筛选筛选 RFLP 分子标记分子标记的方法. 先将 DNA 样品采用选定的限制性内切酶(如 EcoRI, Sau3A)消化, 然后加上接头 PCR 引物(补平粘性末端并额外延伸 1-3 个碱基). 接头 PCR 引物设计: 根据限制酶接头添加数个向外延伸的碱基(补平末端), 然后向 3方向延伸 1-3 个不同的个不同的 碱基碱基(共有 41-43种不同的引物). 选择不同的引物对引物对扩放样品 DNA(PCR), 经聚丙烯 胺凝胶电泳分离标记的标记的(就是用那多出的 1-3 个碱基作为标记)PCR 产物. 10.SSLP(simple sequence length polymorphism,简单序列长度多态性):可变排列的简 单重复顺序重复顺序, 即重复次数不一, 在染色体的同一座位重复顺序拷贝数不同重复顺序拷贝数不同(导致多态性); SSLP 的类型:小卫星序列(minisatellite), 重复单位较长;微卫星序列微卫星序列(microsatellite), 重复 单位较短, 在 1-6 个核苷酸之间。 11.SSR(简单重复序列,即微卫星序列): 其串联重复的核心序列为 1-6 bp,其中最常见 是双核苷酸重复(CA,TG), 重复单位数目 10-60 个。 12. 如何寻找微卫星序列标记? 1982 年 Hamada 等首次报道 microsatellite 现象(PNAS, 79:6564, 1982)。1989 年 Weber 等从 GenBank 中发现人类基因组的 8 个位点中, 有 7 个位 点存在(CA)n 拷贝数的变化(Am. J. Hum. Genet., 44:388, 1989).现已证实人和老鼠基因组 中平均每 18-28 kb 含有一个多态性(CA)n.获取方法: a) 机算机机算机搜寻; b) 用 Sau3A, RsaI, HaeIII 或 AluI 限制酶酶切基因组 DNA, 构建 DNA 文库文库.合成简单寡聚重复核苷酸作为探针探针 从库中筛选筛选.根据简单重复顺序两侧的序列设计引物两侧的序列设计引物, 用同位素同位素标记 PCR 扩增样品, 经聚 丙烯酰胺凝胶电泳分辩. 13. SNP (single nucleotide polymorphism,单核苷酸多态性):指在基因组上单个核苷酸单个核苷酸的变异,包 括置换、颠换、缺失和插入 ,形成的遗传标记,其数量很多,多态性丰富。 14. SNP 的一些特点:理论上同一碱基位置 SNP 等位型等位型式最多为 4. 直接从 STS (sequence-tagged site,序列标志位点)测序中可寻找到 SNP. MIT Whitehead Institute 经分 析证实, 人类基因组平均每每 1 kb 含有一个 SNP. 估计人类基因组有 300 万万个 SNP. SNP 与人类易感性疾病易感性疾病有关, 涉及药物基因组学. 编码区 SNP 主要分布在密码子的摇摆位置摇摆位置 (第第 3 个个碱基) ,表现为沉默突变沉默突变而被保留下来. 15. 遗传图绘制-分子标记的等位型式及 F2 基因型分析,计算重组率重组率,从而绘制遗传图 (Aa/Bb,其中 A/B 连锁) (图-42) 16. 物理图绘制:限制性作图限制性作图(Restriction mapping)它是将限制性酶切位点酶切位点标定在 DNA 分子的相对位置。依靠克隆的基因组作图依靠克隆的基因组作图(Clone-based mapping) 根据克隆的 DNA 片段之间的重叠顺序重叠顺序构建重叠群重叠群(Contig), 绘制物理连锁图。荧光标记原位杂交荧光标记原位杂交 (Fluorescent in situ hybridization, FISH)将荧光标记的探针与染色体杂交确定分子标记分子标记的 所在位置。顺序标签位点顺序标签位点(Sequence tagged site, STS)作图通过 PCR 或分子杂交将小段小段 DNA 顺序定位在基因组的基因组的 DNA 区段中(小段 DNA 序列已知,两端设计引物,利用 PCR 进行扩增) 。 限制性作图(Restriction mapping):将限制性酶切位点酶切位点标定在 DNA 分子(一般为小分 子 DNA)的相对位置。酶切片段电泳图;推测出限制性物理图。 对于大分子 DNA 的研究策略与方法:1) 制备-琼脂糖包埋法 2) 酶切-稀有酶切位点限 制酶 3) 分离-脉冲电泳分离 4) 克隆-载体设计 琼脂糖包埋法(知道即可):a.分离纯化细胞核 b.将收集的细胞核包埋在琼脂糖凝胶薄片 中 c.蛋白酶消化处理细胞核。 稀有切点限制性内切酶的应用:a.什么是稀有切点内切酶: 在基因组 DNA 顺序中有很少可识别序列很少可识别序列的限制酶, 一般识别位点在 6-8 碱基对之间, 并含 有高 G/C 比。 b.选用稀有切点限制酶注意事项:a) 识别位点的非特异顺序非特异顺序, -G ANTC- (HinfI), -GCCN4 NGCC- (BglI) b) 高等生物基因组一般 A/T 比较高, 应选应选 G/C 高比例高比例限制 酶, 如-GC GGCCGC-(NotI) c) 基因组甲基化状态甲基化状态, 高等生物基因组 DNA 甲基化比例很高, 但果蝇和酵母基因组无甲基化。脉冲交变电场电泳:会跑出一段白色的轨迹,而不是一 条一条的片段(因为各片段紧密相连,共同组成了连成一片的轨迹) 。 克隆作图(大分子 DNA 的克隆):根据克隆的 DNA 片段之间的重叠顺序重叠顺序构建重叠群重叠群 (Contig), 绘制物理连锁图。 克隆作图的载体与方法:大分子 DNA 克隆载体载体构建:YAC, BAC, PAC, HAC, MAC, TAC。大分子 DNA 克隆的作图作图:步移步移法和指纹指纹法。 YAC(酵母人工染色体)和 BAC(细菌人工染色体)基因组文库的构建:1) 目标基因 组大分子 DNA 的制备 2) 载体制备 3) 载体和插入 DNA 的连接 4) 转化 5) 转化子鉴定 染色体步移法:以 A1 为探针,找到 B1、B2(A1 两端与 B1、B2 分别配对) ,在分别以 B1、B2 为探针重复杂交,筛选到下一轮阳性克隆 C1、C2,不断重复,建立起彼此连接的 重叠群。 限制性片段指纹作图原理:a.在两个重叠 BAC 克隆间存在相同指纹相同指纹 b.重叠 BAC 克隆 DNA 凝胶电泳指纹图(重叠的片段在图上显出相同位置相同位置的条带):BAC 克隆酶切后经过 琼脂糖凝胶电泳分离,染色后显示片段指纹,再经计算机识别相同的指纹区段,即重叠的 BAC 克隆。最后构建指纹重叠群(物理图的绘制) ,基因组的遗传图可与物理图整合。 顺序标签位点(Sequence tagged site, STS)作图:通过 PCR 或分子杂交将特定特定 DNA 顺顺 序序定位在基因组染色体区段基因组染色体区段中。 STS 作图原理:将染色体 DNA 随机打断,两个标记所处的物理位置越近,位于同一片段 的几率越高。辐射杂种作图: 辐射杂种图距单位辐射杂种图距单位DNA 分子暴露在 N 拉徳(rad) X 射 线剂量下两个分子标记之间两个分子标记之间发生 1%断裂断裂的机率, 其图距单位为厘镭厘镭(centiRay, cR). 17.物理图的应用图位克隆图位克隆或定位克隆:该方法分分离离基基因因是根据目的基因在染色体上 的位置进行的,无需预先知道基因的 DNA 顺序,也无需预先知道其表达产物的有关信息 (遗传作图物理作图转录图基因顺序) 。1) 首先找到与目标基因目标基因紧密连锁的连锁的分子标分子标 记记; 2) 用遗传作图和物理作图将目标基因目标基因定位在染色体的特定位置; 3) 构建含有大插入片大插入片 段段的基因组文库(BAC 库或 YAC); 4) 以与目标基因连锁的分子标记连锁的分子标记为探针筛选基因组文库; 5) 用获得的阳性克隆阳性克隆构建目的基因区域的跨叠群跨叠群; 6) 通过染色体步行步行、登陆或跳跃获得含含 有目标基因有目标基因的大片段克隆; 7) 通过亚克隆亚克隆获得含有目的基因的小片段克隆小片段克隆; 8) 通过遗传转 化和功能互补验证最终确定目标基因的碱基序列。 (百科) 18. 图位克隆的步骤图位克隆的步骤:1) 连锁标记的分离分离与克隆(筛选到); 2) 连锁标记向靶基因靶基因位置 逼近; 3) 以紧密连锁标记为探针筛选探针筛选基因组(大插入片段)克隆; 4) 染色体步移步移, 构建覆盖靶 基因位点的重叠群; 5) 以覆盖靶基因位点的 DNA 克隆为探针从 cDNA 文库文库筛候选基因; 6) 候选基因多态性分析多态性分析; 7) 转基因验证验证. 第三章 基因组测序与诠释 1.本章内容:基因组测序的策略策略 基因组测序的方法方法 高通量自动化自动化测序 序列组装组装 2.基因组测序的策略:随机随机测序 限定测序 3.随机测序(与鸟枪法类似):基因组文库的构建 两端测序(基因组 DNA部分酶 切电泳分离DNA 片段建库建库挑取克隆两端测序两端测序形成重叠群覆盖的 DNA 区段可 得到) 4.基因组测序的方法:测序的 DNA 多聚酶多聚酶 测序标记标记 电泳电泳装置 测序难点难点. 5. 测序的 DNA 多聚酶:高酶活性; 无 53外切核酸酶活性; 无 35外切核 酸酶活性。 6. 链终止法测序(Sanger 法):和放射性同位素标记测序法不同以荧光荧光颜色为标记信 号,每种 ddNTP 各有 1 种代表颜色代表颜色; 整个反应在一个试管中进行; 新合成的终止单链通 过荧光监测仪时,可以光信号读出末端核苷酸并由电脑记录. 7. 化学法测序(Maxam 法):分别修饰分别降解; 试剂含有毒性; 链终止法更易于自动 化. 8毛细管电泳:取代聚丙烯酰胺凝胶电泳,有 96 个泳道,可同时进行 96 次测序,每轮不 到 2 小时,一天近千次反应 9. 几种不同生物基因组的测序:1) 大肠杆菌大肠杆菌基因组测序-图位法 2) 流感嗜血杆菌流感嗜血杆菌基因 组测序-鸟枪法 3) 果蝇果蝇基因组测序-鸟枪法 4) 人类人类基因组测序-图位法和鸟枪法(鸟枪 法局限:无法测到重复出现的 DNA 片段)5) 拟南芥拟南芥基因组测序图位法 6) 水稻水稻基因组 测序-图位法和鸟枪法. 10. 流感嗜血杆菌基因鸟枪法测序无需任何关于遗传图及物理图的信息。 11. 用于测序的流感嗜血杆菌基因组文库构建了两套两套基因组文库,原因原因是:1) 1.6-2 kb 大小插入子基因组文库. 2 kb 大小插入子可减少扩增时的变异率变异率. 此外, 2 kb 大小降低了 克隆片段含有完整基因完整基因的可能性, 有些完整基因的表达产物对宿主菌是有害有害的. 2) 15-20 kb 大小插入子文库, 用于支架搭建支架搭建. 上述两套基因组文库的克隆测序均为两端测序两端测序. 12. 间隙:测序后将 DNA 顺序进行组装,存在不连续的区段。 13. 间隙的类型(名解):1) 顺序间隙顺序间隙:因覆盖率的原因覆盖率的原因而留下的未能测序的顺序,仍存 在于克隆文库中, 这类间隙称为顺序间隙。 2) 物理间隙物理间隙:因克隆载体自身的限制(库中) 或 DNA 顺序特殊的组成等原因造成某些顺序丢失顺序丢失或未能克隆未能克隆, 这类间隙称为物理间隙。 14. 流感嗜血杆菌基因组测序结果(看看即可):1) 两端测序的结果称为读序读序(read), 每个 读序长约 400bp. 2) 在 DNA 顺序组装前,由自动测序仪给出的每个读序都必须经 PhredII 软 件处理, 以确定给出的顺序质量与可靠性.这一步为顺序认可顺序认可 (calling for). 3) 流感嗜血杆菌 基因组测序共组装了 24304 个片段,建立了 140 个重叠群重叠群(contig).根据某些克隆跨越不同的 contig, 再合并为 42 个支架支架(scaffold). 4) 整个组装的基因组顺序存在 42 个物理间隙物理间隙, 98 个 顺序间隙顺序间隙.基因组全长 1830137bp(1.8 Mb). 15. 基因组顺序组装组装的概念定义(名解):1) BAC 末端顺序末端顺序(BAC-end sequence):一个 BAC 克隆插入片段两端两端的已测序的顺序,不包括内部顺序. 可用于确定 BAC 的排列方向以 及重叠群(contig)在支架(scaffold)中的排列方向. 2) 重叠群重叠群(contig):一群相互重叠相互重叠的克隆或 DNA 顺序,可以是草图顺序或精确顺序(finished), 包括连续的(内部无无间隙)或不连续的(内部 含含间隙)DNA 顺序. 3) 草图顺序草图顺序(draft sequence):人类基因组测序计划定义为经 Phred Q20 软件认可覆盖测序克隆片段 3-4 倍倍的 DNA 顺序. 含含间隙或无或无间隙, 排列方向方向和位置未定位置未定. 4) 精确顺序精确顺序(finished sequence):顺序差错率差错率(错误碱基数)低于低于 0.01%的 DNA 序列, 排列方向方向 确定确定,内部不含间隙不含间隙, 一般测序覆盖率在 8-10 个当量. 5) 支架支架(scaffold):一组已锚定已锚定在染色 体上的重叠群, 内部含含间隙或不含或不含间隙. 16. 果蝇基因组测序:第一个采取鸟枪法完成基因组测序的真核生物,基因组总长 180Mb。 17. 鸟枪法顺序组装流程图(看看即可):1) 由自动测序仪记录的测序顺序测序顺序经 Phred Q20 软件判断采用. 2) 筛查过滤重复顺序筛查过滤重复顺序: 如 rRNA 基因, 转座子等。 3) 重叠顺序组装重叠顺序组装: 两段 顺序重叠的认可标准为,至少 40bp 的重叠,差异率小于 6%. 4) Unitigger(重叠单元重叠单元)建立建立: 一组 彼此重叠的 DNA 顺序,其中不存在争议的或不确定的重叠关系,为独立的重叠群. 5) 支架支架 (scaffold)搭建搭建: 由一组 Unitigger 相互叠合以及由 BAC 克隆末端顺序指认彼此相邻的重叠 群,内部可能有间隙. 18. 定位克隆(即图位克隆,见前):首先找到与靶基因连锁连锁的分子标记标记,然后构建基因基因 组文库组文库。通过与靶基因连锁的分子标记筛选阳性克隆筛选阳性克隆,再根据克隆插入子两端的两端的 DNA 顺顺 序序查找与之连接的克隆建立重叠群建立重叠群,直到覆盖整个靶基因覆盖整个靶基因座位(染色体步移) 。 17. 线虫基因组测序策略:图位法 18. 关于基因组测序测序顺序的概念(名解):草图顺序草图顺序(前有): 1) 达到普通质量普通质量但尚尚 未完成未完成的基因组 DNA 顺序, 其精确度高于 90%.所处染色体位置已知位置已知,一般长度约 10kb. 2) 草图顺序可分为 3 个等级: Phase 0: 测序覆盖顺序一次一次的 DNA 序列; Phase 1: 测序覆盖 顺序 4-10 次次的 BAC 克隆, BAC 及内部片段的位置和排列方向未定未定. Phase 2: 测序覆盖顺序 4-10 次次的 BAC 克隆, BAC 及内部片段的位置和排列方向已定已定. 完成顺序完成顺序:1) 完成顺序系 指已测序已测序的, 每 10000 个碱基中出现一个差错差错, 且内部不存在间隙间隙的 DNA 顺序. 2) 完成顺 序也称为 Phase 3 期顺序. 19. 玉米基因组如何测序:1) 玉米基因组大小为 2500 Mb(2.5 x 10 ), 约 80% DNA 顺序由 逆转座子逆转座子组成. 2) 虽然利用 EST(expressed sequence tag)可从基因组中抽提出基因组顺序,但 因表达丰度过低或组织专一性表达的原因, ESTs 库会丢失 50%的基因成员. 3) 绝大多数逆 转座子和非基因编码区都被甲基化甲基化, 而 95%的基因未甲基化未甲基化. 因此采用大肠杆菌 McriA 和 McriB 系统构建玉米基因组文库, 用以富集基因顺序. 20. 玉米基因组甲基化过滤甲基化过滤测序法:1) 大肠杆菌 McriA 和 McriB 系统可以破坏破坏入侵的含有 胞嘧啶甲基化胞嘧啶甲基化的外源 DNA, 动物和植物 DNA 对这一系统也很敏感. 2) 用甲基化敏感甲基化敏感的限 制酶切割玉米基因组 DNA, 将克隆载体转化大肠杆菌 McriA 和 McriB 系统菌系,凡是含有 胞嘧啶甲基化的克隆均被淘汰淘汰, 使基因富集富集 7 倍倍. 3) 采用甲基化过滤法可将玉米基因组中 93%的甲基化顺序除去.经过滤后有 24%的顺序与基因匹配,而未过滤的仅 1.4%与基因匹配. 21. 基因组序列诠释:1) 基因注释注释 2) 基因功能预测预测 3) 基因功能检测检测 4) 功能基因组研研 究究 22. 真核生物基因的一般结构:外显子和内含子。 23. 真核生物基因的组成特征:1) 外显子的组成 2) 内含子的组成 3) 碱基的分布规律 24. 内含子的组成特点:1) 内含子具有前体前体 mRNA 加工的特征顺序。 2) 内含子含有高 比例的三种读框的终止密码终止密码。 25. 外显子的组成特点:1) CpG 岛岛:脊椎动物 2) 摇摆摇摆密码子的使用频率或密码子偏爱偏爱 3) 5和 3非翻译区(UTR)碱基比率, 水稻基因 5的高高 GC 比比 4) 不含不含或含有较少较少的终止密 码。 26.密码子偏爱现象:不同生物表达同种氨基酸的密码子的使用频率不同。 27.同源查询DNA 顺序和氨基酸顺序 28. 同源性,一致性和相似性:1) 同源性同源性(homology):基因系指起源于同一祖先同一祖先但顺序已顺序已 经发生变异经发生变异的基因成员, 分布在不同物种间的同源基因又称直系基因直系基因(orthologous gene). 同 一物种的同源基因则称水平基因水平基因(paralogous gene), 水平基因由重复后趋异产生. 2) 基因同 源性只有只有“是是”和和“非非”的区别, 无所谓百分比. 3) 一致性一致性(identity):系指同源同源 DNA 顺序 的同一碱基位置同一碱基位置的相同的碱基成员, 或者蛋白质的同一氨基酸位置同一氨基酸位置的相同的氨基酸成员, 可可 用百分比用百分比表示. 4) 相似性相似性(similarity):系指同源蛋白质同源蛋白质的氨基酸顺序中一致性氨基酸一致性氨基酸和可取可取 代氨基酸代氨基酸所占的比例比例. 可取代氨基酸可取代氨基酸系指具有相同性质具有相同性质如极性氨基酸或非极性氨基酸的成 员, 它们之间的代换不影响不影响蛋白质(或酶)的生物学功能生物学功能.(注意区别一致性和相似性) 29. 基因注释的方法:1.目前基因注释的方法主要依赖于生物信息学方面的分析结论,它们 包括以下自动注释自动注释内容: 1) ab inition 软件的预测, 依据基因结构的特点. 2) 同源性比较 3) 基序(motif)或功能域(domain)分析预测基因功能. 2. 基因功能的分类主要采用 ONTOLOGY 标准. 3. 人工注释人工注释系指人为检测评价程序自动注释的结果并根据其它数据进行分析与校正. 4. 实验注释实验注释系根据实验结果进行注释. 基因功能注释与调控顺序注释仍处于起始阶段. 30. 基因注释标准人类:Known gene: 与人类人类已知 cDNA 和蛋白质顺序同源的基因. Novel gene: 与脊椎动物脊椎动物 cDNA 或其它物种蛋白质同源的基因. Novel transcripts: 与 novel 基因相似,但缺少明确的 ORF. Putative gene: 有同源 EST 支持, 但缺少 cDNA 或 ORF. Predicted gene: 数据库中至少有一个外显子支持, 但缺少 cDNA 或明确的 ORF. Pseudogene(假基因假基因): 与已知蛋白质已知蛋白质有 50%的同源性,但 cDNA 残缺,在其它位点存在正常的 同源基因的顺序. 31. 水稻注释基因类群的划分标准(3 种): Homology(同源的同源的):与某一蛋白质氨基酸顺序 完全一致或相当一致的基因,有两种水平:一致的命名(same name);可能的(putative protein)或 类似的(-like protein)命名. Unknown(未知的未知的): 具有全长 cDNA 或 EST(覆盖几乎整个基因范 围)支持但没有任何同源蛋白质记录的基因. hypothetical (假定的假定的):由一个或几个注释软件认 可的蛋白质,但缺少 cDNA 或 EST 支持的基因. 32. 人类基因总数的预测有三种方法: cDNA 和 ESTs 顺序 机算机注释 比较基因组 学(保守的 ORF)。 33. 几种模式生物注释的基因总数:大肠杆菌(E.coli):4800 酵母(yeast): 6200 线虫(nematode): 19000 果蝇(fly): 13600 拟南芥(Arabidopsis): 25000 水稻(rice): 60000 玉米(maize):59000 (估计数) 老鼠(mouse): 30000。 34. 功能域注释:1) 任何基因编码的蛋白质都由一些在高级结构水平高级结构水平具有特征性的功能域功能域 组成, 如信号肽, 受体区, 激酶区, DNA 或 RNA 结合域等. 2) 功能域具有很强的保守性, 关 键的氨基酸组成及其排列位置是相当衡定的,是鉴定功能域的主要标识鉴定功能域的主要标识. 3) 功能域是目前确 定基因功能的主要依据主要依据之一. 4) 已由许多专门的功能域注释软件注释软件,可用于基因组顺序的注释. 35. 什么是功能域 (domain)?定义 1:蛋白质具有独特的三级结构和特有功能的区域。定 义 2:具有的独特功能的蛋白质氨基酸序列的不连续的部分。定义 3:蛋白质具有三级结构 的部分,在更大的蛋白质中每个功能域通过短的可弯曲的多肽片段与其他功能域链接。 36. 真核生物核基因组:分子生物学的研究从单个的基因转移到整体的基因组单个的基因转移到整体的基因组活性研究。 基因组主要的部分以染色体形式存在于细胞核中,较少的部分位于线粒体中,植物细胞还 有叶绿体,也且有独立的基因组。不同真核生物核基因组均由一定数目的染色体组成,单 倍体细胞所含有的全套染色体称为 染色体组染色体组。 37. 染色体结构:染色体结构部件 染色体带型 人类染色体区带(带型)命名:人 类染色体带型最早确定的命名方式是从着丝粒向两侧按数字编号, 短臂以 p 代表(p=petit),长 臂以 q 代表。 38. 核型(Karyotype):又称染色体组型,是指用显微镜照像或描绘的方法得到的单个细 胞染色体的系统排列。由体细胞中全套染色体按形态特征形态特征和大小顺序大小顺序排列构成,并依次配 对、分组。代表的是该个体一切细胞的染色体组成。有丝分裂中期染色体的形态较典型, 所以一般分析中期染色体中期染色体。主要观察染色体的长短、着丝点的位置,臂的长短、有无随体, 其中以着丝点的位置最为重要以着丝点的位置最为重要。 39. 染色体核型分析(Karyotyping):是指在显微镜下对个体细胞染色体的大小大小,形状形状,数目数目 进行检测的一种方法.根据染色体分带技术可以检测到样品细胞的染色体结构结构是否正常,是否 发生了染色体数目的变化,结构的重排,区段缺失或重复。 40. 基因组的结构成分:1) SAR 和 MAR 2) CpG 岛岛 3) 等高线等高线 4) 富基因区 5)“沙漠区” 。 41. SAR(骨架附着区,Scaffold attachment region):与染色体骨架蛋白染色体骨架蛋白结合的染色体 DNA 顺序. 42. MAR(基质附着区,matrix attachment region):与细胞核基质蛋白细胞核基质蛋白结合的染色体 DNA 顺序. 43. MAR 和 SAR 的特征(区别):1) 环突的 DNA 基部与细胞核基质紧密结合, 将染色体 DNA 分成相对独立的结构区域. 2) 与细胞核基质结合的 DNA 顺序(基质附着区,MAR)含有 较高比例的较高比例的 AT, 约占总 DNA 的 10%. 3) 拓扑酶 II 可与 MAR 结合, 因此推测 MAR 成分与 DNA 复制有关. 4) MAR 或 SAR 之间的距离平均为 30 kb, 染色体 DNA 环突长约 25-600 kb, 因此并非所有 MAR 或 SAR 均与基质或骨架结合. 44. SAR 和 MAR 的应用:由于发现许多功能基因的两侧含有 SAR 或 MAR 的结构,并证 实 SAR 和 MAR(作用)具有阻止异染色质位置效应和隔离相邻基因彼此干扰的功能具有阻止异染色质位置效应和隔离相邻基因彼此干扰的功能,因 此为了提高转基因的表达水平提高转基因的表达水平, 在构建表达载体时可在基因两侧安装 SAR 或 MAR 顺序, 以减少转基因沉默效应减少转基因沉默效应(防止被干扰) 。 45. 什么是 CpG 岛?满足 CpG 岛的条件为: 1) 连续连续 200 bp 的 DNA 顺序(已修改为 500 bp); 2)C+G 含量含量大于 50%(已修改为 55%); 3)观测观测到的 CpG 双碱基数目与预期预期的数目之比之比 大于 0.6(已修改为 0.65). 46. CpG 岛的一般特点:1) 主要在脊椎动物脊椎动物中发现,其它种属基因组中也有 CpG 岛, 但特征 不明显. 2) 绝大多数 CpG 岛中很少出现胞嘧啶甲基化很少出现胞嘧啶甲基化, 因此被认为是基因转录活跃区. 3) CpG 岛主要分布在基因的启动子区启动子区和第一个外显子区第一个外显子区. 4) 绝大多数管家基因管家基因(housekeeping gene) 含有 CpG 岛, 是寻找基因的一个指标指标. 47.脊椎动物中 CpG 岛的分布有如下特点:1)主要分布在基因的 5端和第 1 个外显子区. 2)人类中 40%的管家基因的 5端均含 CpG 岛. 3)双碱基-CpG-具回文结构,是甲基化酶 作用的位点,可在回文对称的两个胞嘧啶 5 位碳原子上进行甲基化.CpG 岛中-CpG-双碱基均 无甲基化. 48. 为何会产生 CpG 岛? 1) 由于细胞内胞嘧啶甲基化胞嘧啶甲基化与脱氨基脱氨基事件常常发生, 导致复制时 的 CA 错配错配.在下一轮复制时原来的胞嘧啶(C)位置由胸腺嘧啶(T)取代, 即发生碱基代换. 因此基因组 DNA 顺序进化的总趋势是进化的总趋势是 A/T 比例增加比例增加. 2) 管家基因对生物的存活极其重要, 启动子区启动子区是基因调控的主要成分, 因此很少发生可遗传的 CA 的突变, 保留了较平均值更平均值更 高的高的 G/C 比比. 49. 植物基因组中的 CpG 岛:1) 植物基因组,主要是小型基因组(水稻和拟南芥水稻和拟南芥)含有类似脊 椎动物基因组中的 CpG 岛. 2) 水稻和拟南芥 CpG 岛的分布密度分别为 4.7 kb 和 4.0 kb. 3) 水稻和拟南芥 CpG 岛的分布覆盖了整个基因覆盖了整个基因,并非如脊椎动物那样局限于基因 5端. 4) 植物除-CpG-可被甲基化外, -CpNpG-回文结构的胞嘧啶也可甲基化. 5) 植物中-CpG-在 CpG 岛中的比例在 75-80%, 与脊椎动物类似, 单子叶高于双子叶单子叶高于双子叶. 50. 基因组顺序组成的等高线(isochore)特点:1) 等高线等高线(isochore):系指基因组中具有较较 均一均一的相似比例碱基相似比例碱基组成的连续的连续的 DNA 顺序. 2) 脊椎动物基因组中等高线 DNA 顺序具有 镶嵌分布镶嵌分布的特征. 3) 高高 GC 比例区总是分布在基因密集区基因密集区或常染色质区, 高高 AT 比例区大多 数分布在异染色质区或贫基因区贫基因区. 4) 梯度密度离心(Ag+的 Cs2SO4) 可将不同碱基比例不同碱基比例的具 有均一性均一性组成的 DNA 顺序分离。 51. 基因组的顺序组成:1)编码编码顺序 2) 非编码非编码顺序 3) 重复重复顺序 4) 单一单一顺序 52. 染色体结构与交换重组频率:1) 短臂短臂交换率大于长臂 2) 近端粒区近端粒区交换率大于内部 区域 3) 富基因区富基因区大于贫基因区 4) 存在重组热点重组热点 5) 女性女性染色体交换率大于男性 6) 染色 体交换的位置大多分布在启动子区启动子区 53. 基因组的基因构成:1) 蛋白质编码基因 2) 非编码 RNA 基因:几乎所有 RNA 编码基 因都是多拷贝。 54. 动物种属专一性基因非常之少:1) 老鼠基因组注释结果揭示,啮齿类基因中只有 1%为 种属专一性基因. 2) 原来以果蝇作为参照, 认为在脊椎动物中存在许多脊椎动物种属的基 因, 现在在珊瑚虫基因组中已找到许多曾被认为是脊椎动物种属专一性的基因. 因此真正属 于脊椎动物的基因数(专一性)比预期的少很多少很多. 55. 非编码 RNA 基因包括:rRNA 基因 tRNA 基因 snRNA 基因: 小分子细胞核细胞核 RNA 基因,涉及前体前体 mRNA 剪接剪接 snoRNA 基因: 与 rRNA 剪接和修饰剪接和修饰有关 scRNA 基因: 小分子细胞质细胞质 RNA 基因 7S RNA: 与核糖体转移到内质网核糖体转移到内质网上有关 miRNA: 干干 扰基因表达扰基因表达, X 染色体失活。 56. 人类基因组 RNA 编码基因(非编码 RNA 基因):1) rRNA(18S,5.8S,28S 和 5S ) 2) tRNA 基因共 48 种,可解读 61 个氨基酸密码 3) 10 种 snRNA: U1,U2,U4,U4atac,U5,U6,U6atac,U7,U11 和 U12 4) 7SL RNA,端粒酶端粒酶 RNA,7SK RNA,Xist RNA 等 5) 真核生物 rRNA 在合成之后要进行广泛的修饰,主要 由小分子核仁 RNA (small nucleolar RNA,snoRNA)指令修饰的位置。 人类基因组草图顺序中发现 69 个 C/D 盒 snoRNA 基因,15 个 H/ACA snoRNA 基因。 5) miRNA(生物学功能): 参与广泛的个体发育与基因调控个体发育与基因调控, miRNA 来自 mRNA 前体, 但不 编码蛋白质. 57. 如何寻找(得到)miRNA 基因:1) 突变体突变体筛选与基因基因克隆 2) 同源基因同源基因顺序搜寻 3) 茎环茎环顺序的分析 4) RNA 结合蛋白如细菌中的 RNA 伴侣蛋白免疫共沉淀免疫共沉淀分离小分子 RNA 5) 小分子 miRNA 的聚丙酰胺凝胶电泳分离聚丙酰胺凝胶电泳分离。 58. 几种真核类生物转录因子数目转录因子数目比较:拟南芥转录因子基因的数目(1500)远高于线虫 (500)与果蝇(700) ,略底于人类(2000) 。 从结构的复杂性观测,拟南芥应比果蝇简单, 为何前者的转录因子数量多于后者,这与植物具有复杂的次生代谢产物有关为何前者的转录因子数量多于后者,这与植物具有复杂的次生代谢产物有关。由于不能通 过运动主动躲避环境的压力和侵害,植物只能发展丰富的次生代谢产物来适应所遭遇的生 存环境。植物次生代谢产物的种类约 50 000 种,基因组中约基因组中约 25% 的基因涉及次生代谢的基因涉及次生代谢, 其中包括相当数量的转录因子包括相当数量的转录因子。 59. 水稻基因组基因总数(含大量局部重复基因):1) 水稻基因组基因的确切数目尚未确 定. 2) 注释的水稻基因组基因总数(TIGR)为 56 674 个. 3) 经实验确证的水稻全长 cDNA 为 28 467 个,其中可能编码蛋白质的成员约 21 596(已进行功能归类). 4) 水稻基因组的转录 单元约在 19 000- 20 500 之间,许多基因存在可变剪接. 60. 细胞器基因的转移与进化:1) 细胞器基因细胞器基因转移到细胞核基因组细胞核基因组中是一个至今仍在持续 发生的现象. 2) 细胞器基因转移到细胞核之后,必需获得一段转移信号肽的顺序转移信号肽的顺序才能使其编 码的蛋白质进入线粒体. 3) 在这一过程中会发生两种事件:由于未能获得转移肽顺序由于未能获得转移肽顺序, 细胞细胞 核中来自线粒体编码的基因最终被丢失或突变核中来自线粒体编码的基因最终被丢失或突变; 当细胞核中线粒体基因获得转移肽顺序后当细胞核中线粒体基因获得转移肽顺序后, 留在线粒体中的拷贝就失去存在的意义留在线粒体中的拷贝就失去存在的意义, 将发生丢失或突变成为假基因将发生丢失或突变成为假基因. 61. 高等植物线粒体基因组线粒体基因组的结构特点:1) 结构非均一性结构非均一性: 线性和环状 DNA 共存. 2) 拷贝非均一性拷贝非均一性: 同细胞不同亚基因组 DNA 的拷贝数并不相同不相同. 3) 不同种属之间线粒体基因基因 组大小组大小变化很大, 在 1202500 kb 之间. 4) 动态变化动态变化: 不同发育时期,每个细胞线粒体基因 组的拷贝数拷贝数不是恒定的. 5) 分子内重组分子内重组: 高等植物线粒体基因组中含有大量短序列重复顺短序列重复顺 序序, 它们之间的重组导致大量的 DNA 顺序重排, 是 Mt DNA 频繁突变频繁突变的主要原因. 62. 高等植物叶绿体基因组叶绿体基因组特点:1) 结构紧凑结构紧凑, 基因之间排列紧密, 很少非编码顺序. 2) 不同种属之间叶绿体基因组大小比较恒定大小比较恒定, 约在 120 kb 左右. 3) 动态变化动态变化: 不同发育时期, 每个细胞叶绿体基因组的拷贝数拷贝数是不衡定的. 4) 有两段很长的反向重复顺序反向重复顺序, 这一结构可 有效地阻止阻止叶绿体环状 DNA 的分子内重组分子内重组, 这是叶绿体基因组很少发生重排的主要原因. 第四章 染色质结构与基因表达 1. 表观遗传学:研究在不改变不改变 DNA 顺序顺序的情况下基因表达出现可遗传变化表达出现可遗传变化的学科. 这种 表达模式的改变可通过有丝分裂和减数分裂传递给子代传递给子代. 表观遗传学是功能基因组学功能基因组学研究 的重要领域, 是基因表达调控基因表达调控的重要方式之一. 2. 表观遗传(epigenetic) 包括以下内容: 1) DNA 的甲基化的甲基化 2) 位置效应位置效应 3) 核小体和组蛋白核小体和组蛋白 的修饰的修饰(乙酰基化和甲基化) 4) RNAi (siRNA 和 miRNA) 5) 染色质的动态异染色质化动态异染色质化(X- 染色体的失活) 6) 基因组印记基因组印记(genomic imprinting) 7) 等位基因的副突变及同源抑制副突变及同源抑制, 颠换效应。颠换效应。 3. 位置效应:位置效应是指由于基因基因变换了在染色体上的位置染色体上的位置而引起表现型改变表现型改变的现象。 位置效应表明表明基因的功能功能以及基因对生物表现型表现型的影响可以在不改变遗传物质不改变遗传物质本身的情况 下仅仅由于遗传物质在染色体上的位置差别位置差别而发生变化。位置效应实际实际上反映了基因组不 同区域的特定的染色质结构特定的染色质结构。 (如:-球蛋白质基因座位控制区由增强子活化) 4. 花斑型位置效应:当某一基因由于染色体重排重排从原来的常染色质区常染色质区移到异染色质区附近异染色质区附近, 因异染色质的扩散效应扩散效应, 造成基因表达的改变. 这种抑制效应抑制效应的差别使基因表达受抑程度受抑程度不 同, 由此产生嵌合嵌合. 5. 副突变 (paramutation):最初在玉米中发现的在杂合子杂合子中某一基因影响同一座位上另一 等位基因等位基因的表型表型. 副突变在转基因表现型中也已发现, 称为同源抑制同源抑制. 6. 绝缘子(insulator):这种可以阻止邻近位置阻止邻近位置激活或失活效应效应的顺序现在称之为绝缘子。 (染色质位置阻隔效应:使绝缘子邻近的基因互不干扰) 7. 绝缘子的作用(可阻止相邻基因之间增强子相邻基因之间增强子的彼此干扰):1) 真核生物增强子增强子具有双 向作用, 超长距离功能, 从而带来位置相邻基因之间的彼此干扰问题. 2) 有些基因位于异染异染 色质色质邻近, 会受到抑制效应的干扰.绝缘子可以阻止上述因位置原因产生的对基因表达的抑对基因表达的抑 制制. 8. 绝缘子的定向控制(问答:为什么绝缘子的效应具有方向性?即绝缘子插入到转座子 不同的位置,会产生什么不同的效应?):1) 如果插入位置在启动子的 5方向,绝缘子 将影响上游增强子元件的作用。 2) 如果插入位置在启动子的 3方向,只影响下游增强 子元件的功能。 3) 如果插入位置不在增强子与启动子之间,绝缘子对增强子无阻隔效应。 9. 高等生物基因组普遍存在甲基化:1)DNA 分子的化学修饰主要是甲基化,脊椎动物脊椎动物基 因组中约 60-80%双核苷酸 CpG 的胞嘧啶胞嘧啶(C)被甲基化。被子植物被子植物基因组中,甲基化位 置主要出现在 CpG 和 CpN

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论