医学课件人类基因组_第1页
医学课件人类基因组_第2页
医学课件人类基因组_第3页
医学课件人类基因组_第4页
医学课件人类基因组_第5页
已阅读5页,还剩134页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 七、人类基因组 (一)人类基因组计划 (二) DNA多态性 (三) DNA多态性与个性化医 疗 (四)疾病相关基因的定位与 克隆 (五)疾病诊断、防治 (六)人类基因组与法律、社 会伦理 2 什么是基因组? 某种生物所有遗传信息的总和,包括编码 序列,调控序列和其它所有功能未知的 序列 (一)人类基因组计划 3 人类基因组特点: 1)人类基因组单倍体约含有 3109、 30亿个碱基对 。 2) 结构松弛 ;基因组中大约只有 2%-5%为编码序列 ,约含 3万多个基因,近 1/3为多拷贝。 单拷贝基因多数只在分化细胞中翻译为专 一蛋白质,如胰岛素基因在胰岛 细胞表达。因 为这些基因只在极少数细胞甚至只在生物发育 的某个阶段才表达,所以它们在基因组上所占 的份额只需单拷贝即能满足生理需要。 4 多拷贝基因是一些与生物的基本功能密切相关 的基因,如组蛋白基因、 tRNA基因等,只有 多拷贝才能满足生理需要。 3) 含有大量重复顺序。 4) 由线性 DNA与蛋白质组成染色体结构。 5 认识人类本身的科学计划 “ 人类基因组计划 ” “人类基因组计划 ”是人 类自然科学史上最伟大 的创举之一!是两个世 纪交替之时,人类历史 上最重大的事件之一。 它的规模可以与 “曼哈 顿原子弹计划 ”、 “阿波 罗 ”登月计划媲美,而 它的意义又远远超出了 这两个计划。 6 什么是人类基因组计划 如果把人类基因组比喻为一本有 10亿单词的百 科全书,这本书可分 23章,每章为一个染色体 。而每一个染色体上,又包含着数千个被称为 基因的 “故事 ”。这些 “故事 ”由一系列 3字母单词 组成,其中每个单词是 4个基本化学 “字母 ”的 任意排列组合。人类基因组计划,正是要 “读 出 ”这 30亿个化学 “字母 ” 。 7 人类基因组计划是用大撒网的方法,将 人的所有基因一网打尽,即测定人类基 因组的全部 DNA 亿个碱基对的序列 ,发现所有人类基因并搞清其在染色体 上的位置,从而解读所有遗传密码,使 人类第一次在分子水平上全面地认识自 我。 8 计划于年正式启动,这一价值 亿美元的计划的目标是,为亿 个碱基对构成的人类基因组精确测序, 至 2005年完成,从而最终弄清楚每种基 因制造的蛋白质及其作用。 9 “人类基因组计划 ”建立的人类基因组图,可以理 解成 “人体第二张解剖图 ”。 我们知道人体的解剖图告诉了我们人体的构成, 主要器官的位置、结构与功能,了解所有组织与 细胞的特点才有了今天的现代医学。 而人类基因组计划绘成的第二张人体解剖图将成 为疾病的预测、预防、诊断、治疗及个体医学的 参照,将奠定二十一世纪以至于第三个千禧年生 命科学、基础医学与生物产业的基础。 人类基因组计划的意义 10 基因淘金热 -从冰岛透视人类基因 一项鉴定具有重要医药价值的人类基因的研究正在一个未曾预料 的地方进行,这是位于格陵兰岛( Grennland)和斯堪的纳维亚 ( Scandinavian)之间北大西洋中一个称为冰岛( Iceland)的偏 僻岛屿。由于历史和地理隔离的原因,冰岛上 270 000居民为遗传 学研究提供了独一无二的遗传资源。他们是 1 100年前定居在该岛 的海盗的后裔,遗传组成相当均一。这种遗传均一性因发生 2次 遗传瓶颈而进一步强化,当时岛上的居民经历了急剧的人口递减 。 15世纪,由于淋巴腺鼠疫袭击该岛,冰岛人口由 70 000人骤然 降至 25 000人。 17世纪,因 Hekla活火山的三次爆发造成的大火 和由此引起的疾病使全岛人口再次降至 50 000。因此冰岛的人类 基因库较之其他大多数的人口群体更加均一。此外,自 1915年冰 岛的国家健康服务部门即为每个家庭保留着良好的医疗记录。 11 基因淘金热 -从冰岛透视人类基因 1997年,一位哈佛大学的遗传学家 Kari Stefansson意识到冰岛人类 基因库和家庭医疗记录的特殊意义,决定回到他的故乡,宣布成 立一家私人公司,即 deCODE Genetics。该公司的目标是分离和 鉴定人类基因,用于开发新的药物和诊断试剂。这家公司的第一 个成功实验是鉴定出家族性必需震颤( familial essential tremor) 基因 一种与老年人震颤相关基因。此外, deCODE的科学家 在其它人类缺陷疾病方面的研究也获得迅速进展。 由于上述结果, deCODE的遗传学家与瑞士医药巨子 Hoffmann-LaRoche签定了一项 2亿美金的合同,它将给瑞士公司 优先使用来自 deCODE研究开发的任何一种药物或诊断试剂的权 力。此外,该项合同还提到, Hoffmann-LaRoche必需为冰岛居 民无偿提供来自 deCODE研究开发的所有药物,诊断试剂和其它 产品。因此至少在这一情况下,为 deCODE分析研究提供遗传资 料和 DNA样品的人群可从私人公司的研究中获得个人利益。 12 美国 Rockefeller大学的科学家在 1994年发现了 与肥胖有关的基因 Leptin,并转让给美国 Amgen公司,价格是 9000万美元并加上部分未 来收益,总共估计为 1亿美元以上。 FKBP神经免疫因子配体: 1997年 ,Amgen公 司将 FKBP神经免疫因子配体转让给 Guilford公 司,交易额高达 3.92亿美元,是迄今为止单个 基因交易的最高价格。 13 人类基因组的研究历程 1953年, Watson和 Crick提出 DNA的双螺旋结构模型 1972年, Berg等人构建成功第一 个重组 DNA分子; 1977年, Gilbert和 Sanger等人分别 发明了 DNA测序技术。 14 1985 年, 在 美国 加洲 Santa Cruz 由 Robert Sinsheimer 受美国能源部委 托主持 会 议 ,提出了 测 定人基因 组 全 顺 序的 动议 , 由此形成了美 国能源部的 “人类基因组计划 ”草案 。 1986年, 诺贝 尔 奖获 得者 Renato Dulbecco 在 “Science”(科学 )杂志撰 文 “肿瘤研究的转折点 测定人 类基因组序列 ”, 首次提出人 类 基 因 组计 划的 设 想,并建 议组织 国 家 级 和国 际级 的 项 目来 进 行 这 方 面的研究 。 1986年, Leroy Hood等人发明了 第一台 DNA自动测序仪。 15 1987年,人工染色体等载体构 建成功。 1987年,美国能源部开始实施 人类基因组测序计划。 1988年, 国 际 人 类 基因 组织 ( HUGO)成立 。 1988年, Watson担任负责人, 美国国立卫生研究院参与 HGP 。 1990年,美国国会批准正式 HGP,随后 法国、英国、德国 、日本 、中国等陆续启动 HGP 计划。 16 90年代,人类基因组测序 在六个国家合作下全面开 展。 基因组数据成指数增长。 1998年,科学家 Ventor等人 组建 Celera公司,同时开展 人类基因组测序计划,与 HUGO竞争。 2000年 6月,人类基因组草 图宣布绘成。 17 人类基因组计划( HGP)的基本任务可以用 4 张图谱来概括:遗传图谱、物理图谱、序列图谱 、基因图谱。 1、遗传图谱 遗传图谱也称遗传连锁图谱,构建遗传图谱 的基本原理是真核生物遗传过程中会发生减数分 裂,此过程中两条同源染色体要进行交换重组, 重组百分率可以反映出染色体上两点之间相对距 离,称遗传距离,单位为厘摩尔根( cM)。根 据遗传距离 ,可以确定同一染色体上基因间的相 互距离 ,绘制遗传图谱 . 18 I II III AA BB aa bb Aa Bb aa bb Aa Bb aa bb Aa bB aA Bb 左图 3代家系中,第 3 代 4同胞中, 1和 2没发 生重组, 3和 4发生重 组。 19 遗传标记 在基因定 位时的作 用。 不同基因 带有遗传标记的染色体 根据遗传标记,基因在染色体上的位置被 确定。 20 M为遗传标记位点, D为致病位点,两个位点紧密连锁,大写表示为野 生型,小写表示为突变型 21 2、物理图谱 基因组太大 ,必需分散测序 如果将每个碱基比作一个英文字母,以每 10 cm书写 60个字母计算,人类基因组 30亿个碱基其 长度可达 5000千米,相当于从北美洲的蒙特利尔 横跨大西洋到达伦敦,洛杉矶 到达巴拿马。以 上述标准编写书籍,可写成 3000本每册 200万字 的著作。 22 物理图谱的基本原理是将每一条染色体敲碎、分 段克隆,利用重叠的方法将这些克隆头尾重叠相 连,就可以获得横跨和覆盖整条染色体的克隆群 。 物理图以 Mb、 kb、 bp作为图距。 物理图谱的路标: STS(sequence-taged site)序列标 签位点, STS在基因组中只出现一次,可定义重 叠克隆群中某一特定克隆、对重叠克隆群进行排 序。 23 能克隆大片段 DNA载体如 YAC( 10Mb)等的出 现,使克隆群排序变得容易、准确。 特定的大片段 DNA克隆要进行再切割、构建重叠 亚克隆群供测序使用。 24 DNA测序 目前常用的 DNA测序方法为: Sanger法:即双脱氧法,以单链 DNA为模版 ,一个短的 DNA引物和 DNA聚合酶合成一 条互补 DNA链,利用双脱氧核苷酸( ddNTP)插入将会导致链延长反应随机终止 的原理,可以在凝胶电泳上检测到模版不 同位置上的不同碱基。从而读出模版的序 列。 短的 DNA引物,通常十几至几十个核苷酸 长度,单链,称寡核苷酸,可用 DNA合成 仪合成。 25 DNA测序原理示意图 待测序模版引物 四个反应,分别 加入四种 ddNTP 分别终止在不同 的 ddNTP位置上 电泳分开,读 图,解析序列 26 DNA测序原理示意图二 改进的 Sanger法, 用四种荧光 素标记四种 ddNTP,测 序结果直接 被荧光探测 器读出。 测序仪 测序。 27 3、序列图谱 遗传图、物理图都是为绘制序列图而建的,目 前的测序技术还不允许很长链 DNA直接测序。 序列图谱分析基本策略是建立 DNA小片段重叠 群, STS被用作任何两个片段间的重叠区域,使 分别被测的短序列进行正确的拼接。 28 4、基因图谱 在人类基因组中鉴别出占 2%-5%的全部基因。 基因 增强子 组织特异性成分 “CCAAT盒 ” “TATA”盒 “帽子位点 ”转录 起始位点 ATG起始密码子 GT AG GT AG TAA,TGA,TA G终止密码子 AATAAA 多聚腺苷 酸化信号 加 (A)n位点 5 非翻译区 3 非翻译区 29 2003年 4月 15日,在 DNA双螺旋( 1953年 4月 15日发表)发表 50周年之际,美、英、日、徳、 法、中 6个国家政府首脑正式宣布人类基因组序 列图绘制成功,人类基因组计划的所有目标提前 2年实现。 1990-1998年的 8年时间是人类基因组第一阶 段(作图),包括遗传图和物理图。这二张图的 制作使得人类基因组这样一个巨大的 DNA生物大 分子分解成较小的可以操作的部分。 30 1998年后进入第二阶段,即测序阶段。测序 大体上也经历了两个阶段,从 1998年到 2000年 6 月是工作框架图(草图)阶段,其覆盖基因组的 区域达到 90%,在测定的序列中,准确率达到 99%以上。 测序的第二阶段即所谓的完成图,覆盖基因 组 99%,在测定的序列中,准确率达到 99.99%以 上。 所剩 1%为现有技术无法克隆、进行序列分析 部分,如染色体中与有丝分裂有关的称为着丝粒 的区域、端粒的区域以及一些端着丝点的区域, 这些区域基因很少,而重复序列很多,它们肯定 也有重要功能,可能是在染色体的结构、复制等 方面有重要功能,但其编码的基因很少。 31 在人类基因组计划中,中国承担和完成了 1%的任务, 3号染色体短臂约 300Mb的测序任务 。 32 人类基因组计划完成,标志人类已读出人类 生命这部天书,但读出不等于读懂。实际上我们 现在能读懂的还只是其中很小一部分。基因组编 码约 2.5万个基因,一半以上我们还不知其功能 是什么,就是已知功能的那部分,我们也只是知 道其中很小部分。另外个别基因的功能不等于其 在功能网络中的功能。每个基因实际上都有多重 功能,可能我们现在对一些基因赋予的功能只是 其在人类生长发育的一定阶段,或是某个空间位 置( 某一细胞、组织或器官)的功能。 33 基因组计划完成后,接下来要进入的是功能 基因组研究。要知道这些基因是干什么的,其相 互关系,即蛋白产物的相互作用,基因表达的调 控等。 如要真正了解基因组在整体生命系统里的确 切功能,还要进行模式生物的研究。因为要认识 人类基因组,只看人类的 DNA序列,或者只看蛋 白质功能是不够的,人类基因中哪一些基因的结 构决定了我们是人而不是黑猩猩,这就是比较生 物学研究。 34 就与人类疾病的关系而言,功能基因组研究 是最重要的。人类疾病涉及的基因一旦被发现后 ,实际上就是对其功能研究的最好注释。 在疾病相关研究中,单核苷酸多态( SNP) 非常重要。单核苷酸多态性( SNPs)是指不同 个体间在基因水平上的单个核苷酸变异,在人类 基因组中,单核苷酸多态( SNP)很常见,平均 每 300对碱基出现一个 SNP,两个无关个体间大 约有 900万 SNPs。这种 SNP的综合效应可能就造 成了个体间的差异,包括个人的基本特征(身高 、肤色等),其对疾病的易感性、对药物的反应 等。 35 (二) DNA多态性 在一个 (个体、细胞或分子 )群体中,某一遗传 特性若存在若干种类型,则称之为多态性( polymorphism) 。 所谓 DNA的多态性( DNA polymorphism) ,则 是指 DNA水平上的多态性。一般认为 DNA 序 列中某特定位点的变异频率低于 1%的为突变 , 高于 1%则为分子多态性。 36 1、限制性片段长度多态性( RFLP): 同一物种不同个体的 DNA分子,用同一 种限制性内切酶完全酶切后,出现分子 量不同的同源等位基因片段,称为限制 性片段长度多态性。限制性片段长度多 态性是 多态性 DNA标记之一。 37 RFLP 的示意 图 不同的个体的 DNA, 在同一种限制酶作用 下,切出不同大小的 片段,显示出多态性 因为 DNA的多态 性,两个个体的 DNA内切酶位点 是不一致的 38 限制酶 :即限制性内切酶,能识别双链 DNA中 的特定碱基序列,并切割双链 DNA的核酸酶。 常用于重组 DNA技术的是一类限制酶的识别位 点为 回文对称结构 ,它们的结合和切割都在这 一特定的对称结构内。 由于不同的限制酶具有特异性识别和切割特定 DNA序列的能力,我们称之为操作 DNA的手术 刀。 39 有些限制性内切酶切割 DNA后产生 5磷酸突出的末端, 有些则产生 3羟基突出的末端,它们统称为粘性末端酶 ; 还有一些在切割两条链时会产生两端平整 (平末端 )的 DNA分子。 40 41 两种限制性内切酶及其 识别序列 HindIII, 识别六碱基的 回文对称序列 AAGCTT , TTCGAA 并切出两个粘性末端。 (不齐的末端) PvuII, 识别 CAGCTG , GTCGAC 切出一个平末端(平齐 的末端) 42 一个特定限制酶的识别序列在一段特异 DNA中出 现的频率部分地取决于它的长度。如 HindIII识别 TTCGAA这样一个特殊的 6核苷酸序列,在一个 DNA随机片段中可能出现的频率约为 46( 4096) 个核苷酸一次。与此相似,识别 4核苷酸的限制 酶,将会以大约 44( 256)核苷酸的间隔切割 DNA,识别 8核苷酸的限制酶,将会以大约 48( 65000)核苷酸的间隔切割 DNA。实际上,因为 在基因组中某些序列过多或过少地出现,一个特 定限制酶位点的出现频率可能多于或少于预计的 频率。 43 RFLP的特点 ( 1) 处于染色体上的位置固定 ; ( 2)严格遵守孟德尔遗传定律 ; ( 3)同一凝胶电泳可显示不同多态性片段 , 表 现为共显性; ( 4)通常被限制性内切酶检出从而导致 RFLP的 碱基变化本身并不是致病原因,而是一种无功 能后果的中性改变。然而能用来标记特定的基 因跟踪它的遗传。 44 左图是一个典型的甲型血友病家族,在第 IV和第 V代有患病男性。系谱检察发现 III-2、 III-4、 III-5 肯定是杂合子携带者。根据系谱个体 IV-4是携带 者的风险为 50%,她在建立家庭之前想确切知道 这种危险性。通常,人们发现血友病基因携带者 血液中含有大约半量的正常 VIII因子蛋白,因此 有时可利用这一所见来区分纯合的正常妇女和携 带者。但是在正常和携带者之间有很大的重叠, 所以利用蛋白定量的方法有时不能明确区分。这 样的家庭中,确定 IV-4是否是携带者更准确的方 法就是利用 RFLP作为携带突变等位基因的标记 。中图显示 VIII因子基因内一个内含子区域含有 限制性酶 Bcl I多态性的限制图谱。 用位于多态性限制位点两侧的 PCR引物 1和 2扩增 靶区域,用 Bcl I切割扩增后的 DNA,切割后的 DNA片段直接进行凝胶电泳以分析该酶切位点是 否存在。如果存在, 142bp的产物将被切割成为 99bp和 43bp两个片段;如果不存在,将会看到 142bp 的全长片段。所有血友病男性患者都有 142bp片段,说明带有血友病突变基因无 Bcl I酶 切位点。个体 IV-4从她母亲 III-4遗传了 Bcl I等位 基因,因此是血友病携带者。 在 67bp处有一个固定的不明 来源的条带,在本次分析中 可以忽略。 45 在这个例子中讨论了 X连锁隐性遗传病, 这类分析也同样可成功地应用于常染色 体显性和隐性遗传病。 这种基于 PCR技术的分析方法非常快速 ,称为 PCR-RFLP,几小时就能得到结果 ,而且只需要每个个体微量的基因组 DNA。 46 基因体外扩增: PCR 基因扩增是自然状态下,细胞内发生的生理生化 变化。 l985年美国 Cetus公司的 Mullis发明了体外快速扩 增特定 DNA序列的方法,即聚合酶链式反应 (polymerase chain reaction,PCR)。 它是分子生物学在技术上的一次革命。该技术模 拟发生在细胞内的 DNA复制过程,数小时内便可 获得大量拷贝的特定 DNA片段,其步骤简便,结 果可靠,为研究和分析基因提供了一种全新的方 法,在医学、法医、考古学、人类学等许多领域 内获得了广泛的应用。 由于这项工作, Mullis在 l993年获得了诺贝尔化 学奖。 47 1) PCR成分:待扩增的双链 DNA(模板),两 个短的单链 DNA引物(长约 20个碱基,一个与待 扩增 DNA一条链的 5端序列互补,另一个与另一 条链的 5端序列互补, DNA合成仪合成),耐高 温的 TaqDNA聚合酶,四种脱氧核苷酸混合物及 反应缓冲液。 PCR的模板是含有待扩增序列的 DNA或从 mRNA反转录来的 cDNA。 48 2) PCR原理: PCR利用了 DNA复制的一些特点和 DNA双链的热 动力学。 通过加热,使双链 DNA分子接近沸点温度( 94oC)时分离成为两 条单链 DNA; 然后降低温度,使引物分别与待扩增 DNA片段的两条链配对结合 ,称退火,当降到某一温度时,引物分别与待扩增 DNA片段的两 条链配对结合,这一温度称退火温度 Tm, Tm的经验公式: 4X( G+C) +2X( A+T); DNA聚合酶需要一小段双链 DNA来起始合成,引物分别与待扩 增 DNA片段的两条链配对结合,形成 DNA合成的起始点; 提高温度至 Taq DNA聚合酶的最适温度 72oC, Taq DNA聚合酶从 起始点开始,以单链为模板合成新的 DNA互补链;新合成的 DNA链从两个引物端开始,分别延伸并超过另一条链上的另一个 引物位置,因此新合成的 DNA链上也有两个引物结合位点。 49 3) PCR反应过程 包括以下 3个方面: 变性。这是 PCR反应的第一步,即将模板 DNA置于 94 的高 温下,使双链 DNA的双链解开变成单链 DNA; 退火。将反应体系的温度降低至退火温度 Tm ,使得一对引物 能分别与变性后的两条模板链相配对; 延伸。将反应体系温度调整到 Taq DNA聚合酶作用的最适温度 72 ,然后以目的基因为模板,合成新的 DNA链。 如此反复进行约 30个循环左右,即可扩增得到目的 DNA序列。 经过 n个周期循环以后,理论上可获得 2n个双链 DNA分子。 50 引物与模 版配对 延伸得到新的 DNA 第二轮 复制 第三轮 复制 聚合酶链反应示意图 。 目的片段呈指数极扩增 51 PCR反应的温度循环周期 52 4) Taq DNA聚合酶与 PCR 最初, PCR用的是大肠杆菌 E.coli DNA聚合酶,这种酶是热敏感 的,在双链 DNA94oC解链时被破坏,因此每个循环都要用手工重 新加酶,造成操作繁琐、反应低效和费用增加。 后来发现温泉中的细菌 DNA聚合酶能在高温下很好地工作,这个 发现推动了 PCR的发展。 水生嗜热菌( Thermus aquaticus,简称 Taq)生活在 75oC温泉中 ,它的 DNA聚合酶( Taq DNA聚合酶)的最适反应温度是 72oC ,并且在 94oC也相当稳定。 因此, Taq DNA聚合酶只需在反应开始时,加一次就能在整个扩 增循环中保持活性。这样,就可通过编程控制 PCR循环仪的反应 温度和反应时间,使 PCR完全自动化。 53 2、可变数目串联重复序列( VNTR)多态性: VNTR是由一些头尾相连的短 序列以串联方式重复多次形成。这些序列如果有功能现在尚不清楚,但一个 元件中的重复单位数量(即元件的总长度)在同源染色体中经常变化。在这 种情况下,任何限制性酶切割这个串联重复序列的两侧将会产生一个片段, 而其长度反映出 VNTR的大小。因为这个重复序列的总长度在不同染色体之间 变化很大,可能存在很多数量的等位基因,这一特点使这些多态性非常有用 。下图显示了一例 VNTR多态性。探针 1对应于此特殊 VNTR多态性独有的 DNA片段,因此利用 DNA印迹只能检测此单一位点。检测了 3个个体,所有这 三个个体在这个基因座都呈现杂合性。 探针 2与 VNTR多态性本身的串联重复序列配对。因为同样的串联重复序列为 许多散布于基因组中的不同 VNTR多态性,探针 2在 DNA印迹中将从这些众多 多态性中检测到许多带谱。利用探针 2这样的重复性探针检测到的复杂带谱同 时显示出许多多态基因座,因此在两个个体很少一样。这种带谱称 DNA指纹 。 这种 DNA同一性分析在亲子鉴定 和法医学中已经广泛应用。 54 VNTR高度多态,两个非亲缘个体携带相 同的两个等位基因的机率非常低,经常 小于 1%。通过检测 4个或更多这种独立 的多态性,任何两个非亲缘个体相同的 机率非常低,除非是单卵双子。 55 利用单个探针检测大量分散于基因 组内 VNTR多态性的 DNA指纹分析 。每对样品代表卵生儿的 DNA。 B 两个卵生儿和 C两个卵生儿都完全配 对,表明他们都是单卵双生子; A和 D是异卵双生子。异卵双生子之间有 大约一半可变谱带相同,与一级亲 属一样。 56 VNTR多态性和法医学 DNA分析 图左 DNA印迹分析显示独特 DNA探针检测单个 VNTR位点,与前面图中探针 1相似。被害者( V)与嫌疑犯( S)的 DNA显示了不同的谱带。从犯罪现场 采集的物证制备的 DNA与嫌疑犯的 DNA谱带吻合。从各种 VNTR等位基因在 总人群中的频率就可估计出吻合嫌疑人的概率。 通过对许多不同的 VNTR多态性进行相似的分析,这种吻合的概率就会非常 低。图左 DNA印迹分析是同时用了 4个不同的单个位点特异 VNTR探针。提 取的物证与嫌疑犯之间的结果完全吻合。目前的法医学分析通常采用至少四 种独立的、高度多态的 VNTR标记。 57 3、简单序列重复( SSRs)多态性:因为大多数 VNTR的重复区可长达数千 bp ,标准 PCR很难扩增到如此长度。因此 VNTR通常必须用 DNA印迹分析。 简单序列重复( SSRs)多态性,又称微卫星多态性,虽然这类多态性也含有 串联重复序列,但基本的重复单位非常短,通常只有 2、 3、或 4个碱基对(分 别为 2、 3和 4核苷酸重复),是高度多态性 DNA标记,可用 PCR分析,更适合 于大规模 DNA分型。这种 PCR直接分析法也被称为广义上的 DNA指纹图,在 法医学中至少扩增 6个 DNA等位片段。 值得说明的是,在利用 DNA指纹图协助 破案的过程中,简单序列重复 PCR比 VNTR的优越性除了体现在省时、简便 和所需原始样本极少外,还在于有时简 单序列重复 PCR分析法是必须的。这是 因为 VNTR分析一般要求试样中的 DNA 是完整的,不能有断裂发生,否则 DNA 指纹图上的大小不一的片段就不真实了 ,可能使真凶漏网。而现场采取到的样 品由于各种原因,其中的 DNA往往可能 已被部分降解,因而是不完整的,这时 就必须用简单序列重复 PCR分析法。 58 在人类基因组特定位置还存在大量 CA二核苷酸串联重复序列 ,高 度多态 : 父亲 GTCGTACGTGA(CA)10GTACGATACGT 42bp,纯合 母亲 GTCGTACGTGA(CA)12GTACGATACGT 46bp GTCGTACGTGA(CA)9GTACGATACGT 40bp,杂合 儿子 GTCGTACGTGA(CA)10GTACGATACGT 42bp GTCGTACGTGA(CA)9GTACGATACGT 40bp杂合 父亲 42bp 母亲 46、 40bp 儿子 42、40bp 59 4、单核苷酸多态性 单核苷酸多态性( SNP)广泛分布于人类全基 因组,最大限度地代表了不同个体之间的遗传 差异,是研究复杂疾病、药物敏感性及人类进 化的重要标记。 60 在 DNA上位置比较接近的很多 SNPs,会组成单体 型块并作为一个整体遗传。通过少数的几个标记 SNPs,可以识别出不同的单体型块。 61 SNP之间是有关联的,把其中最有代表性的、 每隔一定距离的有代表性的 SNP取出来,做成 的图谱就称为单倍型图谱,这对于将来研究人 类疾病,尤其是多基因疾病非常有用。单基因 病通过定位克隆这条路已经走通,但多基因病 是更为复杂的系统,实际上是相当多的基因组 结构功能发生微小的变化,其协同作用的结果 造成对某些疾病的易感。因为多基因病发病率 高、危险性大,所以是医学遗传学中的重中之 重。 62 1.ATCCTGTACCTACGTGTACAATAGTACTGATCATCTCTATGGG. 2.ATCCTGTTCCTACGTGTACAATAGTA CTGATCATCTCTATGGG. 3.ATCCTGTACCTACGTGTACAATAGTACTGATCAGCTCTATGGG. 1 2 3 SNP1 SNP2 单核苷酸多态性( SNPs) 63 2002年的年的 10月月 28日,在美国华盛顿宣布日,在美国华盛顿宣布 正式启动了正式启动了 HapMap计划。计划。 2003年年 11月月 1日,日, 发布发布 第一次公共数据第一次公共数据 ,公布了可供公众下载的,公布了可供公众下载的 145,554 SNP 位位 点的超过一千三百万的分型数据,以及相点的超过一千三百万的分型数据,以及相 关基因型频率和实验数据。关基因型频率和实验数据。 64 2005年年 10月月 26日,历时日,历时 3年,总投资超过年,总投资超过 1.4亿美元,针对亿美元,针对 100多万个常见多万个常见 SNP位点进行位点进行 了分型检测的人类基因组单体型图在美国宣了分型检测的人类基因组单体型图在美国宣 布绘制完毕。布绘制完毕。 2005年年 3月,完成第一阶段(在月,完成第一阶段(在 270个个体个个体 中对中对 60万个常见的万个常见的 SNP进行基因分型),并开进行基因分型),并开 始第二阶段(在相同的样品中对始第二阶段(在相同的样品中对 225万额外的万额外的 SNP进行基因分型)的工作。进行基因分型)的工作。 65 这个计划有美、英、日、加、中、尼日 利亚 6个国家参与,其中,美国完成 31% ,日本完成 25%,英国完成 24%,加拿大 完成 10%,中国大陆、香港和台湾合作 完成 10%。 66 样本来源 国际 HapMap计划分析祖先来自非洲、亚洲和 欧洲人群的 DNA样品。 科学家共搜集了 270名志愿者的 DNA样本,这 些 DNA样品被转化成细胞系并贮存在非赢利 的 Coriell医学研究所。 67 这些志愿者分别来自 尼日利亚伊巴丹的约鲁巴人 (缩写: YRI) 30组样本,每组包括父母和他们的一个成年孩子(这样的 一组样本被称为一个三体家系) 日本东京的日本人 (缩写: JPT) 45个不相关个体 中国北京的汉族人 (缩写: CHB) 45个不相关个体 CEPH样品(祖居北欧和西欧的美国犹他州居民) (缩写: CHB) 30组三体家系 68 69 HapMap的构建分为三个步骤: ( a)在多个个体的 DNA样品中鉴定单核苷 酸多态性( SNPs); ( b)将群体中频率大于 1%的那些共同遗传 的相邻 SNPs组合成单体型; ( c)在单体型中找出用于识别这些单体型 的标签 SNPs。通过对图中的三个标签 SNPs 进行基因分型,研究者可以确定每个个体拥 有图示的四个单体型中的哪一个。 70 (三) DNA多态性与个性化医疗 在现代医学发展史上,人们大致经历了三次革 命。 第一次医学革命主要是发现和描述疾病,并 试图用现代科学来解释、查明疾病的病因; 第二次医学革命是探明疾病发生的分子机理 ,即采用生物化学、生物物理等一系列新兴 学科知识,从分子水平上揭示疾病的起因, 并由此开发出针对某一类疾患的特效药,我 们今天仍处于这一革命的高峰。 第三次医学革命是 1990年代中期出现的医学 个性化医疗的新趋向, 随着分子生物学,特别是人类基因组研究的不 断深化,人们认识到疾病的发生、发展往往与 患者特定的遗传背景有关。为此,在今后的疾 病诊断和治疗中,医生将更多考虑患者的遗传 背景。 71 研究环境因素对人体健康的影响 疾病 易感性 个体对环境致病因素的易感性有着很大的差 异,因此患病的概率也不同 统计数字表明,中国人患肝癌的比例大大高 于其他种族,即使移居海外已经几代的华人 ,其患肝癌的比例仍明显高于其他民族人群 。反过来,白人中皮肤癌的罹患率相当高, 而中国这一病症的发生率则低到可以忽略不 计。 72 日本是胃癌高发区: Japanese:1.00 Born in Japan:0.72 Born in USA:0.38 US whites:0.17 73 正常人体细胞中有癌基因和抑癌基因。 癌基因 对维持细胞正常生理功能是必需 的。 当癌基因突变激活或抑癌基因突变失活 ,就会引发肿瘤。 74 化学诱变剂和 辐射会损伤 DNA,使癌基因 和抑癌基因发生突变。 细胞中有一部分代谢酶灭活 诱变剂,由 于遗传变异,有的人这 部分代谢酶活性 低,就较易得肿瘤,编码这部分活性低 的代谢酶基因就成为肿瘤易感记基因; 75 相反,有的诱变剂需另 一部分代谢酶活 化,编码这部分活性高的代谢酶基因就 成为肿瘤易感记基因; 细胞中有一系列修复 DNA损伤的酶,编码 活性低的修复酶基因,就成为肿瘤易感 记基因。 76 因此,肿瘤的发生就和许多编码代谢酶 、 DNA损伤修复酶的基因有关,还和环 境化学、物理因素有关,为多基因病。 77 例如对于某种肿瘤,与其发生相关的基 因有许多(代谢酶基因、 DNA损伤修复 基因), SNP也有许多,根据大量的文 献报道,进行综合分析,选取差异显著 的一些 SNP位点进行检测,就可以作出 风险评估。 78 个体对药物的敏感度个体化用药 目前,正在兴起的药物基因组学研究遗传因 素对药物作用的影响和不同基因型个体对药 物反应的差异,从而为临床有针对性地合理 用药,及根据不同基因型群体对药物的反应 来改进药物设计提供了理论依据,促进了个 体化用药的进程。 79 伊立替康( irinotecan)是治疗结直肠癌 的化疗药,由尿苷二磷酸葡萄糖醛酸转 移酶( UGT1A1)代谢。 伊立替康有严重的副作用:白细胞减少 和严重腹泻。 2005年 8月美国 FDA批准第一例通过检测 UGT1A1多态指导伊立替康剂量。 80 UGT1A1野生型在启动子 TATA box 区域 6个 TA重复,变异体 UGT1A1*28 是 7个 TA重复,导致活性降低。 81 硝酸甘油是治疗心绞痛的特效药。线粒 体醛脱氢酶 2( ALDH2)负责 NO的形成 ,而后者是硝酸甘油发挥作用所必需的 。 ALDH2第 12个外显子在中国人中存在 G A多态,导致第 508位氨基酸由谷氨 酸变成赖氨酸,而使 ALDH2失效。 研究表明,在 80个中国病人中,有 21个 对硝酸甘油无效。 82 Gefitinib(吉非替尼), 商品名 : Iressa (易 瑞沙) , 生产公司 : AstraZeneca (阿斯利康 ) 在人类多种上皮细胞源性的肿瘤组织中都存在 EGFR(表皮生长因子受体)的异常激活,使 其正常功能失控,从而引起细胞异常增生和转 移。已知多种实体瘤,如非小细胞肺癌( NSCLC)和头颈癌、结肠癌、乳腺癌等的发生 都与肿瘤组织中 EGFR的异常活化有关。 83 Gefitinib抑制表皮生长因子受体酪氨酸激 酶( EGFR-TK)活性,截断 EGFR生成信 号传递至细胞内,从而遏止细胞的异常 增生和转移,起到抗肿瘤作用。 Gefitinib只对表皮生长因子受体基因突 变肿瘤有效。 84 非小细胞肺癌( NSCLC) 中研究表明: 突变在腺癌中比其它 NSCLC中频率高( 15/70 or 21 vs. 1/49 or 2);在女性中比男性中频 率高( 9/45 or 20 vs. 7/74 or 9);在日本患 者中比美国患者中频率高( 15/58 or 26,腺 癌中 14/41 or 32 vs. 1/61 or 2,腺癌中 1/29 or 3)。在日本女性腺癌患者中基因突变频 率最高( 8/14 or 57)。 85 两年前,西班牙已在临床上试验性推广个性化治疗,采 用的也是基因技术 西班牙妇女玛尔塔和罗莎同时被诊断出患了乳腺癌, 经过治疗病情得到控制。但是医生给她们使用了不同 的药物。 玛尔塔用的药物叫 Trastuzumab, 重组 DNA人单克隆抗 体 。而罗莎使用的是 Gefitinib,一种专门用来治疗顽固 性家族遗传乳腺癌的药物。她们两人患上乳腺癌的病 因完全不同,因而医生针对其各自病情采用了不同的 药物。 对玛尔塔和罗莎来说,医生治愈的不是 “通常 ”的癌症 ,而是属于 “她们 ”自己的癌症。 86 目前已知人类表皮生长因子受体 2( HER 2)是目前认识较为清楚的与乳腺 癌关系密切的人类癌基因,它在乳腺癌 中的高表达往往预示着雌激素受体( ER )阴性、易有淋巴结转移和肿瘤分化差 ,预后不佳。随着对 HER 2研究的深入 ,它已经成为乳腺癌特异性治疗的靶分 子之一。 87 已被 FDA批准的曲妥珠单抗( Trastuzumab)是重组 DNA人单克隆抗体 。曲妥珠单抗选择性作用于 HER 2,具 有高度亲和力,具有高度靶向性,只对 癌细胞起作用,而对正常细胞的杀伤较 小,是当代乳腺癌靶向治疗的代表性药 物。 88 基础研究表明,约有 25 30的乳腺 癌患者 HER 2有基因改变,促使肿瘤细 胞 HER 2增加。曲妥珠单抗可选择性地 与 HER 2牢固结合,抑制癌细胞的增生 ,适用于 HER 2过度表达的乳腺癌患者 。 人类全基因组关联分析 Genome Wide Association Studies (GWAS) 什么是 GWAS? 一种确定遗传与表型 (如血压、体重等 )或 与某种疾病 (或生理状态 )的全基因组范围 的关联性分析研究 快速的扫描被研究人群的全基因组 DNA ,寻找与特定表型或疾病相关的基因差 异 发现新的基因关联,将有助于发展更为 可靠的方法来诊断,预防和治疗疾病 对常见的多基因复杂疾病尤其有效,例 如癌症,糖尿病,心脏病等 GWAS实施的前提 2003年人类全基因组测序完成, 2005年 Hapmap计划使我们得以研究常见疾病的 遗传分布 人类基因组序列和多态性图谱的计算机 化数据库建立 生物技术的进步让基因分型变得快速, 成本也大大降低 GWAS的应用前景 推动医疗行业从现在的普适性治疗向个 性化治疗发展 为健康个人评估特定疾病的患病风险, 为特定遗传背景的人制定个性化的疾病 预防计划 为已经患病的个体选择疗效最好,副作 用最小的治疗方案 GWAS的基本设计 需要两个被研究人群,分别为患病人群 和健康人群,同时获取两个人群的 DNA 样本(常见方法为血样和口腔上皮细胞 ) 从样本中提取出基因组 DNA,然后在自 动化的机器上对不同的基因标记进行分 型,基因标记分很多种,主要是单核苷 酸多态性( SNP) 如果某种基因标记在患病人群中出现频 率显著高于健康人群,即认定它和研究 的疾病 “关联 ” 关于研究人群的不同设计 GWAS的部分现有成果 2005年,三个独立的研究同时发现人类补体因子 H( 一种炎症调控因子)基因上的多态性和一种失明(与 年龄相关的黄斑退行性改变)的强烈关联 一个法国人群的研究 (包括对非肥胖性糖尿病患者 )发现 一种编码胰腺转运锌蛋白的基因剪接本与 II型糖尿病发 病风险的增加有关。三份同期发布的报道在对超过 32 000名参与者的研究中发现了 4个新的与糖尿病相关的 基因变异 ,使我们已知的 II型糖尿病非孟德尔遗传风险 因素达到 10个。这些发现强有力地表明了胰腺 细胞是 这种发病日益增加的根源所在。 研究类风湿性关 节炎的 GWAS 研究包括 1522个患病者 , 1850个健康对照,结 果显示三个基因的多态 性和类风湿性关节炎的 发病风险是显著关联的 ,分别是 PTPN22, MHC, TRAF1-C5 GWAS还存在的局限 假阳性问题,部分鉴定为 “关联 ”的基因 只是与致病基因紧密连锁 出现频率很低的多态性需要非常大的样 本量 目前的高通量基因分型技术还存在误差 研究人群信息不全导致无法研究基因 -环 境的相互作用 评价一个 GWAS是否合理的标 准 GWAS的国际数据库 美国国家生物技术信息中心( NCBI)已 经开始建立网上数据库,收录已经发表 的关联分析研究成果,方便研究人员检 索 /sites/entrez?d b=gap 101 (四)疾病相关基因的定位与克隆 1、功能克隆: 从疾病出发,鉴定功能蛋白质,从 蛋白质再鉴定、克隆致病基因的方法, 称为功能克隆。 102 功能克隆 克隆(致病)基因的 一种策略。 收集所要克隆的基因 的蛋白质产物及其功 能的信息,用以分离 基因,并对基因进行 定位。 性状( 疾病) 蛋白质产 物(生物 学功能) 从氨基酸序列 出发设计 DNA引物,从 文库调取基因 得到基 因序列 染色体定 位 疾病疾病 功能功能 基因基因 103 分析异常基因的产物(蛋白质), 纯化蛋 白质,进行氨基酸序列测定,据此推测可能的核 苷酸序列,合成寡核苷酸探针,然后用探针从 cDNA文库中筛选对应的编码基因。 从细胞中提取 mRNA,建立含有大量 cDNA的 集合体,并将它们连接、克隆到特殊的载体中, 这个 cDNA克隆的集合体就称为 cDNA文库。 104 直到 20世纪 80年代,研究人类医学遗传学的 科学家只能通过仔细分析患者疾病的病理生理学 期望发现易感基因。血红蛋白基因突变引起血红 蛋白病是第一个在分子医学遗传学水平定性的人 类疾病。血红蛋白病特别便于研究,因为疾病的 病理学可以定位于红细胞,相应的血红蛋白可以 通过收集外周血得到。 105 绝大部分分子病、遗传性代谢缺陷(酶)病 如白化病、苯丙酮尿症和 黑尿病 等,都是采取的 这一策略。不幸的是,这种方法仅能用于有限的 、可以直接测定生化缺陷的人类致病基因。 106 2、定位克隆: 到 20世纪 80年代后期,现代分子医学遗传学 强有力的手段,使仅通过图谱位置定位人类疾病 易感基因成为可能,而不必借助任何功能信息。 这种方法称为定位克隆。 疾病染色体定位基因序列 mRNA蛋 白质 /生物学功能 107 定位克隆 又称为 “逆向遗传学 ”, 始于 20世纪 80年代后期 利用遗传连锁或细胞遗 传学定位技术将致病基 因定位于染色体的特定 区带。 定位 :通过连锁分析找 出与目的基因紧密连锁 的遗传标记在染色体上 的位置。 克隆 :从定位的染色体 区段内分离克隆所要的 基因,并进一步研究其 功能。 疾病 遗传标记, 染色体定位 基因 序列 mRNA cDNA 蛋白质产物 生物学功能 基因基因 功能功能 疾病疾病 108 109 定位克隆有两个主要瓶颈,第一是应用细胞 遗传学或连锁分析方法将基因定位于特定的染色 体区域,第二是从该区域内所有可能候选基因中 找出正确的基因。 定位克隆鉴定的第一批基因利用了特定基因 座的染色体畸变。杜氏( Duchenne)肌营养不良 ( DMD)基因的克隆是一个重要的例子。 110 DMD是 X连锁隐性遗传病。经过大量的细胞 遗传学研究发现, DMD患者中大量存在 Xp21区 域的易位和缺失,因此推断 DMD基因最有可能 定位于 Xp21。 两个研究小组分别用两种不同的方法克隆了 DMD基因。 111 DMD患者每个病例

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论