基因组学与蛋白质组学 _第1页
基因组学与蛋白质组学 _第2页
基因组学与蛋白质组学 _第3页
基因组学与蛋白质组学 _第4页
基因组学与蛋白质组学 _第5页
已阅读5页,还剩98页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基因组学与蛋白质组学 Genomics and Proteome 1 基因组 ( Genomics) 指一个生物体、细胞或病毒的全部遗 传物质 2 几个代表物种的基因组大小 3 一、人类基因组计划的启动 1986 年诺贝尔奖获得者 R.Dulbecco( 杜尔贝 科) 提出人类基因组计划 测出人类全套基因组的 DNA 碱基序列( 3 X 109 bp ) 4 1975年,获诺贝尔生理医学奖 5 6 美国政府决定于 1990年正式启动 HGP,预计 用 15年 时间,投入 30亿美元 ,完成 HGP。 由国立卫生研究院和能源部共同组成 “人类基因 组研究所 ” 逐渐地, HGP扩展为多国协作计划。参与者包 括: 英、日、法、德和中国 ( 1993年) 7 二、人类基因组计划的进展状况 ( 1)截至 1998 年 10 月,完成 1.8 X 108bp, 占 计划 的 6 。 ( 2)完成一系列模式生物全基因组测定。 这些 模式生物全基因组 测定的完成有重大理论与现 实意义。 8 ( 3) DNA 测序技术飞速提高 1998.5.9 J.C. Venter 等 宣布,组建商 业公司,投入 3 亿美元, 3 年内完成。 接着又有若干家公司成立, 共投入资金约 几十 亿美元 , 形成 “公 ”“私 ”并进 格局 9 2000.6 完成并公布 人类基因组工作框架图 ( 90%)。 10 二 000年六月二十六日克林顿宣布 人类基因组草图绘制完成 11 美国国家人类基因组研究所所长弗朗西斯 柯林 斯在介绍情况。 12 人类基因组草图基本信息 由 31.65亿 bp组成 含 33.5万基因 与蛋白质合成有关 的基因占 2% 人类基因组 人类蛋白质 61%与果蝇同源 43%与线虫同源 46%与酵母同源 13 2000年 6月公共领域测序计划工作框架图 14 2000 年 12 月美、英等国科学家宣布绘出拟 南芥基因组的完整图谱,这是人类首次全部破译 出一种植物的基因序列。 15 2001 年 2月 16日 人类基因组 “精细图 ”完成, (99%), 16 同时发表论文 美国 Science, Vol. 291, No. 5507 英国 Nature , Vol.409, p.860 17 DAN 测序胶图 18 年月日,人类基因组序列图 亦称 “完成图 ”( 99.99%),提前绘制成功。 19 第一节 基因组学 Genomics 20 一、基因组学 基因组学( Genomics) 阐明基因组的结构、探讨结构与功能的 关系以及基因与基因之间相互作用的科学 。 包括: 结构基因组学 ( structural genomics) 功能基因组学 (functional genomics) 比较基因组学 (comparative genomics) 21 基因组学包括 3个不同的亚领域 结构基因组学 (structural genomics) 功能基因组学 (functional genomics) 比较基因组学 (comparative genomics) 基因组学概念 22 二、结构基因组学 结构基因组( structure genomics) 以生物体全基因组的结构为研究对象, 对其进行分区和标记,使之成为比较容易 操作的小的结构区域,确定染色体基因组 全部 DNA序列、各基因所在的位置以及结 构与功能的关系,为阐明基因功能奠定基 础。 23 (一)结构基因组主要内容 通过基因作图、序列分析及基因鉴定, 建立具有高分辨率的生物 遗传图谱、物理 图谱、转录图谱和序列图谱 。 24 、 遗传图谱( genetic map) 指基因或 DNA标记在染色体上的相对位置与遗传距 离。 cM(基因或 DAN片段在染色体交换过程中分离的频率) 25 多态性 :人的 DNA序列上平均每几百个碱基会出现 一些变异( variation),并按照孟德尔遗传规律 由亲代传给子代,从而在不同个体间表现出不同, 因而被称为多态性( Polymorphism)。 26 第一代多态性 标记 是 RFLP( restriction fragment length polymorphism,限制性片段长度多态性) 27 28 第二代多态性 标记 是短的串联重复序列( short tandem repeats, STR) 包括小卫星 DNA和微卫星 DNA (microsatellite sequence, MS),其多态性主要来自重复序列拷贝数 的变化 29 小卫星 DNA 由 15-65bp的基本单位串联重复而成, 长度一般不超过 20kb。 重复次数(小卫星 DNA区的长度)在人群中是高度变 异的;按照孟德尔的规律遗传 微卫星 DNA/简短串联重复( STR、 STRP或 SSLP) 重复单元 2-8bp,通常重复 10-60次 CTAGCTTATATATATATATATATATATATAAGCTTGC 30 第三代多态性 标记是 单核苷酸的多态性 ( single nucleotide polymorphism, SNP) 31 人类 99 9的基因密码是相同 的,而差异不到 0 1,不同人群 仅有 140万个核苷酸差异。这些差异 是由 “单一核苷酸多样性 ”( SNP)产 生的,它构成了不同个体的遗传基 础。在整个基因组序列中,人与人 之间的变异仅为万分之一,从而说 明人类不同 “种属 ”之间并没有本质 上的区别。 32 遗传图谱的缺陷 v 分别率有限 v 人类只能研究少数减数分裂事件,不能 获得大量子代个体 v 测序要求每个标记的间隔小于 100kb v 实际是 599kb 33 遗传图谱的缺陷 精确性不够 经典遗传学认为,交换是随机发生的 基因组中有些区域是重组热点 倒位、重复等染色体结构变异会限制交 换重组 34 2、物理图 以已知核苷酸序列的 DNA片段(序列标签位点, sequence-tagged site,STS)为 “路标 ”,以碱基 对作为基本测量单位(图距)的基因组图。 35 酵 母 遗 传 图 与 物 理 图 比 较 A 遗传图 B 物理图 36 3、转录图谱 ( transcription map) 以 EST( expressed sequence tag ,表达序列 标签) 为标记,根据转录顺序的位置和距离绘 制的图谱。 EST:通过从:通过从 cDNA文库中随机挑选的克隆进行测序文库中随机挑选的克隆进行测序 所获得的部分所获得的部分 cDNA的的 5或或 3端序列称为表达序列端序列称为表达序列 标签(标签( EST),一般长),一般长 300-500bp左右。左右。 37 4、序列图 (分子水平的物理图)( sequence map) 序列图是指整个人类基因组的核苷酸序列图,也是 最详尽的物理图。 1m 既包括可转录序列,也包括非转录序列,是转录序 列、调节序列和功能未知序列的总和。 38 1. 脉冲场琼脂糖凝胶电泳; 2. 毛细管电泳; 3. 基因芯片技术; 4. 全基因组随即测序 。 (二)结构基因组研究常用的方法 39 CREDIT: JOE SUTLIFF Science, Vol 291: 1221. Fishing in a More Effective Way! 40 基因组测序策略 v有了高密度的基因组图谱,就可以开始全 基因组测序了 v测序的技术飞速发展,现在可以全自动化 v测序的策略有两个: 鸟枪法 克隆重叠群法 41 鸟枪法( shotgun sequencing) 42 鸟枪法的优缺点 v优点: 不需要高密度的图谱 速度快、简单、成本低 v缺点: 拼接组装困难,尤其在重复序列多的区域 v主要用于重复序列少、相对简单的原核生物基 因组 43 克隆重叠群法( clone contig) v 将基因组 DNA切割长度为 0.1Mb 1Mb的 大片段,克隆到 YAC或 BAC载体上 v 然后再进行亚克隆,分别测定单个亚克 隆的序列 v 再装配、连接成连续的 DNA分子。 v 这是一种自上而下( up to down)的测 序策略 v clone-by-clone method 44 两 种 基 因 组 测 序 策 略 45 三、 功能基因组学 v 完成基因组测序,仅仅是基因组计划的 第一步,更重要的工作在于弄清楚: 基因组序列中所包含的全部遗传信息 是什么; 基因组作为一个整体如何行使功能。 v就是对基因组序列进行诠释的过程,也 就是功能基因组学的研究内容。 46 功能基因组学 ( functional genomics) 根据结构基因组学的研究结果,所提供 的基因结构相关信息,采用分子生物学、 生物化学和生物信息学的理论和技术,全 面、系统地研究基因组中所以基因功能的 学科。 47 根据序列分析搜寻基因 v 查找开放阅读框( open reading frame, ORF) v 开放阅读框都有一个起始密码子, ATG,还要有 终止密码子。 v 从 ATG开始,然后向下游寻找终止密码子。 v 起始密码子和终止密码子之间的碱基数目要能够 被 3整除 v 每一条链都有 3种可能的阅读框, 2条连共计有 6 种可能的阅读框 . v 计算机可以很快给出结果。 48 同源查询 v 利用已经存入数据库的基因序列与待查的 基因组序列比对,从中查找可以与之匹配的 碱基序列及其比例,用于界定基因。 v 同源查询可以部分弥补 ORF扫描的不足。 49 同源查询的依据 有亲缘关系的物种,基因组可能存在某 种程度的相似性: v 存在某些完全相同的序列; v ORF的排列相似,如等长的外显子; v ORF指令的氨基酸序列相似; v 模拟的多肽链的高级结构相似,等 。 50 基因功能研究 1、计算机预测基因功能 v 依据仍然是同源性比较。同源基因拥有 一个共同的祖先基因,它们之间有许多 相似的序列。 v 种间同源基因 v 种内同源基因 51 基因功能研究 2、实验确认基因功能 基因克隆 基因敲除 ( knock-out) 基因的超表达 反义 RNA技术 RNAi 转座子插入突变 52 什么是比较基因组学?什么是比较基因组学? 利用生物在 进 化上的 亲缘 关系 ,来比 较 它 们 与人 类 之 间 的相似与相异 ,即比 较 基因 组 学 。 53 54 物种 完成 年份 总长度 /Mp 已完成总长 的百分数 /% 占常染色质 百分数 /Mb 基因数 /Mb 酵母 1996 12 93 100 483 线虫 1998 96 99 100 197 果蝇 2000 116 64 97 117 拟南芥 2000 115 92 100 221 人类第 21染色体 2000 34 75 100 7 人类第 22染色体 1999 34 70 97 16 人类全基因组 (Public Sequence) 2001 2693 84 90 12 人类全基因组 (Celera Sequence) 2001 2654 83 99-93 15 基本完成基本完成 DNA序列分析的真核生物基因组比较序列分析的真核生物基因组比较 55 反义 RNA( antisense RNA)技术 56 小 结 转录组学 蛋白质组学 基因组 基因组学 转录组 蛋白质组 57 基因组 结构 基因组学 功能 基因组学 比较 基因组学 HGP 物理制图 遗传制图 基因组 DNA 序列测定 鉴定 (注释)基因 描述基因 表达模式 分析基 因功能 转录组 分析 蛋白质组 分析 58 基因组学 基因病 疾病相关基因的鉴定 肿瘤病因学 流行病病因学 环境与疾病 药物分析 和设计 单基因病 获得性 基因病 多基因病 检测人类 基因变异 或突变 染色体制图 定位及疾病 相关基因克隆 疾病时 基因组差异 表达分析 已知与未知 基因的比较 正常与肿瘤 基因组比较 基因组基因 功能分类与 疾病关系探索 了解环境对 人类疾病的 影响和意义 59 第二节 蛋白质组学 Genomics 60 * 蛋白组(蛋白组( Proteome) 蛋白质组蛋白质组 是指是指 一种生物体产生的全部蛋白质。一种生物体产生的全部蛋白质。 * 蛋白组学(蛋白组学( Proteomics) 以蛋白质组委研究对象、研究细胞内各种蛋白质以蛋白质组委研究对象、研究细胞内各种蛋白质 的组成、表达及其规律的学科。的组成、表达及其规律的学科。 61 1.蛋白质分离和鉴定: 2.翻译后修饰: 翻译后修饰是蛋白质调节功能的重要方式,因 此对蛋白质翻译后修饰的研究对阐明蛋白质的功能具有重要作 用。 3.蛋白质功能确定: 如分析酶活性和确定酶底物,细胞因子的 生物分析 /配基 -受体结合分析。可以利用基因敲除和反义技术 分析基因表达产物 -蛋白质的功能。另外对蛋白质表达出来后 在细胞内的定位研究也在一定程度上有助于蛋白质功能的了解 。 4.对人类而言,蛋白质组学的研究最终要服务于人类的健康, 主 要指促进分子医学的发展 。如寻找药物的靶分子。很多药物 本身就是蛋白质,而很多药物的靶分子也是蛋白质。药物也可 以干预蛋白质 -蛋白质相互作用。 蛋白质组学的研究内容蛋白质组学的研究内容 62 蛋白质组研究更为复杂和困难: 蛋白质数目大大超过基因数目。 蛋白质随时间和空间而变化。 63 发展高通量、高灵敏度、高准确性的 研究技术平台是现在乃至相当一段时间内蛋 白质组学研究中的主要任务。 当前主要任务 64 二、蛋白质组的研究方法 65 研究蛋白质组的组成成分 支撑技术主要有双向凝胶电泳、以 质谱为代表的蛋白质鉴定技术及生 物信息学分析。 蛋白质组表达模式( expression profile): 66 (一)蛋白质组研究中的样品制备 通常可采用细胞或组织中的全蛋白 质组分进行蛋白质组分析。 也可以进行样品预分级,即将细胞 或组织中的全体蛋白质分成不同部 分,分别进行研究。 67 样品预分级的主要方法 蛋白质溶解性:可溶性蛋白、非溶性 蛋白等 蛋白质定位:膜蛋白、核蛋白等 蛋白质细胞器定位:线粒体、高尔基 体、叶绿体等 68 样品预分级主要作用在于提 高低丰度蛋白质的上样量和检测 灵敏度 。 69 组织水平上的蛋白质组样品制备 临床样本都是各种细胞或组织 混杂,而且状态不一,如肿瘤中癌 变的上皮类细胞总是与血管、基质 细胞等混杂。 70 激光捕获显微切割 (laser capture microdissection, LCM) 可直接在显微镜下从组织切片中 精确分离特定的细胞或细胞群。 71 (二)蛋白质组研究中的样品分离 双向凝胶电泳 two-dimensional electrophoresis, 2-DE):利用蛋白 质的等电点和分子量,结合凝胶化学 特性,分离各种蛋白质的方法。 72 原 理 第一向在高压电场下对蛋白质进行 等电聚焦 (IEF), 再在第一向垂直方向上 进行第二向 SDS-聚丙烯酰胺凝胶电泳 (SDS-PAGE)。 1975年首先由 OFarrell等创立。 73 特 点 可分离 10 100 kD分子量的蛋白质 高灵敏度和高分辨率 便于计算机进行图像分析处理 与质谱分析匹配 74 第一向 IEF电泳 传统 OFarrell系统双向电泳的缺陷。 Bjellgvist等发展并完善了固相 pH梯 度等电聚焦技术, Grg等成功地将 之应用于双向电泳 。 优点 75 固相 pH梯度等电聚焦的优点 克服了载体两性电解质阴极漂移等缺点 。 稳定的可以随意精确设定的 pH梯度。 尤其可在较窄的 pH范围内进行第二轮 分析,大大提高了分辨率及重复性。 76 第二向 SDS-PAGE电泳 垂直板电泳 水平超薄胶电泳 77 2-DE技术的缺点 极酸、极碱性蛋白质,疏水性蛋白质, 极大蛋白质、极小蛋白质以及低丰度蛋 白质用此种技术难于有效分离。 胶内酶解过程费时、费力,难于与质谱 联用实现自动化。 78 新型非凝胶技术 液相色谱法 liquid chromatography, LC 毛细管电泳 capillary electrophoresis, CE 79 液质联用技术( LC-MS/MS) 蛋白质混合物直接通过液相色谱分离以 代替 2-DE的分离,然后进入 MS系统获得肽 段分子量,再通过串联 MS技术,得到部分 序列信息,最后通过计算机联网查询、鉴定 蛋白质。 80 根据蛋白质带电性及疏水性不同, 用 MS分离多肽复合物。 多维 色谱技术( LC/LC-MS/MS) 多维蛋白质鉴定技术 (multidimensional protein identification technology) 81 (三)蛋白质组研究中的样品分析鉴定 传统方法:蛋白质微量测序 氨基酸组成分析 82 新型蛋白质鉴定技术 质谱( MS)法 基本原理 :样品分子离子化后, 根据离子间质荷比( m/z)的差 异来分离并确定样品的分子量。 83 “软电离 ”的特点 分子电离时保留整个分子的完整性,不 会形成碎片离子。 灵敏度高、快速、能同时提供样品的精 确分子量和结构信息、既可定性又可定 量、并能有效地与各种色谱联用来分析 复杂体系。 84 基质辅助激光解吸 /电离飞行时间质谱( matrix-assisted laser desorption/ionization time of flight mass spectrometry, MALDI-TOF MS ) 电喷雾质谱( electrospray ionization mass spectrometry, ESI-MS) 主要质谱类型 85 鉴定和注释蛋白质的路线 通过肽质谱指纹图( peptide mass fingerprinting, PMF)和数据库搜寻匹 配 通过测出样品中部分肽段二级质谱信息或 氨基酸序列标签和数据库搜寻匹配 86 目 录 87 仪 器 MALDI-TOF质谱仪:灵敏度高 (可达 fmol),分析速度快,谱 图简单易于解析以及受缓冲液、 盐份的干扰小 88 肽质谱指纹图在数据库中匹配 不成功的可能原因 样品量太少, PMF图信噪比太低,输 入库中搜寻的数据质量不好。 2-DE胶上所取的一个蛋白质点并非单 一蛋白质,所获 PMF图实际上是两个 以上蛋白质的混合图。 89 操作中角蛋白或其他蛋白质的污染 蛋白质发生了较多的转译后修饰,数据 库中未有记载 所用胰蛋白酶质量不够好,蛋白酶自酶 解片段多 未知的新蛋白质 数据库规模太小 续: 90 组织切片或印片原位质谱分析技术 两级飞行时间串联质谱( MALDI- TOF/TOF) 傅里叶转换回旋共振质谱( FTMS) 表面增强激光解吸 /电离飞行时间质 谱( SELDI-TOF-MS) 联合技术精确鉴定蛋白质 91 ( 1)原理: 将编码某一蛋白 X的 DNA序列与 DNA结合域 BD的编 码序列融合形成一个杂交体,将编码另一蛋白 Y的 DNA序 列与 DNA激活域 AD的编码序列融合形成另一个杂交体, 当两个杂交体共转化酵母细胞(此酵母细胞上游有 DNA结 合位点的报告基因),若 X和 Y没有相互作用,则单独不 能激活报告基因的转录;若 X和 Y可相互作用,则使 BD和 AD靠近形成一个有效的转录激活子,激活报告基因的转 录。因此可通过检测报告基因的转录来研究蛋白质 X和 Y 的相互作用。 3 酵母双杂交系统 92 双 杂 交 系 统 的 原 理 LacZ Gal4激活域 Gal4结合域 Gal4结合域 LacZ LacZ Gal4激活域 LacZ Gal4激活域 Gal4结合域 X Y X Y 93 一、酵母双杂交系统 酵母激活因子 GAL4: N端: 147个氨基酸组成的 DNA 结合域 (DNA binding domain,BD), C端: 113个氨基酸 组成的转录激活域 (transcription activation domain,AD) 。 GAL4分子的 DNA结合域可以和上游激活序列 (upstream activating sequence, UAS)结合,而转录激 活域则能激活 UAS下游的基因进行转录。 组成部分:( 1)与 BD融合的蛋白表达载体,被表达的 蛋白称诱饵蛋白( bait);( 2)与 AD融合的蛋白表达载 体,被其表达的蛋白称靶蛋白( prey);( 3)带由一个 或多个报告基因的 宿主菌株 。 94 Yeast Two Hybrid原理 BD X COOH AD cDNANH2 COOH 共转化+ BD X ? AD Gal4 Gal4 Promoter Reporter Trp- Leu- cDNA library NH2 Gal4 Gal4 95 酵母双杂交系统的优点 采用高拷贝和强启动子的表达载体使杂合蛋白过量表 达,并且避免蛋白质纯化过程 检测在活细胞内进行,体现真核细胞内真实情况 可检测存在于蛋白质之间的微弱的或暂时的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论