基因表达及功能分析基本策略.ppt_第1页
基因表达及功能分析基本策略.ppt_第2页
基因表达及功能分析基本策略.ppt_第3页
基因表达及功能分析基本策略.ppt_第4页
基因表达及功能分析基本策略.ppt_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目 录 第二十六章 基因表达及功能分析的 基本策略 STRATEGIES FOR ANALYZING GENE EXPRESSION AND FUNCTION 目 录 第一节 基因表达的分析策略 Strategies for Analyzing Gene Expression 目 录 一、通过检测mRNA 揭示基因转录水平的表达特征 根据分析方法的原理和功能特性,可将基因表达分析分为: 封闭性系统研究方法:例如DNA微阵列、Northern印迹、实 时RT-PCR等方法,其应用范围仅限于已测序的物种,只能 研究已知的基因。 开放性系统研究方法: 如差异显示PCR、双向基因表达指纹 图谱、分子索引法、随机引物PCR指纹分析等,可以发现 和分析未知的基因。 这里主要针对已知基因的常用表达分析方法做一介绍。 目 录 (一)基于杂交原理的方法可检测mRNA表达水平 1Northern印迹(Northern blot) 既可分析mRNA表达又可验证cDNA新序列 是一种基于RNA-DNA杂交原理建立的一种RNA分析 技术 目 录 Northern印迹分析原理示意图 目 录 2核糖核酸酶保护实验 (ribonuclease protection assay,RPA) 可用于mRNA定量和RNA剪接分析 是一种基于杂交原理分析mRNA的方法,既可对 mRNA进行定量分析又可研究其结构特征,灵敏 度和特异性都很高。 目 录 核糖核酸酶保护实验原理示意图 目 录 可对mRNA进行区域定位 是利用杂交原理建立的组织原位mRNA检测技术,可 对细胞或组织中原位表达的mRNA进行区域定位。同 时也可作为定量分析的补充。 通过设计与目标mRNA碱基序列互补的寡核苷酸序列 ,标记后作为探针;该探针能够特异性地与目标靶序 列杂交,检测标记信号来确定基因在组织和细胞内表 达的区位信息。 虽然原位杂交在功能性方面提供的信息较少,但是该 技术还是被广泛用于组织中的基因表达分析,这是因 为其较高的稳定性、较广泛的靶点和组织适用性。 3原位杂交(in situ hybridization,ISH) 目 录 (二)两种变换的聚合酶链式反应是常用的 mRNA检测方法 1反转录PCR 可用于mRNA的半定量分析 反转录PCR(reverse transcription-PCR,RT-PCR) 是一种简单、快捷地对RNA进行定性、定量分析的方 法。它是以mRNA为模板,体外扩增cDNA,再以 cDNA为模板进行特定基因转录产物的PCR扩增。RT- PCR技术一般用于RNA的定性分析;如果设置阳性参 照,则可对待测RNA样品进行半定量分析。 该方法适合对待测样品进行初步筛选,目前已广泛被 实时定量PCR替代。 目 录 常用于mRNA的定量分析 实时定量PCR (Real-time Quantitative Polymerase chain Reaction,RQ-PCR)是定量分析mRNA的最通用、最快速 、最简便的方法,该方法是对PCR反应进行实时监测, 具有很高的灵敏度和特异性。 2实时定量PCR 目 录 目前有5种技术用于实时定量PCR: 其中最经济、简便的技术是利用荧光染料(如SYBR Green )与双链DNA分子结合发光的特性,指示扩增产 物的增加; 其他4种方法都是以荧光染料标记的寡核苷酸为探针 与正确的扩增子杂交,包括5核酸酶法(即人们熟知的 TaqManTM)、分子信标、ScropionsTM和探针杂交法 ,它们拥有更强的特异性,可以避免对PCR后溶解曲线 的需求,以及后续的Southern杂交或对扩增子的测序鉴 定,但是成本较高。 目 录 SYBR Green实时定量PCR分析原理示意图 目 录 二、通过蛋白质检测揭示基因 翻译水平的表达特征 Western印迹(Western blot)是一种免疫印迹技术, 其基本原理与核酸分子杂交相似,只是以偶联标记物的抗 体分子作为探针,检测转移到固相支持物上的蛋白质/多肽 分子。当在蛋白质水平上检测特定基因的表达活性时,最 常用的方法就是利用Western印迹对细胞或组织的总蛋白质 中的特异蛋白质进行定性和半定量分析。 (一)采用特异抗体经Western印迹可直接 测定基因编码多肽 目 录 1. 蛋白质样品的制备 2. SDS-PAGE分离 3. 蛋白质转膜 4. 特异抗体(即第一抗体)与膜上的蛋白质(抗原)印 迹杂交 5. 再经偶联了可检测标记信号的第二抗体(即抗抗体, 商品试剂盒中多采用偶联辣根过氧化物酶的Ig) 6. 最后经与酶的底物反应而显影、成像,经扫描后获取 免疫印迹信息 Western blot基本程序 目 录 酶联免疫吸附分析(Enzyme-linked immunosorbent assay,ELISA)也是一种建立在抗原-抗体反应基础上的蛋白 质分析基本方法。 该方法不需经电泳分离待检样品蛋白质,而是预先将样品 包被在支持体上,以后反应过程与Western印迹大致相同 顺序结合(即“吸附”)特异抗体(一抗)及与酶连接的第二抗 体(也可预先包被抗体,“吸附”抗原),再进行酶-底物反应 。反应后通过专门的酶标仪测定、记录数据。 (二)酶联免疫吸附分析与Western印迹原理 相似但形式不同 目 录 特点: 具有特异性; 灵敏度很高; 稳定、操作简便,标本用量少,适于大规模筛查, 尤其适用于检测体液中微量的特异性抗体或抗原; 既可以做定性试验也可以做定量分析。 被广泛应用于微生物学、寄生虫学、肿瘤学和 免疫学等领域。 酶联免疫吸附分析 目 录 免疫组织化学(immunohistochemistry)与免疫 细胞化学(immunocytochemistry)原理相同,都是利 用标记的特异性抗体通过抗原-抗体反应和显色反应, 在组织或细胞原位检测特定抗原(即目标蛋白质)的 方法,简称为免疫组化实验。近年来由于荧光标记抗 体的广泛应用,这两种方法又被统称为免疫荧光法。 (三)免疫组化实验可对组织/细胞 表达的蛋白质进行原位检测 目 录 (immunofluorescence),可应用荧光(倒置)显微镜或 激光共聚焦显微镜(confocal microscopy)对靶分子进行 定性、定量和定位分析,激光共聚焦显微镜还可进行断层 成像,是在蛋白质水平分析基因表达的直观方法。 其中抗体对于蛋白质靶点的特异性、种间交叉反应、检测 系统的灵敏性以及细胞或组织的固定类型是该方法的关键 因素。 运用双重着色或多重着色程序同时对多个感兴趣的靶分子 进行检测,是一种揭示更多有关细胞群的功能和它们之间 相互作用信息的有效方法。 免疫组化主要是作为定性、定位的技术,若结合密度计量 系统、图像分析系统等测量工具也可以得到定量的数据。 目 录 流式细胞术(flow cytometry)在细胞水平分析特定 蛋白质的基本原理也是抗原-抗体反应,它利用荧光标记 抗体与抗原的特异性结合,经过流式细胞仪分析荧光信号 ,从而根据细胞表达特定蛋白质的水平对某种蛋白质阳性 细胞(即特异基因表达的细胞)作出判断。 (四)流式细胞术用于分析 表达特异蛋白质的阳性细胞 目 录 流式细胞术可以检测活细胞,也可以检测用甲醛固定的 细胞。 广泛应用于细胞表面和细胞内分子表达水平的定量分析 ,并能够根据各种蛋白质的表达模式区分细胞亚群。 此外,流式细胞术可以使用多个荧光标记的抗体同时对 多个基因产物进行标记和监测,是对细胞进行快速分析 、分选、特征鉴定的一种有效方法。 目 录 三、高通量检测技术成为基因表达 研究的有力工具 高通量筛选(High throughput screening,HTS)技术 是在大量核酸、多肽信息累计(即资料库)基础上,采 用微板作为分子载体,制作集成“芯片”,以自动化操作 系统进行分子杂交的试验过程。 因为快捷、灵敏、信息量大,适合大规模操作,故 称“高通量”。 高通量检测技术适合“组学”(omics)研究,更适 合生命活动过程相关的基因表达谱分析。 目 录 1. 基因芯片已成为基因表达谱分析的常用方法 基因芯片(gene chip)又称DNA微阵列(DNA microarray) 、DNA芯片(DNA chip), 是将大量已知序列的核酸片段( 包括寡核苷酸、cDNA、基因组DNA、microRNA等) 集成 在同一基片上,组成密集分子排列,通过与标记样品进行杂 交,检测、获取细胞或组织的基因信息。 其中基因表达谱(expression prifile)分析是目前基因芯片 应用最多的一个方面,主要采用cDNA芯片,基因表达谱芯 片便于对不同状态(如生理和病理条件)下的基因表达谱进 行比较,揭示转录组(transcriptome)差异表达的规律, 对探索发病机制、评价治疗效果、筛选药物靶标具有重要意 义。 (一)基因芯片和高通量测序技术可在基因 水平高通量地分析基因表达 目 录 2. 高通量测序技术是新一代基因表达谱 分析方法 高通量测序技术可以一次对几十万到几百万个 DNA分子片段进行序列测定,从而快速获得转录组或 基因组的全貌, 又被称为深度测序(deep sequencing)。 目 录 在DNA水平上,可以大规模地分析基因组甲基化、筛选突变基 因、检测基因多态性; 在RNA水平上,可以对RNA片段进行扫描、定量与鉴定,对全 基因组进行广谱表达研究。 1)目前,高通量测序技术不仅仅在DNA测序中起到重 要的作用,并且已经应用于基因组分析的各个方面: 2)高通量测序另一个被广泛应用的领域是小分子RNA或 非编码RNA(ncRNA)研究。测序方法能轻易地解决芯片 技术在检测小分子时遇到的技术难题(短序列, 高度同源), 而且小分子RNA的短序列正好配合了高通量测序的长度, 同时测序方法还能在实验中发现新的小分子RNA。 目 录 基因芯片的缺点: 在于它是一个“封闭系统”, 它只能检测人们已知序 列的特征(或有限的变异)。 高通量测序的优势: 在于它是一个“开放系统”, 它的发现能力和寻找新 信息的能力从本质上高于芯片技术。 目 录 (二)蛋白质芯片和双向电泳可在蛋白质水平 高通量地分析基因表达 蛋白质芯片(protein chip)是一种对蛋白质的表达和 功能进行高通量分析的技术。 是将具有高度亲和特异性的探针分子(如单克隆抗体 )固定在基片上,用以识别复杂生物样品溶液中的目标多 肽;蛋白质功能芯片可用来研究蛋白质修饰、蛋白质-蛋白 质/DNA-蛋白质/RNA-蛋白质,以及蛋白质与脂质、蛋白 质与药物、酶与底物、小分子-蛋白质等的相互作用。 1蛋白质芯片有多种形式和用途 目 录 蛋白质检测芯片包括: 1. 抗体芯片 2. 抗原芯片 3. 配体芯片 4. 碳水化合物芯片等 根据蛋白质芯片制作方法和用途不同,可将其分为 1. 蛋白质检测芯片 2. 蛋白质功能芯片两大类 目 录 目前比较和鉴定蛋白质表达谱更多采用双向聚丙烯酰 胺凝胶电泳结合质谱技术。双向聚丙烯酰胺凝胶电泳技术 又称二维电泳(two-dimensional electrophoresis, 简称2-D 电泳)。 原理: 根据蛋白质分子的两个属性等电点和分子质 量将蛋白质混合物进行分离。电泳结果经染色后,即 可对不同样品中蛋白质的表达谱进行比较;还可从凝胶中 将特定的蛋白质点切下,经胰蛋白酶消化后得到短肽片段 ,利用质谱(mass spectrum)技术进行定性分析,对差异 表达的蛋白质进行鉴定。 可同时分离数成百上千的蛋白质。 2双向电泳结合质谱普遍用于蛋白质表达 谱的分析和鉴定 目 录 第二节 生物信息学在预测基因 功能中的应用 Bioinformatics Application in Predicting Gene Function 目 录 一、利用生物信息学方法进行基因功能 注释 (一)通过序列比对预测基因功能 序列比对是生物信息学最基本的分析技术之一,最常 用的方法是将目的DNA或蛋白质序列与已知的DNA和蛋白 质序列数据库进行比对,搜索到与目的序列高度同源的功 能已知的基因或蛋白质,用这些基因和蛋白质预测目的基 因和蛋白质的功能。局部比对搜索工具BLAST是进行序列 比对的基本工具,它允许用户选择一条查询序列与一个数 据库进行比对,找到数据库中与输入的查询序列相匹配的 项。BLAST是一个序列数据库搜索程序家族,其中包括许 多有特定用途的程序。 目 录 程序 查询查询 序列 类类型 数据库类库类 型注 BLASTNDNADNA BLASTP蛋白质质蛋白质质 BLASTXDNA蛋白质质 将待搜索的核酸序列按6个阅读阅读 框翻译译成蛋白 质质序列,然后与数据库库中的蛋白质质序列比对对 TBLASTN蛋白质质DNA 将数据库库中的核酸序列按6个阅读阅读 框翻译译成 蛋白质质序列,然后与待搜索的蛋白质质序列比 对对 TBLASTXDNADNA 无论论是待搜索的核酸序列还还是数据库库中的核 酸序列都按6个阅读阅读 框翻译译成蛋白质质序列, 然后比对对 BLAST序列数据库搜索程序家族 目 录 (二)利用生物信息学方法分析基因芯片数据 最常用的方法有: 差异表达分析(又称基因表达差异分析) 聚类分析 差异表达分析的目的: 识别两个条件下表达差异显著的基因,即一个基因 在两个条件中的表达水平,在排除各种偏差后,其差异 具有统计学意义 目 录 1. 倍数分析:计算每个基因在两个条件下的表达比值; 2. 统计分析中的t检验和方差分析:通过计算表达差异的 置信度来分析差异是否具有统计学意义; 3. 建模的方法:通过确定两个条件下的模型参数是否相 同来判断表达差异的显著性。 差异表达分析常用的分析方法有3类: 目 录 聚类分析所依据的基本假设: 若组内基因具有相似的表达模式,则它们可能具有 相似的功能,例如受共同的转录因子调控的基因,或者 产物构成同一个蛋白复合体的基因,或者参与相同调控 路径的基因。 在具体应用中可按照相似的表达谱对基因进行聚类 ,从而预测组内未知基因的功能。 目前已经有很多种聚类的方法应用到基因芯片的研 究当中,如层次聚类(Hierarchical clustering)、K 均值聚 类(K-means clustering)、自组织映射(self organizing map)、PCA (principlecomponet analysis)等。 目 录 在氨基酸序列整体同源性不明显的情况下,对 蛋白质的功能域进行分析将对预测基因功能提供极 其有价值的信息。目前已通过多序列比对将蛋白质 的同源序列收集在一起,确定了大量蕴藏于蛋白质 结构中的保守区域或序列,如结构域(domain)和 模体(motif),这些共享结构域和保守模体通常与 特定的生物学活性相关,反映了蛋白质分子的一些 重要功能。 (三)通过生物信息学方法分析蛋白质 结构来预测蛋白质功能 目 录 运用蛋白质序列模体搜索工具预测蛋白质功能的方法是: 首先收集现有的蛋白质家族,构造模体数据库; 而后通过搜索该数据库确定查询序列是否具有可能的序 列模体,判断该序列是否属于一个已知的蛋白质家族; 然后根据该蛋白质家族的已知功能预测未知蛋白质的功 能。 常用的模体数据库有INTERPROSCAN、PROSITE 、 SMART等。 目 录 基因组组功能注释释常用数据库库 数据库库网址描述 AAThttp : / / genome. cs. mtu. edu / aat基因组组分析和注释释工具 COGhttp : / / www. ncbi. nlm. nih. gov / COG/直系同源体簇分析数据库库 EcoCychttp : / / ecocyc. pangeasystems. com/ ecocyc/ ecocyc. html 大肠肠杆菌的基因与代谢谢 OMIMhttp : / / www. ncbi. nlm. nih. gov / Omim/在线线人类类孟德尔遗传资遗传资 料 PEDENThttp : / / pedant . mips. biochem. mpg. de/ frishman/ pedant . html 完整基因组组的生物信息学分析 SAShttp : / / www. biochem. ucl. ac. uk/ cgi2bin/ sas/ query. cgi 结结构为为基础础的基因组组序列分析 WIThttp : / / www. cme. msu. edu/ WIT/基因组组代谢谢途径重构 目 录 现在人们已经越来越清楚地认识到,生物功能大多 不是只由一个或几个基因控制的,而是通过生物体内众 多的分子(如DNA、RNA、蛋白质和其他小分子物质) 共同构成的复杂生物网络实现的。当前生物学面临的巨 大挑战之一就是,了解生物体内复杂的相互作用网络以 及它们的动态特征。要想全面系统地解析这些复杂的生 物网络需要大量相关数据的积累,现代基因芯片、蛋白 质芯片等大规模数据采集技术大大加快了这一进程。目 前人们已经利用生物技术和信息技术建立了各种生物网 络数据库和网站,可为研究者提供基因调控、信号转导 、代谢途径、蛋白质相互作用等方面的信息。 二、利用生物网络全面系统地了解 基因的功能 目 录 生物体任何细胞的遗传信息、基因都是相同的, 但同一个基因在不同组织、不同细胞中的表达却不相 同。一个基因的表达既影响其他的基因,又受其他基 因的影响,基因之间相互促进、相互抑制,构成一个 复杂的基因调控网络。 基因调控网络研究就是:利用生物芯片等高通量 技术所产生的大量基因表达谱数据,以及蛋白质- DNA间的相互作用等信息,结合实验室研究结果,用 生物信息学方法构建基因调控模型,对某一物种或组 织的基因表达关系进行整体性研究,从而推断基因之 间的调控关系,揭示支配基因表达和功能的基本规律 。 (一)利用生物网络研究基因调控 目 录 常用基因转录调转录调 控数据库库 数据库库网址描述 EPD 真核生物启动动子数据 库库 http:/www.epd.idb-sib.ch 包含已被实验证实验证 明的转录转录 起始位点 和组织组织 特异性等启动动子的一般信息 TFD 转录转录 因子数据库库 / 是转录转录 因子及其特性的专门专门 数据库库 ,收集有关多肽肽相互作用信息 TRANSFAC数据库库 http:/www.gene-regulation. com/pub/database.html# transcompel 提供转录转录 因子结结构、功能、序列、 DNA结结合谱谱以及分类类,还还包括基因 的转录转录 因子结结合位点的信息 TRRD 转录调转录调 控区数据库库 http:/www.bionet.nsc.ru/ trrd/celcyc/ 收集了关于真核基因整个调调控区分 级结级结 构和基因表达模式的信息 目 录 信号转导是生物系统的重要生命活动过程,机体 通过信号转导通路中分子之间的相互识别、联络和相 互作用, 实现整体功能上的协调统一。由于细胞内各种 信号通路之间存在着紧密的联系和交叉调控, 形成了非 常复杂的信号转导网络。信号转导网络研究的目的是 期望通过建立细胞信号传导过程的模型,找出参与此 过程的各个蛋白质间的相互作用关系,阐明其在基因 调控、疾病发生中的作用。 生物信息学方法利用已知数据和生物学知识进行 通路推断, 可以帮助阐释信号分子作用机制, 辅助实验设 计, 节省大量的人力物力。有关信号转导通路的网上数 据库资源较多 。 (二)利用生物网络研究信号转导 目 录 常用信号通路数据库库 数据库库网址描述 Biocartahttp:/www. biocarta. com信号通路图图片及注释释数据库库 Reactomehttp:/www. reactome. org 生物核心通路及反应应的挖掘知识库识库 PIDhttp:/pid. nci. nih. gov 从其他数据库导库导 入及文献挖掘的人 信号通路数据库库 STKEhttp:/stke. sciencemag. org 参与信号转导转导 的分子及其相互作用 关系的信息 AfCShttp:/www. signaling- gateway. org 参与信号通路的蛋白质质相互作用和 信号通路图图 DOQCShttp:/doqcs. ncbs. res. in 细细胞信号通路的量化数据库库, 提供 反应应参数及注释释信息 SigPathhttp:/sigpath. org 提供细细胞信号通路的量化信息 目 录 代谢网络处于生物体的功能执行阶段,其结构组 成方式反映了生物体的功能构成。代谢网络把细胞内 所有生化反应表示为网络形式,反映了代谢活动中所 有化合物及酶之间的相互作用。 通过基因组注释信息可以识别出编码催化生物体 内生化反应的酶的基因,结合相关的酶反应数据库就可 以预测物种特异的酶基因、酶以及酶催化反应,由此 产生了许多优秀的代谢数据库,可以方便地检索某一生 物代谢网络中的代谢反应。 (三)利用生物网络研究代谢途径 目 录 常用代谢谢网络络数据库库 数据库库网址描述 KEGGhttp:/www.genome.ad.jp/ke gg/ 包括了700个以上物种的代谢谢、信号 转导转导 、基因调调控、细细胞过过程的通路 BioCyc/包括了260个物种的代谢谢通路及基因 组组数据 PUMA2/p uma2/ 存放了预预先计计算的超过过200个物种的 代谢谢通路信息 BioSilicohttp:/biosilico.kaist.ac.kr:80 17/biochemdb/index.jsp 整合信息的数据库库,提供对对多个代 谢谢数据库库的访问访问 目 录 (四)利用生物网络研究蛋白质相互作用 从某种程度上可以说,细胞进行的生命活动,是 蛋白质在一定条件下相互作用的结果,若蛋白质相互 作用网络被破坏或稳定性丢失,会引起细胞的功能性 障碍。阐明蛋白质相互作用的完整网络结构,有助于 从系统的角度加深对细胞结构和功能的认识。 近年来各种预测蛋白质相互作用的计算方法被不 断提出,将这些方法与实验方法结合,挖掘出了蛋白 质相互作用网络中更多的相互作用节点,目前已有多 个蛋白质相互作用的数据库应运而生,可用来研究蛋 白质相互作用的生物学过程 。 目 录 常用蛋白质质互作网络络数据库库 数据库库网址描述 BINDhttp:/www. bind. ca 提供参与通路的分子的序列和相互作用信息 DIPhttp:/dip.doe- 专门专门 存放实验实验 确定的蛋白质质之间间相互作用的 数据,既包括经经典实验实验 手段也包括高通量实验实验 手段确定的蛋白质质相互作用数据 STRINGhttp:/string.embl.de存储实验储实验 确定的和预测预测 得到的蛋白质质相互作 用数据,并对对各种预测预测 方法得到的结结果的准 确性给给出了相应应的权权重 MIPShttp:/mips.gsf.de包括酵母和哺乳动动物的PPI,可靠性很高,被作 为为准金标标准使用 Yeast Interactome /rakesh/myindex.html 综综合多种来源的由酵母双杂杂交技术术确定的酵 母PPI数据集, 利用基因表达信息、蛋白亚细亚细 胞定位信息以及已知的各种知识对识对 其进进行验验 证证形成高可信度的相互作用数据 目 录 三、复杂疾病的生物信息学研究策略 包括信息提取、分析和建模 癌症、糖尿病、高血压等复杂疾病对人类健康影响 巨大,这类疾病的发病机制一般与多种遗传或非遗传因 素,以及它们之间的相互作用有关,不能通过单基因、 单通路、单层次的变化解释。 以系统的观点解释复杂疾病中遗传与环境的关系、 描述复杂疾病中基因的特征、分析疾病基因型与表现型 之间的关系,已成为生物信息学研究复杂疾病的基本观 点,针对复杂疾病的研究模式,也开始从传统的“序列 结构功能”向“相互作用网络功能”转变。 目 录 疾病的基因组合及相互作用信息的提取:即对复杂疾病相关 靶基因的识别,以及利用SNPs、基因、蛋白质等不同类型的 信息,构建疾病驱使相关基因网络。 生物信息分析及多层次信息的融合:即从不同层次对疾病的 遗传复杂性进行分析,对不同遗传网络间的映射算法进行研 究,进而将SNPs、基因、蛋白质等不同水平的信息进行融合 。 分子调控网络建模:即综合生理病理相关的基因、SNPs、 基因表达状况,蛋白质功能状态以及临床治疗等信息,以系 统的方法将不同的测量数据、各种因素的辨识、各个层次上 的相互作用关系进行整合,建立数学模型,深入了解疾病过 程、揭示复杂疾病的发病机制。 复杂疾病的基本研究策略 目 录 第三节 基因的生物学功能鉴定技术 Methods for Identifying Biological Functions of Genes 目 录 目前在已知的2.5万3万个人类基因中,大约70%的基因我们还 不清楚它们的功能,有90%的基因我们不知道它们在体内的确切 生理作用,因此,利用各种技术手段研究基因组中功能未知基因 的作用,将是“后基因组时代”功能基因组学研究的主要内容。 生物信息学利用已知数据和生物学知识进行合理推断, 可以节省 大量的人力物力,但基因功能的鉴定最终仍需要通过实验来验证 。 通常采用基因功能获得和/或基因功能缺失的策略,观察基因在 细胞或生物个体中的,细胞生物学行为或个体表型遗传性状的变 化,来鉴定基因的功能。此外,基于正向遗传学的随机突变筛选 技术也成为揭示基因功能的重要手段。由于基因的功能必须在完 整的生物个体及其生命过程中才能得到完整的体现,因此从整体 水平研究基因的功能是必然的选择。 目 录 基因功能获得策略即通过将目的基因直接导入某一 细胞或个体中,使其获得新的或更高水平的表达,通过 细胞或个体生物性状的变化来研究基因的功能。常用的 方法有转基因和基因敲入技术等。 一、采用功能获得策略鉴定基因的功能 目 录 转基因技术(transgenic technology)是指将外源基 因导入受精卵或胚胎干细胞中,通过随机重组使外源基 因插入细胞染色体DNA,再将受精卵或胚胎干细胞植入 受体动物的子宫,使得外源基因能够随细胞分裂遗传给 后代。 (一)用转基因技术获得基因功能 目 录 转基因动物(transgenic animal)是指应用转基因 技术培育出的携带外源基因,并能稳定遗传的动物。 其基本制作过程包括:转基因表达载体的构建,外 源基因的导入,转基因动物的获得和鉴定,转基因动物 品系的建立以及外源基因表达的鉴定。 1. 转基因动物可在整体水平研究基因的功能 目 录 转基因动物制作原理示意图 目 录 优点: 1. 利用转基因动物模型研究外源基因,能够接近真实地 再现基因表达所导致的结果,及其在整体水平的调控 规律,把复杂的系统简单化,具有系统性和独立性, 是目前层次最高的实验体系。 2. 利用转基因技术建立的疾病动物模型具有遗传背景清 楚、遗传物质改变简单、更自然更接近疾病的真实症 状等优点。 目 录 但转基因动物模型仍存在一些亟待解决的问题: 1. 外源基因插入宿主基因组是随机的,可能产生插入突变 ,破坏宿主基因组功能; 2. 外源基因在宿主染色体上整合的拷贝数不等; 3. 整合的外源基因遗传丢失而导致转基因动物症状的不稳 定遗传等。 虽然转基因技术本身仍存在一些问题,但其在医学研 究中的重要地位是毋庸置疑的,随着转基因技术的不断完 善,其在医学及生物学领域必将有更加广泛的应用。 目 录 目前,科学家已经采取了多种方法使转基因技术更加完善: 为了更为精确地调控转基因的表达,使其获得时空特异 性的调控,在构建转基因表达载体时,选择只在特定的细胞 类型或特定的生命时期才启动基因表达的启动子,即可使外 源基因获得时空特异性的表达。 可调控的基因表达系统也是一种常用的方法: 例如四环素调控系统,该表达系统可使转基因动物体内 外源基因的表达受诱导剂(四环素)的调控,通过加入或去 除诱导剂,就可以实现对外源基因表达时间及水平的控制。 2. 转基因技术在不断完善 目 录 当前转基因动物所涉及的转基因片段长度大多在几十个 kb以下,但是,随着科学研究需要进行大片段DNA、多 基因或基因簇的转基因。 克隆大片段DNA常应用酵母人工染色体(YAC)、细菌人 工染色体(BAC)等,可获得200kb以上的大DNA片段,能 携带包含完整的基因或多个基因,以及基因的所有外显 子,和附近的染色体调控区,为目的基因提供与其在正 常染色体上一致的环境,保证了转基因在正常细胞中的 时空表达。 目 录 (二)基因敲入可以实现基因的定向插入 基因敲入( gene knock-in)是通过同源重组的方法, 用某一基因替换另一基因, 或将一个设计好的基因片段插 入到基因组的特定位点,使之表达并发挥作用。通过基 因敲入,可以研究特定基因在体内的功能;也可以与之 前基因的功能进行比较;或将正常基因引入基因组中置 换突变基因以达到靶向基因治疗的目的。 目 录 基因敲入是基因打靶技术的一种,基因打靶技术是 20世纪80年代后半期发展起来的,一种按预期方式 准确改造生物遗传信息的实验手段。 该技术的巧妙之处在于把胚胎干细胞技术和DNA同 源重组技术“结合”起来,实现对染色体上某一基因 的定向修饰和改造,从而深入地了解基因的功能。 除基因敲入外,基因打靶还包括基因敲除、点突变 、缺失突变、染色体组大片段删除等。 目 录 基因打靶的原理和基本步骤 1. 首先, 从小鼠囊胚分离出未分化的胚胎干细胞, 然后利用 细胞内的染色体DNA可以与导入细胞的外源DNA,在 相同序列的区域内发生同源重组的原理,用含有正-负 筛选标记的打靶载体,对胚胎干细胞中的特定基因实施 “打靶”; 2. 之后将“中靶”的胚胎干细胞移植回小鼠囊胚( 受精卵分 裂至8个细胞左右即为囊胚, 此时受精卵只分裂不分化) , 移植进去的中靶胚胎干细胞钻入囊胚胚层, 与囊胚一起 分化发育成相应的组织和器官; 3. 最后诞生出具有基因功能缺陷的“嵌合鼠”。由于中靶的 胚胎干细胞保持分化的全能性, 因此它可以发育成为嵌 合鼠的生殖细胞, 使得经过定向改造的遗传信息可以代 代相传。 目 录 基因打靶的原理示意图 目 录 基因功能研究的功能失活策略是通过观察,细胞或 个体的某一基因功能被部分或全部失活后,细胞生物学 行为或个体遗传性状表型的变化,来鉴定基因的功能。 常用的方法主要有 基因敲除 基因沉默 二、采用功能失活策略鉴定基因的功能 目 录 基因敲除(gene knock-out)属于基因打靶技术的一 种,其操作步骤和原理与基因打靶技术相同。基因敲除 技术是利用细胞染色体DNA可以与导入的外源DNA在相 同序列的区域发生同源重组的现象,在ES细胞中定点破 坏内源基因,然后利用ES细胞发育的全能性,获得带有 预定基因缺陷的杂合子,通过遗传育种最终获得目的基 因缺陷的纯和个体。 1987年,Thompsson首次建立了完整的ES细胞基因 敲除的小鼠模型,此后基因敲除技术得到进一步的发展 和完善,目前该技术已经成为研究基因功能最直接、最 有效的方法之一。 (一)基因敲除可以使基因的功能完全缺失 目 录 基因被完全敲除之后使得表型分析受到很多限制: 有些重要的靶基因被敲除后会引起胚胎早期死亡,使 得无法分析该基因在胚胎发育晚期和成年期的功能;某些 基因在不同的细胞类型中执行不同的功能,完全敲除会导 致突变小鼠出现复杂的表型,使研究者很难判断异常的表 型是由一种细胞引起的,还是由几种细胞共同引起的。 近年来,条件性基因打靶(conditional gene targeting) 系统的建立,使得对基因靶位时间和空间上的操作更加明 确,效果更加精确可靠,已达到对任何基因在不同发育阶 段和不同器官、组织的选择性敲除。 目 录 Cre/loxP系统作用原理示意图 目 录 这一技术亦存在一些缺点: 1. 费用太高 2. 周期较长 3. 许多基因在剔除后并未产生明显的表型改变,可能是这 些基因的功能为其他基因代偿所致 条件性基因打靶的优势: 1. 克服了重要基因被敲除所导致的早期致死 2. 并能客观、系统地研究基因在组织器官发生、发育以及 疾病发生、治疗过程中的作用和机制 目 录 基因沉默(gene silencing)是指由外源基因导入引起的 生物体内的特定基因不表达或表达受抑制的现象。 该现象最早发现在转基因植物中,后来这种现象在线 虫、真菌、果蝇、斑马鱼、小鼠早期胚胎中也有发现。 目前最常用的基因沉默技术包括: 1.RNA干涉(RNA interference,RNAi) 2.反义寡核苷酸(antisense oligonucleotide,ASON) (二)基因沉默可以使基因的功能部分缺失 目 录 RNAi是指双链RNA介导同源序列的mRNA特异性 降解,导致的转录后基因沉默。 RNAi是机体的一种天然防御机制,具有防御病毒 感染、入侵等功能。 目前利用RNAi能够在短时间内高效特异地抑制靶 基因表达的特点研究基因的功能已成为功能基因组学的 热点之一。 1. RNA干涉技术可用来研究基因的功能 目 录 RNAi的作用机制: 外源dsRNA可直接被导入细胞,或者通过转基因、 病毒感染等方式进入细胞,并整合到基因组中获得表达 ;各种来源的dsRNA被核酸酶RNase家族中,特异识 别dsRNA的Dicer酶,以一种ATP依赖的方式逐步切割 成长约2123nt的双链小干扰RNA(small interference RNA,siRNA);siRNA识别mRNA链上的同源区域之后 ,结合一个核酶复合物形成RNA诱导的沉默复合体( RNA-induce silencing complex,RISC);RISC定位到 靶mRNA转录本上,并在距离siRNA 3端12个碱基的位 置切割mRNA。 目 录 RNAi的作用机制示意图 目 录 目前有5种方法可用于制备siRNA: 1. 化学合成法 2. 体外转录法 3. 长链dsRNA的RNase体外消化法 4. siRNA表达载体法 5. siRNA表达框架法 前3种方法是在体外制备然后导入到细胞中;后两 种则是基于具有合适启动子的载体或转录元件,在哺乳 动物或细胞中转录生成。 目前多采用RNA聚合酶启动子构建siRNA的表达 载体或表达框架,常用的RNA聚合酶的启动子有人、 鼠U6启动子、人H1启动子。 目 录 研究者既可以将siRNA导入特定细胞,在细胞水平 上研究基因的功能; 也可以通过转基因的方法,在动物体内实现特异、 稳定、长期地抑制靶基因的表达,从而在整体水平上研 究基因的功能。 若将RNAi技术与Cre/loxP重组系统以及基因表达 调控系统相结合,建立转基因动物模型,则不仅具有稳 定、可遗传、可诱导等特点,而且无需使用胚胎干细胞 技术和基因打靶技术,与基因敲除相比具有简单、易操 作、周期短等优势。 已被作为一种简便和有效的工具广泛用于基因功能 的研究。 目 录 缺点: 1. 该技术可能对靶基因的相似序列发生作用,导致 脱靶(off-targeting)效应。 2. 还可能诱导干扰素和其他细胞因子的表达。 目 录 反义寡核苷酸引发基因沉默的机制: (1)可能是通过与靶mRNA互补结合后以位

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论