《生物芯片分析》PPT课件.ppt_第1页
《生物芯片分析》PPT课件.ppt_第2页
《生物芯片分析》PPT课件.ppt_第3页
《生物芯片分析》PPT课件.ppt_第4页
《生物芯片分析》PPT课件.ppt_第5页
已阅读5页,还剩108页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物芯片 (Biochip),武汉大学生物医学工程系 赵 旻,本章提纲,生物芯片简介与沿革 生物芯片的分类 基因芯片基本原理、流程与应用 蛋白质芯片及应用 其它芯片技术,第一节 生物芯片简介与沿革,什么是生物芯片? 生物芯片(Biochip)主要指通过平面微细加工技术,在固体芯片表面等载体上的微型生物化学分析系统,以实现对细胞、蛋白质、核酸以及其他生物组分的准确、快速、大信息量的检测。,芯片上每平方厘米可密集排列成千上万个生物分子(Microarray),能快速准确地检测细胞、蛋白质、DNA及其他生物组分,并获取样品中的有关信息,其效率是传统检测方法的成百上千倍。,生物芯片分析基本流程,建立,1996年美国Affymetrix公司成功地制作出世界上首批用于药物筛选和实验室试验用的生物芯片,并制作出相应的芯片系统。此外,美国的Hyseq公司、Aurora公司、Nanogen公司、Incyte公司等也在积极开展DNA芯片研究工作。近二年,摩托罗拉、惠普、IBM等跨国公司也相继投以巨资加入生物芯片的研究开发。,中国在生物芯片领域起步较晚,我国是从一九九七年才开始对生物芯片研究,而国外从八十年代起就开始研制生物芯片。 中国医药生物技术协会生物芯片分会国际生物芯片领域的第一个行业性组织2006在北京成立。 中国在北京、上海、陕西、天津、南京建立了五大生物芯片研发和产业化基地 。 我国生物芯片产业尚未形成统一的技术标准,不规范。在产品认证认可方面也存在与国际惯例不接轨的情况。,第二节 生物芯片的分类,一般分类,根据用途还可以把生物芯片分为两类: 信息生物芯片和功能生物芯片,第三节 基因芯片 基本原理、流程与应用,本节内容提要,1. 简介 2. 图像处理与数据标准化 3. 基因芯片的数据分析 4. 芯片工具&数据库,简介,基因芯片(Gene chip)技术是指通过微阵列(Microarray)技术将高密度DNA片段阵列通过高速机器人或原位合成方式以一定的顺序或排列方式使其附着在如玻璃片等固相表面,以荧光标记的DNA探针,借助碱基互补杂交原理,进行大量的基因表达及检测等研究的技术。,基因芯片发展历史,Southern & Northern Blot,Dot Blot,Macroarray,Microarray,基因芯片,1. 根据免疫测定的 (immunoassay)的方法 予以改进 2. 高通量、点阵以及Northern杂交 3. 同时测定细胞内数千个基因的表达情况 4. 芯片的体积非常小:微量样品的检测 5. 基因表达情况的定量分析,基因芯片的原理,依据双螺旋原理,核酸分子杂交技术,在靶标样品与探针之间进行选择性反应,将反应一方(探针)固定在芯片上,另一方(荧光标记,即制备好的cDNA,分别标记绿色的Cy3和红色的Cy5)通过流路或加至芯片上。,核酸杂交,RNA,DNA1,DNA2,Probe,Southern hybridization,Northern hybridization,Juang RH (2004) BCbasics,基因芯片的密度:100-1 million DNA 探针/1cm2,将样品中的DNA/RNA表上荧光标记,则可以定量检验基因的表达水平,碱基互补,基因芯片流程,样品制备,芯片制备,杂交,杂交信号检测,数据分析,实验流程,基因表达情况的定量测定,1. 发现在特定生长时期,或者随着环境变化,那些基因的表达收到诱导或者抑制 2. 在相同条件下,上调或者下调变化规律相似的基因,可能具有功能上的关联 3. 可以从共表达的基因中寻找调控模体 4. 基因表达的模式可以用来表征异常的细胞调控,例如,癌症的诊断,基因芯片分类,按芯片制备方法分类 原位合成芯片(synthetic genechip) DNA微阵列芯片(DNA microarray) 按探针分类 寡核苷酸阵列(芯片) DNA阵列 基因芯片 cDNA芯片 RNA芯片,Comparison of DNA Chip Technologies,Sensitivity of DNA chip based assays is a function of: Probe and target DNA/RNA (Complexity) Chip surface (autofluorescence & non-spec. bkg) Attachment chemistry/methodology (hyb. efficiency & crosshyb.) Hybridization efficiency (lots of factors) Detection technology (signal type, efficiency, noise),Oligo-Chip cDNA-Chip Genomic Chip 8 n or 20 n 50,000 n,sequencing,expression,expression,genomic analysis,基因芯片技术的类型,按技术手段、探针类型分类 1. Short oligonucleotide arrays (Affymetrix) 2. cDNA arrays (Brown/Botstein) 3. Long oligo arrays (Agilent) 4. Serial analysis of gene expression (SAGE) 按实验要求分类 1. 单通道 (Single Channel): 一次检验一种状态 2. 双通道 (Dual Channel): 差异表达基因的筛选,1 片上原位合成寡核苷酸点阵芯片(ONA) 2 微量点样技术制作的CDNA 点阵芯片(CDA) ONA特点: (1)易寻址,利用组合化学的原理安排各寡核苷酸的位点,芯片反应后易寻址; (2)点位牢固,用表面化学方法处理基片(玻璃、硅片、尼龙片),使核苷酸固定在基片上; (3)定点合成,光导向平板印刷技术,芯片表面可用屏蔽物屏蔽,光照选择性脱保护,有利于定点合成寡核苷酸中的各个碱基;目前技术:1.6cm2;40万个点;20个核苷酸;,两类主流的DNA芯片,1. cDNA microarrays: 将5005,000bp的cDNA固载到介质上 (例如玻璃),Stanford开发设计,通常为双通道 2. DNA chips: 将寡核苷酸探针 (2080-mer) 合成到芯片上,Affymetrix开发设计,通常为单通道,(1) cDNA microarrays,cDNA clones,Robot spotter,普通的盖玻片,cDNA microarrays的制备,差异表达基因的筛选,Treatment / control Normal / tumor tissue Brain / liver ,点样后的cDNA Microarrays,Genes,mRNA samples,Gene expression level of gene i in mRNA sample j,=,Log (Red intensity / Green intensity),Log(Avg. PM - Avg. MM),sample1 sample2 sample3 sample4 sample5 1 0.46 0.30 0.80 1.51 0.90 . 2 -0.10 0.49 0.24 0.06 0.46 . 3 0.15 0.74 0.04 0.10 0.20 . 4 -0.45 -1.03 -0.79 -0.56 -0.32 . 5 -0.06 1.06 1.35 1.09 -1.09 .,基因表达的数据,(1) DNA chips,DNA chips的制备:Affymetrix photolitography,探针长度:25 bp 每个基因:22-40个探针 Perfect Match (PM) vs. MisMatch (MM) probes,点样后的Gene chip,总结,基因芯片的实验流程,2. 图像处理与数据标准化,单通道基因芯片 white (very high) red (high) Yellow (a little high) green (medium) blue (low) black (no),图像处理,植根区域生长法(SRG),Fixed Circle,栅格化:确定点的位置 图象分割 (Segmentation):将点从背景中分离出来。 抽提亮度:各个像素亮度的平均值 (mean)或中位数 (median) 背景校正:局部或全局,基因表达量的定量,对于每个点,我们可以计算 Red intensity = Rfg - Rbg fg = foreground, bg = background, and Green intensity = Gfg - Gbg and combine them in the log (base 2) ratio Log2( Red intensity / Green intensity) Green intensity (medium): 1,Microarray: 误差的来源,系统的 随机的,log signal intensity,log RNA abundance,Microarray: 误差的来源,1. 图像分析 2. 扫描 3. DNA杂交过程, 温度、时间、混合均匀程度等 4. 探针的标记 5. RNA的抽提 6. 加样 7. 其他,Red/green 比值存在亮度的倾向,M = log2R/G = log2R - log2G,= (log2R + log2G )/2,Values should scatter about zero.,数据标准化,before,after,3. 基因芯片的数据分析,(1) 差异表达基因的分析 (2) 基因共表达分析 (3) 基因表达数据的聚类 (4) 基因表达数据的分类 (5) Map to GO (6) Gene regulatory network,(1) 差异表达基因的分析,1.差异表达基因的分析: 寻找处理前后表达上调或者下调的基因 2. Are the treatments different? 3. 使用标准的统计学方法检验 (t-test or f-test),发现统计显著性差异表达的基因, 4. 如果处理本身并不显著,则结果无意义,统计学分析,1. Fold change, 一般2-fold increase or decrease (平行实验的样本较少) 2. p-value (平行实验的样本较多),P-value: 学生分布,1. T-test: 学生分布 2. Excel函数:TTEST(array1,array2,tails,type) Array1为第一个数据集 Array2为第二个数据集 Tails指示分布曲线的尾数。如果 tails = 1,函数 TTEST 使用单尾分布。如果 tails = 2,函数 TTEST 使用双尾分布 Type为 t 检验的类型 1 成对 2 等方差双样本检验 3 异方差双样本检验,P-value: 学生分布,1. 一般选择双尾分布 2. 异方差双样本检验 3. Excel函数:=TTEST(B2:D2,E2:G2,2,3) 4. C:对照组;T:实验组,Multiple Comparisons,1. 在基因芯片的实验中,每一个基因/探针,都是一个独立的实验 2. 基因芯片:高通量,1,000个基因/探针 3. 因此,无论怎么比较,总会有一些基因会是统计显著性差异表的 可能是随机产生的 4. 如何评估表达差异基因预测的有效性? 5. 例:1,000个探针的双通道芯片,以p-value 0.01为域值,发现7个上调基因,5个下调基因,分析结果是否具有统计学意义?,False Discovery Rate (FDR),1. False positive prediction: “Type 1 error“ or “False Discovery“ 2. False Discovey Rate (FDR) = p-value * No. of Genes 上例: FDR= 0.01* 1,000=10 (随机) 7个上调基因,5个下调基因 10 因此上例计算的结果无统计学意义 3. FDR必须远小于发现的差异表达基因数目 实验的有效性 p-value的选择,(2) 基因共表达分析,1. 在N个不同的条件下 (时间序列的芯片数据),考察基因X和Y的表达是否相似 2. Gene 1#是否与Gene 2#、Gene 3#和Gene 4#共表达? 3. 共表达: 正相关:相似的表达谱,可能存在正关联 负相关:相反的表达谱,可能存在负调控,Eisen MB, et al., (1998) PNAS 95:14863-14868,没有相关性?,基因相关性分析,1. Spearman rank correlation 2. Kendalls tau 3. Euclidean distance 4. Pearson correlation coefficient: -1 1 Excel函数:=PEARSON(array1,array2),Eisen MB, et al., (1998) PNAS 95:14863-14868,Pearson相关系数,1. r -1, 1 r 1,正相关 r -1,负相关,结论:Gene 1#与Gene 2#表达正相关,与Gene 3#表达负相关,与Gene 4#无关联,(3) 基因表达数据的聚类,1. 将表达谱相似的基因聚类在一起 2. 无督导学习 (unsupervised learning) 3. Pattern finding: 发现新的模式 4. 聚类方法: A. Hierarchical clustering B. K-means clustering,Hierarchical Clustering,Hierarchical clustering,1. 用树状结构来表征基因表达之间的相似性/相关性 2. 优点:不需要指定结果有多少类,Distance matrix,K-means clustering,1. 对数据进行聚类 2. 必须给定结果分成多少类! 3. 假设,该例中,指定为聚成5类,K-means clustering,1. 随便选取5个点,作为每一个类的中心点,K-means clustering,2. 计算其他点与这5个中心点的距离 距离: 欧氏距离 马氏距离 皮尔孙相关系数 点的归类:离哪个中心点近,归哪个类,K-means clustering,3. 针对每一类中的每一个点,计算其与其他点的距离,加和,除以该类点的数目; 找到新的中心点,即改点到该类中其他点的平均值最小; 确定新的5个中心点!,K-means clustering,4. 重复2, 3,直到结果收敛 实际操作时,因结果完全收敛时间过长,一般指定迭代的次数,如1,000次,K-means clustering,5. 最终结果:所有基因芯片数据被聚成5类 软件:Cluster 3.0, Michael Eissen, Stanford,(4) 基因表达数据的分类,1. 根据基因表达的数据将样本分成两类或多类; 2. 督导学习 (supervised learning):根据发现的pattern进行预测 3. 应用: 癌症 vs. 正常组织 癌症的亚型、不同阶段 (良性的 vs. 恶性的) 对药物的敏感性 (tamoxifen for breast cancer),Diffuse large B-cell lymphoma (DLBCL),1. 通过聚类发现各种亚型之间的关系 2. 根据基因表达模式,能够预测新的基因表达样本,(5) Map to GO,1. 通过基因芯片,找到了一批“interesting” 的基因 2. 生物学功能上是否存在关联? 某种功能是否显著? 3. Gene Ontology + 超几何分布,GOToolBox,(6) Gene regulatory network,1. 早期观点:表达谱相似的基因可能存在功能上的关联,可能相互作用 (直接作用) 2. 当前的观点:表达谱相似的基因可能具有共同的调控元件 (基因UTR区域存在共同的Promotor), 能够被同一个上游因子所调控,相关系数:基因共表达网络,ERL2,SKP1,Unknown,ChS1,Wild-type,Mutant,1. 与光合效率和气孔发育相关的基因:ERL2 A. 在Wild-type中与之显著相关,但在Mutant中显著不相关的基因,相关系数:基因共表达网络,4. Microarray: 工具&数据库,GEO - NCBI,Array Express - EMBL,SMD - Stanford,芯片技术的应用,1 基因表达分析: 分析基因表达时空特征 检测基因差异表达 发现新基因 大规模测序,DNA序列测定: 杂交测序:sequencing by hybridization, SBH 建立在特定序列的DNA与特定长度的寡核苷酸集合的杂交的基础之上。未知DNA序列可以通过鉴定与靶DNA序列形成完整的双链体寡核苷酸的重叠区域来确定;65536个八核苷酸点阵可测定约200个核苷酸的序列;一百万个十二核苷酸点阵可测定约1000个碱基对。,2 基因型、基因突变和多态性分析 分析基因组中不同基因与性状或疾病的关系 3 疾病的诊断与治疗 遗传病相关基因的定位:产前筛查与诊断 肿瘤诊断 感染性疾病的诊断 基因突变检测与遗传病和肿瘤诊断大量平行测定。,4.药物研究中的应用 新药开发 发现药物的新功能 调查药物处理细胞后基因的表达情况 对药物进行毒性评价 在基因水平上寻找药物靶标,毒性对基因的影响。,其它: 病原体的检出 肿瘤相关基因表达谱 位点突变 耐药基因检测 疾病的分子分型 HLA分型,细胞凋亡PCR芯片 细胞周期PCR芯片 血管生成PCR芯片 肿瘤转移PCR芯片 癌通路发现者PCR芯片 DNA损伤信号通路PCR芯片 氧化应激与抗氧化PCR芯片 应激和毒性通路发现者PCR芯片 肿瘤药物耐受和代谢PCR芯片 细胞因子PCR芯片,乳腺癌和雌激素受体信号通 路PCR芯片 药物代谢PCR芯片 内皮细胞生物学功能研 PCR芯片 骨再生PCR芯片 干细胞PCR芯片 动脉粥样硬化PCR芯片 糖尿病PCR芯片 趋化因子与受体PCR芯片,生长因子PCR芯片 炎症细胞因子与受体PCR芯片 干扰素及其受体PCR芯片 Th1-Th2-Th3PCR芯片 Toll样蛋白受体信号转导PCR芯片 细胞外基质与粘连分子PCR芯片 神经营养素与受体PCR芯片 低氧信号通路PCR芯片,胰岛素信号通路PCR芯片 JAK / STAT信号通路PCR芯片 MAPK信号转导通路PCR芯片 NF-kB信号通路PCR芯片 一氧化氮PCR芯片 Notch信号通路PCR芯片 信号转导通路发现者PCR芯片 TGFb / BMP信号通路PCR芯片 TNF配体及受体PCR芯片 Wnt信号通路PCR芯片 管家PCR芯片,第四节 蛋白质芯片,蛋白质芯片:又称为蛋白质阵列或蛋白质微阵列(protein microarray) 蛋白质芯片是指在固相支持物上有序排列的各自独立的多肽、蛋白或相应配体,利用蛋白质与蛋白质、蛋白质与DNA、蛋白质与RNA,或与其它配体间的相互作用,同时平行分析大量蛋白质的生物化学性质,在蛋白质组学基础研究以及临床诊断、药物研究、环境监测、食品卫生等方面有广阔的应用前景。,是指以蛋白质分子作为配基,将其有序地固定在固相载体的表面形成微阵列;用标记了荧光的蛋白质或其他它分子与之作用,洗去未结合的成分,经荧光扫描等检测方式测定芯片上各点的荧光强度,来分析蛋白之间或蛋白与其它分子之间的相互作用关系。,根据其固定生物分子的不同,可以分为受体配体检测芯片,抗原芯片,抗体芯片等。 根据芯片载体的不同,分为普通玻璃载玻片,多孔凝胶覆盖芯片和微孔芯片3种主要形式。 应用最普遍的是玻璃片,另外PVDF膜,聚丙烯酰氨凝胶,硝化纤维素膜,聚苯乙烯微珠,磁性微珠等 对最普遍应用的玻璃片而言,用于制备蛋白质芯片的方法主要有戊二醛修饰法、聚赖氨酸修饰法、巯基修饰法和多糖修饰法等。,Interaction Arrays Proteins on Chip- Labelled Sample Caputure Arrays Antibody on Chip-Labelled Sample ELISA on Array Miniaturised Sandwich Assays Reversed Phased Arrays Multitude of arrayed Samples,Interaction Arrays,-Cloning and expression of 6600 yeast protein -Complex arrays for protein-protein interaction studies Zhu et al. (2001)Science.293,2101,Capture Arrays,SAMPLE ARRAYS Reverse Phase Screen,ANTIBODY ARRAYS Sample Labelling Approaches,ANTIBODY ARRAYS Mutiplexed Sandwich ELISAs,Sandwich Immunoassays,highly parallel high sensitivity expensive equipment labour intense automation difficult,Reverse Phase Protein Microarrays,YYYYYY,Forward Phase Detection Antigen,Reverse Phase Detection,Capture Molecules,Immobilized Antigen,Capture Molecules,Y Y Y Y,蛋白质芯片的核心技术是蛋白芯片的制备和反应信号的检测分析。因此蛋白质的纯度;蛋白质的固定是蛋白质芯片技术的重点和难点。 由于蛋白质分子的活性依赖于不同的折叠方式,因此对芯片的表面修饰至关重要,要保证被点在芯片上的蛋白质不失活而又能牢固的固定在芯片上。,蛋白质芯片的原理,蛋白质芯片技术主要包括四个基本要点: 芯片阵列的构建 样品的制备 芯片生化反应 信号检测及分析,首先将蛋白按设计的阵列方式点印在介质上,样品蛋白质与芯片反应,然后用经过标记的(可以是酶、荧光、同位素、生物素等)蛋白质与芯片-蛋白质复合物结合,通过激光共聚焦显微镜和CCD照相机对标记信号进行扫描分析。 联合应用双向凝胶电泳,表面增强激光解析离子化飞行时间质谱(SELDI-TOF-MS)或串联质谱(MS/MS)还可以对蛋白分 子进行定量分析。,提出生物学问题 (实验目的),样品预处理 (重组蛋白, 制备一、二级抗体, 荧光标记),生化反应 化学偶合,加底物, 反应温度和时间, 冲洗条件,检测 (荧光和比色扫描或 拍照,参数设置),数据分析和建模 图象量化,标准化 建立模型),1,2,3,4,5,蛋白质芯片制备,6,蛋白质芯片的分类,蛋白质检测芯片,蛋白质功能芯片,与基因芯片的比较:,蛋白质是基因表达的最终产物, 接近生命活动的物质层面; 探针蛋白特异性高、亲和力强, 可简化样品前处理,甚至可直接利用生物材料(血样、尿样、细胞及组织等)进行检测; 适合高通量筛选与靶蛋白作用的化合物; 有助于了解药物或毒物与其效应相关蛋白质的相互作用。,Protein chip的应用(理论上),Diagnostic immunoassay simultan

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论