基因组学技术在致病基因发现_第1页
基因组学技术在致病基因发现_第2页
基因组学技术在致病基因发现_第3页
基因组学技术在致病基因发现_第4页
基因组学技术在致病基因发现_第5页
已阅读5页,还剩94页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,1,基因组学技术在致病基因发现及临床诊断中的应用,引言,对疾病的研究一直是人类科研活动的重点和热点之一 人类所有疾病都具有遗传影响和背景,但只有在一少部分疾病中,遗传因素起主要作用 遗传病通常具有先天性、终生性和家族性的特点,2,遗传病分类单基因遗传病研究策略回顾复杂疾病研究策略回顾应用二代测序技术寻找易感基因,3,遗传病分类,单基因遗传病多基因遗传病染色体疾病线粒体疾病体细胞遗传病,4,权威的在线人类孟德尔遗传数据库(Online Mendelian Inheritance in Man,OMIM),目前已收录的以孟德尔遗传方式为主的遗传病约6700种,其中常染色体连锁的约6200中,性染色体连锁的500种。在这6700多种遗传疾病中,其中已确定其分子遗传基础的单基因病接近3000种,表型已知而致病分子基础未知的约有1830多种。由于单基因病的遗传异质性,还有很多的亚型未被发现。,单基因遗传病,OMIM Statistics for May 3, 2011,6,多基因遗传病,遗传方式复杂,无显性和隐性之分,故也称多因子遗传或复杂疾病。常见的有唇腭裂、先天性下颌前突、高血压、糖尿病、精神分裂症、类风湿性关节炎及先天性心脏病等。复杂疾病的发病率常有地区或族群差异。比如在世界范围内,唇腭裂的发生率约为1/700,拉美、亚洲发生率高,非洲较低。下颌前突亚洲群体发病率较高,大约有8%40%,非洲为3%8%, 欧美较低,约为0.4%4%。,7,染色体疾病,数目性染色体畸变例子如Down综合征,即21三体综合征表型特征有智力低下、伸舌、鼻梁低平、眼裂上斜、小耳、小颌、枕平、内眦敖皮、颈短及肌张力减低等,常伴有先天性心脏发育缺陷结构性染色体畸变 是在细胞分裂过程中曾有染色体断裂所致。常见的结构异常有缺失、环状染色体、易位、重复、倒位和等臂染色体。如毛细血管扩张性共济失调症 染色体数目异常比结构异常更常见,8,疾病致病基因查找研究,疾病致病基因查找 对疾病的诊断与治疗有巨大意义除DNA水平,还有RNA、蛋白、细胞水平等自动化DNA测序仪与微阵列芯片-强有力工具人类基因组计划完成 总体框架传统的基于连锁不平衡(LD)的方法基于家系的Linkage分析基于大样本的Association分析很多成功范例,疾病致病基因定位研究,罕见疾病感染率低(318,000 tag SNPs,20,数据分析方法,Genome StudioCall rate 99%CNV partition至少连续5个探针,21,数据分析方法,连锁分析MerlinGenehunterMendel单体型分析MerlinHaplopainterCNV partition,22,连锁分析流程,23,参数连锁分析在复杂疾病中的应用,在复杂疾病连锁分析中,很多研究倾向于非参数分析,避开对遗传模式的猜测仍有一些学者认为参数连锁在复杂疾病研究中仍然有不可替代的优势在很多研究采用一系列不同的遗传模式,以得到最优遗传模式参数最好结合参数和非参数分析的结果,二者吻合度到,共同支持的连锁区域更可信。,24,参数连锁分析在复杂疾病中的应用,双致病位点连锁分析在定位到两个或多个候选区域的复杂疾病家系研究中,具有重要意义双致病位点模式可以提高复杂疾病连锁信号的检测效能。这种方法已在多项复杂疾病如家族性高胆固醇血症、静脉血栓栓塞和双相情感障碍研究中成功运用。双区域连锁分析数值高于与单个区域连锁值提示遗传因素相互影响是客观存在的。而这种优势越明显,则越支持两个区域的相互作用。,25,CNV与疾病,CNV不仅在基因组中广泛存在,而且在基因富集区尤为突出。大量研究已证实CNV是某些复杂疾病的易感因素,与人类的一些复杂性状,如个体之间的感官差异(包括嗅觉、听觉、味觉和视觉)也有关系。目前已知多种复杂疾病与特定基因的CNV有着明确关系。目前,关于基因组内CNV与疾病的相关性仍处在广泛的研究中,可以肯定的是,其中高频拷贝数变异区域往往在减数分裂时产生重排,导致发育异常类疾病。,26,总体结论,基于类似孟德尔遗传的大家系(患者大于10例,至少3代),采用SNP芯片连锁分析是定位复杂疾病易感基因的有效方法之一。双致病位点连锁分析在定位到两个或多个候选区域的复杂疾病家系研究中,具有重要意义。,27,应用二代测序技术寻找易感基因,外显子组测序 单个病例、病例组、核心家系 全基因组测序几个病例、癌组织,28,应用二代测序技术寻找易感基因,随着二代高通量测序技术的成熟,基于家系样本和少量病例样本的全基因组重测序和外显子组重测序在疾病易感基因研究方面开始显现巨大优势。目前,已有数十种疾病通过外显子组重测序成功定位到了新的易感基因及突变,比如恶性黑素瘤、和痉挛性截瘫。全基因组重测序主要是在癌症这样异常复杂的疾病研究中应该更广泛,比在肝癌和乳腺癌。,29,外显子捕获测序(WES)技术,外显子区域基因组主要功能区至少85%孟德尔遗传疾病突变位点位于外显子域只占全基因组1%区域,数据量小外显子捕获测序多重探针杂交,特异扩增2009 年首次应用于致病基因的筛选Freeman Sheldon syndrome, 4样本-MYH3,验证了已有研究结果。 (NG S B, Jay Shendure, Nature,2009)2010年科学杂志十大科学突破之一,WES筛选疾病致病基因策略,筛选目标引起氨基酸变化的未知或已知罕见突变(missense, nonsense, splice SNP, coding Indel)筛选方案,WES实验方法,外显子捕获试剂盒及实验Agilent 公司SureSelect Human All Exon Kit试剂盒(有效覆盖区域 30M)Pair-end文库Illumina Paired-End Genomic DNA Sample Prep Kit (p/n PE-102-1001)试剂盒,平均插入片段长度200测序平台及实验Illumina Hiseq 2000单样本单道(lane),目标测序长度100,循环次数为108次,WES数据分析,目标:Rare或novel突变,NS/SS/cIndel流程图,WES数据分析,方法和软件选择依据:1000 Genomes使用软件使用软件原始数据质量评估与过滤 - SolexaQA软件包原始数据定位(Reads Alignment)软件- BWA软件数据校准和重定位 Genome Analysis Toolkit(GATK)突变和插入缺失查找 SamtoolsdbSNP 和1000 Genomes 位点过滤 - 自编Perl 程序 基因注释 自编程序 突变功能评估 - Polyphen-2,突变基因筛选,复合杂合突变基因 - 筛选流程,NGS突变查找中的FN和FP问题,NGS突变查找中的存在假阴性和假阳性未知突变中的FP问题尤难发现解决方法应用及检验:新算法,后续大样品SNP验证,NGS突变查找中的FN和FP问题,FN主要与测序覆盖度有关FP主要来自系统偏差和数据处理偏差系统偏差:454单碱基重复引起插入缺失;Solexa/SOLiD累计误差数据分析偏差:对齐错误,Paralog突变查找软件通常计算整体的FNR和FPR,未知突变中的FP问题,发现现象FP在未知突变数据集(NDB)中富集,而已知位点(DB)突变数据中少。估测随机抽取50个候选未知突变,使用Samtools工具观察其序列对齐情况。,未知突变中的FP问题,碱基置换率考察同类型碱基置换(transition)应高于不同类型碱基置换(transversion)。结果:DB突变符合正常情况,NDB突变明显偏离。,未知突变中的FP问题,解释1)已发现报导的突变位点数量巨大(24M),个体细胞中可发现的新的突变越来越少。真正突变中大部分是频率较高的已知突变。2)相对于全基因组,已报告位点只占少数(8%),随机假阳性事件大部分发生在非已报导位点。Venter研究Venter团队2008年基于Sanger测序数据的研究(HuRef)表明,相对于db129,至少25%的新突变是假阳性。何况是NGS?,FP对未知致病基因突变查找的影响,FP对基于未知致病基因突变查找的影响加大人工负担降低样本利用效率引发假阴性事件样本过多,目标区域覆盖率不足,未知突变中的FP问题分析,FP突变有哪些特征,哪些最严重?Solexa:低质量碱基,读序末端,前面有单碱基重复,插入缺失定位紊乱,单向极端覆盖,等等。很难确定硬阈值:界限不清,与设备、试剂有关。,未知突变中的FP问题分析,突变碱基重复(VR)JPT数据,应用二代测序技术研究发病机理、开发临检标志物,转录组测序miRNA组测序 甲基化组测序免疫组测序,44,An example,白血病相关的三株淋巴细胞系转录组差异表达及microRNA表达调控分析,研究背景, 急性淋巴细胞白血病,急性淋巴细胞白血病以未分化或分化异常的原始幼淋巴细胞在造血组织中恶性增殖为特征,由内源性或外源性致癌物诱发DNA损伤,导致原癌基因突变或过表达以及抑癌基因失活,从而引起的一种恶性血液肿瘤。,白血病细胞恶性增生活跃 细胞形态异常 细胞内多出现空泡 大量退化细胞出现 粒系、红系、巨核系细胞明显受抑,5,研究背景,(引自Rosenbauer Frank, et al. 2007),辐射暴露 吸烟 有毒化学物(苯并芘、苯) 化疗 唐氏综合症及其他特定类型遗传疾病 骨髓增生异常综合征及其他特定类型血液病 一型T细胞白血病病毒(HTLV-1)感染 家族病史 ,白血病病发诱因, 白血病发生,3,研究背景, 淋巴系白血病转录组,(引自Staratschek-Jox, et al. 2009),6,研究背景, 淋巴系白血病miRNA,(引自Zac Chatterton, et al. 2010),7,CL,Cell Line;PB,Peripheral Blood;BM,Bone Marrow;ND,Not Determined,研究目的及意义,通过新一代测序技术对不同淋巴细胞系中基因表达丰度和功能分析,了解淋巴系白血病细胞的转录谱基本特征;不同分化阶段的细胞间相互比较,理解分化相关基因在调节淋巴系多方向分化过程中的重要作用;不同白血病亚型细胞间的比较,了解不同亚型的淋巴细胞白血病之间差异形成的分子基础以及各自关键的调控因素;从基因转录和转录后调控的角度分析白血病相关的淋巴细胞间基因表达谱差异形成的主要原因,并为临床诊断、治疗及药物研发提供一定的理论基础。,Cell Line 1,Cell Line 2,Cell Line 3,mRNA,miRNA,ExpressionRegulation,Network,Diagnosis,Differentiation,Drug design,Therapy,10,Lymphoblastic cell lines,Diverse differential periodsLeukemia related,材料与方法, 实验取样,RS4;11 来源于32岁急性B淋巴前体细胞白血病女性病患的骨髓; Jurkat 来源于14岁急性T细胞白血病男性病患的外周血; GM 来源于正常女性静脉血,经EBV转染后永生化的B淋巴细胞。,细胞系,RS4;11,Jurkat,GM,样本制备,复苏后,悬浮培养细胞系;Trizol方法提取Total RNA;Ribo-minus方法提取mRNAmRNA-seq;Flash-page切胶18-30bp的片段miRNA-seq。,12,材料与方法, 整合分析策略,mRNA数据,miRNA数据,差异表达分析,基因功能分类,代谢途径富集,差异表达分析,新miRNA预测,靶基因预测,数据整合分析,DEG,WEGO,KEGG,DEG,RNA fold,RNAhybridMirandaTarget Scan,miRNA功能预测,构建调控网络,实验验证临床应用,17,GO KEGG,IPA,结果与讨论, 总体差异比较1,共表达基因聚类分析,特异性表达基因功能分类,25,结果与讨论, 白血病细胞差异2,原癌基因表达聚类,29,结果与讨论, B细胞分化差异2,细胞迁移,33,GM特异表达上调8倍以上上调2-8倍上调1-2倍下调1-2倍下调2-8倍下调8倍以上RS4;11特异表达无显著差异,结果与讨论, 白血病细胞差异3,NOD样受体信号通路,30,上调2-8倍上调1-2倍下调1-2倍下调2-8倍下调8倍以上RS4;11特异表达无显著差异,结果与讨论, 免疫表型差异2,B细胞受体信号通路,35,Jurkat特异表达上调8倍以上上调2-8倍上调1-2倍下调1-2倍下调2-8倍下调8倍以上GM特异表达无显著差异,结果与讨论, 小结2,两株白血病细胞具有更相似的基因表达谱,并且在Jurkat细胞中表现出更多上调基因。几乎所有趋化因子在白血病细胞中表达都受到抑制,而CXCR4的异常表达可能与其行使细胞免疫功能和细胞迁移的触发作用相关。不同亚型的白血病细胞拥有各自的原癌基因表达谱,两株癌细胞可能参与不同的细胞凋亡途径。PU.1、EBF、PAX5等基因在B淋巴细胞早期分化中扮演重要角色,而IRF基因家族主要在B淋巴细胞成熟后的分化过程中起作用。细胞免疫相关蛋白及其辅助受体在Jurkat细胞中特异性表达,而体液免疫相关蛋白及其辅助受体在GM细胞中表现为显著性上调。,37,结果与讨论, miRNA表达,数据注释结果,miRNA表达分布,miRNA表达数量统计,39,(571),结果与讨论, miRNA聚类,miRNA表达聚类,40,结果与讨论, miRNA差异比较,miRNA显著上调比较,miRNA表达上下调分析,特异性高表达miRNA,41,结果与讨论, 白血病调控网络,造血系统分化与白血病发生相关基因调控网络,42,细胞增殖、凋亡与白血病发生相关基因调控网络,结果与讨论, 调控网络预测1,ETS1,BMI1,RAB23,RAB9b,MYB,RELB,IRF4,NFkB2,REL,FLI1,cell cycle inhibitor,cell death,signal transduction,regulation of hematopoiesis,abnormal proliferation trigger,apoptosis,FOS,MAFK,cell survival and proliferation,differentiation,membrane trafficking,differentiation,proliferation and differentiation,blood coagulation,AP1,proliferationdifferentiationapoptosis,白血病发生,43,结果与讨论, 细胞分化调控网络,B,44,结果与讨论, 调控网络预测2,B细胞分化,Blimp-1,PAX5,PU.1,LEF1,ID2,NOTCH,NOTCH1,NOTCH2,CD19,LMO2,ERG,RUNX1,RUNX3,45,结果与讨论, 小结3,在三株淋巴系细胞中检测到约15%左右的已知miRNA表达,其中80%以上表现为低或极低表达,在三株细胞中均表达的miRNA有103个。miRNA表达谱聚类结果与转录组一致,白血病细胞之间更为相似且拥有更多上调的miRNA。造血系统分化及白血病发生的过程由多个miRNA同时调控,这些miRNA在特定时期的上、下调影响了转录表达谱的改变。,46,总结与展望, 总结,48,Summary,Justin M. Longa, 2012,个体化医疗核心实验室,疾病导向标志 (癌症,心脏病,) 药物基因筛检疾病风险评估. 预防医学,医师,病人,健康人,R&D,治疗 1 2 3 4 5,(药物, 其他),CLIA认证,组织DNARNA,Others,生物标志 分子影像其他检测方法,基因诊断与个体化医疗,Complexity,DNA,RNA,Protein,高通量系统与癌症标记,Genome,Epigenome,Transcriptome,methylation,Expression genechip and microRNA array,SNP, aCGH chips & NGS,Mass spectrometry,Methylation chip,Metabolyte,ProteomeMetabolomics,New Generation Sequencing,71,肺癌发展过程 与 癌症标记研发,Herbst RS, N Eng J Med 2008,肺癌发展史与个体化医疗,时间,诊断点,高危险族群,低危险族群,癌症临床指标,73,基因与小RNA之预后标记mRNA and microRNA Prognostic Signatures,74,Classification by Multiple Biomarkers,Risk score =0.47NF1+0.51HGF+0.52HMMR+ 0.52IRF4+0.55ZNF264+0.55ERBB3+0.59STAT2+0.59CPEB4+0.65RNF4+0.75DUSP6+0.92MMD+1.32DLG2-1.09ANXA5-0.84LCK-0.77FRAP1-0.58STAT1,Weighting value: coefficient of Cox regressionSummarize the minor effects of multiple genes,Chen HY, N Eng J Med 2007,75,Hazard ratio was adjusted by age, sex, and stage,CPE: concordance probability estimate, refer to prediction accuracy,Shedden & Beer, Nat Med, 2008,Gene signatures and clinical variables in two test sets with all stage,Fewest genes,Fewest genes,Biogenesis of microRNA,miRNA gene,Transcription,RNAPolymerase II,Pri-miRNA,Cap,(A)n,Cropping,Drosha-DGCR8(Microprocessor),Pre-miRNA,Exportin 5,Nucleus,Cytoplasm,Dicer,Ago2TRBP,Strand selection,Mature miRNAIn RISC,Base-pairing with the target mRNA,Cap,(A)n,mRNA Cleavage,Near perfect mach,Cap,(A)n,3UTR,Partial match,Translational Repression mRNA decay,miRNA的功能,Post-transcriptional gene silencingEach miRNA regulates hundreds of target mRNAs30% of protein coding genes are regulated by miRNAControl diverse pathways: development, differentiation, metabolism, proliferation, apoptosis, tumorigenesis, metastasis,78,miRNA预后标记预测病患存活率,(Yu SL, Cancer Cell 2008),miR-137,miR-182*,miR-372,miR-221,let-7a,79,Stage-subgroup Analysis,80,基因与miRNA之预后标记,81,个体化医疗:表皮生长因子受体EGFR epidermal growth factor receptor定性 vs 定量,东西方肺癌成因的差异性,白种人,亚洲人,EGFR(10%),KRAS(30%),ERBB2(10%),MET(10%),Unknown(Others),EML4-ALK,EGFR(30-40%),KRAS(5%),ERBB2(10%),MET(10%),Unknown(Others),EML4-ALK,83,东亚的肺癌个人化医疗Personalized Therapy of Lung Cancer in East Asia,Lung Cancer,Gene Testing (Reference Lab),EGFR,KRAS,HER2,BRAF,EML4-ALK,GefitnibErlotinibBIBW2992,Sorafenib(?)Chemotherapy,TrastuzumabBIBW2992,Sorafenib(?),PF02341066,MET,Met inhibitorARQ-197?,30%,10%,5%,5%,5%,510%,NTUCGM 2011,84,DNA质谱仪检测EGFR突变,Primers for PCR reaction to amply interested region,Probes for specific wild-type/mutation allele detection,Starting template (sample),Amplification,Final products with different mass by single nucleotide extension,Analysis by MALDI-TOF MS,85,85,质谱仪与直接测序的比较,40,48,42,59,Unpublished data,EGFR T790M的定量,Su KY, unpublished data,87,87,二代测序验证DNA质谱仪EGFR基因检测,Unpublished data,88,88,T790M突变 与 无病存活率的关系,Unpublished data,肺癌基因拷贝数的分析,基因拷贝数变化 与 EGFR

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论