版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算表观遗传学的兴起与发展哈尔滨医科大学生物信息科学与技术学院系统生物学教研室2010/06---生物信息学与表观遗传学的整合张岩目前一页\总数一百零三页\编于十八点经典遗传和表观遗传是一个事物(遗传)的两个方面,既相互区别又相互依存而构成一个整体,这样人类基因组就含有两类信息。表观遗传学信息:何时、何地、以何种方式去应用遗传信息遗传编码信息:提供生命必需蛋白质的模板应用及开发生物信息学方法(数据挖掘,统计学习,模式识别等)解决生物医学相关的表观遗传学问题。生物信息学工具计算表观遗传学整合目前二页\总数一百零三页\编于十八点一、计算表观遗传学概况二、计算表观遗传学研究现状
1.DNA甲基化的预测
2.组蛋白修饰的高通量分析
3.核小体定位的研究
4.印记基因的预测三、计算表观遗传学展望内容大纲目前三页\总数一百零三页\编于十八点基因型(Genotype)->
表型(Phenotype)一一、计算表观遗传学概况目前四页\总数一百零三页\编于十八点表观遗传(epigeneticinheritance):
通过有丝分裂或减数分裂来传递非DNA序列信息的现象。表观遗传学(epigenetics):则是研究不涉及DNA序列改变的基因表达和调控的可遗传变化的。或者说是研究从基因演绎为表型的过程和机制的一门新兴的遗传学分支。表观遗传学(epigenetics):则是研究不涉及DNA序列改变的基因表达和调控的可遗传变化的。或者说是研究从基因演绎为表型的过程和机制的一门新兴的遗传学分支。表观遗传学(epigenetics):则是研究不涉及DNA序列改变的基因表达和调控的可遗传变化的。或者说是研究从基因演绎为表型的过程和机制的一门新兴的遗传学分支。表观遗传学(epigenetics):则是研究不涉及DNA序列改变的基因表达和调控的可遗传变化的。或者说是研究从基因演绎为表型的过程和机制的一门新兴的遗传学分支。表观遗传学(epigenetics):则是研究不涉及DNA序列改变的基因表达和调控的可遗传变化的。或者说是研究从基因演绎为表型的过程和机制的一门新兴的遗传学分支。表观遗传学(epigenetics):则是研究不涉及DNA序列改变的基因表达和调控的可遗传变化的。或者说是研究从基因演绎为表型的过程和机制的一门新兴的遗传学分支。表观遗传学(epigenetics):则是研究不涉及DNA序列改变的基因表达和调控的可遗传变化的。或者说是研究从基因演绎为表型的过程和机制的一门新兴的遗传学分支。(1)可遗传;(2)可逆性;(3)DNA不变目前五页\总数一百零三页\编于十八点表观遗传学领域全球论文发表目前六页\总数一百零三页\编于十八点三大有影响杂志发表的表观遗传学相关论文目前七页\总数一百零三页\编于十八点这一专题围绕目前表观遗传学研究的热点展开了讨论,为表观遗传学领域研究拓宽了视野。目前表观遗传学的研究热点是在发育和疾病发生过程中,基因表达相关的染色质和染色体结构对表观遗传学机制的影响,并且对表观遗传学进行更深入的定义。
目前八页\总数一百零三页\编于十八点表观遗传学信息:何时、何地、以何种方式去应用遗传信息(1)DNA的甲基化:CpG位点,>5,000万个(2)组蛋白修饰:组蛋白密码(Histonecode)目前九页\总数一百零三页\编于十八点目前十页\总数一百零三页\编于十八点TowardahumanepigenomeRomuloMBrena,TimH-MHuang&ChristophPlassNATUREGENETICS|VOLUME38|NUMBER12|DECEMBER2006个体间组织特异的DNA甲基化和表观遗传的不均一性目前十一页\总数一百零三页\编于十八点AdeleMurrell,VardhmanK.RakyanandStephanBeckFromgenometoepigenomeHumanMolecularGenetics,2005,Vol.14,ReviewIssue1生物信息学构架了基因组学与表观基因组学的桥梁目前十二页\总数一百零三页\编于十八点ComputationalEpigenetics目前十三页\总数一百零三页\编于十八点计算表观遗传学当前及未来的朝向预测的角度研究表观遗传现象应用生物信息学工具建立遗传与表观遗传调控网络表观遗传数据库建立在表观遗传机制基础的功能基因组及比较基因组研究目前十四页\总数一百零三页\编于十八点二、计算表观遗传学研究现状
1.DNA甲基化的预测
2.组蛋白修饰的高通量分析
3.核小体定位的研究
4.印记基因的预测目前十五页\总数一百零三页\编于十八点1.DNA的甲基化的预测目前十六页\总数一百零三页\编于十八点DNA甲基化影响转录的机制目前十七页\总数一百零三页\编于十八点CpG岛的定义在基因的末端通常存在一些富含双核苷酸“CG”的区域,称为“CpG岛”,或HTF岛(HpaIItinyfragments-islands)。该序列与基因转录活性有关。主要位于基因的启动子和第一外显子区域。CpG岛的预测
正常情况下,人类基因组“垃圾”序列的CpG二核苷酸相对稀少,并且总是处于甲基化状态,与之相反,人类基因组中大小为100—1000bp左右且富含CpG二核苷酸的CpG岛则总是处于未甲基化状态,并且与56%的人类基因组编码基因相关。人类基因组序列草图分析结果表明,人类基因组CpG岛约为28890个,大部分染色体每1Mb就有5—15个CpG岛,平均值为每Mb含10.5个CpG岛,CpG岛的数目与基因密度有良好的对应关系。目前十八页\总数一百零三页\编于十八点1987Gardiner-Gardenetal.Firstlarge-scalecomputationalanalysisofCGIsCGI:CGIlength>200bp%G+C>50%
(observed/expected)CpGratio>0.6ComputationalpredictionofCGIs目前十九页\总数一百零三页\编于十八点2002TakaiandJonesCGI:CGIlength>500bp%G+C>55%CpGratio>0.65SuccessfullyexcludeAlurepeatsfromCGIsPNASMarch19,2002vol.99no.6DaiyaTakai*andPeterA.Jones目前二十页\总数一百零三页\编于十八点目前二十一页\总数一百零三页\编于十八点2002PongerandMouchiroud目前二十二页\总数一百零三页\编于十八点目前二十三页\总数一百零三页\编于十八点2006HackenbergandJonesCGI:%G+C>55%CpGratio>0.65目前二十四页\总数一百零三页\编于十八点2006HackenbergandJonesCGI:%G+C>55%CpGratio>0.65目前二十五页\总数一百零三页\编于十八点June2007|Volume3|Issue105562007ChristophBocket,al.目前二十六页\总数一百零三页\编于十八点目前二十七页\总数一百零三页\编于十八点2008YeSujuanet,al.目前二十八页\总数一百零三页\编于十八点目前二十九页\总数一百零三页\编于十八点目前三十页\总数一百零三页\编于十八点实验方法识别CpG岛原理:基于CpG二核苷酸甲基化的缺失,利用Chip-seq试验测得低甲基化的区域。实验限制:CpG岛具有组织特异性,细胞类型的特异性,识别的CpG岛数目少。目前三十一页\总数一百零三页\编于十八点基于互信息识别哺乳动物的功能CpG岛目前三十二页\总数一百零三页\编于十八点基于互信息研究CpG岛和CpG聚类中相邻CpG的相互作用的程度的分布目前三十三页\总数一百零三页\编于十八点研究的CpG岛和CpG聚类中相邻的CpG的累积互信息定量的区分CpG岛和CpG聚类目前三十四页\总数一百零三页\编于十八点CpG_MI具有最高的预测精度CpG_MI预测的人类功能CpG岛的基因组分布目前三十五页\总数一百零三页\编于十八点组蛋白修饰和CpG岛的关系发现了六种组蛋白甲基化修饰和十种组蛋白乙酰化修饰在CpG岛显著富集,两种甲基化修饰在CpG岛区域显著缺失(H3K9me3和H3K9me2)目前三十六页\总数一百零三页\编于十八点识别哺乳动物CpG岛六种哺乳动物中随机片段中的相邻CpG二核苷酸的累积互信息的分布,发现它们的分布满足指数分布,并且分布具有一致性,由此把CpG_MI推广到其它哺乳动物上。目前三十七页\总数一百零三页\编于十八点目前三十八页\总数一百零三页\编于十八点DNA甲基化的检测方法DanielZilberman1andStevenHenikoffDevelopment134,3959-3965(2007)Genome-wideanalysisofDNAmethylationpatterns目前三十九页\总数一百零三页\编于十八点目前四十页\总数一百零三页\编于十八点目前四十一页\总数一百零三页\编于十八点目前四十二页\总数一百零三页\编于十八点目前四十三页\总数一百零三页\编于十八点目标:确定DNA甲基化位点在人类基因组中的分布与频率methylationvariablepositions(MVP)(1)不同组织、细胞(2)不同发育阶段(3)正常细胞vs.癌症、疾病细胞系统研究DNA甲基化在胚胎发育,基因印记,肿瘤发生中的作用目前四十四页\总数一百零三页\编于十八点此次结果主要来自43个样品中,12个不同组织和细胞中的3条染色体,迄今为止该项计划已经研究了2500多个不同的基因组loci,发现其中21%的loci至少在一个组织中是不同甲基化的。
人类表观基因组计划的第一个结果
目前四十五页\总数一百零三页\编于十八点目前四十六页\总数一百零三页\编于十八点DNA-methylationpatterninhumanEckhardtetal.
NatGen.(2007)43.7%22.5%14.3%13.3%3.6%目前四十七页\总数一百零三页\编于十八点差异甲基化目前四十八页\总数一百零三页\编于十八点目前四十九页\总数一百零三页\编于十八点Results-iPS与ES目前五十页\总数一百零三页\编于十八点Results-数据证实我们通过两种方法证实这些数据。第一:我们通过重亚硫酸盐测定9个DMRs,每个DMR测定2-6个CpG位点,来验证通过CHARM测得的甲基化结果;结果证实了由CHARM得到的差异甲基化数据(图)。第二:我们通过芯片来进行全局的基因表达分析。结果发现:在TSS500bp范围内的R-DMRs的差异甲基化与其相应基因的差异表达之间有很强的负相关:超高甲基化和超低甲基化的区域的p均<0.001.这种关系对TSS1kb范围内的R-DMRs仍存在,对超高甲基化和超低甲基化DMRs的p值分别为0.01和<0.001(图).同时,这种关系在处于CpG岛边缘的DMRs中得到增强。目前五十一页\总数一百零三页\编于十八点Results-R-DMRs区分成体组织与癌症组织进一步,我们通过R-DMRs做了一个非监督聚类分析,来研究这些区域中的甲基化在多大程度上区分正常的脑、肝和脾(图)。值得注意的是:这三种组织被完全正确分类,表明:在重编程发生甲基化改变的位点能够正常的区分三类不同的组织。不仅如此,R-DMRs能够从结肠癌中区分大部分的正常结肠组织(图)。作为一个重要的检验,从CHARM芯片中随机取4401个区域,这些区域与R-DMRs有相同的长度和数量,重复1000次,都不能正确分类三种组织。结肠癌与正常组织中也得到了相同的结果。目前五十二页\总数一百零三页\编于十八点全基因组范围tDMRs的鉴别和分析的整合资源目前五十三页\总数一百零三页\编于十八点对人组织特异差异甲基化区域(tDMRs)做了基因组范围的研究,本资源是迄今所有物种中DNA甲基化的数据集最大的。人类13个正常体细胞组织,胎盘,精子及ENCODE使用的GM06990永生化细胞系。使用最新开发的可视化工具,所有数据都可以整合入Ensembl基因组浏览器,也是第一个整合进基因组浏览器的全基因组DNA甲基化数据。我们开发的整合系统包括最新开发的甲基化分析的贝叶斯工具(Batman),它能从MeDIP估计甲基化的绝对值。ABayesiandeconvolutionstrategyforimmunoprecipitation-basedDNAmethylomeanalysis.Nat.Biotechnol.2008.目前五十四页\总数一百零三页\编于十八点目前五十五页\总数一百零三页\编于十八点甲基化预测CpG岛甲基化模式的预测CpG位点甲基化模式的预测目前五十六页\总数一百零三页\编于十八点ModelsforpredictingDNAmethylationofCGI目前五十七页\总数一百零三页\编于十八点使用特征选择筛选乳腺癌超甲基化基因目前五十八页\总数一百零三页\编于十八点2.组蛋白修饰的高通量分析目前五十九页\总数一百零三页\编于十八点组蛋白的结构组蛋白于1834年由德国科学家A.科塞尔发现。组蛋白是存在于染色体内的与DNA结合的碱性蛋白质,染色体中组蛋白以外的蛋白质成分称非组蛋白。
目前六十页\总数一百零三页\编于十八点组蛋白的共价修饰目前六十一页\总数一百零三页\编于十八点高通量实验技术介绍ChIP-chip染色质免疫共沉淀-芯片法(Chromatin
Immunoprecipitation-chip
ChIP-Seq染色质免疫沉淀-测序目前六十二页\总数一百零三页\编于十八点组蛋白修饰的研究基于ChIP-seq数据HMM方法识别全基因组的差异组蛋白修饰位点目前六十三页\总数一百零三页\编于十八点目的:表观遗传修饰是调控基因表达和基因组功能的一个主要因素。在不同的表观遗传修饰中,差异组蛋白修饰位点(DHMSs)是不同细胞类型、时期和环境影响时,表观遗传动态性质和基因表达调控的一个研究热点。为了测定全基因组的组蛋白修饰,ChIP-seq技术是一种有效的方法。因此,通过比较两个ChIP-seq文库可以识别潜在的DHMSs。结果:我们的目的是识别DHMSs,提出一种称为ChIPDiff的方法来通过ChIP-seq测定的数据全基因组比对组蛋白修饰位点。基于观察的ChIP片段数,提出了一个隐马模型的方法推断每个基因组位置的组蛋白修饰变化状态。我们通过比对小鼠ESC和NPC细胞的H3K27me3修饰位点来评估ChIPDiff的效果。我们证明了此方法确定H3K27me3的DHMSs具有高灵敏度,特异性和重复性。进一步应用ChIPDiff揭示不同细胞时期的差异H3K4me3和H3K36me3位点。我们研究中的比对有很多有趣的生物学发现。目前六十四页\总数一百零三页\编于十八点Fewcomputationalpredictivemodelsforhistonemodifications.–Yuanetal.(2006)establishedasimpleregressionmodeltoapproximatetheregulatoryeffectofhistoneacetylationManycorrelationanalysis–Therelationshipbetweenhistonemodificationsandgeneactivities–HowdifferenthistonemodificationscooperateingeneregulationComputationalstudiesofhistonemodification目前六十五页\总数一百零三页\编于十八点组蛋白修饰与基因表达的关系利用贝叶斯网络推测组蛋白各种不同修饰和基因表达之间的因果关系及组合关系。
组蛋白各种不同修饰和基因表达之间建立的贝叶斯网络具有很好的交叉验证结果。它不仅吻合很多已知的组蛋白与基表达的关系(如H3K27me3抑制基因表达,H3K4me3促进因表达,以及这两种修饰的共同影响),而且发现了许多新的组蛋白修饰和基因表达之间的关系,以及组蛋白修饰相互之间形成的逻辑关系。
目前六十六页\总数一百零三页\编于十八点目前六十七页\总数一百零三页\编于十八点2007全基因组20个组蛋白赖氨酸和精氨酸甲基化的高分辨率的图谱
目前六十八页\总数一百零三页\编于十八点提供了关于组蛋白甲基化的功能和染色质组织基因组功能的新的见解
提供了关于组蛋白甲基化的功能和染色质组织基因组功能的新的见解
提供了关于组蛋白甲基化的功能和染色质组织基因组功能的新的见解
提供了关于组蛋白甲基化的功能和染色质组织基因组功能的新的见解
人类全基因组组蛋白变体H2A.Z、RNA聚合酶II和隔离子结合蛋白CTCF。在启动子、隔离子、增强子和转录区域典型的组蛋白甲基化模式被识别出来。H3K27、H3K9、H4K20、H3K79和H2BK5的单甲基化都与基因活化相关,而H3K27、H3K9和H3K79三甲基化都与基因抑制相关。H2A.Z与功能调控元件相关,而CTCF标记在组蛋白甲基化区域边界。染色体带型与独特组蛋白修饰模式相关。
目前六十九页\总数一百零三页\编于十八点人类CD4+T细胞中分析39种组蛋白修饰的模式
2008.目前七十页\总数一百零三页\编于十八点2007组蛋白修饰交互调控
目前七十一页\总数一百零三页\编于十八点组蛋白不同的翻译后修饰可以调控许多生理学过程。这些共价的修饰显示出很多交互的调控,有丰富的调控潜能。
目前七十二页\总数一百零三页\编于十八点大量的模式与启动子和增强子相关
识别出一个修饰模块,包含在3286个启动子中检测到的17种修饰
在个体的核小体水平上,这些修饰共定位到基因组上并且彼此相关
与这些模块结合的基因趋向于高表达,模块中增加修饰可以进一步增加表达量
组蛋白修饰可以共同作用调节染色质转录激活
目前七十三页\总数一百零三页\编于十八点HHMD人类组蛋白修饰数据库目前七十四页\总数一百零三页\编于十八点HumanHistoneModificationDatabase目前七十五页\总数一百零三页\编于十八点目前七十六页\总数一百零三页\编于十八点3.核小体定位的研究目前七十七页\总数一百零三页\编于十八点人类基因组内核小体定位的动态调节目前七十八页\总数一百零三页\编于十八点父源和母源基因组在功能上具有不等同性,由此提出在哺乳动物基因组中存在印记现象印记基因对于胎儿发育,个体生长与行为,特别是胎盘的发育都极为重要。4.印记基因的预测目前七十九页\总数一百零三页\编于十八点描述一种新算法直接从人类基因组序列特征预测基因组印记情况。通过交叉验证和独立检测得知该预测方法比之前的预测更敏感。发现156个新的印记基因,其中
8号染色体上有2个印记基因,之前认为8号染色体上不包含印记基因。一个基因KCNK9,在大脑中十分活跃,已知是引起癌症,和双相障碍(bipolar
disorder),癫痫的原因之一,而第二个基因DLGAP2是一个可能的膀胱癌肿瘤抑制因子。
目前八十页\总数一百零三页\编于十八点创造了第一张人类基因组印记基因(imprintedgenes)图谱成功的关键在于一个称为机器学习(machinelearning)的人工智能形式:modern-dayRosettastone。该项研究新发现了四倍于之前识别的印记基因。
GenomeResearch2007.17PhilippeP.Luedi,et,al.目前八十一页\总数一百零三页\编于十八点表观遗传意义重大目前八十二页\总数一百零三页\编于十八点表观遗传学相关的信息资源目前八十三页\总数一百零三页\编于十八点目前八十四页\总数一百零三页\编于十八点目前八十五页\总数一百零三页\编于十八点目前八十六页\总数一百零三页\编于十八点目前八十七页\总数一百零三页\编于十八点目前八十八页\总数一百零三页\编于十八点目前八十九页\总数一百零三页\编于十八点MicroRNA数据库
1、miRNA数据库(miRBase)2、miRNA基因组注释数据库(miRGen)3、miRNA功能注释系统(miRGator)4、miRNA靶向和表达的预测系统(microRNA.org)目前九十页\总数一百零三页\编于十八点其他表观遗传学数据库
1、重复序列去除软件(TheRepeatMaskerServer)2、开放阅读框寻找(ORFFinder)3、转录调控因子数据库(TranscriptionalRegulatoryElementDatabase)4、人类DNA第一外显子和启动子的预测服务(FirstEF)5、转录调
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年绍兴市中等专业学校合同制工作人员(融媒体工作技术员)招聘备考题库及完整答案详解一套
- 昆明市官渡区云南大学附属中学星耀学校2026年校园招聘备考题库完整答案详解
- 2025年湘科研究院招聘专业技术人员5名备考题库完整参考答案详解
- 盘活资产经验交流材料范文
- 新疆维吾尔自治区气象局2026年度事业单位公开招聘应届毕业生备考题库(第二批第1号)及一套参考答案详解
- 2025年湖南省中西医结合医院湖南省中医药研究院附属医院高层次人才公开招聘13人备考题库及一套完整答案详解
- 2025年大连市皮肤病医院招聘合同制工作人员36人备考题库及答案详解1套
- 2025年中国科学院东北地理与农业生态研究所学术期刊中心工作人员招聘备考题库及答案详解一套
- 中国信息通信研究院2026届校园招聘80人备考题库完整参考答案详解
- 总量联合行业《“十五五”规划建议》解读:“十五五”规划引领资本市场谱写创新升级新机遇
- 资金无偿赠予协议书
- 课件王思斌:社会工作概论
- 2025年度交通运输安全生产费用使用计划
- 防水工程验收单
- 2025年高考数学总复习《立体几何》专项测试卷及答案
- 自由职业者合作协议样本
- 2025工程质检部工作计划
- 《四川省信息化项目费用测算标准》
- 大学武术知到智慧树章节测试课后答案2024年秋浙江大学
- 【初中道法】在奉献中成就精彩人生(课件)-2024-2025学年七年级道德与法治上册(统编版2024)
- 中医适宜技术-中药热奄包
评论
0/150
提交评论