版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目录目录6.范例实现-17.范例实现-200遇到的一系列计算难题。应到计算空间的维度也就愈高。被称为高维数据。时,常常会发生的一些奇奇怪怪的现象。Bellman)在考虑优化问题时首次提出来的术语,用来描述当计算空间维度增加时,分析高维空间(如数千维)时,会遇到各种问题场景。是一个有效的工具。”习。”•例如,在基因医学领域里,基因排序相关的数据,AI个维度,于是计算空间成为极高维度的空间。•如今,利用ML的自编码器(Autoencoder)模型的降据空间的重要特征。•这样即可在低维度的潜藏空间中,进行高速的运算。常用的。•在本节课里,就拿基因医学的GWAS分析来举例说明之,也设计一个简单的StackedAE模型,然后解析其代码内容。前言•ThehighdimensionalitypresentingeneticdatamakesuateallPcombinations使得计算上变得困难。前言•WithregardstothediscoveryofSNP-to-SNPnpromise•关于SNP到SNP交互的发现,深度学习(DL)已显示出光明的前景。bydeephiddenlayersandneurons•它的特色在于深层的隐藏层及其神经元。SNPsandtheirassociationtothephenotype.声这些特征来辨别曲风。场,来帮忙进行各种识别(如遗传表征)了。11目的•Genome-wideAssociationStudies(GWAS):目的•Genome-wideAssociationStudies(GWAS):目的•Genome-wideAssociationStudies(GWAS):手段•GWAS(Genome-wideAssociationStudies):•观察基因的变异,探索其与特定表型之间潜藏的定义•Genome-wideAssociationStudies(GWAS):ctinga定义•Genome-wideAssociationStudies(GWAS):•从全体基因组中探索其中数以百万计的SNPs(即<基因ies定义•(GWASlookathundredsofthousandsofSNPsacrossthewholegenome,toseewhichofthemareassociatedwithaspecificdisease.)认识GWAS定义ies•(GWASlookathundredsofthousandsofSNPsacrossthewholegenome,toseewhichofthemareassociatedwithaspecificdisease.)定义GWASGenomewideassociationstudies):从全体•基因组就像一本书,各版本可能会有变异。ies定义•(GWASlookathundredsofthousandsofSNPsacrossthewholegenome,toseewhichofthemareassociatedwithaspecificdisease.)认识GWAS•GWASareusedtoidentifywhethercommonSNPsinthepopulationareassociatedwithdisease.认识GWAS•GWASareusedtoidentifywhethercommonSNPsinthepopulationareassociatedwithdisease.认识GWAS•GWASareusedtoidentifywhethercommonSNPsinthepopulationareassociatedwithdisease.认识GWAS•GWASareusedtoidentifywhethercommonSNPspopulationareassociatedwithdisease预测认识GWAS22•近些年,GWAS利用SNP(单核苷酸多态)分子标记已经定号在多次试验中有很高的可重复性。•例如,人类常见疾病肥胖,糖尿病,精神分裂等。在。定义一部分个体(如:1%以上)中的基因多样性。•ASNPisdefinedasasinglebasechangeinaDNAcethatoccursinasignificantproportionmorethan1%)ofalargepopulation.定义一部分个体(如:1%以上)中的基因多样性。•ASNPisdefinedasasinglebasechangeinaDNAcethatoccursinasignificantproportionmorethan1%)ofalargepopulation.定义个体(如:1%以上)中的基因多样性。•ASNPisdefinedasasinglebasechangeinaDNAcethatoccursinasignificantproportionmorethan1%)ofalargepopulation.定义族中明显一部分个体(如:1%以上)中的基因多样性。•ASNPisdefinedasasinglebasechangeinaDNAcethatoccursinasignificantproportionmorethan1%)ofalargepopulation.定义族中明显一部分个体(如:1%以上)中的基因多样性。是指含氮碱基(NitrogenousBase),一般简称:碱基(Base)•DNA主要碱基共有4种:胞嘧啶(C)、鸟嘌呤(G)、腺嘌呤(A)、胸腺嘧啶(T)。•人类基因组含有30亿个碱基对。•人类基因组含有30亿个碱基对。•每一物种都有一致的DNA序列,但每一个个体会有些变异。•人们的99.9%基因序列都是相同的。认识SNP•DNA主要碱基共有4种:胞嘧啶(C)、鸟嘌呤(G)、腺嘌呤(A)、胸腺嘧啶(T)。染色体&DNA碱基对定义群族中明显一部分个体(如:1%以上)中的基因多样性。定义群族中明显一部分个体(如:1%以上)中的基因多样性。或者多个磷酸基团组成。个体(如:1%以上)中的基因多样性。或者多个磷酸基团组成。NA认识SNP列中的单一碱基对(Basepair)变异」,也就是DNA序列中A、TCG即基因组(genome)的一个特异和定位的位个的核苷酸可能性,会造成这样的变异原因为基因发生删除、插入或是取代反应。Mr.B•例如上图,两不同个体相对应的DNA区段分别是AAGCCTA和AAGCTTA其包含有一单一碱基对变异。变异。genome-widesetofgeneticvariantsUgenome-widesetofgeneticvariantsUrrr33GWAS的进展•Advancesinthefieldhaveidentifiedgeneticvariationserliecommondisorderssuchascertaincancers.•GWAS领域的进展已经确定了导致常见疾病(如某些癌症基于SNP特征•GWASutilizeSNPInformationandthishashelpedtodgeandunderstandingofdiseasegenetics.学的了解和理解。commontypeofgeneticvariationamonghumans.•Thesehavebecomethegeneticmarkerofchoiceinthegeneticmappingofcomplextraits.•单核苷酸多态性(SNPs)是人类身体最常见的基因变异类型。•这些已成为复杂特征基因图谱中首选的遗传标志。diseasesremainsasignificantchallenge.•了解常见病的遗传(基因)结构仍然是一项严峻的挑战。•GWASimplementssingle-locianalysiswhereSNPsareytestedforassociationwithphenotypesestwithoutconsiderationoftheinteractionsthatoccurbetweenloci.•GWAS实践了单位点分析,其拿SNPs来独立测试以便找互作用。•ThisisamajorlimitationinGWAS,particularlywhenausedbySNPSNPgene-geneandgene-environmentinteractions.疾病时。新方向:SNPs之间的相互作用•Traditionalstatisticalmethodssuchaslogisticsionhaveshownlimitedpowerinmodellingghordernonlinearinteractionsbetweengeneticvariants.•传统的统计方法(例如逻辑回归)有项缺点:在建立的。新方向:SNPs之间的相互作用•Thisapproachassumesthatgenesdonotworkeffectsontestedphenotypes网络”,成为对测试表型的主要影响因子。新方向:SNPs之间的相互作用•Thisapproachassumesthatgenesdonotworkeffectsontestedphenotypes网络”,成为对测试表型的主要影响因子。::•Therefore,tobetterunderstandthemissingssarytoexamineepistasisinteractions.expressionofanothergene.xpressionofanothergeneexpressionofanothergene.expressionofanothergene.下下位基因•位于不同染色体的基因。被抑制biologicalmechanismsandpredictcomplextraitsfromgenotypedata.制并根据基因型数据预测复杂性状。44ML善于表达SNPs与表型之间的关联性SNPsandtheirassociationtothephenotype.关系和相互作用;以及表达它们与表型之间的关联性。ML善于表达SNPs与表型之间的关联性SNPsandtheirassociationtothephenotype.机器学习助力GWASstodetectSNPionandfeatureselection.预测、和特征选择。机器学习助力GWASistodetectSNPionandfeatureselection.预测、和特征选择。机器学习助力GWAStectionofgenegeneinteractionsanddiseaseclassification.病分类。机器学习助力GWAStectionofgenegeneinteractionsanddiseaseclassification.sideredthemostrelevantbutdifficultchallenge.挑战。•Although,thesetypesofmachinelearninglingcomplexamongasmallnumberheydonotscaletolargernumbersofASdataonemillionSNPsandthousandsofsamples).•Although,thesetypesofmachinelearninglingcomplexongasmallnumberheydonotscaletolargernumbersofASdataonemillionSNPsandthousandsofsamples).GWAS与机器学习•ThehighdimensionalitypresentingeneticdatamakesuateallPcombinations使得计算上变得困难。•Therefore,analternativeapproachtomodelhigh-actionsbetweenSNPsisneeded.•Therefore,analternativeapproachtomodelhigh-actionsbetweenSNPsisneeded.sappealingsinceitexhibitsthepotentialtodealtaandthedetectionofcomplexfeaturesandassociatedinteractions.的相互作用。sappealingsinceitexhibitsthepotentialtodealdataandthedetectionofcomplexfeaturesandassociatedinteractions.深度学习(DL)+GWAS•GWAS是在人类全基因组范围内找出存在的序列变异,即单核苷酸多态性(SNP),并进行SNP插补 (imputation)以补足未被定序的基因变异片段。•然后探索出哪些基因位点(genelocus)的序列变异与特定表型(phenotype)的关联。•GWAS为人们打开了一扇通往研究复杂疾病的大门。深度学习(DL)+GWAS•GWAS是在人类全基因组范围内找出存在的序列变异,即单核苷酸多态性(SNP),并进行SNP插补 (imputation)以补足未被定序的基因变异片段。•然后探索出哪些基因位点(genelocus)的序列变异与特定表型(特定表型(phenotype)的关联。Ingenetics,alocus(pluralloci)isaspecific,fixedpositiononachromosomewhereaparticulargeneorgeneticmarkerislocated.应用范例Ps与血清丙胺酸转胺酶(ALT)浓度的变化趋势相关。atMountSinai)的研究团队,透过全基因组关联分析迄今最大规模的躁郁症基因研究,并找出15个与疾病紧密相关、有望成为治疗标靶的基因。该论文发表于期刊应用范例Ps与血清丙胺酸转胺酶(ALT)浓度的变化趋势相关。atMountSinai)的研究团队,透过全基因组关联分析迄今最大规模的躁郁症基因研究,并找出15个与疾病紧密深度学习的特点•WithregardstothediscoveryofSNP-to-SNPomise•关于SNP到SNP交互的发现,深度学习(DL)已显示出光明的前景。GWAS与机器学习深度学习的特点•WithregardstothediscoveryofSNP-to-SNPnpromise•关于SNP到SNP交互的发现,深度学习(DL)已显示出光明的前景。denlayersandneurons•它的特色在于深层的隐藏层及其神经元。以AE(Autoencoder)为例以AE(Autoencoder)为例•Anautoencoder(AE)isanunsupervisedlearningo•AE可以透过反向传播技术来训练模型,让其输出Y值,非•AE(自编码器)是一种可以实现编码和译码的神经网络。将原始资料。>>>>XH55•多个AE逐层堆栈以产生堆栈式自动编码器(SAE)。都可以实现<降维>的效果。•多个AE逐层堆栈以产生堆栈式自动编码器(SAE)。都可以实现<降维>的效果。•把各AE里的Encoder迁移过来,堆栈在一起。Encoder1Encoder2•形成一个多层次深度<降维>模型。I•分类模型)的输入值。更多组合形式•也可以结合起来,成为一个深度学习模型。活用SAE修正权重•OurproposedapproachextendsGWASbycombiningautoencodersSAEsandRMtoidentifyepistaticinteractionsbetweenSNPs.tsignificantSNPsareuentanalysistoinvestigateepistasis.•从传统的GWAS质量控制和关联分析中,挑选出最显着的作用。tsignificantSNPsareuentanalysistoinvestigateepistasis.•从传统的GWAS质量控制和关联分析中,挑选出最显着的作用。•Therefore,SAEsarecombinedwithassociationrulenscontributetoclassificationresultss交互作用有助于分类结果。•AssociationrulesareimplementedtorevealbiologicallyNPsIfSNPsfrequentlylyingrelationshipbetweenthem.•ARM用来揭示SNPs之间的生物学的组合关联。如果SNPs经常出现在一起,则它们之间存在潜在的关系。tomodelepistaticinetuneafullyconnectedmulti-layerperceptron(MLP).Ps•ThisisthefirststudyofitskindtocombinesisedlearningbuiltonstackedautoencodersLPclassifierfortheclassificationofTDsusingGWASdata.Ds进行分类。entinSNPSNPinteractionsdforwardartificialneuralnetwork(ANN)classifier.化一个ANN分类器。kingfoursinglelayerAEswith000-500-50hiddenunits.500和50个神经元。•透过这个AE来从2465个SNPs中,进行特征提取。ckingfoursinglelayerAEswith000-500-50hiddenunits.ecompressedhiddenunitsconsideredintheSAE.ANN(使用softmax激活函数)模型。SAE+ANN分类器的效果•ThisdemonstratesthepotentialofusingourdeeplargecomplexentrepresentationsectbetweenSNPsinGWAS.GWAS中SNP之间的上位性效应。SAE+ANN分类器的效果classifierinedinourpreviousstudyusingthesamedataset.更棒的效果。SAE+ANN分类器的效果identifywhatinformationPscontributedtothecompressinlyduetothelackofinterpretationofdeeplearningmodelswhichactasablackbox.•但是,使用SAE压缩功能很难识别2465个SNP中的哪些子一样,人们难以解释其推论逻辑所致。SAE+ANN分类器的效果•Thislimitationfosterstheneedtocreaterobust•因此想办法来解释这个DL模型。SAE+ANN分类器的效果•Wecombinedcommongenetictoolsandtechniquesionanalysiswithdeeplearningtotinformationandt
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 采购部门工时制度
- 采购销售合同登记制度
- 采购需求管理制度范本
- 采购领取制度
- 采购验收退货制度
- 金融托盘采购保理制度规定
- 铁路单位物资采购制度
- 论安妮·埃尔诺作品中的女性衰老书写-以《我走不出我的黑夜》为例
- 第8章 实数(提高卷)章节复习自测卷(原卷版)-人教版(2024)七下
- 2026年人造草坪施工合同(1篇)
- 建设施工分包安全管理培训讲义图文并茂
- C语言试讲稿课件
- (完整版)英语仁爱版九年级英语下册全册教案
- 三角形的认识(强震球)
- JJG 602-2014低频信号发生器
- GA/T 832-2014道路交通安全违法行为图像取证技术规范
- GA 1800.6-2021电力系统治安反恐防范要求第6部分:核能发电企业
- 教学课件-氢氧化钠溶液的配制与标定
- 人教版政治七年级下册全套课件
- 《水资源》-完整版课件
- 一级半压气机优化教程
评论
0/150
提交评论