通过DNA测序数据对结核病耐药性进行分类的机器学习_第1页
通过DNA测序数据对结核病耐药性进行分类的机器学习_第2页
通过DNA测序数据对结核病耐药性进行分类的机器学习_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

通过DNA测序数据对结核病耐药性进行分类的机器学习1.背景结核病(TB)是世界范围内导致死亡的主要原因之一,与艾滋病相比拥有更高的致死率,对可用结核病(TB)药物的结核分枝杆菌(MTB)耐药性的正确和快速测定对结核病的控制和管理至关重要。应对全球结核病流行的一个关键挑战是及时诊断和正确治疗。快速分子诊断测试有助于确保早期发现和及时治疗,迄今为止的研究集中在识别描述的多变量关联,然而,鉴于某些抗结核药物的关联性仍然知之甚少,鉴定这种多变量关联的方法可能具有有限的效用。综合这种效应,耐药性的遗传基础比预期更复杂:耐药相关基因可能含有与药物耐药相关的非同义SNP;而以复杂方式相互作用的突变可能会对特定药物产生高水平的耐药性。基于机器学习的预测模型可以探索遗传变异之间的多变量关联。以前的研究已经采用了许多这样的算法来预测结核分枝杆菌(MTB)耐药性:例如逻辑回归和随机森林。然而,对MTB耐药性分类潜在适用方法的全面评估尚未见报道。2.方法本文利用大量MTB分离株评估了不同模型对四种一线药物,几种二线药物和耐多药结核病药物耐药性的分类能力。本文研究了7种机器学习分类器,包括包含L1和L2正则化(LR-L1和LR-L2)的逻辑回归,L2正则化支持向量机和径向基函数核(SVM-L2和SVM-RBF),随机森林(RF),产品边际模型(PM)和类条件伯努利混合模型(CBMM)。在评估所有方法的时,同步在每个实验中反复随机选择敏感类型的敏感分离株,给出与单个药物相同的耐药类型。考虑了三组功能:F1-F3,以评估他们的表现。特征集F1是基线特征集(在23个候选基因内发现的所有SNP)。特征集合F2仅包含先前怀疑为抗性决定簇的那些SNP。功能集F3是给定特定药物的F1的子集(其中包括仅具有该药物的抗性决定簇的基因)。因此F3反映了可以被认为是直接决定因素的因素,而F2包含了使用抗性共同发生的可能性)在11种药物的所有直接决定因素中用于通知预测,并且F1更大规模地解释抗性共同出现。

而切LLL上U-UIW鹫Ed而切LLL上U-UIW鹫Ed吕OHV图1在八种抗结核药物和耐多药结核病的7种分类器的分类性能,包括Fl、F2和F3的特性集。图1显示了7个机器学习分类器的AUC性能的比较,可以发现:1、几乎所有分类器在三个特征集(INH,RIF,EMB和MDR)上都很稳健;2、分类器较好地配置F1和F2(PZA和SM)的药物;3、分类器较好地使用特性集来分类F3(MOX和OFX)的药物。所有分类器对于所有特征集均达到至少93%的AUC(除了在CIP的情况下具有F1和F3的RF)。MOX和OFX抗性鉴定是最具挑战性的,对于特征组F1和F2,所有分类器的AUC值都低于90%。特别是F3的平均表现明显优于F1或F2平均AUC至少为85%的患者。3・结果与直接关联相比,本文的模型达到了相当或更好的耐药性分类,而直接关联仅依赖于文献中以前确定的任何抗药决定因素。结果验证了使用机器学习算法识别MTB耐药性,并支持以前未知的多变量关联和相互作用导致对几种抗结核药物耐药性的假设。与先前的基于规则的方法相比,异烟肼,利福平和乙胺丁醇的最佳表现模型的敏感性分别提高2-4%至97%(Pv0.01);对于环丙沙星和多重耐药结核病,他们增加到96%。对于莫西沙星和氧氟沙星,敏感性分别从现有已知耐药等位基因的83%和81%分别增加12%和15%至95%和96%(P<0.01)。特别是,与先前基于规则的方法相比,我们的模型分别提高了灵敏度15和24%,吡嗪酰胺和链霉素分别为84和87%(P<0.01)。表现最好的模型将吡嗪酰胺和链霉素的面积下ROC曲线增加10%(Pv0.01),其他药物为4-8%(P<0.01)。4.结论该论文所做的工作显示了机器学习在提高高维度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论