版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
机器学习模型在代谢功能障碍相关脂肪性肝病中的应用进展2026代谢功能障碍相关脂肪性肝病(metabolicdysfunction–relatedsteatoticliverdisease,MASLD)是全球范围内最常见的肝脏疾病之一,其患病率随着代谢综合征(metabolicsyndrome,MetS)、肥胖以及人口老龄化的加剧而持续攀升。机器学习(machinelearning,ML)作为一种能够处理和分析海量数据与信息的强大分析工具,已被广泛应用于MASLD的诊断优化、风险评估、无创筛查技术研发以及治疗策略制定等多个方面。本综述全面梳理了ML在MASLD相关基因和脂质组学生物标志物筛选、超声、影像学等无创筛查技术的应用,以及预测疾病进展为代谢功能障碍相关脂肪性肝炎(metabolicdysfunction–associatedsteatohepatitis,MASH)或肝硬化等更晚期阶段风险方面的应用进展。此外,ML模型在精准预测并有效管理MASLD相关合并症风险方面也显示出显著潜力和可靠的应用性能表现。通过整合临床资料、生化指标、影像学信息以及个体生化特征,ML为MASLD的诊疗提供了一种个体化医学的新范式,有助于优化临床治疗策略,并有望在未来对公共健康发展产生重要影响。1.引言非酒精性脂肪性肝病(non-alcoholicfattyliverdisease,NAFLD)是一种以肝脏脂质沉积为特征、且非由酒精滥用所致的疾病,主要包括两种类型:单纯性脂肪变性(又称非酒精性脂肪肝,NAFL)以及非酒精性脂肪性肝炎(non-alcoholicsteatohepatitis,NASH)。随着“代谢功能障碍相关脂肪性肝病(MASLD)”这一新术语正式取代NAFLD,MASLD被定义为经影像学或组织学证实的肝脏脂肪变性(>5%),并伴随至少一种心血管代谢危险因素,如肥胖、2型糖尿病、高血压或血脂异常。这一命名转变标志着从传统的“排除性诊断”向“以代谢异常为核心的正向诊断框架”的转变,更突出了疾病潜在的代谢异常发病机制,同时也减少了“脂肪肝”这一术语所带来的社会污名化影响。值得注意的是,欧洲NAFLD登记研究的分析结果显示,约98%的原NAFLD患者符合MASLD诊断标准,表明两种定义对应的患者人群具有高度重叠性。尽管如此,MASLD在病因学和病理生理学层面更明确地强调了代谢发病机制的核心地位,让疾病的诊断和病理生理机制阐释更具针对性。同时,原有的NASH术语也被“代谢功能障碍相关脂肪性肝炎(MASH)”所取代。MASH的组织学特征为肝脂肪变性伴随炎症和肝细胞气球样变,可伴或不伴肝纤维化。目前,MASLD/MASH已成为全球最常见的慢性肝病,约25%的人口受其影响。流行病学研究显示,MASLD的发病率正快速上升,且在亚洲地区呈现出明显的发病年轻化趋势。大规模研究数据表明,2012年至2017年间亚洲MASLD的患病率攀升至33.9%,美国的患病率约为30%。MASLD患者的心血管疾病相关死亡风险显著升高,且该风险会随肝内脂肪积累程度的增加而进一步加重。疾病可从单纯脂肪变性逐步进展为肝细胞气球样变、肝脏炎症、肝纤维化、肝硬化、终末期肝病,甚至发展为肝细胞癌。越来越多的证据表明,MASLD有望在未来十年内成为肝移植的首要适应证。本综述均采用MASLD及其相关最新命名体系,但需指出,部分早期研究仍使用NAFLD/NASH表述。肝活检仍是诊断MASLD/MASH并评估肝纤维化程度的“金标准”。尽管其诊断准确性高,但该操作具有侵入性,且存在疼痛、感染和出血等严重并发症风险,同时也不适合通过频繁重复检测来监测治疗反应。因此,超声等检查手段凭借其无创、快速、无辐射等优势,已成为临床首选的筛查方式。超声已被广泛用于MASLD的临床筛查,也适用于随访过程中的常规复查,但其检测结果易受操作者经验影响,且缺乏定量评估的统一标准,存在一定局限性。近年来发展起来的多用途磁共振成像(MRI)技术,如质子密度脂肪分数(protondensityfatfraction,PDFF)以及质子磁共振波谱技术,为MASLD提供了高精度的无创诊断方案选择。然而,MRI检查的可及性受限,部分受检者存在检查禁忌证,且相较其他无创检测技术成本更高。此外,当肝脏铁负荷过高时(该情况在MASLD患者中较为常见),MRIPDFF的测量结果可能缺乏可靠性。图1机器学习模型机器学习(ML)是计算机科学的一个重要分支,其核心是通过多种算法从海量数据集中挖掘并识别数据模式,并在无需预设规则的情况下进行决策与预测(图1)。ML的学习方式主要包括三大类:无监督学习、监督学习与强化学习。在无监督学习中,模型无需额外的标签数据即可自主发现数据模式;在监督学习中,模型基于输入数据及其对应的正确输出结果进行训练;在强化学习中,模型通过学习能够获得最大奖励的策略来完成训练(图2)。深度学习作为ML的一个子领域,以深层神经网络为基础,其网络结构模拟人脑神经网络,具有更高的复杂度与学习能力。图2机器学习模型分类在肝病研究领域,ML已被用于分析多种类型的数据,包括临床数据、人口学数据、分子数据、影像学数据以及病理数据。ML模型能够辅助临床医生进行疾病识别,实现实时临床决策,优化医院资源配置,并对高风险患者进行分层管理。与许多传统临床风险评分体系和基于规则的评估工具相比,ML方法可灵活构建复杂的非线性关系以及变量间的高阶交互作用模型,从而有望提升对MASLD这类复杂疾病的预测性能。因此,ML能够整合疾病的多个诱发因素,并从数据中直接学习规律,在众多变量之间识别新的关联模式,特别适用于高维且变量交互复杂的研究场景,进而实现更准确的预测,这对于肝脏疾病等多因素疾病的研究尤为关键。2.机器学习在预测和阐明MASLD病因中的应用MASLD是重大的全球公共健康问题,其病理生理过程复杂。准确理解并预测MASLD的病因及疾病进展,对于制定有效的预防策略和个体化治疗方案至关重要。近年来,ML技术凭借其处理海量数据并识别数据内在复杂模式的能力,已被广泛用于MASLD的发病机制研究与临床预测模型构建。但需要强调的是,目前大多数基于ML的研究主要提供的是相关性证据,而非明确的因果关系,因此在病因因果层面的研究仍属于探索性阶段,相关结论需进一步的生物学与临床验证。铁蓄积与脂质代谢调控失衡已被证实与MASH的发生密切相关。尽管铁死亡相关基因(ferroptosis-relatedgenes,FRGs)在MASH中的作用尚未完全阐明,Dai等结合113种ML算法发现,基于铁死亡相关特征,采用广义线性模型(generalizedlinearmodel,GLM)和梯度提升决策树(gradientboostingdecisiontree,GBDT)能够有效预测NASH。该研究还识别出包括ZFP36在内的8个关键FRGs,并强调其与免疫细胞富集及免疫特征具有显著相关性,为MASLD精准医学研究提供了潜在的生物标志物。此外,Zhang等使用R包“LinearModelsforMicroarrayAnalysis”(limma)与“weightedgeneco-expressionnetworkanalysis”(WGCNA)识别出219个MASLD相关基因,这些基因主要参与炎症通路调控。研究进一步采用支持向量机递归特征消除(SVM-RFE)与最小绝对收缩与选择算子(LASSO)回归算法筛选出4个特征基因(AXUD1、FOSB、GADD45B、SOCS2),这些基因或可作为MASLD的诊断生物标志物。其他研究也利用WGCNA识别特定基因,并构建了一个五基因生物标志物ML模型,用于预测MASLD患病风险并评估患者的脂质代谢表型。Mo等通过ML探索MASLD与动脉粥样硬化之间共同的病理机制,识别出3个共同标志基因(PLCXD3、CCL19、PKD2)及相关免疫特征,并构建了诊断模型,为理解MASLD并发症的发生机制提供了新视角。脂质组学与MASLD的关系同样是探索脂肪肝病因的重要切入点。近年来,ML技术与多组学数据的整合应用,推动了学界对MASLD复杂致病机制的新认识,尤其是随机森林(randomforest,RF)与极端梯度提升(XGBoost)模型,可通过分析患者脂质组学数据识别NASH的生物标志物。在另一项相关研究中,Ji等将靶向代谢组学与ML技术结合,识别出谷氨酸、异柠檬酸等关键代谢物,这些代谢物可用于区分MASLD的不同病理进程。Chiappini等采用RF模型识别出32种不同脂质分子,可作为MASH的潜在诊断标志物。Shafiha的研究显示,从转录组与脂质组数据集中提取的C4BPA基因可能作为MASH的生物标志物,这也凸显了补体通路在MASH发生进展及其代谢调控机制中的重要作用。此外,Atabaki-Pasdar等利用队列数据,采用LASSO与RF分析并整合临床与多组学资源,开发出高准确度的MASLD预测模型。在该研究中,整合临床与多组学变量的模型交叉验证ROC-AUC约为0.84(95%CI:0.82,0.86;P<0.001),而仅使用9个临床可获得变量的模型ROC-AUC约为0.82(95%CI:0.81,0.83;P<0.001),并且该模型在同一队列中的预测效果优于多个既有的MASLD无创评分体系。尽管该模型的研究重点为诊断性能,但通过整合脂质组学数据,也凸显了脂质代谢在MASLD发病机制中的重要作用。Perakakis等利用多种ML工具,通过对血清样本进行脂质组学、糖基组学及游离脂肪酸分析,并结合激素测量数据,成功区分健康人群、MASLD与MASH患者,提出了可用于肝纤维化诊断的脂质标志物。这些研究进一步强调了脂质组学在理解MASLD病因中的关键作用。另一项研究使用超高效液相色谱-质谱(UHPLC-MS)检测249名患者的血清代谢物,发现经历MASLD-肝细胞癌(HCC)疾病进程序列的参与者血清脂质组发生显著改变,并据此建立了基于ML的诊断模型。该研究提示,血清代谢组学不仅对MASLD-HCC的监测与早期诊断至关重要,也为理解MASLD的病因提供了新线索。除遗传与代谢因素外,化学物质与环境污染物暴露也是MASLD发生发展的另一类重要致病因素。Cotterill等利用ML工具构建了用于预测MASLD的定量构效关系模型(QSAR模型)。该模型基于包含207种药物与杀虫剂的数据集,能够识别可能诱发脂肪性肝病的化合物。上述发现均有助于MASLD的精准诊断,并可能为其预防与治疗提供潜在的治疗靶点。在多组学研究背景下,ML正开始突破传统单指标无创检测工具(如ALT/AST、FIB-4、NFS)的局限,这些传统指标大多反映的是下游肝损伤情况,而非上游的病因异常。通过同时整合数百至数千种脂质、代谢物或基因特征,多组学ML模型能够捕捉疾病亚型、潜在发病机制以及与铁代谢、免疫微环境和脂质代谢网络相关的关键通路,从而较传统评分体系具备更强的敏感性与机制相关性。例如,ZFP36、C4BPA以及特定脂质分子等特征,均是通过ML在大规模组学数据中的挖掘而被发现,这提示MASLD存在多通路的病因基础,也为疾病研究提供了更全面、以及针对机制信息的丰富视角。尽管取得了上述进展,多组学ML在MASLD病因研究中仍存在若干关键方法学问题:(1)许多研究依赖靶向组学检测模式,仅测量预先选择的分子,导致大量未知脂质与未注释代谢物被忽略。对于病因异质性显著的MASLD而言,这可能遗漏关键的致病信号与新的发病通路,从而限制ML模型的发现能力。(2)“高维—小样本”问题尤为突出:研究样本量通常<200,而特征维度常超过500–5000。若缺乏严格的正则化处理、严谨的交叉验证以及对特征选择与超参数调优策略的透明报告,则模型过拟合风险显著增加,可能出现内部验证表现乐观但在独立队列中性能明显下降的情况。(3)多组学评分体系、脂质检测模式与ML模型的数量迅速增加,但其建立基于异质的样本类型、检测平台、数据预处理流程与算法,且对TRIPOD或PROBAST等研究标准的遵循不足,缺乏标准化的研究流程,导致不同研究结果难以客观比较、整合与临床转化采用。(4)模型的外部验证不足,且很少跨国家与跨种族开展评估,导致模型的可重复性与泛化能力有限。(5)临床转化受限于检测成本与基础设施投入高、缺乏标准化的分析流程、模型可解释性不足、与电子病历(EHR)及影像系统的整合程度有限,同时几乎缺乏正式的成本–效果或风险–收益分析,也未获得相关监管批准。因此,在当前阶段,多组学ML模型更适合作为病因探索与假设生成的工具,而非用于常规人群的筛查或临床决策支持。此外,即便某些模型在研究环境中具有良好的区分度,基因组学及其他组学检测所需的多步骤处理流程,也使其相较于基于常规临床或影像数据构建的模型,更不适合床旁实时决策。为实现临床转化,未来研究应优先推进以下工作:建立标准化的质谱采集与数据分析流程;开展大规模、多中心、多种族的外部验证研究;引入可解释ML与因果ML方法,将模型的预测性能与疾病机制认识相连接;制定统一的模型评价标准与临床可行性基准;并开展系统性的成本–效果分析,以量化其相较于传统指标的增量价值。随着这些前提条件逐步满足,多组学ML模型有望从“机制研究工具”演进为“可临床部署的决策支持系统”。3.机器学习在MASLD无创筛查中的应用MASLD及MASH在疾病早期往往缺乏明显的临床症状与特异性体征。开发有效的无创筛查方法,对于脂肪肝的早期识别与及时干预至关重要。近年来,ML为MASLD的无创筛查提供了新的方法与思路。ML用于无创筛查的主要数据来源包括体检数据、EHR、实验室检测结果、超声影像发现以及放射学影像数据。3.1基于体检数据、EHR与实验室检查的MASLD无创筛查体检数据、EHR与实验室检测结果富含临床与生物学信息,为MASLD的无创筛查与管理开辟了新路径。通过对这些数据集进行综合利用与深度分析,ML模型能够帮助临床医生更早识别MASLD/MASH患者。JiW等使用304,145名成年人的体检数据构建并验证了一个MASLD的ML筛查模型。该模型首先使用LASSO进行初步特征筛选,再采用XGBoost等算法建立模型。XGBoost模型在验证集中表现最佳:准确率0.880、精确率0.801、召回率0.894、F1值0.882、AUC0.951,预测性能显著优于多项传统指标。该研究不仅展示了ML在MASLD早期识别与分型方面的潜力,也强调了年龄、体重指数(BMI)与腰围等危险因素在MASLD防治中的重要意义。同样地,Uchida等基于体检数据采用线性非高斯无环模型进行因果分析;Noureddin等则结合多种ML模型对NHANES数据进行分析,以评估2型糖尿病人群中MASLD的患病情况。两项研究均明确指出了ML在MASLD早期识别中的潜力,并提示MASLD的发生与代谢综合征、年龄与BMI密切相关。Razmpour的研究通过分析体格指标与体成分测量数据,采用RF、k近邻等多种ML方法预测MASLD,发现腰围与腹围是重要的预测因子,其中RF模型在该研究队列中预测任何分期脂肪肝的准确率约为82%。有趣的是,一项最新研究纳入浙江省365名成人,基于纤溶指标(如组织型纤溶酶原激活物TPA、纤溶酶原激活物抑制剂-1[PAI-1])与代谢指标,利用ML构建MASLD预测模型,结果显示纤溶指标预测MASLD的准确性高于代谢参数,且TPA和PAI-1与MASLD呈强相关。在比较不同ML算法结合体检与EHR数据预测MASLD的研究中,Ma等发现所有ML算法在识别MASLD个体方面的效果均优于脂肪肝指数(FLI)与肝脂肪变性指数(HSI)。在2522名健康个体队列中,贝叶斯网络模型在区分MASLD患者方面的准确性最高,准确率、特异度、敏感度与F-measure分别可达83%、0.878、0.675与0.655。值得注意的是,相较逻辑回归模型,贝叶斯网络模型将F-measure提升了9.17%。另一项由Huang开展的前瞻性队列研究使用6种ML模型进行MASLD早期识别,结论指出CatBoost模型在训练集中表现最佳,而逻辑回归模型在独立的内部与外部验证集中表现最佳。在Qin与PaoloSorino的研究中,通过对多ML算法及元学习方法进行比较分析,认为支持向量机(SVM)在所有提出的模型中预测效果最优。上述研究为临床及远程场景下的MASLD早期无创筛查提供了便捷方法,有助于降低医疗成本。总体而言,基于体检与EHR数据的ML模型通常能比FLI、HSI等传统评分体系更好地区分MASLD与非MASLD人群,并能纳入更广泛的临床与代谢特征,用于患者的风险分层与个体化随访。然而,其更广泛的实践应用仍需考虑若干实际问题:(1)模型性能对数据完整性与质量高度依赖;(2)不同医疗系统中,变量定义、测量流程与数据采集方式存在显著异质性;(3)多数模型在单一体检中心或单一医疗系统内开发,跨中心与跨人群的验证研究有限;(4)模型的临床实施与成本–效果问题亟待解决。虽然常用临床与实验室变量的检测本身成本较低,但将复杂ML模型嵌入医院信息系统需要额外的软件开发、计算资源与长期维护成本,并且其对临床工作流程与成本–效果的影响仍需通过卫生经济学研究评估。3.2基于超声与放射学影像的MASLD无创筛查由于无创、成本效益高且可及性强,超声技术已成为诊断肝脏疾病的首选方法之一。然而,传统超声在轻度脂肪变性诊断方面的准确性较低,且检测结果往往具有主观性。近年来,定量超声(quantitativeultrasound,QUS)技术(包括弹性成像、回声分析以及散斑统计建模等)能够在单次超声射频数据采集的基础上获取定量的组织信息。这些先进的超声成像方式显著提升了诊断性能,可提供互补的定量组织信息,并通过ML模型整合肝脏特征。基于超声的ML模型目前已在多种疾病(包括心血管疾病、神经系统疾病,以及慢性乙型肝炎与MASLD)的诊断与评估中得到应用。Das等基于超声图像进行数字图像分析,通过提取正常人群与MASLD患者超声图像的纹理特征构建ML分类器,能够准确区分病理性MASLD与正常肝组织。该研究采用多种ML分类算法,最终构建的集成ML模型(包括SVM、神经网络与XGBoost等)在外部验证队列中亦表现出相当的准确性。此外,Wu等基于常规超声参数与患者生理信息开发了RF模型;Destrempes等则在RF模型中结合了QUS与弹性成像数据。两项研究针对不同脂肪变性与纤维化终点的AUROC多处于约0.75–0.90的范围,提示其在基于超声的脂肪肝诊断方面具有良好性能,并能显著提升对慢性肝病背景下脂肪变性、炎症与纤维化分级评估的精确性。此外,近期引入深度学习的研究进一步促进了影像技术在肝脏病变评估中的应用。例如,Graffy等构建了基于深度学习的CT自动化工具,可准确量化肝脏脂肪含量。ML在这些技术中的引入不仅提高了诊断准确性,也实现了特征提取的自动化,并推动了报告流程的标准化,从而有助于降低观察者间与观察者内的差异,以及减少临床医生随时间变化产生的主观解释差异。为克服散斑噪声与模糊导致的超声图像质量欠佳问题,Rhyou提出一套全自动预测模型,采用三种基于深度学习的神经网络,实现了对肝脂肪变性的自动诊断,且具有较高的准确性与精密度。放射学影像技术(如CT与MRI)由于分辨率高、组织对比度强,在脂肪肝定量评估中具有重要作用。通过在无创筛查中引入ML,这些研究整体推动了MASLD的早期发现与管理,有望改变临床实践并改善患者结局。与传统目测评估及简单定量指标相比,基于ML的超声、CT与MRI模型具有若干明确优势:(1)提高对轻至中度脂肪变性与纤维化的检出能力;(2)减少观察者间与观察者内的评估差异;(3)具备在图像采集后立即生成标准化、全自动报告的潜力。然而需要指出的是,这种“近实时”的诊断能力主要适用于基于常规影像与基础临床数据建立的模型。依赖复杂多组学检测的模型受限于实验室检测的周转时间,难以实现真正的实时决策。影像ML模型的表现高度依赖图像采集参数、扫描仪类型与图像质量,其在不同中心与不同设备间的泛化能力需要严格验证。许多模型基于单中心或少数中心数据训练,跨设备与跨人群的测试研究有限。此外,大规模影像监督学习也带来了数据治理、隐私与伦理问题,需要明确的数据共享与使用政策。最后,将深度学习算法整合进现有影像PACS及医院信息系统,还需解决计算资源需求、网络安全与监管合规,以及部署与维护成本等问题。4.机器学习在识别MASLD组织学特征中的应用除超声等无创检测外,以肝活检为基础的病理诊断虽被视为MASLD诊断的金标准,但同样存在主观性与观察者间差异的问题。近年来,ML技术的应用为该领域带来了显著创新。在MASLD的诊断中,肝脂肪变性是关键病理特征。当脂肪变性伴随小叶性炎症及肝细胞气球样变时,即可诊断为MASH。Sethunath等在脂肪性肝病小鼠模型中,利用图像处理与ML方法开发了一种自动分类器,用于检测大泡性脂肪变性与小泡性脂肪变性。该分类器在预测大泡性脂肪变性时的敏感度、准确率及AUROC分别为94.2%、95%和99.1%;在预测小泡性脂肪变性时,模型准确率为79.2%,敏感度为77%,AUROC为78.1%。Ramot等进一步开发了一种深度学习算法,用于定量分析脂肪肝小鼠模型中的脂滴,显示出深度学习在区分脂滴与肝血管、胆管及其他组织结构方面的显著优势。Vanderbeck等获取了MASLD患者及健康对照者肝活检标本的HE染色数字切片图像,并基于两名病理学专家的标注构建监督式ML模型。该自动分类技术能够准确识别大泡性脂肪变性、胆管、门静脉及肝窦结构。全视野切片成像(wholeslideimaging,WSI)是指利用扫描仪对完整组织学切片进行数字化成像。基于人工智能的病理诊断通常结合WSI与ML(多为由病理专家标注的监督式ML),其中深度学习被广泛应用。一旦模型训练完成,样本评估即可自动完成(无需人工干预),从而实现快速、客观且全面的病理评估。Heinemann等展示了卷积神经网络(convolutionalneuralnetworks,CNN)在MASLD/MASH模型自动评分中的应用潜力。该研究利用CNN处理染色后的完整WSI,自动对肝细胞气球样变、炎症、脂肪变性及纤维化等病理特征进行评分。该方法可直接提供高分辨率的定量指标与分布图,其结果与人工病理评分高度一致。Forlano等开发了一款全自动ML软件,用于定量评估MASLD标本中的脂肪变性、炎症、肝细胞气球样变及纤维化。该软件的分析结果与人工病理评分具有高度一致性,并在内部及外部验证中均表现出良好的重复性与准确性,显示出ML在提升病理评分一致性及减少主观误差方面的潜力。总体而言,ML技术在MASLD病理评估中展现出良好前景,随着算法的不断优化及应用场景的扩展,未来有望成为临床病理医生的重要辅助工具。然而,该领域的发展仍面临若干挑战:第一,现有模型多依赖由资深肝脏病理学专家标注的大规模高质量训练数据,而此类专家资源本身较为稀缺,在保证标注质量的同时降低工作负担仍是现实瓶颈;第二,不同中心在组织处理、染色流程、扫描设备及分辨率设置方面存在差异,这些差异可显著改变切片外观并降低模型在外部数据上的性能,因此亟需开展颜色归一化、多中心联合训练及标准化工作流程的研究;第三,数字病理平台的建设与维护、安全的数据存储与传输,以及隐私与监管合规均需要大量投入,而目前许多医疗中心尚不具备相应条件。5.机器学习在MASLD临床风险预测中的应用5.1利用机器学习预测MASLD向MASH、肝纤维化及肝硬化进展的风险MASLD具有向MASH、重度肝纤维化甚至肝硬化进展的趋势。为评估MASLD的严重程度并识别MASH患者,Canbay等设计了一种新的ML算法,通过整合特征选择(EFS)与回顾性收集的无创参数,对164名肥胖患者的NAFLD活动评分(NAS)相关组织学评估结果进行预测。该模型有助于识别MASH患者、评估疾病状态并监测特定病程的进展。在一项回顾性研究中,研究者使用美国NIDDK的MASLD数据(704名患者)训练并测试模型,并在Optum电子健康记录数据(约300万人)中进行评估。该研究构建了一个包含14个特征的XGBoost模型,在NIDDK队列中的AUC约为0.82,敏感度为81%,阳性预测值为81%;在OptumEHR数据集中AUC约为0.76,显示出该模型在预测MASLD向MASH进展风险方面的较高准确性与敏感度。Garcia-Carretero等利用ML算法对2239名高血压患者的数据进行特征筛选,识别出MASH的显著预测因子。Verma等收集了来自8个亚洲国家、14个中心共1656名患者的临床与生化指标,训练、测试并验证了21种ML模型,并将其与通用评分系统(如APRI、FIB-4、NFS)在排除显著纤维化方面进行比较。结果显示,ML模型在区分能力上优于FIB-4。优化后的RF模型在总体数据集中取得阴性预测值(NPV)0.947、F1值0.754,显著优于FIB-4(NPV0.744,F1值0.499),且在测试集(0.798/0.588)与验证集(0.852/0.559)中均保持优势。Goldman等在ML分类模型中引入时间相关协变量,以预测健康志愿者中MASLD与进展性纤维化的风险。Perveen等提出基于CART决策树的方法,用于评估加拿大人群中MASLD及其进展风险。Ben-Assuli等采用时间序列ML模型(隐马尔可夫模型与基于轨迹的分组模型)对2007–2017年间5579名患者的肝纤维化风险进行无创评估,并利用无监督ML算法(k-means)分析1652名MASLD患者,识别出三种具有不同全因死亡风险的MASLD表型。这种表型识别为精准医学与个体化管理提供了重要的支持证据。总体来看,大多数研究表明,ML模型在预测显著纤维化、MASH及不良临床结局方面的性能通常优于传统无创评分体系,并能更好地捕捉疾病复杂、非线性的风险模式。然而,这些模型也存在共性局限:通常需要高质量的纵向随访数据,模型的开发与验证成本较高;多源于特定人群,模型的泛化能力受限;且缺乏前瞻性干预研究以证明其确实改善临床结局或具有成本–效果优势。5.2预测MASLD相关合并症风险Zoncape等利用ML模型评估MASLD和/或FIB-4评分较高的患者是否具有更高的重症COVID-19风险。在672例SARS-CoV-2肺炎患者数据中发现,高FIB-4评分与更高的死亡风险及更长的住院时间相关。MASLD还与胰岛素抵抗、代谢综合征、糖尿病及心血管疾病密切相关,部分研究者因此提出将其命名为代谢相关脂肪性肝病(MAFLD)。心血管疾病是MASLD患者最主要的发病与死亡原因。为识别MASLD患者的心血管疾病风险,Sharma等分析英国生物银行数据,整合遗传多态性、生活方式因素(如久坐行为)及临床指标(如高血压、腰围),评估7种ML模型,并提出基于RF的集成模型,该模型显示出较高的预测性能。类似地,Drozdz等利用ML模型评估MAFLD患者的心血管疾病风险,能够有效识别高危人群,从而指导心血管疾病的筛查与代谢危险因素的干预,潜在降低心血管相关的发病率与死亡率。Deng等将ML算法(RF、XGBoost)与逻辑回归结合,建立脂肪肝患者发生颈动脉斑块风险的预测模型。该模型基于6个特征(收缩压、年龄、总胆固醇、低密度脂蛋白胆固醇、HIS及空腹血糖),具有良好的预测性能与校准度,可为个体化颈动脉斑块风险评估及分期阈值提供依据,从而提升颈动脉超声筛查的成本效益。MASLD与代谢综合征关系密切。Solomon等结合多种无创检测(如FIB-4、APRI与肝硬度测量),利用ML算法对代谢综合征患者的不同肝病模式进行分类并开展风险评估。通过ML模型精准识别MASLD及相关病理实体的高危人群,有助于遏制其流行趋势,并减轻公共卫生、医疗系统及支付方的负担。在合并症风险分层方面,传统心血管/代谢评分体系很少将MASLD或纤维化分期作为核心变量。通过整合肝脏相关指标与遗传、生活方式及代谢信息,ML工具有望在标准评分体系的基础上进一步优化风险分层。然而,相关的前瞻性比较研究、正式的卫生经济学分析及亚组公平性评估仍然有限。多数MASLD预测模型基于基线变量构建,而真实世界中的疾病管理具有动态性。ML特别适合处理纵向数据,未来研究应在大型前瞻性队列中构建可解释的动态模型,并评估其对患者随访频率、转诊决策及干预时机的影响。6.机器学习在MASLD治疗中的应用目前尚无MASLD的标准化治疗方案,个体化医学与精准治疗正成为该领域的发展趋势。过去十年中,营养、食物及膳食模式在MASLD中的作用已得到广泛研究,但如何有效利用这些信息管理MASLD患者仍是一大挑战。近年来,ML技术在该领域取得突破性进展,尤其体现在个体化营养建议的制定方面。一项研究监测了800名个体对46,898份餐食的血糖反应,发现不同个体对相同食物的血糖反应差异显著。该研究提出的ML算法(GBDT回归模型)整合生物标志物、饮食习惯与体格指标,可准确预测个体对特定食物的血糖反应,从而通过个体化饮食干预有效管理高血糖及其代谢后果。另一项研究对常规体检中收集的生化参数与临床数据进行层次聚类与因子分析,成功对代谢综合征患者进行分型,结果显示肝功能异常与高蛋白摄入相关,而不饱和脂肪酸摄入不足者更易出现严重的胆固醇异常,为精准治疗策略的制定提供了科学依据。Berna等提出“营养几何学”概念,强调营养、生物学与环境的整体性,尝试将多种营养素与食物成分纳入单一模型,以研究其相互作用及对健康与疾病调控的影响。AI开发的算法能够提供定制化的营养建议,在MASLD的预防与治疗中具有重要价值。除营养干预外,药物治疗在控制MASLD进展中同样至关重要。尽管目前尚无获批的有效治疗药物,研究表明过氧化物酶体增殖物激活受体γ(PPAR-γ)激动剂可降低肝脏/内脏脂肪含量,并改善肝脏坏死性炎症活动。Gastaldelli等研究显示,PPAR-γ激动剂通过提高循环脂联素水平,改善内脏脂肪与皮下脂肪的分布比例,从而减轻肝脏炎症与肝细胞损伤。该研究采用偏最小二乘判别分析(PLS-DA)这一ML方法,验证了PPAR-γ激动剂与
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 儿童新春活动策划方案(3篇)
- 冬季冻土施工方案(3篇)
- 化学教学与实验管理制度(3篇)
- 南阳营销活动策划方案(3篇)
- 咖啡品牌策划活动方案(3篇)
- 2026年吉林工程职业学院单招职业倾向性考试题库带答案详解(完整版)
- 垂钓比赛活动策划方案(3篇)
- 2026年唐山职业技术学院单招职业适应性测试题库附参考答案详解(研优卷)
- 人机自动化管理制度(3篇)
- 公关珠宝活动策划方案(3篇)
- 【新教材】人教PEP版(2024)四年级下册英语 Unit 1 Class rules A Lets talk 教案
- 2026年非煤矿山三级安全教育培训考核试题(及答案)
- 2026年包头职业技术学院单招职业技能测试题库附答案详解(考试直接用)
- 2026海南三亚市吉阳区机关事业单位编外聘用人员、村(社区)工作人员储备库(考核)招聘200人(第1号)考试备考试题及答案解析
- 2026年春季小学信息科技(清华版·贵州)四年级下册教学计划及进度表
- 2025-2026学年下学期初三春季开学第一课
- 聚焦实战破局!零碳园区建设实战指南与路径规划
- 国家计委建设部计价格200210号文关于发布《工程勘察设计收费管理规定》的通知上
- 项目管理奖罚细则
- 组织生活会工作流程(附流程图)
- SimMarketing营销模拟实验室操作篇
评论
0/150
提交评论