融合 Tree SHAP 与热力学仿真辅助随机森林的船舶燃烧室部件故障诊断_第1页
融合 Tree SHAP 与热力学仿真辅助随机森林的船舶燃烧室部件故障诊断_第2页
融合 Tree SHAP 与热力学仿真辅助随机森林的船舶燃烧室部件故障诊断_第3页
全文预览已结束

融合 Tree SHAP 与热力学仿真辅助随机森林的船舶燃烧室部件故障诊断.doc 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

融合TreeSHAP与热力学仿真辅助随机森林的船舶燃烧室部件故障诊断引言在船舶工程领域,AI诊断模型常陷入“高精度、低信任”的怪圈:当准确率标称到99%时,一线工程师往往因其不可解释性而持观望态度。近期《Measurement》刊发的论文《ThermodynamicSimulation-assistedRandomForest:Towardsexplainablefaultdiagnosisofcombustionchambercomponentsofmarinedieselengines》为这一难题提供了新解法。该研究的核心在于知识驱动与数据驱动的深度耦合。作者构建了一套“热力学仿真辅助随机森林(RF)”的混合架构,不仅提升了柴油机燃烧室组件的故障识别率,更引入了SHAP(ShapleyAdditiveExplanations)算法。这一举动犹如为模型安装了“X光机”,通过量化各热力学特征的贡献度,将晦涩的黑盒输出转化为逻辑清晰的参数路径,让每一次预警都有据可查。边际贡献SHAP的核心目标是:回答每一个特征对最终预测结果做出了多少贡献。放在故障诊断里,就是哪个热力学参数让模型判定了这个故障。普通的故障诊断是将模型训练好后,输入数据,输出结果就结束了。但这个可解释性故障诊断会反向拆解,推测各个热力学参数的贡献大小。具体如下:以随机森林模型举例,随机森林内部包含许多决策树,每个决策树均能进行分类任务,每个决策树给它自己分类出来的故障种类投票,将投票最多的故障判定为随机森林最终输出的故障种类。将数据输入给随机森林模型后,故障k的预测分数为f=投票给类别k的决策树数量。这个预测分数是热力学参数i与除了参数i的其他的参数组成的集合S共同输入在模型中输出的预测分数。那么如何知道单独输入参数i的贡献呢?只要再求一遍只在参数集合S的输入下的预测分数做差即可,求得即为参数i的边际贡献:参数i的边际贡献表明了参数i在判断故障k发挥的作用,包含影响的正负与大小。如果加入参数i的输入以后,模型判断故障k的概率(预测分数)变大,表明参数i对于判断为故障k起到了正面作用,说明导致发生故障k的原因有参数i的作用;否则起到了负面作用,参数i不会导致发生故障k。参数i的边际贡献数值越大,表明参数i对故障k的作用就越大,在导致发生故障k的原因中越占主导地位。从边际贡献到SHAP值对于一个参数是有很多的边际贡献的,这是由于S有很多。举个例子,有P1到P4这4个热力学参数的数据输入模型,计算参数P1的边际贡献,不包含参数P1的参数集合有{P2,P3,P4}、{P2,P3}、{P3,P4}、{P2,P4}、{P2}、{P3}、{P4}、∅这八个集合,那P1的边际贡献就有八个。有了边际贡献就可以计算该参数的SHAP值了,依靠所有边际贡献的加权平均即可计算出该参数在当前样本数据下的故障k的SHAP值了,公式为:其中p为总参数个数,|S|为集合S中的参数个数。SHAP值表明了该参数在故障诊断中的重要程度,SHAP值越大,对模型分类故障的作用就越大。这样在众多的参数中可以筛选出更具有判断价值的参数。TreeSHAP:让计算“快起来”在常规SHAP框架下,特征贡献的计算需要穷举所有可能的参数组合,这在特征较多时会引发“维度灾难”。然而,TreeSHAP算法巧妙地利用了决策树的天然层级特性。它不再盲目遍历全局参数,而是精准定位样本在决策树中穿行的实际分支。以下图中的路径为例:若样本仅触达了参数1、2、3所在的节点,TreeSHAP只需顺着这条红色路径,递归计算节点分裂带来的增益。这种“沿路拆解”的模式剔除了无关参数(如参数4)的干扰,将计算复杂度从指数级降至线性级别,极大地压缩了计算耗时。可解释性分析如上图是活塞环磨损(F4故障)的SHAP值多维度分析图,图(a)为瀑布图;图(b)为蜂群图。图(a)是对某一个F4故障样本的解释,能看清该样本被判定为F4故障的具体原因。该图的基本逻辑是从模型对所有样本的平均预测水平E(X)=-1.797上进行叠加每个参数的SHAP值,最终得到该样本的预测得分1.464。其中,红色表示对于判断该故障参数的取值起到了正向作用,蓝色表示起到了负向作用。从图中可以明显看出,P12涡轮增压器前排气温度、P6窜气热流、P14涡轮增压器后排气温度这三个热力学参数的数值绝对值最大,在该样本上对于活塞环磨损起到了主要作用。图(b)是展示所有F4故障样本的全局参数重要性,能看清哪些参数是F4故障的全局关键指标。图中的每个点表示一个样本在对应参数的取值,颜色表明它的取值高低,纵轴是各个参数,下横轴是散落在行上面的点的边际贡献大小,上横轴是该参数的平均的SHAP值大小,参数越靠上表明对判断该故障越起到重要作用。P11的平均SHAP值最高,表明在判断故障F4上起到主要作用。且P11的大多的高值样本在0的左侧,低值样本在0的右侧,表明大多的故障F4都有P11的低值,而没有故障F4的时候P11取高值,P11的低值对判断故障F4起到了正向作用,而高值起到了负向作用。从物理学角度解释,活塞环磨损的密封失效使窜气加剧,进而导致排气系统热力学失衡,涡轮增压器前排气压力降低,故展示出了P11的低值。由蜂群图可知,对于判断船舶柴油机燃烧室故障之一的活塞环磨损,主要是由于参数P11涡轮增压器前排气压力过低、P12涡轮增压器前排气温度过低、P7涡轮增压器后排气温度过低。原始文献C.Luo,M.Zhao,X.Fu,S.Zhong,S.Fu,K.Zhang,X.Yu.Thermodynamicsimulation-assistedrandomforest:Towar

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论