打破诊断“黑箱”:热力学仿真如何辅助船用柴油机的可解释故障诊断
论文标题:
Thermodynamic Simulation-assisted Random Forest: Towards explainable fault diagnosis of combustion chamber components of marine diesel engines
论文链接
原作者Blog
一、高可靠性系统对透明决策的需求
轨道交通、航行安全这些关键工业领域,系统越来越复杂、集成度越来越高。技术人员面对一个“黑箱”式的诊断结果,很难贸然采信——尤其是当这个结果缺乏物理层面的依据时。船用柴油机作为核心动力设备,可靠性设计冗余极高,实际运行中重大故障数据少得可怜。传统方法既有样本数据与物理模型融合的难题,又有解释特征决策过程的短板。2025年
《Measurement》
热力学仿真辅助随机森林(ThermoRF)
二、ThermoRF 架构:物理模型与数据驱动的融合
整个诊断框架可以理解为“模型数据协同”,主要包含四个核心阶段:
1.热力学建模与校准
先搭建柴油机的一维热力学模型,用它来模拟故障状态、生成训练数据。通过与真实航行数据校准,模型参数偏差控制在5%以内,仿真环境的可靠性有保障。下图就是柴油机的一维热力学模型。

2.高保真故障数据集生成
通过微调物理参数,模拟出气缸盖开裂(F1)、活塞烧蚀(F2)、缸套磨损(F3)、活塞环磨损(F4)及活塞环粘着(F5)五种典型故障。实际运维中这些数据很难拿到,仿真算是解了燃眉之急。下表是各故障状态的细节。

3.基于 SHAP 理论的特征筛选
利用SHAP(Shapley Additive Explanations)值量化14个热力学参数的重要性,最终精选出涡轮后排气温度(P14)、缸套壁热流(P05)等8个核心参数。优化后的特征子集,能有效提升诊断效率。下图为基于SHAP的参数选择过程。

4.智能故障识别
优化后的子集送入随机森林(RF)分类器。实验数据很亮眼:RF平均准确率高达99.07%,明显优于KNN与SVM等分类算法。下图为KNN、SVM和RF的精度-召回率曲线图。

三、双尺度可解释故障诊断分析
这项研究的核心价值在于,让故障判定的逻辑不再是一团迷雾。它实现了两个层面的可解释性分析:
1.局部尺度解释
用瀑布图直观展示模型对单个样本的决策逻辑。比如,通过捕捉窜气热流(P06)与质量流量(P07)的特定异常,能揭示模型如何根据物理规律判定特定故障。
2.全局尺度解释
蜂群图、交互图及依赖图从整体层面提炼核心指标。分析发现,“窜气导致涡轮前排气压力(P11)降低”等深层物理联系,这证明了数据特征与内燃机热力学机制的一致性。
下图为基于 SHAP 值的双尺度故障分析:(a)瀑布图;(b)蜂群图;(c)交互图;(d)依赖图。

四、结论与展望
ThermoRF 方法把物理建模和数据驱动的优势结合得不错:故障诊断精度提上去了,双尺度分析又给诊断结果提供了物理支撑。这种可解释故障诊断模式,对于提升重大装备运维的安全感与科学性,意义不小。

原始文献
C. Luo, M. Zhao, X. Fu, S. Zhong, S. Fu, K. Zhang, X. Yu. Thermodynamic simulation-assisted random forest: Towards explainable fault diagnosis of combustion chamber components of marine diesel engines[J]. Measurement, 2025, 251: 117252.