预测分析
维护、维修和大修计划可以根据实际故障时间线进行优化。
Novity

计划外停机是当今工业制造商最大的痛点之一,据德勤估计,每年给他们造成500亿美元的损失。工艺制造的风险更大,关键设备的故障可能导致整个批次的损失、环境危害或安全风险。工业物联网(IIoT)等数字技术的采用有望通过提前预测设备故障并在故障导致计划外停机之前捕获故障来减轻这些威胁。然而,在实践中,当维护人员和运营负责人致力于实施旨在消除意外停机的工业物联网解决方案时,会出现一些挑战。

随着支持预测性维护(PdM)解决方案的各种技术领域的成熟,市场上可用的产品和方法在范围和种类上都有所增长。有效地对这些不同的解决方案进行分类本身就是一项工作,甚至在任何实施工作开始之前。即使是那些多年来一直致力于实施工业物联网解决方案的早期采用者,对解决方案的期望与产品的实际输出之间也经常存在脱节。

围绕数据分析技术的叙述,如机器学习和人工智能(ML/AI,在这里可以互换使用),通常是具有预测分析的平台的承诺,能够预测设备何时以及如何发生故障。实际上,“预测性”一词被误用在本质上不可预测性的技术上。尽管非预测性技术本身提供了一些价值,但应该清楚哪些是真正可预测的,哪些不是。

诊断分析与预测分析

对于具有预测性的算法或软件平台,它应该在事件实际发生之前提供有关事件的信息。目前,几乎所有被宣传为预测性的解决方案实际上都是以诊断的方式运行的,通过提供对资产或系统当前操作或状态的解释性洞察。诊断解决方案采用实时传感器数据,并提供有关所监控资产的当前状况或性能的信息。顶级解决方案可以提供小问题的实时通知,这些小问题是已知的大问题的前兆,这为最终用户提供了价值。然而,在这个场景中没有任何东西是可预测的,因为没有提供任何关于未来事件的时间或严重性的信息。

一种流行的诊断技术,最近已经看到了进步和增强是在线状态监测。状态监测本身只提供对数据的访问。在线或连续的状态监测通过在资产的整个操作窗口期间实时提供关键数据,增强了这种访问能力。更复杂的解决方案可能将诊断分析应用于状态监测之上,以操作员和维护经理更容易解释的形式呈现数据。

相比之下,预测分析范式,如预测和预测维护,超越了资产或设备的当前状态,并明确地提供了故障发生时间的信息。预测算法考虑机器或过程的当前状态,以及负载和压力源,并对系统的演变做出预测。这为资产何时以及如何失败提供了额外的见解。类似的方法也可以用于执行“假设”场景,预测由过程、资产状况或操作的变化引起的假设结果。

真正的预测可能吗?

严格地说,预后有三个要素:时间、地点和事件的严重程度。然而,这在实践中似乎很难实现。长期以来,能够预测故障发生的时间和方式一直被认为是工业维护的圣杯。因此,关于这个问题已经做了很多研究。近年来,这项研究为工业运营商提供了更精确的建模、机器学习和数据科学的进步以及计算能力的提高。这些技术在预测机器故障方面的应用已经产生了不同的应用科学领域,如预测和健康监测(PHM)和PdM。事实上,在过去五年左右的时间里,用户已经看到了PHM和PdM研究的商业化,工业终端用户开始意识到这项新技术的价值。

使预测成为可能的是几个关键技术的融合:

  • 专门设计用于工业物联网设置的新型传感器,能够在恶劣或敏感的环境中运行。
  • 机器学习和深度学习的进步使这种方法适用于预后问题。
  • 失效物理和模拟方法的进展,提供了损伤和失效进展的准确预测模型。

当这些技术与深厚的专业知识相结合时,可以开发出获取传感器数据的算法,跟踪特定资产状况的进展,并提供资产何时以及如何发生故障的预测模型。

从预测解决方案中获得价值

使用诊断解决方案,最终用户可以从对资产健康状况的更深入了解中受益,并在故障发展的早期识别出故障时实现价值。这样的价值主张通常被称为可操作的洞察力,代表了工业物联网典型实现所提供的新范式,与传统的基于计划的维护实践相反。诊断分析的成功还很大程度上取决于故障检测的准确性。由于误报率和误报率很高,操作人员和管理人员很难判断应该对哪些事件采取行动。即使在故障检测精度较高的情况下,维护人员也无法立即解决很多早期故障,需要提前安排服务时间。如果不了解故障发展为资产灾难性故障的时间框架,并且没有对这种故障的严重程度的合理估计,维护计划仍然不理想,并且无法消除计划外停机时间。

通过将准确的故障检测与预测相结合,维护管理人员可以根据对资产或组件故障时间的准确估计确定维修和维护时间框架。例如,如果检测到一个严重的故障,但故障预计在几个月内都不会发生,则可以分配更多的时间来准备维修和更换活动,从而最大限度地减少或消除对生产的破坏。相反,如果预测严重故障将在几天内发生,则可以自信地优先考虑立即响应。

预后的时间范围是另一个需要考虑的方面。新兴技术通过使用对退化和故障机制更敏感的度量和特性来增加故障发生前的时间。随着故障物理学和基于模型的预测技术的扩展和发展,算法可以检测到早期故障的最早信号,通常会在故障发生前将故障检测周期从几天延长到几周。

选择预测分析平台

在选择工业物联网解决方案时,工厂运营商和维护经理应该做的第一件事是定义这种努力的预期结果。如果经过仔细考虑,除了故障检测之外,还有理由追求一种提供故障预测的方法,那么在评估不同的解决方案时,应该考虑预测分析平台的以下功能。

提供故障预测的最常见方法是通过剩余使用寿命(RUL)估计。

根据传感器读数确定的情况,这样的估计可以为作业人员提供预计资产发生故障之前的时间。另一个感兴趣的参数是评估中的不确定性,它提供了评估可靠性的感觉和预期失效的时间框架。

为了产生最准确的RUL预测,预测算法应该考虑资产操作或工艺条件的变化。这通常可以使用基于模型或基于物理的方法来实现。RUL将适应过程或工作点的变化。此外,通过结合设备退化的物理过程和具体特性,可以选择对故障和退化机制最敏感的特征,并进行准确的预测。

还有一些方法可以提供关于故障位置和原因的信息。这些诊断方法包括故障检测、隔离和估计。当这些因素结合在一起时,操作员或维护经理得到的信息远远不止是资产出现问题的指示。适当的维护可以提前计划,操作可以优化,以完全防止意外故障。

热交换器的预测

换热器因结垢而逐渐退化,可说明其预后的价值。污垢是几乎每种换热器最常见的故障模式。然而,在许多应用中,导致结垢的物理过程并不总是线性的或容易预测的。例如,化学加工行业中的一些热交换器应用不时表现出自清洁行为,因此,污垢水平可以反复波动,导致假阳性。

通过包括污垢所涉及的物理过程的演化模型和换热器的性能特征,可以解释操作条件的变化,并且可以更准确地预测资产随时间的非线性行为。在图1中,螺旋热交换器的寿命结束是在发生实质性的退化之前预测的。仅检查第一个图中的健康历史,维护经理可能会得出这样的结论:很多年都不需要清洗热交换器。然而,结合基于模型的预后的RUL预测,对维护需求的更准确估计表明,清洗应该比仅使用状态监测考虑的要早得多。

图1:螺旋热交换器的寿命在发生实质性退化之前就已经被预测到(图片由Novity提供)
图1:螺旋热交换器的寿命在发生实质性退化之前就已经被预测到(图片由Novity提供)

尽管第一个图中的预测有一定的不确定性和误差,但稳健的预测算法随着时间的推移在误差和不确定性方面都有所降低,因为算法有更多的历史可用性。这种误差和不确定性的减少可以在图2中看到,因为健康状况进一步降低了。随着退化过程的进行,故障特征信号逐渐增大,预测算法逐渐成熟
更准确。

图2:误差和不确定性的减少
图2:误差和不确定性的减少

通过预测和诊断技术的知情应用,流程工业设备用户可以显著改善其底线。有了来自传感器的新数据来源,以及处理这些数据流的有效分析工具,就可以提供准确及时的设备问题通知,并在关键任务硬件发生任何额外损坏之前采取适当的行动。此外,通过利用新兴的预测技术,维护人员不再需要猜测设备何时会出现故障。维护、维修和大修计划可以根据实际故障时间线进行优化,并可以实现消除计划外停机的可能性。

问题