关于PHM,这是有史以来听到最接地气的解说

2018-07-27  |  作者:金超  |  来源:天泽智云  |  浏览:

简言之,把不确定的信息确定化,并为客户节约成本、提高效率就是我们维护的最终目标。

什么是PHM?

 
与数学、物理等这些传统从哲学演化出来的学科不同,PHM是从工程领域提炼,并且不断系统化、体系化的一门系统工程学科,聚焦于复杂工程健康状态的监测、预测和管理。PHM的实现需要状态监测、故障检测诊断、预测、运维优化等多项技术的支撑,其目标是降低成本,减少浪费,提高效率,让机器设备更安全、可靠地运行。
 
新概念:MTBD
 
为了更好的理解PHM,我们先来介绍个新的概念—MTBD (Mean-Time-Before-Degradation),衰退发生前的平均时间。与之对标的MTBF,是可靠性领域另外一个非常重要的概念,指的是机器从这次失效到下次失效的平均时间,即平均寿命是多长。
 
传统基于时间可靠性分析的方式,一般先统计零部件使用的寿命,假设大概服从正态分布,通过求解寿命的期望值,估计该部件的有效使用时间。这种方式有一定的局限性。首先是其只基于时间一个维度,无法把其他变量(如环境、自身机理状态等)整合到寿命预测里,本质上信息的缺陷导致预测结果的精确度欠佳;其次该方法只适用于大批量生产的同类型的简单组件(如灯泡、轴承),而对于一些结构复杂、数量不多的设备很难做预测。
 
而PHM本质上是信息的融合,它把运行过程中不同维度的数据整合到模型中,再量化成能够反映系统衰退的健康值指标,能够对结构、过程复杂的对象做更为精准的预测。同时由于它是基于自身的历史数据或机理做分析,所以可以进行个性化的处理,并不完全依赖于研究对象的存在数量。
 

为什么需要PHM?

 
新一代的维护系统需要重点关注以下三个共通问题:
 
设备智能化
 
未来的设备将越来越智能化,具备状态自知觉、趋势可预测、以及洞察可传承等能力。
 
信息同步性的智能化
 
未来维护系统的另一个关键组成部分是信息同步性的智能化。对于信息同步性的智能化,李杰教授曾提出OHIO(Only Handle Information Once)的概念,即只对信息做一次处理。自动化协同传递出来的信息,并且直接推送给所有需要知道这些信息的用户,给不同用户以最合适的方式展示最合适的信息,最大化信息的对称性。
 
我们现在用的很多手机APP(比如“航旅纵横”)起到的就是这样的作用:信息(比如前序航班起降时间)与终端(比如已经买了机票的人)直接相连,无论用户在何时何地,都可以看到与自己相关的第一手的信息(比如航班是否延误),根据该信息可以直接作出决策(比如机票的退改签),最大限度避免意外情况造成的损失。
 
运维技术智能化
 
操作设备的智能信息及同步的状态等信息都需要传递到运维这个层面,让用户能够实现运维决策优化,并对运维任务的优先级进行排序,最终实现整个系统时长可用性的提高(All-Time Readiness)。
 
我们通常只能看到设备故障的一些表象问题(如失效、瑕疵、缺陷等),但并不清楚具体是磨损、腐蚀还是其他什么因素导致了这些结果,这就需要智能技术来识别并预测其发展趋势,并将这些信息传递给客户来做决策。
 
简言之,把不确定的信息确定化,并为客户节约成本、提高效率就是我们维护的最终目标。
 
天泽智云,工业智能实践引领者
降本、增效的宗旨始终体现在维护策略的演进过程:从最开始的东西坏了再修的修复性维护,到预防性维护,再到基于状态的维护,然后发展为现在的PHM。
 
其中修复性维护整体花费最高;预防性维护对于高可靠性系统,很有可能在其还没坏的时候就换掉,造成很大的浪费;基于状态的维护相对来说更有针对性且更精准,但仍有一定的局限性,它只能反映当前状态,而没有办法对未来进行预测,管控未来的风险;所以PHM技术的出现就是要预测并管理系统未来可能出现的风险,进而降低系统运维成本。

不同维护策略的详细介绍可参考天泽智云之前的文章《从修复性维护到预测性维护 风机维护策略的发展趋势》。

PHM技术相关名词解释

 
故障预测(Prognostics)
 
故障预测的狭义定义是指监测某一类故障的早期现象,并能预测故障距离失效还有多长时间,即预测剩余使用时间(RUL)。PHM与传统的CBM(基于状态的监测)最大的区别是,要做到能够预测它最后的剩余使用寿命到底有多少。
 
健康预测(Health Prediction)
 
健康预测是另外一个维度,是一个更广泛的概念,指近期剩余使用寿命的健康值趋势走向如何,与RUL不同的是在做健康预测时可能不清楚失效的标准,不知道设备到底什么时候会坏。
 
失效(Failure)
 
失效并不是指被监测对象完全不能用了,而是诸如设备仍在运转,但精度下降且对最终生产产品造成不良损失,或者系统出现不稳定的状态等我们都认为是失效,分为硬失效和软失效两类。
 
硬失效/绝对失效(Hard failure):完全损坏的组件。
软失效/相对失效(Soft failures):对系统可靠性的信心度下降,在工业场景中更为常见。这种失效由用户定义,用户通常知道某设备或部件可能会出现故障,只是不确定什么时候发生。
 
特征(Features)
 
从原始信号中提取出的关键信息,和应用直接相关、紧耦合的信息,通过数学运算、统计计算得到,从数据分析的角度直接提取的能够描述数据状态的一些凝练信息。
 
健康值(Health Index)
 
和系统的健康状况直接对标的量,可以是机理相关的(如桥梁的裂纹长度),也可以是概率相关的(如失效的可能性),或者是虚拟的(如机器学习得到的拟合度或者距离)等,能够直接反应系统衰退状态的一些值。
 

数据驱动的PHM方法简介

 
故障预测包括基于数据驱动、基于机理、基于混合模型,及基于可靠性、统计分析等多种方法,下面我们主要介绍数据驱动的PHM建模方法,有以下几种不同的思维方式:
 
模型与机理模型对比。将对比后产生的不同偏移量化成健康值。
与自身历史趋势对比。将历史状态做一个基线,认为它是健康的,用当前状态与基线对比,如果有漂移我们则认为该状态发生衰退。 
对等相较。假设多数同类设备是健康的,通过对比找到不健康的设备,并分析失效模式。
 
数据驱动的PHM技术的分析流程通过5S方法论指导工业智能化的落地。
 
Streamline:数据排序、过滤、优先级划分;
Smart Processing:选择合适的特征和正确的建模工具做智能分析;
Synchronize & See:将结论通过可视化界面同步给用户;
Standardize:将以上信息标准化并形成组织里的知识;
Sustain:标准化后的知识组成模型中的智能资产,最终实现可传承的洞察与知识。
 

辅助PHM对象选择的关键性分析

 
PHM并不是适用于所有的对象,我们可以参照下图进行判断(纵轴代表发生频率,横轴表示故障发生后的影响),PHM适用于发生频率不高、但一旦发生影响很大的故障。
 
天泽智云,工业智能实践引领者
资料来源:美国IMS中心
 
频率低、影响大:PHM 
频率低、影响小:传统维护方式
频率高、影响小:准备更多备件
频率高、影响大:系统设计的问题,需改进设计
 

PHM系统设计

 
具体到PHM系统设计,其流程共分为以下七步:
 
1、需求定义
 
与传统互联网思维不同,工业智能的应用是收敛式的,所以在设计PHM系统时首先要定义有哪些问题,做问题的拆解,与用户一起探讨他们面临哪些挑战(如运维、质量、能效等),并对其进行完整的调研。
 
2、监控层次定义
 
第二步是确定监控层次,包括确定是要做组件级的分析,还是机器、产线或者系统级的分析,要选择哪些关键的组件、部件进行建模,以及需要关心哪些特定的故障模式等等,这些都要在这个层面定义好。
 
3、模型选择
 
第三步是模型选择,考虑到底应该采集哪些信号,是用数据驱动式的建模方式,还是机理式的,或者混合式的。当选定了一种建模方式后(如数据驱动),再进一步确定哪些关键因素对建模目标有决定性影响,并将这些信息提取出来。
 
4、关键参数选择
 
第四步是传感器及采集策略的选择,此时需要有专业的数据采集团队根据数据科学家的需求来做信号采集。
 
5、部署策略和实验设计
 
接下来是部署策略和实验设计,即模型最终是人工触发的还是在线一直运行的,要嵌入系统还是部署在云端等等。我们在建模之前需要把这些问题考虑清楚,之后就可以做一些实验,如果有条件的话可以从实验台上获得我们需要的一些数据。
 
 6、技术和经济性可行性研究
 
之后通过示范项目,验证整个系统从硬件到软件再到算法是否能够有机结合,算法能否闭环用户需求并实际传递给用户一些可执行的信息,同时对投资回报率(ROI)进行分析,判断我们现在这种方式能否在成本可控范围内最小程度定制化地推广。
 
7、技术开发与上线应用
 
确定可以实施之后进行技术上线,并且平行展开规模化的应用。
 
天泽智云logo

推荐文章