新闻资讯

用于预测性维护的大数据分析:领域知识的作用

发布日期:2021-06-24 18:08:41浏览量:31

工业组织越来越多地利用领先的数字技术来提高其企业维护系统的有效性、准确性和可靠性。大数据技术为开发和部署预测性维护系统提供了机会,可以及时准确地估计资产和设备的生命周期参数,例如 RUL(剩余使用寿命)和 EoL(使用寿命结束)。

大数据技术提供了收集、存储和处理大量指示设备状况的数据的手段,例如振动、声学、超声波、温度、功耗和油分析数据集,以及来自设备热图像的数据.

但收集数据只是第一步。为了从这些数据集中获得有用的维护见解,工厂运营商及其维护解决方案集成商采用数据挖掘和机器学习流程。

数据挖掘过程的偏见挑战
数据挖掘过程通常是迭代的。他们旨在评估不同模型的预测能力和稳健性。作为这些过程的一部分,数据科学家测试不同的机器学习和统计方法选项,对照它们在预测参数或获得手头维护过程的见解方面的有效性。在此过程中,数据科学家将可用数据分为两个数据集:一个用于训练,另一个用于测试。

训练数据集用于训练机器学习程序(即算法),以主动识别需要维护的情况,例如设备退化模式。
测试数据集用于根据分类或预测精度等参数评估算法的性能。
为什么训练数据集必须与测试数据集不同?在用于训练的数据上测试算法会自动给出好的结果。此外,了解数据集及其结构对于识别可能提供所需预测见解的模型至关重要。数据科学家通常负责审查数据集并提出候选机器学习算法。后者需要根据可用数据集进行评估。

数据挖掘过程的主要挑战之一涉及适当数据集的可用性。例如,基于传感器数据识别工具或机器的故障状态需要在数据集中出现多次故障。

一般来说,工具故障更频繁,因此更容易在相关数据集中找到它们。机器故障并非总是如此,因为工厂所有者或操作员不太可能拥有或保留有关给定机器故障的历史数据。此外,数据集可以分散在不同的系统中,这使得收集它们并确保它们适合由机器学习算法处理的过程变得非常困难。

即使在适当的数据集可用的情况下,数据挖掘过程仍然具有挑战性,主要是在将数据集中发现的见解与现实生活中的维护问题相关联方面。
具体来说,所有数据挖掘过程都存在偏差问题,这源于这样一个事实,即数据科学家倾向于根据数据集中的可用内容定制他们的程序,以在测试数据集上实现最佳性能。

这个过程虽然从数学角度来看是最佳的,但在一些情况下无法产生有效的结果,因为它完全忽略了手头业务问题的参数。

例如,特定参数(例如,温度或湿度)对退化模式的作用可能是短暂的或季节性的,而不是必须始终监测的决定性指标。

作为另一个例子,一些故障指标可能与工具或零件的特定批次有关,不应被视为某些故障模式的永久指标。

机器算法无法理解和排除此类季节性或短期因素:一旦它们始终存在于数据集中,算法可能会认为它们是导致失败的重要因素。

此外,这些因素将与它们在数据集中出现的时间成比例地考虑,而不考虑它们的季节性或出现的随机性。

领域知识助您一臂之力
为了减轻过拟合偏差,维护解决方案提供商必须考虑领域知识。后者是指解决方案所针对的目标行业和企业所独有的知识和见解。

在实施任何分析项目期间,您必须考虑此类知识;如果没有领域知识,预测分析解决方案将无法解决真正的维护问题。
同样,如果没有专家参与维护解决方案开发过程,就无法部署数据驱动的预测性维护解决方案。

在维护实践中,领域知识反映在组织的 FMEA(故障模式和影响分析)和 FMECA(故障模式、影响和关键性分析方法)中,其中包含以下知识:

识别产品或过程的潜在故障模式,从而推动数据科学家在识别这些模式方面开展工作。
评估与这些故障模式中的每一种相关的风险,这使数据科学家能够在收集的数据中寻找适当的风险因素及其概率。
根据重要性对问题进行排名,从而将工作引向最严重的失败因素。检测和解决后一个因素可以最大限度地提高解决方案的性价比。
在实践中,FMEA 和 FMECA 过程提供了关于资产、它们的故障模式、各种故障的影响和原因以及当前控制和建议措施方面的专家知识。此外,它们还包括一些评估与分析期间识别的问题相关的风险的方法,包括对纠正措施的优先级排序。

后者基于分配风险优先级编号 (RPN) 等方法。根据故障的严重性、每个故障原因发生的可能性以及每个故障原因的先前检测的可能性,为每种故障模式分配 RPN。特别是,RPN 是通过获得上面列出的评级(即严重性、发生率、检测)的乘积来计算的。

在数据挖掘的范围内,RPN 可用于确定算法的优先级并缓解过度拟合。为此,数据科学家不会选择从数学角度来看最优的算法。相反,除了考虑它们在数据集中的统计存在之外,他们还可以选择最能反映最高优先级 RPN 的算法。

作为一个突出的例子,数据科学家应该关注预测算法和属性,重点关注必须避免的最关键故障,因为它们修复起来最昂贵和最耗时,同时会导致重要设备功能的丧失。

来自 FMECA/FMEA 的见解与来自数据集的知识相结合,可以使系统更好地解决当今的维护问题。同时,它们使系统具有更高的投资价值,这意味着它们有助于实现许多组织的最高维护目标。

利用领域知识
要利用大数据预测性维护系统中的领域知识,应考虑以下最佳实践和建议:

组建合适的团队:将领域专家纳入大数据团队至关重要。他们应该与数据科学家、数据库专家和程序员密切合作,以提供一个不仅在技术上稳健而且对业务而言也是最佳的解决方案。领域专家(例如,维护工人和工程师)应该是团队的一部分,并在整个项目中积极参与(不是偶尔)。
测试和学习:数据挖掘过程是迭代的。每个算法和专家建议都应在部署之前进行测试和验证。请注意,此过程也可作为数据科学家和领域专家的教育工具,他们只会在每次迭代中了解该过程。同样,他们很可能会想出新的想法来在下一个周期中进行测试和验证。
投资领域知识和流程:如果没有适当的 FMECA/FMEA 流程,就不可能基于数字技术进行预测性维护。因此,对数字技术的投资还应该伴随着对互补资产的投资,例如领域知识和流程。
请记住,成功的预测性维护解决方案不容易复制:在不同的环境(例如,不同的工厂和设备)中复制成功的解决方案并不容易。每个工厂都可能拥有自己独特的 FMECA/FMEA 流程,因此拥有不同的领域知识和数据集。因此,每个新的用于预测性维护的大数据项目都带来了新的挑战,并且在不更改和定制它们的情况下,从其他部署中利用组件的空间很小。
交流新的数据驱动知识:虽然专家知识是数据挖掘的重要驱动因素,但不要忘记数据处理能够获得事先不知道的见解和知识。因此,在挖掘过程中,数据科学家和领域专家之间应该存在双向交互。一方面,专家将提供驱动适当算法规范的知识。另一方面,某些数据处理算法在维护数据集上的应用可能会揭示数据科学家应该与领域专家交流的新见解。
协作:来自预测性维护的大数据都是关于利益相关者的协作。数据科学家、维护专家、IT 专家应密切合作,培养合适的机器学习和数据挖掘专家。此外,C-Suite 的承诺对于降低阻力障碍和成功管理变革也是必不可少的。
总体而言,成功的用于预测性维护的大数据分析需要很好地理解业务目标和专家知识以及维护数据集。领域知识的重要性得到了证明,不仅在企业维护的情况下,而且在其他工业部门的各种用例中也是如此。

构建此类领域知识并在下一个企业维护大数据项目中聘请相关专家至关重要。我们希望上述最佳实践能帮助您使这个项目取得成功。

相关推荐