新闻资讯

数据仓库和大数据正在演变成数据湖

发布日期:2021-07-17 15:02:45浏览量:45

物联网 (IoT) 和机器学习是工业 4.0 的关键方面。两者都将导致前所未有的数据收集和分析,以推动新的见解和收益。想要使用制造数据来推动改进并没有什么特别新鲜的。什么是新的过渡远离大数据的准备工作,这是经常的数据仓库,甚至大数据工作的很大一部分。来自不同系统的数据通常经过多个级别的聚合和索引,以便为回答传统问题做好准备。

这对制造商意味着什么?
制造商应该将所有企业数据集规划为更大数据湖的一部分。数据湖是一个存储库,以原始格式保存大量原始数据,包括结构化、半结构化和非结构化数据。直到需要数据时才定义数据结构和要求(与传统数据库不同)。向数据湖的过渡强调对分析工具的灵活访问,而不是以数据准备为中心。根据定义,数据湖将由各种数据源组成,可访问性要求和工作量仅在查询时定义。

传统 ERP 数据中可能唯一包含的信息可以成为工业 4.0 工作的核心部分。例如,灵活的制造资产可用于生产许多不同的 SKU。在生产相应的 SKU 时,资产的磨损存在差异。各个运营商之间以及他们运营资产的方式也可能存在差异。有关生产订单和指定操作员之间差异的数据通常存在于 ERP 系统中。

大量基于物联网的以资产为中心的流程变量的冲击必须与传统业务数据相平衡。基于 ERP 的资产数据是全面了解资产绩效的基本要素。这种生产数据的形式和格式显然与代表直接来自资产和物联网的馈送和速度的时间流标量值完全不同。数据格式的差异并没有降低考虑生产的所有方面以提供完整理解的重要性。当制造商转向机器学习时,必须考虑所有这些不同但相关的数据技术来推动真正的预测性维护。任何给定时间段的传感器数据只能在该时间段内正在处理的生产订单的上下文中进行真实评估。高级数据分析和机器学习可以结合使用这个“块状”数据集。

数据是基础
数据仍然是理解和潜在改进的关键基础。需要重新评估基于批量导出和导入集中式索引数据仓库的传统技术。数据存储和评估工具需要发展以匹配工业 4.0 带来的动态数据收集和查询要求。

相关推荐