利用大数据方法对设备的故障(腐蚀)原因进行分析,改变了设备事故预测的思维、范式和方法,充分运用大数据资源和技术手段,可以解决隐性关系显性化问题,实现设备故障的科学预测,预防事故发生,保障设备长周期安全运行,是设备智慧化管理的必然发展趋势。
数据挖掘
概念
数据挖掘(Data Mining)是一种通过数据驱动发现问题并解决问题的手段,也称作来自数据存储库中的知识发现(Knowledge Discovery in Database),该技术从大量数据中提取信息,将多个学科交叉融汇起来,横跨数理学、统计学、分析学、数据库和机器学习等领域,透过数据表象发现内在潜伏规律和数据间的相关性,提供数据间隐藏的映射关系,将数据对象进行关联分析、聚类分类、分类分析、空间或者序列分析等,提供有效信息和决策参考,并实现对未来的预测
功能
数据挖掘的功能有很多种,不同领域对它功能的表达不一样,下面将其功能概括为六种,如图所示。
数据挖掘功能
常用算法
常用的数据挖掘算法包括聚类模式分析、关联规则、神经网络、时间序列、故障树、遗传算法、支持向量机、模糊集理论和粗糙集理论等。
案例介绍
运用BP神经网络数据挖掘模型预测设备失效的根本原因。
承压类设备数据集
分类
数据变量
输入/输出
设备属性
尺寸,材料等级,制造商
输入
运行信息
运行压力,运行温度,流量,服役年限,输送介质,焊缝状态,防腐层状态
输入
检测信息
压力试验压力,内检测缺陷类型,
输入
失效数据
设备故障失效的类型
输出
失效根本原因
设计问题,材料问题,制造安装问题,使用问题
输出
失效时间
从投用到首次失效的时间
输出
状态数据
设备状态
输出
在案例库学习的过程中,关键词如服役时间、失效机理、失效类型等文本信息进行数字编码转换以达到数据挖掘的基本计算要求,输出则是为设备的4类失效原因(设计原因、制造和安装原因、材料原因和使用问题)。大多数案例所包含的关键信息基本全面,经过隐藏层的“黑箱”运算输出的结果能够显著指向失效根本原因类别。案例库学习过程与实际数据应用过程的对应输出情况如图所示。
设备失效案例的学习与应用示意图