基于IMS聚类算法的柴油发动机故障诊断方法研究2020-08-31 08:34

摘 要: 将IMS聚类算法引入柴油发动机故障诊断中,首先对柴油机各工况振动信号进行特征提取,之后对提取的信号特征进行选择;最后建立IMS聚类算法模型,将提取到的特征量作为该模型的输入参数,实现发动机故障的智能诊断。试验研究在一台V6涡轮增压柴油发动机上进行,以获取训练和验证IMS聚类算法模型的数据。经过数据验证,该模型对于故障的判断全部正确。当前的研究为柴油发动机故障的诊断提出了一个新的检测途径。

关键词: 归纳监视系统; 聚类算法;柴油发动机;故障诊断;特征提取

柴油发动机是石油矿场、固定发电和船舶等领域广泛应用的动力机械,一旦发生故障,会造成巨大的经济损失,因此对柴油机进行故障诊断和状态监测具有重要意义。目前,柴油发动机故障诊断常见的方法和理论主要分为基于热力参数、油液、信号处理的传统故障诊断技术和基于模型、常识的现代故障诊断技术。

基于热力参数的诊断技术[1],是指通过监测柴油机工作时的各种性能参数,包括各种进排气压力、柴油温度、油管压力等,然后运用各种理论来分析诊断柴油机故障的方法,但是热力参数法对冲击类故障诊断不敏感。基于油液监测的诊断技术,是利用光电或磁力学技术对润滑油样进行分析,从而诊断出发动机故障的种类及其发生部位[2]。但油液监测诊断技术只能确定故障的种类,不能精确诊断故障发生部位,同时在实现实时监测方面也有很大的困难。基于信号处理的故障诊断方法,在发动机故障领域中常用的检测信号为振动信号。信号处理的对象主要包括有时域、频域以及峰值等指标。运用相关分析、频域、小波分析等信号分析法[3],提取方差、幅值、频率等特征值,从而检测出故障。这种诊断法的缺点在于只能对单个或者少数的振动部件进行分析和诊断。基于模型的故障诊断法[4],是指在建立诊断对象的数学模型的基础上,根据由模型获得的预测形态和所测量的形态之间的差异计算出被诊断系统的故障元件。但是其诊断精度严重依赖于模型的精度,一旦模型有所偏差,就会导致诊断失败或误诊。基于常识的诊断法不需要对象的精确数学模型。主要有以下几种:神经网络故障诊断法[5],基于粗糙集的故障诊断法[6],基于模糊系统的故障诊断法[7],如模糊聚类算法等以及故障树故障诊断法[8]和专家系统[9]等。

单一的故障诊断技术有着各自的优缺点,难以满足复杂系统的诊断的要求。因此,将不同的诊断法有效的结合起来,是故障诊断技术发展的一个趋势。本文将信号处理的诊断方法与模式识别相结合,将柴油发动机振动信号经过特征提取和选择后的特征参数,作为归纳监视系统算法模型的输入参数。最终实现发动机故障的智能诊断。

归纳监视系统(Inductive Monitoring System,IMS)不需要对系统模型进行构建,因此适用于系统模型复杂或者未知的情况,它通过已有正常数据建立一个或多个监控数据库。其训练数据主要来源有两种:系统正常运行时传感器提供的数据以及系统的仿真测试数据,通过训练形成不同数据群,待测数据通过与各数据群进行比较得出与各数据群的不同关系进而判断是否故障[10]。IMS聚类算法的原理就是根据数据空间分布的不同,计算相互间的距离差异进行故障诊断。该方法要求被聚类数据的波动性较为稳定,适用于多维参数综合分析,并且不需要故障数据,所以即可用于实时监控,也可用离线数据分析。IMS聚类算法作为一套成熟的故障诊断算法,已经广泛被国外使用于各类动力系统的故障诊断领域,例如,NASA地面指挥中心将IMS聚类算法用于航天飞机外部热控系统、速度陀螺装备等系统的故障诊断[11],然而在国内应用案例却极少。故本文应用IMS聚类算法进行柴油机故障诊断研究。

1 IMS故障诊断方法

归纳式监控算法分为训练过程与诊断过程。训练过程中,根据训练数据生成数据群。数据群即若干数据点的集合。对于正常工作过程中的数据,每个数据点P都含有多个分量P1P2,…,PN。对于每一个新数据点P,如果没有建立过数据群,则建立数据群C1,该数据群的初始上下限分别为

, …,

, …,

数据群上、下限即数据群边界的定义,所以数据群的初始范围仅仅为一个数据点,上、下限分别与该数据点各个分量相等。

如果已经建立过数据群,则需判断是否有一个数据群的上、下限包含了这个新数据点P。如果有一个数据群的上、下限包含了这个新数据点P,则将这个数据点P并入这个数据群,并更新数据群内数据点个数信息。其含义为新数据点的每一个分量都在数据群对应分量范围上、下限之间。

如果没有数据群的上、下限包含这个新数据点P,则计算新数据点P到每个数据群的距离,找出这些距离的最小值。如果这个最小值小于一个给定阈值D,则将这个数据点P并入这个数据群,并更新该数据群的上、下限。本文选择的距离定义为:该数据点各分量到数据群上限和数据群下限距离之和。更新数据群上下限的规则为:单边扩充,即若数据点某一分量超出与该分量对应的数据群上限,则新的数据群上限为该分量加上该分量超出原数据群上限乘以数据群扩张系数E;若数据点某一分量超出与该分量对应的数据群下限,则新的数据群下限为该分量减去该分量超出原数据群下限乘以数据群扩张系数E。通常,扩张系数选择2%可以满足要求。

如果这个最小值大于一个给定阈值D,则建立一个新的数据群Ck,该数据群上下限分别为

, …,

, …,

即数据群的初始范围为新的数据点,上、下限分别与该数据点各个分量相等。

诊断过程中,判断数据点的位置及与各数据群的距离,如果数据点既不在各数据群内,而且与各数据群的距离大于给定阈值,则表示系统故障。

归纳式监控算法训练与测试两部分流程,分别如图1和图2所示。

图1 归纳式监控算法训练程序流程图

Fig.1 Flow chart of IMS training program

2 柴油发动机振动信号的特征提取与选择

研究对象为一台WP10六缸柴油发动机。实验台发动机的飞轮端的齿轮盘上端安装电涡流传感器、在各缸的缸盖上安装加速度振动传感器、在曲轴箱对角方向涡轮增压器上分别安装加速度振动传感器,本文所研究的振动信号即采集于安装在6#缸缸盖上的加速度振动传感器。为获取柴油发动机故障状态下的振动信号数据,云顶娱乐官网登录入口模拟试验了柴油发动机常见的三种故障,分别为:失火,小头瓦磨损和撞缸故障。具体过程如下:

图2 归纳式监控算法测试程序流程

Fig.2 Flow chart of IMS test program

(1) 失火故障:将6号缸的燃油进口用堵头堵住,其余各缸均保持正常供油,开车运行约10 min,转速稳定在600 r/min;

(2) 小头瓦磨损故障:将6号缸的小头瓦拆下进行人为磨损减薄,然后重新装上,其他缸均正常,开车运行约10 min,转速保持在600 r/min;

(3) 撞缸故障:将一段活塞环放入6号缸内,其他缸均正常,点火运行。开车运行约10 min,转速保持在600 r/min。

2.1 柴油发动机振动信号的特征提取

本文试验所安装振动传感器的采样频率为25 600 Hz,而柴油发动机稳定转速为600 r/min。根据计算柴油发动机振动信号每个周期包含约5 120个数据点。

通过试验,共采集正常状态下数据1 000组,其中800组作为训练数据,其余200组作为测试数据;各故障状态下数据200组,对数据进行时域分析。

设信号x(t)经过量化处理后分解成一组离散数据X ={xi}, i=1, 2,…, n,则峰峰值为信号的最大值减去xmax最小值xmin,是信号变化的幅值范围,峰峰值对于柴油发动机的失火和撞缸故障比较敏感。平均值是描述信号波动中心的变化,方差μx]2,描述的是信号的波动范围。标准差即方差S开方后的正平均根。均方值即,它的稳定性较好,但是对机械早期故障信号不敏感。峭度指标是无量纲参数,由于它与轴承转速、尺寸、载荷等无关,对冲击信号特别敏感,特别适用于表面损伤类故障、尤其是早期故障的诊断。这几种指标是信号时域最主要的统计参数[13],对柴油发动机故障较为敏感,可以有效地对设备的总体振级大小进行定量分析,初步判别故障[14]。因此,为了描述信号时域特性以及取得较好的故障诊断效果,本文选取选均方值、峰峰值、平均值、峭度值、标准差和方差值六个时域特征作为信号的特征参数。

本文对各工况下振动信号经过时域特征提取后,得到4种工况下振动数据的6种特征值。然后对每一个特征在不同的工况下的值求出取值范围,如表1所示。

表1 各工况下不同特征参数的取值范围

Tab.1 Value range of different characteristic parameters on different working conditions

2.2 柴油发动机振动信号的特征选择

从表1可知,六个时域特征量当中,不同的故障工况下的同一种时域特征量的取值范围是不尽相同的,所以各个时域特征量对柴油发动机不同故障的灵敏度是不一样的。

本文用优、良、中、差来衡量各特征量对不同故障工况的灵敏度,对初始输入故障数据与正常数据之间的差异化做一个半定型的分析,以此来选出适合于IMS聚类算法的聚类过程的特征量。“差”为故障特征量和正常特征量范围大部分重合,重合率大于80%;“中”为故障特征量和正常特征量小部分重合,重合率小于20%;“良”为故障特征量和正常特征量范围不重合,但不同故障特征量间范围大部分重合,重合率大于80%;“优”为故障特征量和正常特征量范围不重合,但不同故障特征量间范围小部分重合,重合率小于20%,经过大量数据验证,这样的特征量可以更好地用于IMS聚类算法的聚类过程,如表2所示。

表2 各特征量对不同故障工况的灵敏度

Tab.2 The sensitivity of different characteristic parameters on different fault conditions

从表2可知,平均值、标准差和方差值对于区别柴油发动机正常状态和各故障的效果并不是很好, 因此选择峭度值、峰峰值和均方值作为反映振动的3个特征参数组成特征向量,作为IMS算法的输入值。

3 基于IMS聚类算法的故障诊断

应用归纳式监控算法对实验所得数据进行分析,以柴油机正常工作状态下的800组数据作为训练样本,正常状态下其余200组数据和各故障状态下的200组数据分别作为待测数据。

算法代码在MATLAB环境下实现,分为归一化、优化、训练、测试四个部分。根据上述参数和前面的分析, 应用均方值、峰峰值和峭度值这3个参数作为IMS算法的输入向量。

3.1 归一化

由于提供的初始数据的不同分量数量级差距很大,并且量纲不同,它们数值的变化与它们的重要性不一定相称。在聚类分析中,分析结果完全依赖于各个变量的变异度,因此需要统一数据尺度,即进行归一化,消除量纲差异。本文使用标准差规范化方法对样本数据进行归一化[15]

x

(1)

式中:x为原始训练样本数据;xmin为数据中最小值;xmax为数据最大值;x′为归一化之后的数据。归一化程序部分结果输出,如表3所示。

3.2 优化距离阈值

在使用距离阈值判定样本数据是否属于某一数据群时,应该有一优化方法对距离阈值进行优化,以最大限度的去除人为设定因素对诊断结果带来的干扰。

表3 IMS归一化程序部分结果输出

Tab.3 The partial result output IMS normalization procedure

Fukuyama-Sugeno指数[16]可以作为适应度函数表征数据群分组是否合理,FS指数的计算方法为

(2)

式中:xij为数据群内各个数据点;vi为参考点;v为参考点的中心;C为数据群个数;N为该数据群内数据个数。在固定其他影响训练结果的因素时,FS最小时的D为最优值。通过MATLAB中优化工具箱中的遗传算法寻找适应度函数绝对值最小时所对应的D,即为D的最优结果。

FSD值变化的大致对应关系,如图3所示。

图3 FSD值变化的大致对应关系

Fig.3 The approximate correspondence between FS and D values

以归一化后正常状态数据作为输入,优化结果如图4所示。

图4 距离阈值优化结果

Fig.4 The optimized result of distance threshold

由图4可知,当距离阈值D为1.70时,适应度函数值最小,距离阈值D与正常状态数据群个数的关系,如图5所示。此时对应的正常数据群个数为10个。

图5 距离阈值D与正常状态数据群个数的关系

Fig.5 Relationship between the distance threshold D and the number of normal state data group

3.3 训练

以归一化后正常状态数据、优化阈值D=1.70、数据群扩张系数E=1.02作为输入,训练结果即数据群上、下限、个数、各群内数据个数作为输出。具体输入输出结果,如表4和表5所示。

表4 各数据群上限值结果

Tab.4 Upper limit value of each data group

3.4 测试

由于发动机工作环境的原因,即使在正常工作状态下数据也可能出现些许波动,这些波动可能造成的结果就是被判断为故障数据,这些数据被称为野点。为了提高报警的准确率降低错误超限数据和误判率,需要对野点进行判断处理。对于一个待测数据,数据可能的类型增加为四种。首先判断是否完全属于某个数据群的上、下限,若属于则为正常数据,若不属于,则进行下面的工作。

表5 各数据群下限值和群内数据个数结果

Tab.5 The lower limit values and data number of each data group

计算该数据点到数据群的最短距离,记为Dis;计算该点各分量到归一化中心的距离,根据设定去除距离最大的2个分量,计算余下分量到数据群的最短距离,记为Dis1。根据下表对DisDis1与数据群阈值D和阈值变形(Num-2)/Num·D比较(Num为数据点分量个数),进行数据类型判断[17]。野点判断准则,如表6所示。

表6 野点判断准则

Tab.6 The judgment criterion of outlier

利用其余200组正常数据作为测试数据进行故障检测,结果如图6所示。

图6 正常状态数据测试结果

Fig.6 The test results of normal state data

由图6可知,该算法对正常状态下的数据具有很好的检测准确性,误警率为0。

将失火、小头瓦磨损和撞缸故障状态下的200组数据分别作为测试数据,输入到经过上述步骤训练好的IMS聚类算法中,得到最后测试结果,如图7~图9所示。

图7 失火故障状态数据测试结果

Fig.7 The test results of misfire fault data

图8 小头瓦磨损故障状态数据测试结果

Fig.8 The test results of the small end bushing data

图9 撞缸状态数据测试结果

Fig.9 The test results of cylinder collision fault

由图7~图9可知,该算法对各故障状态下的数据同样具有很好的检测准确性,报警率均为100%,证明IMS聚类算法模型可以很好地用于柴油机的故障诊断。

4  

本文首先对柴油机各工况振动信号进行特征提取和选择。然后建立IMS聚类算法模型,在一台V6涡轮增压柴油发动机上进行相关故障实验,得到训练和验证IMS聚类算法模型的数据,将提取到的特征量作为该模型的输入参数,实现发动机故障的智能诊断。经过数据验证,该模型对于故障的判断全部正确。当前的研究为柴油发动机故障的诊断提出了一个新的检测途径。

与此同时,IMS聚类算法也存在一定的不足,目前仅能应用于异常/故障检测,并未涉及故障模式识别、健康评估等领域。基于此,以后的学者可以利用正常数据和故障数据分别对模型进行训练,合并各个工作状态下训练得到的数据群作为最终的测试模型,然后进行故障识别。 另外,也可以从健康评估的角度入手,根据计算测试数据与各数据聚类模型之间的空间距离、方位角度关系,实现故障模式识别,当系统处于故障状态,利用测试数据在不同故障方向上的投影大小,评估柴油发动机的相应的故障程度。


XML 地图 | Sitemap 地图