软件学报  2021, Vol. 32 Issue (8): 2379-2390   PDF    
基于1D-CNN联合特征提取的轴承健康监测与故障诊断
刘立1 , 朱健成1 , 韩光洁1 , 毕远国2     
1. 河海大学 信息学部物联网工程学院, 江苏 常州 213022;
2. 东北大学 计算机科学与工程学院, 辽宁 沈阳 110169
摘要: 针对特定机械设备构建数据驱动的故障诊断模型缺乏泛化能力,而轴承作为各型机械的共有核心部件,对其健康状态的判定对不同机械的衍生故障分析具有普适性意义.提出了一种基于1D-CNN(one-dimensional convolution neural network)联合特征提取的轴承健康监测与故障诊断算法.算法首先对轴承原始振动信号进行分区裁剪,裁剪获得的信号分区作为特征学习空间并行输入1D-CNN中,以提取各工况下的代表性特征域.为了避免对故障重叠信息的处理,优先使用对健康状态敏感的特征域构建轴承健康状态判别模型,若健康状态判别模型识别轴承未处于健康状态,特征域将与原始信号联合重构,通过耦合自动编码器开展故障模式判定.使用凯斯西储大学(Case Western Reserve University)的轴承数据开展实验,结果表明,该算法继承了深层学习模型的准确性和鲁棒性,具有较高的故障诊断精度和较低的诊断时延.
关键词: 工业物联网    故障诊断    轴承    一维卷积神经网络    联合特征    
Bearing Health Monitoring and Fault Diagnosis Based on Joint Feature Extraction in 1D-CNN
LIU Li1 , ZHU Jian-Cheng1 , HAN Guang-Jie1 , BI Yuan-Guo2     
1. College of Internet of Things Engineering, Hohai University, Changzhou 213022, China;
2. School of Computer Science and Engineering, Northeastern University, Shenyang 110169, China
Abstract: Data-driven fault diagnosis models for specific mechanical equipment lack generalization capabilities. As a core component of various types of machinery, the health status of bearings makes sense in analyzing derivative failures of different machinery. This study proposes a bearing health monitoring and fault diagnosis algorithm based on 1D-CNN (one-dimensional convolution neural network) joint feature extraction. The algorithm first partitions the original vibration signal of the bearing in segmentations. The signal segmentations are used as feature learning spaces and input into the 1D-CNN in parallel to extract the representative feature domain under each working condition. To avoid processing overlapping information generated by faults, a bearing health status discriminant model is built in advance based on the feature domain sensitive to health status. If the health model recognizes that the bearing is not in a healthy state, the feature domain will be reconstructed jointly with the original signal and coupled with an automatic encoder for failure mode classification. Bearing data provided by Case Western Reserve University are used to carry out experiments. Experimental results demonstrate that the proposed algorithm inherits the accuracy and robustness of the deep learning model, and has higher diagnosis accuracy and lower time delay.
Key words: industrial Internet of things    fault diagnosis    bearing    one-dimensional convolution neural network    joint feature    

工业物联网是驱动工厂智能化改造与网络协同制造纵深发展的重要技术基础[1, 2], 由此催生的智能产线已逐步实现柔性化、定制化、自适应的混流制造模式.然而, 伴随着不断增长的设备规模、愈发精密的元件和更加多元的机械组合方式, 产线设备集群协作的智能化和复杂度不断提高, 其运维强度和难度均大幅度增大.对于不同设备可能出现的意外行为模式以及无法用精确数学模型描述的工业流程, 传统的机理模型和经验模型将失去对未知工作模式的解释能力[3].随着泛在感知和人工智能的兴起, 依靠部署传感器网络捕获关联松散的智能产线信息物理要素, 结合基于机器学习的数据驱动模型实现设备运行状态特征提取和故障诊断, 体现了巨大的潜力[4-6].

针对特定机械设备运行数据驱动构建的故障诊断模型, 仅对该设备的状态具备解释性, 不具备泛化能力; 而以机械设备为单位建立单独的诊断模型成本极高[7, 8].若将目光放在更小但具有代表性的机械元件上, 则能大幅度削减诊断模型的建模成本.作为设备运转的关键部件之一, 滚动轴承几乎存在于所有机械中, 是机械设备中最易损坏、也最能反映机械健康状态的元件.研究表明: 在工业物联网大型机械的故障中, 轴承缺陷占比达40%;在小型机械故障中, 轴承缺陷的占比达90%[9].因此, 轴承的运行数据包含大量机械运行状况的信息[10], 依靠轴承运行数据构建的故障诊断模型将具备更好的泛化能力[11].

现有数据驱动的轴承故障建模研究在特征信号选择上涵盖了振动、电流、电压、声信号.文献[12]通过融合声信号和振动信号进行轴承的故障检测, 实验表明, 振动信号比声信号包含更丰富的状态信息.文献[13]使用声发射信号进行故障分类, 虽然短时傅里叶变换代替信号处理和特征提取技术减少了数据预处理的时延, 但是模型精度受不规则噪音影响严重.文献[14]选择电动机本身的电流信号结合深度卷积神经网络(convolutional neural network, 简称CNN)和信息融合技术进行故障的分类, 复杂的故障分类过程佐证了电流信号中相关信息的贫乏.上述文献表明了, 运用振动信号进行轴承故障检测具有明显优势.具有分类能力的机器学习模型能够通过训练大量特征信号实现故障模式识别.与浅层学习模型相比, 深层学习模型具有特征自动学习能力, 诊断准确度和鲁棒性更加优越[15-17].作为一种典型的深层学习架构, CNN将特征提取、特征变换、信息融合、模式识别整合在同一深层结构中.在故障诊断领域, CNN的应用思路主要分为两个方向.第1类是将信号转换到频域, 由CNN提取频率特征完成分类.如: Janssen等人[18]采用了离散傅里叶变换将振动信号变换到频域, 并训练带标记样本的CNN完成齿轮箱故障诊断; Guo等人[19]将连续小波变换后的结果作为CNN的输入矩阵来诊断旋转故障, 并取得了良好的诊断效果.在此类研究中, CNN仅作为分类器, 优秀的多层特征提取和抽象能力未得到充分利用.第2类是利用时间序列信号的图像作为CNN的输入, 将故障诊断问题视为图像识别问题.Wen等人[20]将轴承振动信号图像作为CNN的输入, 诊断准确率在95%以上.Wang等人[21]对原始信号进行了预处理, 用短时傅里叶变换得到时频图, 通过CNN自适应提取时频特征完成诊断.

以上两类研究中, 引入的CNN是以二维矩阵为输入的2D-CNN.然而, 机器运行期间产生的振动、压力等状态信号通常是一维向量[22-24].因此, 部分学者尝试构建1D-CNN[25]实现故障诊断.例如, Turker等人[26]测试了电机的电流, 并利用1D-CNN实现实时状态监测和故障诊断; Peng等人[27]利用1D-CNN对轮毂轴承的振动信号进行故障诊断, 取得了较好的效果.与2D-CNN相比, 1D-CNN对于一维时间序列信号无需傅里叶变换、小波变换等时频变化处理, 而是直接输入原始的时间序列信号, 避免了因时频变换导致的特征丢失或失真[28].

尽管1D-CNN能通过数据驱动的方式良好分类轴承工况, 但是作为一种深层学习模型, 1D-CNN需要大幅度降低硬件设施的存储计算负担、加速模型训练进程, 以适应时延敏感的工业故障诊断应用.因此, 本文以一维卷积神经网络为架构对轴承振动状态进行健康监测和故障诊断.为缩减训练时延、去除故障信息重叠的冗余信号区域, 所提算法对轴承不同工况下产生的原始振动信号进行裁剪, 将裁剪获得的信号区域作为特征学习空间, 并行输入1D-CNN中以提取各工况下的代表性特征, 并优先针对健康状态选择代表性特征构造健康状态判别模型.对检测为非健康状态的原始信号, 令其与各故障信号裁剪获得的代表性特征通过自动编码器进行耦合, 学习特征间的相关性和完整性后, 进入softmax层对故障进行具体分类.

本文第1节介绍1D-CNN模型的理论基础.第2节介绍基于1D-CNN联合特征提取的健康状态监测与故障诊断算法.第3节设计实验综合验证方案的有效性.第4节对本文工作进行总结并提出未来研究方向.

1 一维卷积神经网络

图 1所示为具有l层的1D-CNN的网络架构.输入信号自输入层进入卷积层后, 通过卷积层中的一维卷积核对输入信号的局部区域卷积实现特征提取, 不同的卷积核可从在输入中提取不同的特征信号.对于第(l-2)层卷积层, 其输出可以表示为

Fig. 1 One-dimensional convolution neural networks 图 1 一维卷积神经网络

$x_j^{l - 2} = f\left( {\sum\limits_{i = 1}^M {k_i^{l - 3}*w_{ij}^{l - 2} + b_j^i} } \right)$ (1)

其中, k表示卷积核, j表示卷积核数量, M表示输入xl-1的通道数, b表示与内核对应的偏置, f表示激活函数, *表示卷积算子.

经卷积层提取的特征信号随后进入池化层实现特征降维, 简化网络计算复杂度.若最后一个池化层是第(l-1)层, 其输出作为输入传递给全连接层, 在全连接层产生的输出结果为

$y_i^l = f({w^{l - 1}} \cdot {x^{l - 1}} + {b^{l - 1}})$ (2)

其中, w表示权重, b表示偏置.最终, 全连接层连接softmax层进行分类操作.

输出层的结果与预期结果的误差反向回传网络, 依次得到全连接层、池层和卷积层的误差.通过计算误差梯度更新权值和阈值, 直至满足误差允许条件完成训练.输入向量a在输出层的均方误差所示如下:

${E_a} = \sum\nolimits_{i = 1}^{{N_l}} {{{(y_i^l - t_i^a)}^2}} $ (3)

其中, $y_i^l$是网络最终的输出结果, $t_i^a$为向量a的目标输出.为了找到Ea的导数, 首先应计算出增量误差如下:

${\rm{\Delta }}_k^l = \frac{{\partial E}}{{\partial x_k^l}}$ (4)

增量误差可采用梯度下降法更新每个神经元的权重与偏置, 增量误差${\rm{\Delta }}_k^l$用于更新该神经元的偏差和连接到该神经元的上一层神经元的所有权重, 其定义如下:

$\frac{{\partial E}}{{\partial w_{ik}^{l - 1}}} = \frac{{\partial E}}{{\partial x_k^l}} \cdot \frac{{\partial x_k^l}}{{\partial w_{ik}^{l - 1}}} = {\rm{\Delta }}_k^ly_i^{l - 1}$ (5)
$\frac{{\partial E}}{{\partial b_k^l}} = \frac{{\partial E}}{{\partial x_k^l}} \cdot \frac{{\partial x_k^l}}{{\partial b_k^l}} = {\rm{\Delta }}_k^l \cdot 1 = {\rm{\Delta }}_k^l$ (6)

随后从全连接层到池化层的执行反向传播:

$\frac{{\partial E}}{{\partial s_k^l}} = {\rm{\Delta }}s_k^l = \sum\nolimits_{i = 1}^{{N_l} + 1} {\frac{{\partial E}}{{\partial x_k^{l + 1}}} \cdot \frac{{\partial x_k^{l + 1}}}{{\partial s_k^l}}} $ (7)
${\rm{\Delta }}s_k^l = \sum\nolimits_{i = 1}^{{N_l} + 1} {{\rm{\Delta }}_i^{l + 1}} w_{ki}^l$ (8)

可得${\rm{\Delta }}s_k^l$l+1层nl+1个神经元来提供层之间的增量误差:

${\rm{\Delta }}s_k^l = \sum\nolimits_{i = 1}^{{N_l} + 1} {conv1Dz({\rm{\Delta }}_k^{l + 1},rev(w_{ik}^l))} $ (9)

其中, rev(·)表示反转数组, conv1Dz(·)表示完全卷积.

传统的深度学习模型对样本数量的要求极高, 而1D-CNN可在样本有限的条件下完成模型训练; 其次, 对比需要经时频域转换或者参量计算从而在振动信号中学习故障信息的方法, 1D-CNN无需手工特征提取、特征选择以及快速傅里叶变换或离散小波变换等任何预定转换即可开始模型训练; 最后, 1D-CNN紧凑的架构配置仅执行1D卷积, 其经济高效的特性以及简单的硬件实现适合于实时故障检测和监视.因此, 本文以1D-CNN为基础架构, 构建轴承的健康状态判别模型和故障诊断模型.

2 1D-CNN联合特征提取的轴承故障在线监测方案 2.1 原始振动信号分区裁剪

传统方案在轴承故障诊断模型训练的过程中令健康态和各故障态组成完整的工况特征集合U={Wh, Wr, Wo, Wb}, 通过训练各工况下的故障特征, 直接判断出轴承所处的具体状态.其中, Wh, Wr, Wo, Wb分别表示健康状态、内圈故障、外圈故障和滚珠故障的对应特征.

本文考虑健康状态作为实际工厂运作时的常态, 不应当与小概率出现的工况(内圈故障、外圈故障和滚珠故障)属于同一优先级, 而应属于先后关系, 因此优先监测健康状态, 当出现故障时再进行故障诊断.所以首先将工况集合中的元素归纳为健康态和非健康态, 即$U' = \{ {W_h},{\tilde W_h}\} $, 其中, ${\tilde W_h} = \{ {W_r},{W_o},{W_b}\} $, 从而对轴承健康状态优先做出判断, 避免对故障重叠等冗余信息的处理.记轴承的旋转速度为v, 轴承旋转一轮所需的时间为单位周期, 在单位周期内对产生的振动信号进行采样, 采样频率为fs, 将单位周期内获得的采样点作为样本, 样本规模n=fs/v.如图 2所示.

Fig. 2 Health monitoring and fault diagnosis based on 1D-CNN joint feature extraction 图 2 基于1D-CNN联合特征提取的健康监测与故障诊断

在振动信号分区裁剪阶段, 将单位周期内的振动信号进一步拆分成若干信号区间, 选择j个单位周期的采样数据, 并将其矩阵化表示为

$\left( {\begin{array}{*{20}{c}} {C_1^1}&{...}&{C_i^1} \\ \vdots & \ddots & \vdots \\ {C_1^j}&{...}&{C_i^j} \end{array}} \right)$ (10)

其中, i表示区间序号.矩阵的每一行是由i个区间组成的一个样本, 每一列代表一类信号区间, 每个元素的组成如下所示:

$C_i^j = [X_{i1}^j,X_{i2}^j,...,X_{im}^j]$ (11)

$C_i^j$表示第j个样本的第i个信号区间, $x_{im}^j$表示第j个样本的第i段中的第m个采样点.每个信号区间中包含的采样点集合称为伪特征.

2.2 基于1D-CNN并行训练的特征域筛选

1D-CNN能够直接学习原始信号中的相关信息, 使得伪特征具备该工况对应的部分特性.在图 2所示的特征域筛选阶段, 通过1D-CNN并行训练所有工况下的每类伪特征, 从中筛选出能准确反映特定工况(健康状态、外圈故障、内圈故障、滚珠故障)的伪特征组, 构建该工况下状态检测模型的特征域.过小的振动信号采样数值会增加1D-CNN学习过程中的计算难度, 为了避免此类问题, 将每个伪特征进行单独归一化处理.对于任意一个伪特征的归一化方式如下:

${\hat x_i} = ({x_i} - \min )/(\max - \min )$ (12)

其中, xi代表进行归一化的采样数据, max和min表示进行归一化的伪特征中最大和最小的值.每个伪特征归一化后, 能保证并行训练时具有相仿的时延; 其次, 相同维度的数据给予每个伪特征一样的贡献能力, 在筛选阶段提供可靠的敏感度评判结果.使用1D-CNN筛选伪特征的过程本质上是在单位周期内的振动信号上进行的数据裁剪, 丢弃不具代表性的伪特征, 从根本上降低所需处理的数据量.

通过1D-CNN的并行训练, 得到每个伪特征对应于每个状态(健康状态、内圈损坏、外圈损坏、滚珠故障)的分类准确度, 作为能够准确反映各状态的敏感度.

首先筛选出对于诊断健康状态具有高分类准确率的伪特征:

${P_h}({C_i}) > Threshol{d_h} \to {F_h} = [{C_{h,1}},{C_{h,2}},...,{C_{h,{n_h}}}]$ (13)

Ph(Ci)为第i个伪特征对于判断轴承健康状态的准确度; Thresholdh是人为设置的用于判断伪特征在健康判别时是否具有代表性的阈值; nh为筛选出的伪特征数量, 筛选的数量应当不超过总数的2/3, 以免过分增加在线监测的时延和硬件负担; Fh为健康状态的特征域.如图 3所示, 本文将筛选出的伪特征进行联合特征的提取, 即特征域中的元素拼接形成子样本输入1D-CNN学习, 训练后的模型用于判断轴承是否处于健康状态.

Fig. 3 Online health monitoring based on feature domain splicing 图 3 基于特征域拼接的健康状态在线监测

已有文献表明: 轴承健康状态的诊断所需要的数据量极少, 大多数模型针对的问题是如何实现对轴承4种工作状态的准确分类.在实际工业背景下, 优先发现故障比花费大量时间直接分类故障更具有实际意义.

考虑到轴承故障已知且种类较少, 本文采用为不同故障选取伪特征的方式降低需要处理的数据量.针对故障选出的伪特征组成的特征域涵盖大量该故障的相关信息, 不易造成故障种类混淆, 能够提高判断的准确度.使用公式(14)~公式(16)筛选出对于不同故障状态下具有高分类准确率的伪特征:

${P_r}({C_i}) > Threshol{d_f} \to {F_r} = [{C_{r,1}},{C_{r,2}},{C_{r,3}},...,{C_{r,{n_r}}}]$ (14)
${P_o}({C_i}) > Threshol{d_f} \to {F_o} = [{C_{o,1}},{C_{o,2}},{C_{o,3}},...,{C_{o,{n_o}}}]$ (15)
${P_b}({C_i}) > Threshol{d_f} \to {F_b} = [{C_{b,1}},{C_{b,2}},{C_{b,3}},...,{C_{b,{n_b}}}]$ (16)

其中, Pr(Ci)是第i个伪特征对于判断内圈故障的准确度, 类似地, Po(Ci)和Pb(Ci)分别表示第i个伪特征对于判断外圈故障和滚珠故障的准确度, Thresholdf是人为设置的阈值, Fr, FoFb是分别针对内圈故障、外圈故障、滚珠故障所选择的伪特征组成的特征域.为故障筛选伪特征是为了筛选出包含特定故障种类相关信息最多的伪特征, 而非直接用于分类故障.并行式1D-CNN筛选伪特征构造的健康状态判别模型具有低时延、低复杂度、强泛化能力的特点, 而为故障分类筛选出的伪特征所包含的信息比全局学习得到的特征更具针对性, 也意味着多个故障信息重叠易造成混淆判断的区域会被舍弃.

2.3 基于联合特征提取的故障诊断

对实时收集的振动信号优先采集健康状态特征域, 并在训练完成的健康状态判别模型中对其进行判别, 确定轴承的健康状态, 对表现出非健康状态的数据重新采样, 使用耦合自动编码器的softmax层对其进行分类, 得出确切的故障类型.

由于当前筛选出的针对3种故障的3个特征域本质上是轴承旋转一周所得采样点中富含特定工况信息的段落集合, 虽然包含大量特定工况的信息, 但是缺少关联性和完整性.如果效仿健康状态判别模型将特征域内的元素连接成一维数组形成新的子样本并通过1D-CNN学习, 则无法达到良好的故障分类效果.综合考虑裁剪周期后数据不完整、缺少相关性的特点, 将筛选出来的伪特征组与原始信号通过自动编码器做联合特征处理后对具体故障进行识别.

首先对原始信号采样数据的矩阵进行全局归一化, 数学表达式如下:

${\hat p_j} = {p_j}/||{p_j}|{|_2}$ (17)

p是以周期为行、以样本数为列的原始信号数据集, $p_j^{(i)}$表示矩阵中第i行、第j列的数据点, ||pj||2表示第j 列的二范数.上述公式表示每一列的每一个数据点除以该列的二范数.

随后归一化每个样本的特征:

${\tilde p^{(i)}} = {\hat p^{(i)}}/||{\hat p^{(i)}}|{|_2}$ (18)

||p(i)||2是每一行的二范数.上述公式表示每一行的每个数据点除以该行的二范数.

耦合自动编码器期望得到一种稀疏且特征间依然具有相关性的原始信号数据集, 用来弥补被挑选出来的伪特征间缺失的相关性和裁剪掉的信息所包含的相关信息.因此, 本文采用两个自动编码器进行两组数据间的特征耦合, 即: 将两个数据集通过编码器和解码器进行重构, 通过重构误差和相关性度量组成的损失函数实现高准确度的故障分类.自动编码器的编码解码如下:

$ {h_i} = {f_s}\left( {{C_i}} \right){\rm{\;and\;}}{z_i} = {g_s}\left( {{h_i}} \right) $ (19)

其中, fs为特征提取函数, 即编码器; hiCi编码的表示; gs函数映射回输入空间; s是编码器与解码器的权重和偏置的集合{W, b, W', d}.

自动编码器在训练过程中减小重构误差:

$S = \arg \min \sum\nolimits_{i = 1}^j {L({C_i},{z_i})} $ (20)

L(·)表示重构函数.

通常情况下, 使用平方误差表示重构误差, 训练则使用反向传播, 通过梯度下降实现最小化.

Fr, FoFb分别与p进行重构耦合, 以外圈故障为例, 为重构误差增加相关性度量项, 相关性度量定义如下:

$ Q\left( {{C_a},{C_o};{S_a},{S_o}} \right) = \left\| {{f_a}\left( {{C_a},{S_a}} \right) - {f_o}\left( {{C_o},{S_o}} \right)} \right\| $ (21)

由于两数据集同源, 两个自动编码器的耦合能够很快捕获两者间的相似性, 弥补缺失信息.fafo分别是数据集pFo的映射函数, CaCo是输入的数据, SaSo是权重和偏置的集合, 所以更新损失函数为

$ L\left( {{C_a},{C_o};{S_a},{S_o}} \right) = {\mu _1}{L_a}\left( {{C_a};{S_a}} \right) + {\mu _2}{L_0}\left( {{C_0};{S_0}} \right) + {\mu _3}Q\left( {{C_a},{C_o};{S_a},{S_o}} \right) $ (22)

其中, μi是控制重构误差和相似性度量的参数且$\sum\nolimits_{i = 1}^3 {{\mu _i}} = 1$.训练过程依旧由反向传播和梯度下降进行, 在模型最后加入softmax层进行分类.本文针对两个同源数据集开展特征耦合: 一类数据剔除了采样周期内受噪声影响, 包含故障重叠信息的部分, 保留特定工况信息最丰富的区域; 一类具有强相关性、稀疏性, 通过自动编码器耦合之后能够发挥出两类数据的优势, 故障分类的准确度优于其中的任何一类数据.本文所提基于1D-CNN联合特征提取的轴承健康监测与故障诊断算法伪代码如下.

Input: Vs: 轴承的振动信号. //对健康状态的特征域采样点进行存储

Output: Fk: 故障类型的结果.

Pseudocode:

1. if collected.Vs=On; //传感器采集到的振动信号

2. forselectSP=Sampling(circle); //按旋转机械旋转一圈采样点的数量为一个样本存储数据

3. {

4. CutSPcircle=Pseudo-feature(i); //将每个样品裁剪成i个伪特征

5. Conv1Dz(Pseudo-feature(i), n); //一维卷积并行训练i个伪特征, 并取n个样本

6. Select(Feature domain(Pseudo-feature(i), j, );l); //为l个工况分别选择j个区域组成特征域

7. }

8. Conv1Dz((Feature domain(health), h), n); //利用一维卷积训练健康状态特征域实现监测模型

9. AE Coupling(Feature domain(fault(i), i), Sampling(circle)); //自动编码器耦合特定工况特征域和原始信号

10. Softmax(AE Coupling.fault); //Softmax做故障分类

11. if (Collected.Vs.Feature domain(health)=Conv1D((Feature domain(health), h), n));

//判断实时收集的数据是否健康

12. Continue;

13. Else if

14. Temporary=Collected.Vs.Feature domain(fault, i); //收集i个故障所需要的特征域

15. fault=Softmax(Temporary); //Softmax分类故障

16. DeleteTemporary; //删除存储的采样点

17. End if;

3 实验仿真与性能评估 3.1 参数设置

实验采用凯斯西储大学(Case Western Reserve University)轴承数据中心提供的轴承数据进行实验, 数据以12 000个采样点每秒从机械的加速度计上收集, 采样点/圈数=采样频率×60/旋转速度=12000×60/1797=400, 因此固定单位周期的振动信号长度为400个采样点, 即每个样本由400个采样点组成.轴承健康状态及不同故障状态各选取1 000个样本, 训练与测试所用数据比例为9:1.实验所用1D-CNN的激活函数为Relu, 而网络层数包括5层卷积、5层池化以及2层完全连接层, 卷积核大小为10, 数量分别是27, 27, 27, 36, 36.

图 4(a)~图 4(d)所示为轴承正常运转、内圈故障、外圈故障、滚珠故障下产生的一个样本长度的振动信号时域波形图.

Fig. 4 Vibration signal under four working conditions per cycle 图 4 4种工况下单位周期长度的振动信号

4种工况单位周期长度的振动信号图表明, 不同信号区间包含不同的相关信息.依据本文提出的方案对每个样本进行裁剪, 将每个样本平均裁剪成10个信号区间, 每个信号区间中的采样点集合作为一个伪特征, 可获得数据矩阵:

$\left( {\begin{array}{*{20}{c}} {C_1^1}&{...}&{C_{10}^1} \\ \vdots & \ddots & \vdots \\ {C_1^{4000}}&{...}&{C_{10}^{4000}} \end{array}} \right)$ (23)
3.2 健康诊断和联合特征故障模式识别

将数据矩阵中每一列分别作为一个样本集, 并行地进入1D-CNN中训练, 图 5为分别使用10个伪特征(分别记为PF1, PF2, .., PF10)诊断健康状态、滚珠故障、内圈故障、外圈故障的准确度.

Fig. 5 Diagnosis accuracy of different bearing states using 10 pseudo-features 图 5 使用10个伪特征诊断不同轴承状态的准确度

如图所示, 使用不同伪特征判断4种工况的准确度是具有差异性的, 即单位周期长度的样本内每个信号区间所包含的相关信息差异很大, 主要原因在于: (1) 部分信号区间包含大量的混淆信息, 往往是造成传统方法中错误分类故障的原因; (2) 一些区域对于工况信息不敏感, 特定工况的相关信息少.而诊断健康状态的准确度比诊断其他故障的准确度明显要高, 因为健康状态的信号在某些区域与故障的信号有明显差异, 便于分辨出数据是否健康.因此, 可以将针对健康状态的阈值设置在较高水平, Thresholdh=0.95, 随后针对故障的分类结果设置阈值.图 5中结果表明: 仅靠一小部分区域来分类故障很难达到令人满意的结果, 但是分类的准确度可以提供每个区域对于判断特定工况的敏感性.因此, 设置故障准确度阈值时不必太高, 本文设置Thresholdf=0.85.

在实验过程中, 存在不同伪特征判断的准确度普遍不高或准确度区分性不明显的情况.可通过适当减少每个样本切割出的伪特征数量, 增加切割出的伪特征即信号区间长度, 或切割时不从信号初始点位开始切割, 使每个伪特征包含最多且最具针对性的轴承工况的相关信息.

基于特征域拼接的健康状态检测有效性的实验结果如图 6所示, 根据阈值筛选出针对健康状态的伪特征组成特征域Fh=[Ch, 1, Ch, 3, Ch, 5], 将选择出的特征域中元素拼接成子样本进入1D-CNN训练健康状态判别模型.本实验将3个伪特征分别诊断健康状态的准确度与使用特征域拼接构建子样本进行诊断健康状态的准确度以及传统一维卷积诊断健康状态的准确度进行了比较, 结果如图 6所示.3个元素连接形成的子样本因为包含最多的健康状态相关信息, 比3个伪特征单独分类的结果具有更高的准确度, 证明了伪特征连接成子样本的有效性.

Fig. 6 Experimental analysis of the validity of health status detection based on feature domain splicing 图 6 基于特征域拼接的健康状态检测有效性实验分析

图 7所示分别是: 1) TR1D-CNN: 传统一维卷积健康状态判别模型; 2) CFC1D-CNN: 健康状态的特征域中元素连接成子样本通过1D-CNN构建健康状态判别模型分别诊断相同数量的信号所需的时延.如图所示, 随着样本数量的增加, 本文的健康状态判别模型因为只对每个样本特征域所在区域进行处理, 所以实际处理的数据量远小于传统的1D-CNN.传统的1D-CNN模型本身因为能够直接学习原始信号而具有低时延特点, 本文在此基础上进一步降低了训练时延, 兼顾了工业场景下对诊断精度与诊断时延的服务质量要求.

Fig. 7 Time delay comparison of different health discrimination models 图 7 不同健康状态判别模型的时延对比

图 8所示分别是: 1) TR1D-CNN: 基于传统一维卷积的轴承故障诊断模型; 2) CFC1D-CNN: 故障的特征域中元素连接成子样本通过1D-CNN构建的故障诊断模型; 3) CFJ1D-CNN: 故障特征域中每个伪特征的故障分类结果以投票方式进行决策级融合构建的故障诊断模型; 4) CFCAE: 本文所提的特征域与原始信号做联合特征, 最后在softmax中进行分类构建的故障诊断模型.TR1D-CNN因为数据包含冗余和故障信息重叠的部分, 在准确度上并不突出.而CFC1D-CNN和CFJ1D- CNN虽然都比各自特征域中任意一个伪特征故障分类的准确度高, 但是提升的准确度很有限, 而由于处理的数据量最少, 在时延方面占优.最后, CFCAE因只联合同源数据, 不会显著提升时延, 其次, 耦合的过程对于数据完整性和相关性的弥补大大提高了故障分类的准确度.

Fig. 8 Comparison of diagnosis accuracy of different fault diagnosis models 图 8 不同故障诊断模型的诊断精度对比

4 总结

基于价值驱动的工业故障诊断应当是时延与准确度拉锯平衡下的技术, 及时发现故障避免灾难性损失, 再进行精准的故障模式识别, 能对当前工业生产产生实际价值.本文提出了一种基于1D-CNN联合特征提取的轴承健康监测与故障诊断算法, 该算法优先通过健康状态特征域组成的子样本训练1D-CNN模型, 高效、准确地发现故障, 随后使用故障的特征域和原始信号耦合模型进行故障的模式识别.实验结果表明: 本文在追求分类故障准确度的同时, 降低了分类延迟, 且模型的存储和计算复杂度弱化了对基础硬件设施的承载能力要求.在未来的工作中, 我们将在本文提出的算法基础上对轴承复合故障诊断进行研究, 分析并发故障对轴承运转数据变化规律的影响, 消除由单故障和复合故障共存引起的诊断歧义.

参考文献
[1]
Wang FY, Zhang J. Internet of minds: The concept, issues and platforms. Acta Automatica Sinica, 2017, 43(12): 2061-2070(in Chinese with English abstract). https://www.cnki.com.cn/Article/CJFDTOTAL-MOTO201712001.htm
[2]
Chen BT, Wan JF, Shu L, et al. Smart factory of industry 4.0:Key technologies, application case, and challenges. IEEE Access, 2018, 6: 6505-6519. [doi:10.1109/ACCESS.2017.2783682]
[3]
Rani S, Ahmed SH, Talwar R, Malhotra J. Can sensors collect big data? An energy-efficient big data gathering algorithm for a WSN. IEEE Trans. on Industrial Informatics, 2017, 13(4): 1961-1968. [doi:10.1109/TII.2017.2656899]
[4]
Hsu J, Wang YF, Lin KC, et al. Wind turbine fault diagnosis and predictive maintenance through statistical process control and machine learning. IEEE Access, 2020, 8: 23427-23439. [doi:10.1109/ACCESS.2020.2968615]
[5]
Wen CL, Lv FY, Bao ZJ, Liu MQ. A review of data driven-based incipient fault diagnosis. Acta Automatica Sinica, 2016, 42(9): 1285-1299(in Chinese with English abstract). https://www.cnki.com.cn/Article/CJFDTOTAL-MOTO201609001.htm
[6]
Jiang SF, Wu TJ, Peng X, Li JQ, Li Z, Sun T. Data driven fault diagnosis method based on XGBoost feature extraction. China Mechanical Engineering, 2020, 31(10): 1232-1239(in Chinese with English abstract). [doi:10.3969/j.issn.1004-132X.2020.10.015]
[7]
Hu HX, Tang B, Gong XJ, Wei W, Wang HH. Intelligent fault diagnosis of the high-speed train with big data based on deep neural networks. IEEE Trans. on Industrial Informatics, 2017, 13(4): 2106-2116. [doi:10.1109/TII.2017.2683528]
[8]
Fravolini ML, del Core G, Papa U, Valigi P, Napolitano MR. Data-driven schemes for robust fault detection of air data system sensors. IEEE Trans. on Control Systems Technology, 2019, 27(1): 234-248. [doi:10.1109/TCST.2017.2758345]
[9]
Shahriar MR, Borghesani P, Tan ACC. Electrical signature analysis-based detection of external bearing faults in electromechanical drivetrains. IEEE Trans. on Industrial Electronics, 2018, 65(7): 5941-5950. [doi:10.1109/TIE.2017.2782240]
[10]
Li YM, Cao HR, Zhu YS. Study on nonlinear stiffness of rolling ball bearing under varied operating conditions. In: Proc. of the 2013 IEEE Int'l Symp. on Assembly and Manufacturing (ISAM). Xi'an, 2013. 8-11.
[11]
Eren L. Bearing fault detection by one dimensional convolutional neural networks. In: Proc. of the Mathematical Problems in Engineering. 2017. Article No. 8617315.
[12]
Ma M, Sun C, Chen XF. Deep coupling autoencoder for fault diagnosis with multimodal sensory data. IEEE Trans. on Industrial Informatics, 2018, 14(3): 1137-1145. [doi:10.1109/TII.2018.2793246]
[13]
He M, He D. Deep learning based approach for bearing fault diagnosis. IEEE Trans. on Industry Applications, 2017, 53(3): 3057-3065. [doi:10.1109/TIA.2017.2661250]
[14]
Hoang DT, Kang HJ. A motor current signal-based bearing fault diagnosis using deep learning and information fusion. IEEE Trans. on Instrumentation and Measurement, 2020, 69(6): 3325-3333. [doi:10.1109/TIM.2019.2933119]
[15]
Hu NQ, Chen HP, Cheng Z, Zhang L, Zhang Y. Fault diagnosis for planetary gearbox based on emd and deep convolutional neural networks. Journal of Mechanical Engineering, 2019, 55(7): 9-18(in Chinese with English abstract). https://www.cnki.com.cn/Article/CJFDTOTAL-JXXB201907002.htm
[16]
Yang BY, Liu RN, Chen XF. Fault diagnosis for a wind turbine generator bearing via sparse representation and shift-invariant K-SVD. IEEE Trans. on Industrial Informatics, 2017, 13(3): 1321-1331. [doi:10.1109/TII.2017.2662215]
[17]
Guo L, Lei YG, Xing SB, et al. Deep convolutional transfer learning network: A new method for intelligent fault diagnosis of machines with unlabeled data. IEEE Trans. on Industrial Electronics, 2019, 66(9): 7316-7325. [doi:10.1109/TIE.2018.2877090]
[18]
Janssens O, Slavkovikj V, Vervisch B, et al. Convolutional neural network based fault detection for rotating machinery. Journal of Sound and Vibration, 2016, 377: 331-345. [doi:10.1016/j.jsv.2016.05.027]
[19]
Guo S, Yang T, Gao W, et al. A novel fault diagnosis method for rotating machinery based on a convolutional neural network. Sensors, 2018, 18(5): Article No. 1429.
[20]
Wen L, Li XY, Gao L, et al. A new convolutional neural network based data-driven fault diagnosis method. IEEE Trans. on Industrial Electronics, 2018, 65(7): 5990-5998. [doi:10.1109/TIE.2017.2774777]
[21]
Wang LH, Zhao XP, Wu JX, et al. Motor fault diagnosis based on short-time Fourier transform and convolutional neural network. Chinese Journal of Mechanical Engineering, 2017, 30(6): 1357-1368. [doi:10.1007/s10033-017-0190-5]
[22]
Yang D, Wang XT, Xu GL. Research on 1D signal fast trend extracting via multi-scale extrema. Journal of Electronics & Information Technology, 2013, 35(5): 1208-1214(in Chinese with English abstract). https://www.cnki.com.cn/Article/CJFDTOTAL-DZYX201305029.htm
[23]
Chou YX, Xu BL, Gu Y, Zhang RL, Wang LG, Jin Y. A fast mathematical morphology filter on one dimensional sampled signal. In: Proc. of the 2017 Int'l Conf. on Control, Automation and Information Sciences (ICCAIS). Chiang Mai, 2017. 233-238.
[24]
Yu DC, Yu ZG, Chen XC, et al. Compliance control with vector decomposer using one-dimensional pressure sensor for robotic hand. In: Proc. of the Chinese Automation Congress (CAC). Ji'nan, 2017. 445-450.
[25]
Zhu YJ, Lin HW. Mesh saliency detection via regularized 1D CNN. Journal of Computer-aided Design & Computer Graphics, 2020, 32(2): 203-212(in Chinese with English abstract). https://www.cnki.com.cn/Article/CJFDTOTAL-JSJF202002004.htm
[26]
Ince T, Kiranyaz S, Eren L, et al. Real-time motor fault detection by 1D convolutional neural networks. IEEE Trans. on Industrial Electronics, 2016, 63(11): 7067-7075. [doi:10.1109/TIE.2016.2582729]
[27]
Peng DD, Liu ZL, Wang H, et al. A novel deeper one-dimensional CNN with residual learning for fault diagnosis of wheelset bearings in high-speed trains. IEEE Access, 2018, 7: 10278-10293. http://ieeexplore.ieee.org/document/8584445/
[28]
Eren L, Ince T, Kiranyaz S. A generic intelligent bearing fault diagnosis system using compact adaptive 1D CNN classifier. Journal of Signal Processing Systems, 2019, 91(2): 179-189. [doi:10.1007/s11265-018-1378-3]
[1]
王飞跃, 张俊. 智联网: 概念、问题和平台. 自动化学报, 2017, 43(12): 2061-2070. https://www.cnki.com.cn/Article/CJFDTOTAL-MOTO201712001.htm
[5]
文成林, 吕菲亚, 包哲静, 刘妹琴. 基于数据驱动的微小故障诊断方法综述. 自动化学报, 2016, 42(9): 1285-1299. https://www.cnki.com.cn/Article/CJFDTOTAL-MOTO201609001.htm
[6]
姜少飞, 邬天骥, 彭翔, 李吉泉, 李治, 孙涛. 基于XGBoost特征提取的数据驱动故障诊断方法. 中国机械工程, 2020, 31(10): 1232-1239. [doi:10.3969/j.issn.1004-132X.2020.10.015]
[15]
胡茑庆, 陈徽鹏, 程哲, 张伦, 张宇. 基于经验模态分解和深度卷积神经网络的行星齿轮箱故障诊断方法. 机械工程学报, 2019, 55(7): 9-18. https://www.cnki.com.cn/Article/CJFDTOTAL-JXXB201907002.htm
[22]
杨达, 王孝通, 徐冠雷. 基于多尺度极值的一维信号趋势项快速提取方法研究. 电子与信息学报, 2013, 35(5): 1208-1214. https://www.cnki.com.cn/Article/CJFDTOTAL-DZYX201305029.htm
[25]
朱奕杰, 蔺宏伟. 基于正则化一维卷积神经网络的网格模型显著性检测. 计算机辅助设计与图形学学报, 2020, 32(2): 203-212. https://www.cnki.com.cn/Article/CJFDTOTAL-JSJF202002004.htm