期刊: IEEE TRANSACTIONS ON INDUSTRIAL ELECTRONICS (IF:7.7)
引言
滚动轴承工作在严苛的环境中,容易导致损坏,危害工业和人生安全。因此有必要提出一些效果更好的方法。
介绍传统基于机械原理方法的故障诊断。但计算过程复杂,对设计人员的技术要求高。此外,特征提取器是与分类器分开执行的。一旦操作条件发生变化,就无法保持精度。
介绍了基于深度学习方法故障诊断方法。
在实际的工业场景中,从旋转机械上采集的振动信号往往含有大量的噪声。噪声干扰会严重影响振动信号的原始波形,使不同状态下的轴承振动信号难以区分。介绍了多种噪声环境下的方法。
为了解决这些问题,本文开发了两种注意力机制网络,即混合域残差阈值网络(MRTN)和双路径混合域残差门限网络(DPMRTN),以提高噪声环境下故障诊断模型的准确性。
在这项工作中,混合域是通道域和空间域的统称,通道注意力机制和空间注意力机制被称为混合域注意力机制。拟议方法的贡献如下。
- 提出了多尺度混域注意块(MMAB),它将空间注意机制和通道注意机制整合到残差块中,并使用多尺度卷积核对混域注意特征进行多尺度特征表示。将多尺度卷积核纳入注意力机制有利于充分捕捉特征的上下文信息,这对注意力系数的学习至关重要。
- 在多尺度 MMAB 的基础上,提出了混域残差阈值块(MRTB)。在混域残差阈值块中插入软阈值函数作为非线性变换层,从 MMAB 中自动获取阈值,从而选择输入数据中对目标任务重要的特征,消除振动信号中与噪声相关的信息,从而提高网络的泛化性能。
- 本文提出了一种双路径注意力机制网络,即 DPMRTN。DP-MRTN 有两条独立的路径,可以同时捕捉振动信号的短期动态和长期关系。将从两条路径中提取的特征进行融合,可以进一步提高捕捉到的长期依赖性信息的相关性。与现有技术的比较表明,DP-MRTN 对环境噪声具有出色的鲁棒性。
方法
多尺度MMAB
普通卷积过程对所有特征一视同仁,这使得振动信号中的重要特征很容易被噪声信息覆盖。为了提高故障诊断模型的抗噪声能力,本文将注意力机制集成到 DL 架构中。DL 中的注意机制是强制模型忽略与预测任务无关的信息,而更多地关注与任务相关的信息。注意力机制模型会快速扫描全局信息,获取需要关注的目标区域,然后将更多的注意力资源投入到该区域,从而获取更多对目标任务有用的细节,同时抑制其他无用信息。
在 CNN 方法中,每个特征通道都可视为输入数据的特征表示。通道注意机制衡量每个输入特征对当前目标任务的重要性,从而为目标任务选择更关键的信息。与通道注意机制不同,空间注意机制对输入特征的空间关系进行建模,并生成空间注意系数,从而使网络能够关注具有重要价值的局部特征。提出的多尺度 MMAB 由通道注意块、空间注意块和多尺度 CNN 组成,如图 1(a)中红框所示。整个 MMAB 结构以残差块 [16] 为基本组件。残差网络的特点是易于优化,并且可以随着网络深度的增加而提高泛化能力。残差块中使用了跳过连接来保护信息的完整性,并直接将输入信息迂回到输出端,从而缓解了深度神经网络中因深度增加而导致的梯度消失问题。
如左图(a)中,其主要结构如下:
- 两个卷积层
- 一个全局平均池化
- 一个全连接层
- 一个Batch Normalization、一个Relu、一个全连接层
- 一个sigmoid
- 一个注意力机制(全局平均池化的结果与上一层的结果按元素相乘)
- 使用一个全局最大池化和一个全局平均池化,然后将这两个结果concat
- 使用结果7通过三个平行卷积提取多尺度信息然后进行按元素相加
- 将结果5与结果上一步的结果进行注意力操作(即按元素相乘)
- 最后将结果9结果2进行软阈值操作
- 将结果11与结果0(即原始数据)进行按元素相加的操作
软阈值
传统的阈值函数主要包括硬阈值和软阈值。硬阈值函数意味着保留绝对值大于或等于阈值T的输入特征,而将其他输入特征设置为零作为噪声。其公式可以表示为[20]:
$$ f(x)=\left{ \begin{aligned} x , |x| \geq T \ 0 , |x| < T \end{aligned} \right. $$
软阈值函数意味着其绝对值大于或等于阈值T的输入特征在幅度上收缩,而其他输入特征被设置为零。那么,它的公式可以表示为[21]:
$$ f(x)=\left{ \begin{aligned} sgn(x)(|x|-T) , |x| \geq T \ 0 , |x| < T \end{aligned} \right. $$
$x$是输入数据,$T$是阈值。
硬阈值函数在阈值T处是不连续的,这将导致可用信息的丢失。软阈值函数具有较好的整体连续性,在信号去噪中得到了广泛的应用。同时,为了解决阈值难以确定的缺点,MMAB采用RSBU-CW[14]的阈值构造思想,根据输入特征自动确定阈值。具体操作过程是使用通过通道注意力块和空间注意力块获得的特征来计算具有输入特征的阈值。构建的MRTB如图1(a)所示。
DP-MRTN
为了捕捉时间序列数据中的遥远相关性并获得更多的特征细节,在MRTB中添加了空洞卷积[22]。
与池化操作相比,空洞卷积可以在不丢失特征信息的情况下增加模型的感受野,从而使卷积输出的特征图都包含更大的范围。
然而,即使扩张卷积增加了感受野,也会带来严重的问题。由于空洞卷积在特征图中是离散采样的,并且缺乏相关性。随着网络层数量的增加,大量膨胀的卷积层被叠加。在这个阶段,内核是不连续的,这将导致一些像素不参与计算的问题。这种将信息作为“棋盘”处理的方式将失去信息的连续性,即网格化效应[23]。
如果在故障诊断网络中只使用扩张卷积,则网络在分析输入信息时会丢失局部信息,从而使捕获的距离相关信息没有相关性。因此,本文引入了双路径网络,以最大限度地减少这个问题的影响。
![fig. 2](/images/Dual-Path-Mixed-Domain-Residual-Threshold-Networks-for-Bearing-Fault-Diagnosis/fig. 2.png)
可以看出,文中网络使用了多个DP-MRTN块stacking,具体有12个块。
实验
数据集
- 自收集:The 2200-W three-phase asynchronous motor.
- CWRU
不同噪音水平下的实验比较
CWRU数据集上的结果
总结
- 网络结构比较复杂,但是都是已有模块的叠加。故事讲的还是比较合理,比如空洞卷积和注意力等机制的添加。
- 网络用在去噪场景上。