康守强(1980-), 男, 教授, 博士生导师, 从事非平稳信号处理、机械故障诊断、状态评估与预测技术等研究, E-mail:
刘旺辉(1993-), 男, 硕士生, 从事旋转机械故障诊断技术的研究, E-mail:
王玉静(1983-), 女, 副教授, 博士, 从事非平稳信号处理、机械故障诊断、状态评估与预测技术等研究, E-mail:
王庆岩(1984-), 男, 讲师, 博士, 从事图像处理与模式识别、遥感图像处理技术等研究, E-mail:
Mikulovich V I (1946-), 男, 教授, 博士生导师, 从事旋转机械故障诊断、状态评估与预测技术等研究, E-mail:
针对变负载条件下滚动轴承源域与目标域中相同状态的数据特征分布差异性较大, 目标域数据按照序列方式在线获取时, 数据更新需重新训练模型的问题, 提出一种深度在线迁移的CNN-ISVM (convolutional neural networks-incremental support vector machine)变负载下滚动轴承故障诊断方法. 该方法运用短时傅里叶变换得到不同负载下滚动轴承振动信号的频谱图并构建数据集; 使用源域数据建立CNN-ISVM预训练模型并保存模型参数; 利用迁移学习将源域共享模型参数迁移至目标域CNN-ISVM模型训练过程中, 快速建立分类模型; 分类模型中的ISVM分类器在保留已学到知识的基础上, 在线处理目标域新增数据, 无需重新训练. 经实验验证, 所提出方法可实现数据按照序列方式采集的变负载下滚动轴承多状态在线分类, 并具有较好的稳定性及较高的准确率.
For the problem that the data feature distribution of the same state in the source domain and target domain of rolling bearing is quite different under varying loads, and the model needs to be retrained for data update when the target domian data is obtained online in a sequential manner, a fault diagnosis method of rolling bearing under varying loads with the deep online transfer CNN-ISVM (convolutional neural networks-incremental support vector machine) is proposed. Short time Fourier transform is used to obtain the time-frequency spectrum of rolling bearing vibration signals under different loads, and the data sets can be constructed; the source domain data is used to build the CNN-ISVM pre-training model, and the model parameters are saved; transfer learning is used to transfer the source domain shared parameters to the target domain CNN-ISVM model training process to quickly establish the classification model; the ISVM classifier in the classification model retains the learned knowledge and processes the new data in the target domain online without being retrained. The experimental results verify that the proposed method can realize multi-state online classification of rolling bearings under varying loads with data collected in a sequential manner, and has better stability and higher accuracy.
滚动轴承作为工业生产设备中的关键零部件, 一旦发生故障, 将直接影响整台机械设备的安全运行[
随着机器学习研究的不断深入, 基于人工智能的数据驱动方法成为故障诊断领域研究的热点[
近年来, 深度学习理论逐渐成为机器学习领域中炙手可热的学习算法, 其在机械智能故障诊断领域也受到越来越多的关注[
迁移学习放宽了传统机器学习中的两个基本假设, 运用已有的知识解决不同但相关领域的问题, 是一种新的机器学习方法[
上述离线训练方式的深度迁移方法虽能较好解决变负载下的故障诊断问题, 但应用的一个重要假定是目标域数据的可用性, 即在识别模型建立前已准备好全部目标域数据. 然而实际情况中, 数据的在线获取导致待分类目标域的数据按照序列方式到达, 无法满足目标域数据在模型训练过程中的完备性假设, 因此, 离线训练方式的深度迁移学习算法将不再适用.
在线学习的引入为解决上述问题提供了一种新思路. 在线学习在保留绝大多数历史知识的前提下, 不断地从新样本中学习新知识, 使得更新后的知识适应新到达的样本. 在线学习在很多领域都展示了它的有效性, 如图像识别、语音识别和人机交互等领域. 文献[
短时傅里叶变换(short time Fourier transform, STFT)是在傅里叶变换基础上发展而来的, 是一种时-频分析方法, 可同时反映出信号的时域和频域信息, 被广泛应用于非平稳信号的研究[
针对变负载条件下滚动轴承振动数据特征分布差异性较大, 目标域数据的在线获取与识别问题, 本文提出一种深度在线迁移学习的故障诊断方法. 该方法首先将原始时域振动信号作STFT处理, 构建二维频谱数据集; 然后使用源域数据训练源域CNN-ISVM模型, 得到源域分类模型, 保存模型参数并将模型共享参数迁移至目标域CNN-ISVM训练过程中, 加速模型建立; 最后通过在线数据对目标域CNN-ISVM模型中的ISVM分类器进行更新和修正, 实现变负载下滚动轴承多状态在线识别.
CNN是一种专门用于处理具有类网状结构数据的典型前馈神经网络, 其本质是构建多个能够提取数据特征的滤波器, 并运用这些滤波器对输入数据进行逐层卷积和池化, 提取蕴含在输入数据中的鲁棒特征. 典型的CNN网络通常包含输入层、卷积层、池化层、全连接层和输出层. 在CNN的前期特征提取算法中, 通过利用交替的卷积层和池化层对输入数据进行层层提取特征, 接近输出层则采用普通多层神经网络. 在卷积层中, 利用前一层的输出与多个卷积核卷积并生成特征映射, 通过激活函数构建输出特征矢量. 其数学模型描述为
其中:
线性修正单元(ReLU)被广泛用作激活函数以缓解神经网络的过拟合问题. ReLU的公式为
其中
池化层是对上一层数据的缩放映射, 池化能够提取每个特征映射中最重要的局部信息, 并通过该操作可以显著减小特征维度. 本文选取实际中广泛使用的最大池化作为池化方式, 池化长度为
其中:
全连接层通常会与Softmax组合使用来完成分类任务. 具体过程是, 将最后一个池化层的输出展平为一维特征向量并作为全连接层的输入, 其公式描述为
其中:
Softmax回归函数是Logistic分类器的推广, 主要用于多分类问题. 类标签
其中:
SVM是一种结构风险最小化模型, 广泛应用于分类和回归任务. ISVM是在SVM的基础上提出的, 其核心思想是随着在线数据逐步训练一个模型, 将其训练过的数据全部丢弃, 仅保留作为SV的数据, 这些SV将加入下一次循环训练. SV参数优化的准则为搜索支持向量的Karush-Kuhn-Tucker (KKT)条件, 以下对ISVM算法[
给定训练数据集为
其中:
其中:
Softmax回归函数是Logistic分类器的推广
在线学习过程中, 当新样本
最终可以得到新的最优分类超平面, SVM的判决函数为
在传统CNN网络中, 判别输出层通常由一个全连接层与Softmax分类器组合构成, Softmax分类器实质上是对最终的分类结果做一次符合概率分布的归一化操作, 其在多分类性能上尚不如SVM功能强大. 然而SVM存在对深层特征提取和数据挖掘能力不足[
本文所提出的算法基本结构如
CNN-ISVM算法基本结构
不同负载情况下, 滚动轴承正常、内圈、外圈和滚动体故障及不同故障程度的多状态在线识别方法流程如
在线迁移CNN-ISVM模型的滚动轴承多状态识别方法流程
1) 数据预处理.
获取离线状态某些负载情况下滚动轴承振动信号作为源域. 在线获取其他负载情况下滚动轴承振动信号作为目标域. 对轴承原始时域振动信号中的源域数据(离线数据)和目标域数据(在线数据)做STFT, 构建二维图像源域数据集和目标域数据集.
2) 源域CNN-ISVM预训练模型.
离线训练阶段, 将处理好的源域数据集输入到网络中. 首先, 通过Softmax函数进行误差反向传播最小化损失函数
3) 目标域CNN-ISVM模型在线更新.
在线更新阶段, 将步骤2)中冻结的源域CNN-ISVM模型参数迁移至目标域CNN-ISVM模型. 当目标域训练数据输入到网络时, 利用目标域CNN模型进行特征提取, 将该数据提取到的特征向量输入给ISVM分类器, ISVM分类器将得到的预测值与其真实值进行比对, 判断该特征向量是否违背KKT条件. 若违背, 则需构造满足该特征向量和SV集合的新超平面, 以此更新ISVM分类器; 否则完成目标域CNN-ISVM模型更新. 将目标域中实际测试/诊断数据输入至模型中, 完成故障分类, 输出故障诊断结果.
为验证本文所提出算法的有效性和准确性, 采用美国凯斯西储大学的轴承数据集进行实验验证[
负载类型包括0 hp、1 hp、2 hp和3 hp, 根据负载的不同, 电机转速在1 730 rpm与1 797 rpm之间变化. 每种负载下均包含正常状态(N)以及内圈故障(IR)、外圈故障(OR)、滚动体故障(B)的3种故障损伤程度, 损伤直径分别为0.177 8 mm、0.355 6 mm、0.533 4 mm. 正常状态下滚动轴承没有发生损伤, 因此, 没有故障部位及故障损伤程度. 对滚动轴承的正常状态, 内圈、外圈、滚动体故障以及不同故障损伤程度10种状态进行分类. 以0 hp为例, 实验数据的表示方法如
实验数据表示方法
故障程度/mm | 内圈故障 | 外圈故障 | 滚动体故障 |
0.177 8 | IR07 | OR07 | B07 |
0.355 6 | IR14 | OR14 | B14 |
0.533 4 | IR21 | OR21 | B21 |
本文共设置12组实验数据集, 分别使用某些负载下10种状态数据作为源域数据集, 其他负载下10种状态数据作为目标域数据集. 目标域数据集包括训练数据集和实际测试/诊断数据集, 具体数据集组成如
实验数据表示方法
任务编号 | 源域/hp | 目标域/hp | 源域样本数/个 | 目标域样本数/个 | |
训练样本数 | 实际测试/诊断样本数 | ||||
1 | 2 | 1 | 2 000 | 2 000 | 600 |
2 | 2 | 3 | 2 000 | 2 000 | 600 |
3 | 0 | 2 | 2 000 | 2 000 | 600 |
4 | 1 | 2 | 2 000 | 2 000 | 600 |
5 | 1 | 3 | 2 000 | 2 000 | 600 |
6 | 3 | 2 | 2 000 | 2 000 | 600 |
7 | 23 | 01 | 4 000 | 4 000 | 1 200 |
8 | 02 | 13 | 4 000 | 4 000 | 1 200 |
9 | 12 | 03 | 4 000 | 4 000 | 1 200 |
10 | 13 | 02 | 4 000 | 4 000 | 1 200 |
11 | 3 | 012 | 2 000 | 4 000 | 1 200 |
12 | 2 | 013 | 2 000 | 6 000 | 1 800 |
为实现对滚动轴承不同故障位置及不同故障程度的智能识别, 建立CNN-ISVM模型. 以启发的方式设置CNN模型的超参数, 采用ReLU函数作为激活函数, 减少过拟合现象; 为了控制网络的学习率, 使用Adam优化算法更新网络参数, 学习率设置为0.001;在全连接层引入Dropout正则化方法, 避免过度拟合训练数据, 速率为0.5;CNN模型超参数设置如
CNN网络超参数设置
名称 | 结构参数 | 输出尺寸 | 激活函数 |
输入层 | 224×224 | - | - |
卷积层1 | 8@3×3 | 222×222×8 | ReLU |
池化层1 | 2×2 | 111×111×8 | - |
卷积层2 | 16@3×3 | 109×109×16 | ReLU |
池化层2 | 2×2 | 55×55×16 | - |
卷积层3 | 32@3×3 | 53×53×32 | ReLU |
池化层3 | 2×2 | 27×27×32 | - |
全连接层1 | - | 512×1 | ReLU |
全连接层2 | - | 10×1 | ReLU |
Softmax层 | - | 10×1 | Softmax |
经实验验证, ISVM采用线性核函数, 惩罚系数
对目标域训练数据集10种故障类型数据进行设置, 以模拟在线学习过程中新增故障类型数据的情况, 具体设置见
新增故障类型数据设置
故障类型种类 | 样本量/个 | ||
任务1 | 任务7 | 任务12 | |
5 | 1 000 | 2 000 | 3 000 |
6 | 1 200 | 2 400 | 3 600 |
7 | 1 400 | 2 800 | 4 200 |
8 | 1 600 | 3 200 | 4 800 |
9 | 1 800 | 3 600 | 5 400 |
10 | 2 000 | 4 000 | 6 000 |
任务1、任务7和任务12分别代表
新增故障类型实验结果
由
为验证本文所提出CNN-ISVM方法具有处理在线新增数据的能力, 将目标域训练数据集作为在线数据进行处理. 将在线数据分批地输入到模型中进行训练, 模拟在线学习过程中新增数据样本的情况, 具体设置见
任务1在线数据集设置
在线数据集 | 在线数据集百分比/% | 在线数据集样本量/个 | 目标域训练集样本总量/个 |
第1组 | 10 | 200 | 2 000 |
第2组 | 30 | 200→600 | 2 000 |
第3组 | 60 | 600→1 200 | 2 000 |
第4组 | 100 | 1 200→2 000 | 2 000 |
以
在线学习准确率
在线学习消耗时间
在线学习SV数量
任务1是以2 hp作为源域, 1 hp作为目标域的在线迁移变负载下故障诊断实验, 采用2 hp的2 000个样本构建预训练模型, 利用1 hp设定的在线数据集进行更新目标域模型, 最终完成在线迁移的变负载下故障诊断.
为进一步验证CNN-ISVM算法的有效性, 本文引用精确率和召回率对所提出算法进行评价.由于篇幅有限, 本文仅以
CNN-ISVM模型诊断结果评价
故障损伤程度 | 精确率 | 召回率 |
N | 1.000 0 | 1.000 0 |
IR07 | 0.983 3 | 1.000 0 |
IR14 | 1.000 0 | 0.983 6 |
IR21 | 1.000 0 | 1.000 0 |
B07 | 1.000 0 | 1.000 0 |
B14 | 1.000 0 | 1.000 0 |
B21 | 1.000 0 | 1.000 0 |
OR07 | 1.000 0 | 1.000 0 |
OR14 | 1.000 0 | 1.000 0 |
OR21 | 1.000 0 | 1.000 0 |
平均值 | 0.998 3 | 0.998 3 |
从
滚动轴承故障分类混淆矩阵
从
使用t-SNE[
果进行特征可视化, 如
t-SNE特征可视化
为更好验证所提出方法的效率, 本文比较了3种方法的时间消耗及准确率, 其中在线数据集的设定与
3种方法时间消耗及准确率对比
训练方式 | 方法 | 在线数据集百分比/% | ||||||||
训练时间/s | 准确率/% | |||||||||
10 | 30 | 60 | 100 | 10 | 30 | 60 | 100 | |||
离线方式 | 方法1: CNN-Softmax | 170.52 | 198.89 | 243.68 | 303.37 | 70.70 | 88.70 | 95.00 | 96.80 | |
方法2: CNN-SVM | 171.33 | 202.72 | 248.38 | 309.35 | 96.67 | 98.17 | 98.33 | 98.33 | ||
在线方式 | 方法3: CNN-ISVM | 171.88 | 1.65 | 1.83 | 2.07 | 97.17 | 98.17 | 98.33 | 98.67 |
实验中, 方法1和方法2采用离线的训练方式, 即每次重新训练模型来处理新增在线数据. 方法3为在线训练方式, 只需对新增在线数据部分进行更新模型. 具体而言: 方法1为CNN与Softmax组合进行反向传播优化训练CNN模型; 方法2是将方法1训练好的CNN模型对故障数据进行特征提取后, 再输入给SVM进行故障分类; 方法3为本文提出的CNN-ISVM滚动轴承多状态识别方法. 在准确率方面, 方法3诊断准确率均高于方法1和方法2, 说明CNN的提取深层特征能力与ISVM在多分类功能方面的优越性相结合, 可获得较好的效果. 在时间方面, 方法2和方法3虽然在CNN的基础上, 使用SVM和ISVM进行分类, 但是, 在建立模型所需时间上较方法1并未过多增加, 而且方法3能在保留已学到的知识基础上继续处理新的样本, 通过在线获取的新增样本对ISVM的知识进行更新与修正, 并不需要重新建立模型来处理新增在线数据. 由
为了更好地验证本文方法的泛化能力, 使用
为进一步表明本文方法在变负载下滚动轴承在线故障诊断问题上具有明显的优势, 选择ISVM、OS-ELM[
与其他在线学习方法的时间对比
迁移任务 | 本文方法 | ISVM | OS-ELM | 文献[ |
任务1 | 6.91 | 4.04 | 3.60 | 102.73 |
任务2 | 5.79 | 3.87 | 4.32 | 103.81 |
任务7 | 15.47 | 5.53 | 8.04 | 171.14 |
任务10 | 14.12 | 5.46 | 8.62 | 169.40 |
任务11 | 29.14 | 9.65 | 12.82 | 226.27 |
任务12 | 30.41 | 10.87 | 14.13 | 234.28 |
平均值 | 16.97 | 6.57 | 8.59 | 167.94 |
与其他在线学习方法准确率对比
由
1) 基于ISVM具有保留历史知识、能够处理在线新增数据的特点, 本文提出了一种深度在线迁移CNN-ISVM的新方法. 该方法只需对在线新增数据进行处理, 更新现有模型, 从而避免重新训练整个模型, 极大地减少了模型训练时间和计算量.
2) 利用模型参数知识迁移, 减小由于负载变化而引起的源域数据与目标域数据之间的分布差异, 进而解决变负载下在线采集滚动轴承数据进行故障状态识别问题.实验表明, 在处理相同数量的轴承数据时, 本文方法所需模型训练的时间约为离线方法的20%, 具有较高的建模效率. 同时所提出方法在不同迁移任务下平均准确率较所对比的离线方法提升3.80%, 较所对比的在线学习方法提升至少3.60%, 表明本文方法具有良好的泛化性. 而且在线学习耗时较短, 表明本文方法在变负载下滚动轴承在线故障诊断问题上具有明显的优势.
3) 本文提出的深度在线迁移的CNN-ISVM算法可较好地解决变负载条件下的滚动轴承在线故障诊断, 在保证较高识别准确率的基础上, 提高了诊断效率, 这对滚动轴承在实际工作中故障的在线监测与快速诊断有着重要的指导意义.
下一步工作将在本文研究的基础上, 研究基于CNN的深度迁移学习模型微调方法.同时, 对实际中使用嵌入式微处理器完成实时故障诊断工作也需要进一步深入研究.
责任编委: 方华京.
曲建岭, 余路, 袁涛, 等. 基于卷积神经网络的层级化智能故障诊断算法[J]. 控制与决策, 2019, 34(12): 2619-2626.
Qu J L, Yu L, Yuan T, et al. A hierarchical intelligent fault diagnosis algorithm based on convolutional neural network[J]. Control and Decision, 2019, 34(12): 2619-2626.
Wang J Y, Mo Z L, Zhang H, et al. Ensemble diagnosis method based on transfer learning and incremental learning towards mechanical big data[J]. Measurement, 2020, 155: 107517.
Kang S Q, Chen W W, Wang Y J, et al. Method of state identification of rolling bearings based on deep domain adaptation under varying loads[J]. IET Science, Measurement & Technology, 2020, 14(3): 303-313.
蔡赛男, 宋卫星, 班利明, 等. 基于鲸鱼算法优化LSSVM的滚动轴承故障诊断[J]. 控制与决策, 2022, 37(1): 230-236.
Cai S N, Song W X, Ban L M, et al. Fault diagnosis method of rolling bearing based on LSSVM optimized by whale optimization algorithm[J]. Control and Decision, 2022, 37(1): 230-236.
马洪斌, 佟庆彬, 张亚男. 优化参数的变分模态分解在滚动轴承故障诊断中的应用[J]. 中国机械工程, 2018, 29(4): 390-397.
Ma H B, Tong Q B, Zhang Y N. Applications of optimization parameters VMD to fault diagnosis of rolling bearings[J]. China Mechanical Engineering, 2018, 29(4): 390-397.
Shao H D, Jiang H K, Lin Y, et al. A novel method for intelligent fault diagnosis of rolling bearings using ensemble deep auto-encoders[J]. Mechanical Systems and Signal Processing, 2018, 102: 278-297.
任浩, 屈剑锋, 柴毅, 等. 深度学习在故障诊断领域中的研究现状与挑战[J]. 控制与决策, 2017, 32(8): 1345-1358.
Ren H, Qu J F, Chai Y, et al. Deep learning for fault diagnosis: The state of the art and challenge[J]. Control and Decision, 2017, 32(8): 1345-1358.
Verstraete D, Ferrada A, Droguett E L, et al. Deep learning enabled fault diagnosis using time-frequency image analysis of rolling element bearings[J]. Shock and Vibration, 2017, 2017: 5067651.
Zhang W D, Zhang F, Chen W, et al. Fault state recognition of rolling bearing based fully convolutional network[J]. Computing in Science & Engineering, 2019, 21(5): 55-63.
Wang F A, Jiang H K, Shao H D, et al. An adaptive deep convolutional neural network for rolling bearing fault diagnosis[J]. Measurement Science and Technology, 2017, 28(9): 095005.
Zhang R, Tao H Y, Wu L F, et al. Transfer learning with neural networks for bearing fault diagnosis in changing working conditions[J]. IEEE Access, 2017, 5: 14347-14357.
康守强, 邹佳悦, 王玉静, 等. 基于无监督特征对齐的变负载下滚动轴承故障诊断方法[J]. 中国电机工程学报, 2020, 40(1): 274-281.
Kang S Q, Zou J Y, Wang Y J, et al. Fault diagnosis method of a rolling bearing under varying loads based on unsupervised feature alignment[J]. Proceedings of the CSEE, 2020, 40(1): 274-281.
雷亚国, 杨彬, 杜兆钧, 等. 大数据下机械装备故障的深度迁移诊断方法[J]. 机械工程学报, 2019, 55(7): 1-8.
Lei Y G, Yang B, Du Z J, et al. Deep transfer diagnosis method for machinery in big data era[J]. Journal of Mechanical Engineering, 2019, 55(7): 1-8.
Wang J Y, Mo Z L, Zhang H, et al. A deep learning method for bearing fault diagnosis based on time-frequency image[J]. IEEE Access, 2019, 7: 42373-42383.
Li X Q, Jiang H K, Zhao K, et al. A deep transfer nonnegativity-constraint sparse autoencoder for rolling bearing fault diagnosis with few labeled data[J]. IEEE Access, 2019, 7: 91216-91224.
Wu Q Y, Wu H R, Zhou X M, et al. Online transfer learning with multiple homogeneous or heterogeneous sources[J]. IEEE Transactions on Knowledge and Data Engineering, 2017, 29(7): 1494-1507.
Wang D, Vipperla R, Evans N, et al. Online non-negative convolutive pattern learning for speech signals[J]. IEEE Transactions on Signal Processing, 2013, 61(1): 44-56.
Chen Y T, Xiong J, Xu W H, et al. A novel online incremental and decremental learning algorithm based on variable support vector machine[J]. Cluster Computing, 2019, 22(3): 7435-7445.
朱茂桃, 吴新佳, 郑国峰, 等. 基于短时傅里叶变换的汽车零部件耐久性载荷信号编辑方法[J]. 机械工程学报, 2019, 55(4): 126-134.
Zhu M T, Wu X J, Zheng G F, et al. Load signal edition method based on the short-time Fourier transform to durability test of vehicle component[J]. Journal of Mechanical Engineering, 2019, 55(4): 126-134.
Cauwenberghs G, Poggio T. Incremental and decremental support vector machine learning[C]. International Conference on Neural Information Processing Systems. Denver, 2000: 409-415.
宫文峰, 陈辉, 张美玲, 等. 基于深度学习的电机轴承微小故障智能诊断方法[J]. 仪器仪表学报, 2020, 41(1): 195-205.
Gong W F, Chen H, Zhang M L, et al. Intelligent diagnosis method for incipient fault of motor bearing based on deep learning[J]. Chinese Journal of Scientific Instrument, 2020, 41(1): 195-205.
http://www.eecs.case.edu/laboratory/bearing/welcome_overview.htm.]]>
Hinton G. Visualizing high-dimensional data using t-SNE[J]. Vigiliae Christianae, 2008, 9: 2579-2605.
Liang N Y, Huang G B, Saratchandran P, et al. A fast and accurate online sequential learning algorithm for feedforward networks[J]. IEEE Transactions on Neural Networks, 2006, 17(6): 1411-1423.
Mao W T, Tian S Y, Liang X H, et al. Online bearing fault diagnosis using support vector machine and stacked auto-encoder[C]. IEEE International Conference on Prognostics and Health Management. Seattle, 2018: 1-7.
Xia M, Li T, Xu L, et al. Fault diagnosis for rotating machinery using multiple sensors and convolutional neural networks[J]. IEEE/ASME Transactions on Mechatronics, 2018, 23(1): 101-110.