无领域知识的多尺度特征值提取应用于机器寿命预测

时间序列 30/11/2021

三个要点
✔️以旋转轴承为例，改进剩余使用寿命的预测模型
✔️通过将模拟多层次细节的U-Net结构与GANs相结合，我们提出了一个不需要领域知识或人工配置的排序/预测模型。
✔️需要进一步研究以实现该领域所需的无监督模型

Generalized multiscale feature extraction for remaining useful life prediction of bearings with generative adversarial networks
written by Sungho Suh, Paul Lukowicz, Yong Oh Lee
(Submitted on 26 Sep 2021)
Comments: Published on arxiv.
Subjects: Machine Learning (cs.LG); Computer Vision and Pattern Recognition (cs.CV)

code：

本文所使用的图片要么来自论文、介绍性幻灯片，要么是参考这些图片制作的。

简介

纵观展会上人工智能在制造业的应用实例，似乎继图像和文件（自然语言）之后，最常见的应用是检测机器零件的老化异常情况。特别是，人们经常看到振动分析的挑战。本文是关于旋转轴承的磨损和恶化的预测。这篇论文是关于旋转轴承的磨损和劣化的预测，我想同样的方法也可以应用于泵和阀门。

(ROHM在2021年AEC/APC亚洲会议上提出了与本文所涉及领域不同的方法。(ROHM在2021年AEC/APC亚洲会议上对这个主题领域提出了不同的方法，你可能会感兴趣)。

PHM（预知和健康管理）技术从工业系统中收集状态信息，如制造机械、设备和发电厂，并通过分析和预测验证来预测故障的位置，使系统故障被发现并提前安排维修。预测滚动轴承的剩余使用寿命（RUL）是一种PHM技术，可以防止意外故障并提高可靠性。基于模型的方法通过基于物理规律或数学函数的分析模型来估计RUL。这些方法包括基于物理规律的方法、经验方法、卡尔曼滤波和粒子滤波。然而，这些方法需要专家知识来建立日益复杂的工业系统中的准确模型。近年来，随着机器学习的显著发展，不需要专家知识的数据驱动方法越来越受到关注。数据驱动的方法使用机器学习技术来捕捉收集的机器数据和退化状态之间的直接关系。

近年来，基于深度学习的RUL预测方法已经被提出，与传统的数据驱动方法相比，这些方法取得了更好的预测性能。虽然这些基于深度学习的RUL预测方法已经被成功开发出来，但有三个具有挑战性的问题并没有得到重视。

(1) 这些方法需要领域知识来提取特征，或者需要手动指定特征类型。

(2) 上述数据驱动的方法假定训练和测试数据是由相同的传感器在相同的操作条件下或从相同的分布中收集的。然而，在工业领域，这样的假设是不现实的，因为机器的工作条件往往因任务而异，训练和测试数据可能从不同的实体收集。

(3) 为了准确预测RUL，必须正确确定机器的健康阶段（HS）。这是因为，对于处于健康状态的机器来说，从运行到失败的训练数据集没有明显的差异。然而，传统的方法在预测RUL时并没有确定第一预测时间（FPT），也就是不健康阶段的开始时间。

本文提出了一种用于RUL预测的广义多尺度特征提取方法，该方法使用生成对抗网络（GAN）来学习不同方位的多个训练数据的分布，并提取领域不变的广义预后特征。

提出的预测FPT和RUL的特征提取方法包括两个步骤。

第一步，训练一个多尺度对抗性神经网络，将振荡输入信号重建为一般化的预后特征。在这里，一维U-Net架构的三个不同层次被训练来最小化拟议的基于GAN的特征提取方法的损失函数。

第二步，将概括的特征转化为嵌套散点图（NSP）图像，用于FPT测定和RUL预测 NSP是一种多变量相关分析的图像技术，尽管NSP是一种启发式方法，但从原始振动信号转化的NSP图像可用于NSP是一种启发式的方法，但从原始振动信号转化而来的NSP图像减少了基于领域知识的特征工程的努力。NSP图像也可以与卷积神经网络（CNN）相结合，用于旋转机械故障诊断的特征提取：一个基于CNN的二元回归模型确定FPT，一个CNN-LSTM（长短期记忆）模型预测RUL。RUL。本研究的主要贡献可归纳为以下几点

- 提出了一种为HS分割和RUL预测而设计的新型多尺度特征提取方法：一维特征提取被表述为主信号分离任务，并引入了U-Net的使用，以重建RUL预测的预知特征。我们还介绍了一种基于GAN方案的新的领域不变的广义解法，用于学习不变的表征和预测RUL。

- 将多尺度的预后特征转换为NSP图像，并结合通用的多尺度特征，可以降低计算成本，而不需要领域知识或人工配置。

- 我们还提出了一种使用基于CNN的二元回归模型确定HS的方法，以及一种使用CNN-LSTM模型预测RUL的方法。与其他现有的方法相比，这些方法能够以较小的误差和较高的预后准确性来预测RUL。

- 为了验证所提出的方法，在两个旋转机器数据集上进行了实验：Fanche-Comte电子机械热科学和光学科学与技术研究所（FEMTO）数据集和西安交通大学的数据集。大学和长兴住友科技公司（XJTU-SY）的数据集。通过在多个数据集上进行实验，可以验证所提出的方法对不同模式的轴承磨损的有效性。

方法

广义的多尺度特征提取

对于HS分割和RUL预测，我们使用了一种基于GAN方案和UNet架构的通用多尺度特征提取方法。图1显示了拟议中的图像提取模型的整体框架和简化的训练程序。

GAN结构采用了作者以前工作中的分类增强GAN（CEGAN）。 CEGAN由三个独立的网络组成：判别器、生成器和分类器。与传统的GAN方法不同，CEGAN分类器是在真实数据和生成的数据上进行训练的，这可以防止生成的少数人数据在不平衡数据上过度拟合多数人数据。换句话说，只在真实数据上训练的分类器会偏向多数人的数据，而少数人阶层产生的数据则不会偏向多数人的数据，从而提高分类器的性能。传统的GAN方法使用一个辅助分类器，它与判别器共享网络结构和权重参数，所以辅助分类器的性能并不能导致生成高质量的图像。应用CEGAN的结构，提出的GAN方法定义了三种独立的网络：1。基于CEGAN的结构，提出的GAN方案定义了三个独立的网络：1）多尺度特征提取网络，2）鉴别器，将生成器生成的特征与实际输入数据分开，并区分不同领域的数据，3）基于CNN的HS分割器和基于LSTM的RUL预测器作为分类器网络。

发电机

该发生器由三个多尺度发生器组成，如图1所示。所提出的生成器采用了U-Net的基本概念，通过用一维运算取代原来的二维卷积来重建一维（1D）时间序列特征。U-Net被设计用于图像分割，以提高分割性能。U-Net是为图像分割而设计的，通过串联不同层次的特征图，将低层次的细节和高层次的语义信息结合起来，以提高分割的性能。将低层次的细节与高层次的语义信息相结合，在各种图像分割问题上取得了可喜的成绩。基于CNN的U-Net架构由一个编码器、一个解码器和编码器与解码器之间的跳过连接组成。编码器包括一个多级卷积运算以提取输入数据的抽象表示，以及一个下采样块以降低输入的复杂性。卷积操作之后是最大集合下采样，将输入图像编码为几个不同层次的特征表示。解码器块还包括一个多级卷积运算，一个上采样块和一个串联块。解码器块从语义上将编码器学习到的鉴别性特征投射到更高分辨率的图像空间，以进行密集分类。与U-Net一般用于图像分割任务不同，我们发现U-Net的结构允许同时考虑深层和浅层特征，提高了特征提取的有效性。因此，可以对特征进行重构，以满足设计要求。在一个典型的GAN中，高斯噪声被输入到生成器中，但这里的噪声仅以应用于生成器多层的辍学形式提供。发电机的结构如图2所示。生成器由一个编码器和一个解码器组成，用于处理输入数据。

即使U-Net可以同时考虑深层和浅层的特征，但具有深层卷积运算的UNet通常只关注更多的局部特征，可能会失去更高的特征层的输入的细节信息。因此，可以通过整合不同的特征水平来提高特征提取的性能。因此，这三个多尺度发生器在编码器和解码器块的数量上有所不同。

鉴别器

拟议的GAN已经被开发出来，用于从多个信息源进行领域适应。一般来说，GANs训练一个判别器来区分生成的数据和真实数据。然而，这里的判别器也作为领域判别器来区分数据的领域。这是因为提出的广义多尺度特征提取框架旨在从多个领域提取旋转轴承的磨损特征。在本文中，数据域指的是轴承的类型和它们被收集的条件。逆向学习允许生成器提取包含领域无偏见信息的高层次特征，使鉴别器不仅难以对源领域进行分类，而且难以对源领域是真还是假进行分类。因此，在判别器的卷积层中，用Leaky ReLU提取输入特征（来自发生器的真假数据的重构特征），两个分离的线性层分别输出真实频率和域分类（见图3）。

分类器

如前所述，为了准确预测RUL，我们需要确定机器的HS，但不需要训练RUL预测的直接回归模型，因为对于处于健康状态的机器来说，运行到失效的轴承磨损没有明显的区别。提高HS分区和RUL预测的性能为了提高HS分割和RUL预测的性能，所提出的GAN结构采用了分类器网络为独立网络的结构；在图1中，第一阶段包括用于HS分割的广义多尺度特征提取GHS，由提取的特征组成的CNN和转化的NSPHS分割模型CRUL的图像。在第二阶段，一个广义多尺度特征提取模型GRUL被训练用于预测RUL，一个CNN-LSTM模型CRUL使用从提取的特征转化而来的NSP图像来预测RUL。

损失函数和学习程序

在本研究中，假设振动信号是由水平和垂直放置在每个轴承上的两个高频振动传感器采集的，来自不同轴承的整个生命周期的大量_Ntrain运行-失效振动数据可用于训练拟议的DNN。$ X_j = {x^i_j}^{n_j}_{i=1}∈R^{N_{samples}},j=1,2,。,N_{train} $表示来自第j个方位的_第n个连续训练样本。对于每个轴承数据有两个样本，一个来自水平方向，一个来自垂直方向的振动传感器。

目标是提取通用的预测特征，以提高HS分割和RUL预测的性能。 HS分割需要对目标数据进行标记，以进行监督学习，从而区分不同轴承退化条件下机器的HS特征。训练数据集根据采集时间被分为两个健康阶段。整个振动数据集的初始部分，对应于正常功能，被标记为健康，而样本期的最后部分，即有损坏的轴承部分，被标记为不健康。这是基于这样的假设，即旋转机械的退化数据可以获得，直到失效。这种方法不仅减少了贴标签的工作量，而且在没有正确的HS答案时（大多数开放的数据集没有HS的信息），也提高了对HS分裂的预测。假设我们对一小部分从运行到失败的数据集进行标记，如果不给健康阶段的标签，信号可以明确区分为健康和不健康的。

然后，RUL标签表示如下

其中$ yRUL^i_j $代表$ x^i_j $的RUL标签。发电机网络由两个子发电机组组成GHS和GRUL分解为两个子发生器。这两个子生成器对应于具有相同结构的判别器DHS和DRUL。为了学习程序的稳定性和生成数据的质量，WGANGP被应用于目标函数以指导学习过程。目标函数定义如下

其中，x是顺序训练样本，y在HS分割的情况下是HS标签，在RUL预测的情况下是RUL标签，d是领域的相关标签，_λD是控制领域泛化效果的超参数，_λG控制不同损失项的相对重要性，_LCE是标准交叉熵损失函数参数_θD、_θG和_θC分别为判别器、发生器和分类器的参数。真实数据和生成的数据都是判别器的输入，而数据的实际状态和领域分类分别是判别器_DR和_DD的输出。鉴别器D被训练成最小_LD，以便同时鉴别来自不同领域的数据以及真实数据和生成数据，而生成器G被训练成最小_LG。此外，分类器C是一个基于CNN的HS分割器_CHS和一个基于LSTM的RUL预测器_CRUL，它被训练来分类HS和预测RUL。换句话说，生成器重构了广义的特征，以误导判别器，提高HS分割和RUL预测的性能。通过重建接近真实数据的特征，生成器能够生成一个恒定的特征值范围，从而保留了时间序列的属性。

最后，我们对HS分裂和RUL预测的分类器的损失定义如下

其中，_LBCE是标准二元交叉熵损失，_LMAE是平均绝对误差（MAE），_LRMSE是均方根误差（RMSE），_LMAPE是平均绝对百分比误差（MAPE）。

通过以下两个步骤，将三种不同的重建特征转换为NSP图像的三个通道。在第一步，两个重建通道的特征被压缩成嵌套的集群。每个通道的特征被映射到x轴和y轴上，从三个多尺度发生器中重建的三种不同的特征分别被染成红色、绿色和蓝色。为了从重建的特征中表示每个群组的强度，映射值的计数被转换为像素强度。在第二步中，三个散点图被聚集起来，产生一个单一的RGB图像，如图1所示。所提出的多尺度特征提取方法的训练细节在算法1中进行了总结（见原始论文）。

使用NSP进行健康分期和剩余使用寿命预测

通过将连续的原始振动时间序列数据重构为多尺度特征，并将特征转化为NSP图像，将信号处理问题转变为图像分类问题，使用CNN-HS（CNN-HS）的HS分割模型和CNN-LSTM（CNN-LSTM-RUL）的RUL预测模型来分类。拟议的CNN-HS和CNN-LSTM-RUL的结构如图4所示。训练好的CNN-HS和CNN-LSTM不用于训练，但它们可以在外部测试数据集上对NSP进行分类，该数据集与其他训练数据集在相同的条件下运行。在HS-分割中，整个运行到失败的二元回归结果由CNN-HS和没有必要指定一个阈值。经过训练的CNN-HS学习了训练数据集中健康和不健康数据的NSP特征之间的差异，因此它可以识别所有数据的退化模式。CNN-LSTM可以识别从FPT到结束时间的所有数据的退化模式，CNN-LSTM中的CNN从转换后的NSP图像中进行特征提取，LSTM和RUL预测器计算出RUL的百分比。

实验结果

为了在运行至失效的振动数据集上评估所提出的方法（用GMFE表示），使用了两个流行的数据集，即FEMTO和XJTU-SY数据集。FEMTO数据集是在PRONOSTIA试验台上收集的，已经被自IEEE PHM 2012预知挑战赛（PHM 2012）以来，它已经公开可用。试验台包含一个异步电动机、一根轴、一个速度控制器、一个由两个滑轮组成的组件和一个经过测试的旋转轴承，如图5（a）所示。该数据集包括17个运行至故障的数据集（两行振动数据，一个是水平的，一个是垂直的），其中一个轴承已经被测试。每个数据集都有不同的故障时间，因此需要一种适应时间变化的操作条件和环境的故障检测方法。当振动数据的振幅超过20g时，中止运行至失效的实验，并认为该轴承有缺陷。

有三个指标被用来进行比较评估：MAE、RMSE和MAPE。

结果

图6显示了来自FEMTO和XJTU-SY数据集的两个测试旋转轴承的NSP图像转换实例。通过从原始振动数据中提取有用的特征，转换后的NSP图像可以很好地代表机器的健康状况。为了评估该方法，一个旋转轴承数据集被用于测试，另一个具有相同工作条件的轴承被用于训练DNN。

实验结果是五个试验的平均值，以便不受模型的随机性影响。为了揭示所提方法的优越性，我们将其与多尺度神经网络（MCNN）、深度对抗神经网络（DANN）和所提方法进行了比较。用监督下的HS分解方法，CNN-LSTM方法进行了比较。可以看出，所提出的方法在MAE和RMSE方面的预测误差远低于其他方法，但在MAPE方面略高于DANN。这就是为什么λ_MAPE=20，但λ_MAE=100 或 λ_RMSE=这就是为什么MAPE=20的评级低于

为了评估FPT和NSP的效果，进行了分割研究，但为了显示HS分割和FPT决策的有效性，采用了 "无FPT"，目前正在考虑在机器运行初期分阶段实施。 1D-GAN方法是通过转换NSP图像和所提出的CNN-LSTM-RUL来实现的，没有融合多个特征，以显示转换后的NSP图像和CNN-LSTM-RUL的头部大小。与 "NoFPT "和 "1D-GAN "相比，所提出的方法显示出优越的结果，所提出的HS分割方法能有效地捕捉到初始阶段的机械退化，CNN-LSTM-RUL与转化的NSP图像显示出对不同数据集更好的通用性。对不同数据集的通用性。

图7显示了两组数据中四个测试旋转轴承的RUL预测结果。可以看出，尽管退化评估是在检测到旋转轴承的FPT时开始的，但所提出的方法有效地捕捉到了退化模式，实际RUL和预测RUL之间的误差非常小。

摘要

在这项研究中，我们提出了一种使用多尺度GAN的通用多尺度特征提取和RUL预测方法。为了提取通用的预测特征，为生成器设计了一个多尺度的一维U-Net结构，并在生成器和判别器之间设计了一个对抗性学习程序，其中包括现实和领域判别器。对抗性学习程序学习了来自不同旋转轴承的多个训练数据的分布，并提取了领域不变的广义预测特征。

所提出的方法的特点是，它不需要任何领域知识或人工配置，通过提取通用特征来预测RUL。提出了一种基于CNN的二元回归模型，用于确定无阈值的HS，以及用于预测RUL的CNN-LSTM模型，与现有的其他方法相比，可以预测RUL的误差更小，预测精度更高。实验结果表明，所提出的方法将CNN和CNN-LSTM与基于重构的轴承磨损特征的NSP相结合，可以有效地捕捉退化模式，并获得比其他方法更好的RUL预测结果。

为了进一步提高拟议方法的性能，需要更多的训练数据。然而，在实际的工业应用中，收集轴承整个生命周期的注释数据是很困难的，而且不可能定义轴承的健康状态。因此，有必要对无监督的轴承退化数据进行进一步的相关研究。在未来，作者计划将所提出的方法扩展到制造业中其他部件的故障诊断和预测，并利用注意机制和无监督转移学习进一步发展故障预测模型。