当前位置：首页 > news >正文

（论文速读）一种用于智能机械故障诊断的去噪扩散概率模型数据增强方法

news 2026/6/16 10:22:58

论文题目：Denoising diffusion probabilistic model-enabled data augmentation method for intelligent machine fault diagnosis（一种用于智能机械故障诊断的去噪扩散概率模型数据增强方法）

期刊：EAAI 2025

摘要：轴承故障是旋转机械故障的主要原因之一。然而，由于故障数据的复杂性，在真实的工业环境中收集足够的故障数据被证明是具有挑战性的。由于这一限制，目前的大多数方法无法在数据有限的情况下准确识别故障类型，从而阻碍了及时的维护工作。针对这一问题，本文提出了一种基于扩散模型数据增强的轴承故障诊断方法。在数据采集后，利用连续小波变换将各种一维振动数据转换成二维时间序列图。随后，将这些特征图划分为故障样本集。然后，利用扩散模型对训练样本进行扩充。然后将这些扩充后的样本送入卷积神经网络进行故障诊断，并与原始数据集的诊断精度进行比较。对比分析表明，基于扩散模型的数据增强技术在小样本训练数据集下提高了故障诊断的准确率。最后，利用帕德伯恩方位数据集验证了该方法的有效性，并与其他数据增强技术进行了对比。结果表明，基于扩散模型的数据增强方法在训练精度和稳定性方面都优于其他方法，特别是在小样本情况下。

已根据论文实现代码，具体可见博客：

基于 DDPM 的轴承故障诊断数据增强：代码运行指南-CSDN博客基于 DDPM 的轴承故障诊断数据增强：代码运行指南https://blog.csdn.net/LJ1147517021/article/details/162005529?fromshare=blogdetail&sharetype=blogdetail&sharerId=162005529&sharerefer=PC&sharesource=LJ1147517021&sharefrom=from_link

用扩散模型打破小样本困境：DDPM在轴承故障诊断中的数据增强实践

一、背景：旋转机械故障诊断为什么难？

旋转机械（如电机、风机、泵）在现代工业中无处不在，而轴承作为其核心零部件，一旦出现内圈、外圈或滚动体损伤，轻则导致停产损失，重则引发安全事故。因此，轴承故障的智能诊断一直是工程界和学术界的重要课题。

近年来，深度学习——尤其是卷积神经网络（CNN）——在故障诊断领域展现出强大的特征提取能力。然而，深度学习本质上是一个"数据饥渴"的过程。在真实工业场景中，轴承故障数据的获取面临三重困境：

故障本身稀少：生产线上故障是小概率事件，正常状态数据远多于故障数据，造成严重的类别不平衡；
采集成本高昂：人为制造故障、进行加速疲劳测试的代价极高；
一维信号难以直接生成：振动传感器采集的原始数据是一维时序信号，传统生成模型（如GAN）在生成高质量一维时序数据时表现不佳。

这些困境导致的直接后果是：在小样本条件下训练的深度学习模型极易过拟合，诊断准确率大幅下滑。

那么，如何在数据匮乏的条件下，让模型仍能准确识别轴承故障？这正是本文要解决的核心问题。

二、已有方法的局限

在数据增强领域，常见的应对策略包括：

2.1 添加高斯噪声

最简单的方法——在原始样本上叠加随机高斯噪声，人为制造"新样本"。

优点：实现简单，一定程度上提升模型鲁棒性，防止过拟合。

缺点：引入的噪声是随机的，并不对应真实的故障物理变化规律；过度加噪还会模糊细微的故障特征，导致模型泛化能力反而变差。

2.2 生成对抗网络（GAN / DCGAN）

以DCGAN为代表的生成对抗网络通过"生成器与判别器的博弈"来学习数据分布，生成逼真样本。

优点：生成的样本具有一定的真实性和多样性。

缺点：

GAN的训练过程不稳定，存在模式崩塌（mode collapse）风险；
在小样本场景下，判别器因数据不足而难以提供有效梯度，训练更加困难；
实验数据表明，DCGAN在Paderborn数据集上，Data1增加80张生成样本后准确率反而从84.7%下降至82.5%，说明训练稳定性存在明显问题。

三、本文的解决思路：CWT + DDPM + CNN

本文提出了一套完整的故障诊断流程，核心思想可以概括为：先把一维信号变成二维图，再用扩散模型生成更多图，最后用CNN来分类。

【此处配图：论文图1 —— DDPM数据增强的整体流程图】

整个方法分为三个关键模块：

3.1 连续小波变换（CWT）：从一维信号到二维图像

振动信号本质上是一维时序数据，直接用于DDPM生成效果不佳。论文选择连续小波变换（Continuous Wavelet Transform, CWT）将其转化为二维时频图。

这一转换的优势在于：

多尺度分析：CWT能同时在时域和频域捕捉信号特征，揭示不同频段上的故障成分；
可视化直观：二维图像中，故障特征以纹理、色块等形式呈现，适合CNN提取空间特征；
绕开一维生成难题：将问题转化为图像生成，充分发挥DDPM在图像领域的成熟优势。

【此处配图：论文图3 —— 振动数据经CWT变换后的二维时频图示例】

3.2 去噪扩散概率模型（DDPM）：高质量图像生成

DDPM由Ho等人于2020年提出，是当前图像生成领域最具竞争力的生成模型之一。其核心思想是通过两个互逆的过程来学习数据分布：

前向过程（加噪）

从原始干净图像出发，逐步向其中添加高斯噪声，经过 T 步后，图像退化为接近纯高斯噪声。这一过程是固定的马尔可夫链，不含可训练参数：

任意时刻 t 的含噪图像可以直接由原始图像计算得到：

【此处配图：论文图2 —— DDPM前向加噪与反向去噪过程示意图】

反向过程（去噪生成）

训练阶段，模型学习逆转加噪过程——从噪声开始，逐步预测并去除噪声，最终恢复出高质量图像。反向转移分布由神经网络参数化：

损失函数

训练目标是让网络预测的噪声尽量接近真实添加的噪声，损失函数化简为：

推理（样本生成）

生成新样本时，从随机高斯噪声出发，迭代执行去噪步骤：

本文中，DDPM采用3000个epoch训练，时间步T=1000。

3.3 U-Net：DDPM中的噪声预测网络

DDPM中负责预测噪声的神经网络采用U-Net结构。U-Net因其编解码对称结构和跳跃连接（skip connections）在图像处理任务中表现卓越：

编码器（下采样）：使用4-5个池化层逐步降低分辨率，从底层纹理特征逐步抽象至高层语义特征；
解码器（上采样）：逐步恢复分辨率；
跳跃连接：将编码器各层特征图直接融合到对应的解码器层，保留高分辨率细节，避免信息瓶颈（这正是VAE系列模型生成图像模糊的根本原因）。

【此处配图：论文图5 —— 包含像素空间、潜在空间、Denoising U-Net和跳跃连接的DDPM完整结构图】

生成的新样本与原始样本在同一故障类别下具有相似的时频特征，但在细节上存在一定差异，有效扩充了样本的多样性。

【此处配图：论文图4 —— 原始Paderborn数据集样本（图a）与DDPM生成样本（图b）的对比】

3.4 2D-CNN：故障分类网络

增强后的二维时频图输入二维卷积神经网络（2D-CNN）进行故障分类。该网络结构如下：

输入层：二维小波图像
隐藏层：3个卷积层（分别含16、6、1组卷积核）+ 3个池化层 + 2个全连接层（64神经元 → 11或4神经元）
激活函数：ReLU（卷积层）、Softmax（输出层）
优化器：Adam，学习率0.001
损失函数：交叉熵损失
批大小：64

【此处配图：论文图6 —— CNN结构示意图】

四、实验验证

论文在两个公开数据集上进行了系统验证：CWRU数据集（Case Western Reserve University）和Paderborn数据集，实验平台为PyTorch，GPU为GeForce GTX 1080 Ti / 3060。

4.1 CWRU数据集实验

数据集简介：CWRU轴承数据集是故障诊断领域最广泛使用的基准数据集之一。振动信号由驱动端（SKF6205，12kHz/48kHz）和风扇端（SKF6203，12kHz）加速度计采集，电机转速1730-1797 RPM，涵盖4种健康状态（正常、外圈故障、内圈故障、滚动体故障），故障直径分7 mil、14 mil、21 mil三种，共10类状态。

实验设置：每类健康状态选取100张CWT变换图像作为训练集，2500张作为验证集和测试集；2D-CNN以batch size=200训练300个epoch。

增强设置：以100张训练图为输入，DDPM生成500张合成图像，与原训练集合并构成新训练集。

实验结果：

【此处配表：论文表1 —— CWRU数据集原始数据与DDPM增强后的测试精度对比】

原始数据测试精度仅为74.0%，经DDPM数据增强后提升至87.6%，提升幅度高达13.6个百分点。

【此处配图：论文图7 —— CWRU数据集的混淆矩阵对比（原始 vs. +500张生成数据）】

从混淆矩阵可以明显看出，增强前多个类别存在严重的误分类（如Ball_007、Ball_014等相互混淆），增强后各类别的识别精度均显著提升，对角线元素更加集中。

4.2 Paderborn数据集实验

数据集简介：Paderborn数据集由德国帕德博恩大学于2016年发布，专为电机驱动系统中的轴承损伤监测而设计。测试台由电机、转矩测量轴、轴承测试模块、飞轮和负载电机组成，振动信号采样频率64kHz，机械参数采样频率4kHz。数据集包含：

12个人工损伤轴承（7个外圈损伤、5个内圈损伤）
14个加速寿命测试损伤轴承（5个外圈、6个内圈、2个复合损伤）
6个健康轴承

实验设置：选取6203深沟球轴承（节圆直径28.55mm）在转速900 RPM、加载扭矩0.7N·m、径向力1000N条件下的数据，考察4种健康状态（健康、内圈损伤、外圈损伤、混合损伤）。构建两个各含40张CWT图像的训练集（Data 1和Data 2），400张图像作为验证集和测试集。

【此处配图：论文图8 —— Paderborn轴承测试台实物图】

基准精度：

【此处配图：论文图9 —— Paderborn数据集原始数据混淆矩阵（Data1: 0.798，Data2: 0.738）】

Data 1原始精度79.8%，Data 2原始精度73.8%，可见小样本（每类仅10张）条件下性能本就受限。

4.3 三种增强方法横向对比

论文在Paderborn数据集上系统对比了三种数据增强方案：

方法一：高斯噪声增强

向原始40张图像添加均值为0、方差为0.01的高斯噪声，分别生成40张和80张噪声图像并加入训练集。

【此处配表：论文表2 —— Paderborn数据集高斯噪声增强结果】

【此处配图：论文图10 —— Paderborn数据集高斯噪声增强混淆矩阵（Data1和Data2，+40和+80张）】

Data 1精度从79.8%分别提升至84.2%和85.2%；Data 2从73.8%提升至80.3%和82.0%。

方法二：DCGAN增强

DCGAN生成器和判别器均采用5层反卷积/卷积结构，特征图尺寸64，训练10000个epoch，Adam优化器学习率0.0005。

【此处配表：论文表3 —— DCGAN生成器结构】

【此处配表：论文表4 —— DCGAN判别器结构】

【此处配表：论文表5 —— Paderborn数据集DCGAN增强结果】

【此处配图：论文图11 —— Paderborn数据集DCGAN增强混淆矩阵（Data1和Data2，+40和+80张）】

Data 1精度分别为84.7%和82.5%（注意：+80张反而比+40张下降了2.2%，训练不稳定的问题暴露无遗）；Data 2分别为81.4%和83.1%。

方法三：DDPM增强

输入同样为40张训练图，DDPM分别生成40张和80张新图像。

【此处配表：论文表6 —— Paderborn数据集DDPM增强结果】

【此处配图：论文图12 —— Paderborn数据集DDPM增强混淆矩阵（Data1和Data2，+40和+80张）】

Data 1精度分别提升至89.6%和92.3%；Data 2分别达到84.2%和86.3%，且随着生成样本数量增加，性能持续稳定提升，未出现性能下滑。

三方法综合对比

【此处配表：论文表7 —— 三种方法在Data 1上的对比】

【此处配表：论文表8 —— 三种方法在Data 2上的对比】

【此处配图：论文图13 —— 三种增强方法在Paderborn数据集上的柱状图对比】

从综合对比来看，DDPM在所有场景下均取得最高精度，且具备以下突出优势：

训练稳定性最强：随生成数量增加，精度单调提升，无下降现象；
生成质量最高：产出的时频图在视觉特征上与真实故障样本高度一致；
小样本场景优势明显：在每类仅10张原始图像的极端条件下，依然能显著提升诊断性能。

五、方法优势与局限性分析

优势总结

维度	DDPM的表现
训练稳定性	无模式崩塌，精度随样本数单调提升
样本质量	生成图像与真实样本高度相似（见图4对比）
模式覆盖	能生成多样化样本，防止过拟合
噪声鲁棒性	内置去噪机制，对含噪数据有天然适应性
小样本适配	极少训练样本（40张）下仍能有效工作

局限性

论文作者也坦诚指出了当前方法的不足：

不能直接处理一维信号：DDPM难以高质量生成一维时序数据，必须先经CWT转换为二维图像，增加了流程复杂度；
计算资源消耗大：DDPM训练需要3000个epoch、1000个时间步，相比GAN训练周期更长，推理速度较慢；
生成速度较慢：每次从噪声到图像需要迭代T步，实时性不如直接方法。

六、未来展望

论文指出，未来在故障诊断数据增强领域值得探索的方向包括：

物理模型与机器学习融合：将轴承动力学方程等先验知识注入生成模型，使合成数据更符合物理规律；
迁移学习与跨域适应：在不同机器、不同工况之间共享生成模型，提升泛化能力；
强化学习动态增强：利用强化学习自适应调整数据增强策略，针对当前诊断难点定向生成样本；
可解释AI：通过注意力可视化等手段验证生成样本的合理性，提升增强数据的可信度；
少样本学习与半监督学习：进一步减少对大量标注数据的依赖（Few-Shot Learning、Semi-Supervised Learning、Anomaly Detection、Transfer Learning）。