（论文速读）REF-DDPM：一种新的基于DDPM的不平衡滚动轴承故障诊断数据增强方法-尧图网站建设

📅 发布时间：2026/7/5 15:14:19

论文题目：ReF-DDPM: A novel DDPM-based data augmentation method for imbalanced rolling bearing fault diagnosis（一种新的基于DDPM的不平衡滚动轴承故障诊断数据增强方法）

期刊：Reliability Engineering and System Safety

摘要：有效的轴承故障诊断是保证机械系统安全可靠运行的关键。由于复杂恶劣的工作环境，机械数据往往来自不平衡的数据集，这是诊断应用中亟待解决的问题。然而，目前提出的主要基于生成性对抗网络的数据增强方法在平衡生成样本的质量和多样性方面仍然具有挑战性。针对这一问题，本文提出了一种新的数据增强方法--再参数残差去噪扩散概率模型(REF-DDPM)，并将其应用于故障诊断。该结构包括前向扩散过程和反向去噪过程，其中高斯噪声和原始样本通过马尔可夫链进行变换。为了提高生成样本的质量，对噪声预测网络进行了改进，通过增强层内和层间特征来更好地表示特征。此外，还将信号标签作为条件信息添加到模型中，以指导采样过程中相关类别样本的生成。该研究为承载不平衡数据提供了一种新的数据增强方法，生成的数据可进一步用于故障诊断任务。验证实验证明了该方法的有效性和良好的泛化能力，提高了不平衡故障诊断的准确性。

用扩散模型解决轴承故障诊断中的数据不平衡问题：ReF-DDPM详解

一、背景：为什么轴承故障诊断需要数据增强？

滚动轴承是旋转机械中最易发生故障的核心零部件。及时、准确地诊断轴承故障，对于保障机械系统安全稳定运行至关重要。近年来，基于深度学习的故障诊断方法凭借其自适应特征提取能力，展现出强大的性能潜力。

然而，深度学习模型的训练有一个前提：需要大量且均衡的标注样本。现实情况却恰恰相反——工业现场的轴承绝大多数时间处于健康运行状态，各类故障状态的发生概率本就很低，加之数据存储不当等原因，使得故障样本极度稀缺。这就造成了严重的数据不平衡（Class Imbalance）问题：健康样本数量远远多于故障样本。

数据不平衡会直接导致诊断模型"偏科"——模型倾向于将所有样本都预测为多数类（健康状态），对少数类（故障状态）的识别能力极差，而这恰恰是我们最需要准确识别的类别。

二、现有方法的局限

目前解决数据不平衡问题的主流思路是生成对抗网络（GAN），通过生成虚假的少数类样本来补充数据集。已有多项工作探索了一维卷积GAN、DCGAN、WGAN-GP等变体。但GAN系列方法存在三个根本性缺陷：

① 模式崩溃（Mode Collapse）：生成器陷入只生成少数几种样本的局面，生成数据多样性严重不足，无法覆盖真实故障信号的全部变化模式。

② 训练不稳定：判别器与生成器的对抗训练过程极其敏感，容易陷入不稳定状态，需要大量人工调参才能收敛，工程应用门槛高。

③ 生成质量有限：生成样本从真实样本中学到的特征有限，低质量的扩充数据反而会"污染"训练集，影响最终的故障识别精度。

此外，SMOTE等传统过采样技术易受噪声干扰且存在过拟合风险；变分自编码器（VAE）因重建损失的设置会削弱生成质量；元学习方法则需要大量与目标分布相似的训练数据，在故障数据极度稀缺的场景下难以奏效。

三、核心思路：用扩散模型替代GAN

近年来，去噪扩散概率模型（Denoising Diffusion Probabilistic Model, DDPM）在图像合成、语音合成领域取得了突破性进展，生成质量甚至超越了GAN。与GAN相比，DDPM的优势在于：

利用马尔可夫链逐步加噪/去噪，训练过程更稳定
直接学习数据分布，从根本上避免模式崩溃
生成样本多样性更丰富

然而，将DDPM直接用于振动信号生成仍面临挑战：标准DDPM的噪声预测网络存在局部特征信息丢失和全局特征信息冗余两个问题，限制了生成振动信号的质量。

本文提出的ReF-DDPM（Reparameterized Residual Denoising Diffusion Probabilistic Model）正是针对这两个问题，对DDPM的噪声预测网络进行了系统性改进。

四、方法详解：ReF-DDPM的完整框架

4.1 整体流程

【配图：Fig. 2 — ReF-DDPM数据增强策略全流程图】

整个框架分为五个步骤：

Step 1：对不平衡数据集中的训练样本，在时间步逐步添加高斯噪声，生成带噪样本
Step 2：将、时间步和样本类别标签一起输入ReF-DDPM模型进行训练，学习预测噪声
Step 3：训练完成后，从标准正态分布中采样，结合时间步和目标类别标签，驱动模型生成指定类别的新样本
Step 4：将生成样本与原始训练样本混合，构建平衡数据集
Step 5：用平衡数据集训练分类器，完成故障诊断

其中，类别标签作为条件信息参与训练和采样，使模型能够有针对性地生成指定故障类型的样本，而不是随机生成，这对故障样本扩充至关重要。

4.2 噪声预测网络架构

【配图：Fig. 3 — 噪声预测网络（改进U-Net）整体架构】

噪声预测网络采用U-Net架构，由三类核心模块构成：DoubleConv模块（两个3×3卷积层）、Downsample模块（下采样，提取浅层特征）、Upsample模块（上采样，提取深层特征）。深层特征与浅层特征通过跳跃连接融合，最终由1×1卷积输出预测噪声。

本文对标准U-Net做了两处关键改进，分别对应两类特征增强。

4.3 创新点一：RepRFN（增强层内特征，解决局部特征丢失）

【配图：Fig. 4 — Downsample和Upsample模块结构】
【配图：Fig. 5 — RepRFB、RepBlock、Attention Layer的详细结构】

受图像超分辨率领域的重参数化残差特征网络（RepRFN）启发，本文将其引入DDPM的下/上采样模块，解决局部特征信息丢失问题。

核心设计是重参数化残差特征块（RepRFB），其内部的RepBlock采用多并行分支结构：

训练阶段：同时使用3×3、3×1、1×3、1×1以及1×1→3×3级联共五种尺度的卷积核并行提取特征，覆盖不同感受野，捕捉振动信号中从局部冲击到全局趋势的多尺度特征
推理阶段：通过重参数化操作，将所有并行分支的权重等效合并为一个3×3卷积核，推理时计算量不增加，实现"训练重参数、推理轻量化"

提取深层特征后，RepRFB通过局部残差连接融合浅层与深层特征，并使用注意力机制增强整体特征表达。

这一设计的意义在于：振动信号包含轴承各部件的特征频率（BPFO、BPFI、BSF等），不同尺度的卷积核能同时捕捉这些不同频率范围的局部纹理特征，从而保留关键的故障特征细节。

4.4 创新点二：MRLA（增强层间特征，解决全局信息冗余）

【配图：Fig. 1 — MRLA（多头循环层注意力）原理图】

标准DDPM的U-Net跳跃连接仅使用简单的通道拼接（Concatenation），完全忽略了高层特征与低层特征之间的语义关系，导致全局特征信息冗余。

本文在跳跃连接处引入多头循环层注意力（Multi-head Recurrent Layer Attention, MRLA）机制。其核心思想是：

将高层特征向量通过平均池化和卷积变换为Q（Query）、K（Key）、V（Value）三组特征矩阵，然后通过点积注意力计算Q和K的相关性，得到注意力分布，再与V相乘得到注意力特征矩阵；最后将低层特征向量与注意力特征矩阵相加，实现跨层特征的自适应融合。

具体地，层注意力的计算为：

通过递推展开（令），MRLA能够聚合来自所有历史层的信息，实现真正的跨层循环信息检索，既强化了高层语义对低层细节的指导，又过滤掉了冗余的全局特征，使生成样本的频率特征更加准确。

4.5 网络结构参数

【配表：Table 2 — ReF-DDPM网络结构参数（输入/输出数据尺寸）】

完整网络共包含1个输入层、1个DoubleConv、3个Downsample（通道数从32→64→128→128，空间尺寸从512→256→128→64）、3个DoubleConv（通道数扩展至256）、3个Upsample（逐步恢复至512）和1个输出层，最终将512点输入信号还原为预测的噪声信号。

五、实验验证

5.1 Case 1：CWRU公开数据集

数据设置

【配表：Table 1 — CWRU数据集详情】

使用凯斯西储大学（CWRU）轴承故障数据集，选取SKF6205轴承在1797 rpm、0 hp负载下的数据，包含：

3种故障位置（球（BA）、内圈（IR）、外圈（OR））× 3种故障尺寸（7/14/21 mils）= 9类故障
1类正常状态（Normal）
共10类，样本长度512点，每类故障训练样本20个，正常训练样本160个

不平衡比设置从1:80到1:1共7个梯度，最极端情况下每类故障仅有2个训练样本。

【配图：Fig. 6 — 三种故障条件下原始轴承故障数据的时域和频域波形】

模型训练参数：Adam优化器，初始学习率1e-4，批大小36，扩散步数1000，训练轮数300。

生成质量评估

【配图：Fig. 7 — OR故障（21 mils）TFDW对比：原始/WGAN-GP/DDPM/ReF-DDPM】【配图：Fig. 8 — IR故障（21 mils）TFDW对比】
【配图：Fig. 9 — BA故障（21 mils）TFDW对比】

从时频波形（TFDW）的直观对比可以看出：

WGAN-GP：引入了额外噪声，且容易忽略细小的低频成分
DDPM：某些特定频率无法被生成，时域波形幅值也不够明显
ReF-DDPM：生成信号的时域波形特征和频域峰值位置均与原始信号高度一致，且不同故障条件下的生成数据具有良好多样性

量化评估结果：

评价指标	DCGAN	WGAN-GP	DDPM	ReF-DDPM	原始数据
MMD↓	0.6845	0.4056	0.3415	0.3070	0.3034
JSD↓	0.0309	0.0240	0.0228	0.0212	0.0209
COSINE↑	0.9038	0.9272	0.9152	0.9315	0.9328

ReF-DDPM在三项指标上均优于其他方法，且与原始数据自身评估值（0.3034/0.0209/0.9328）极为接近，说明生成样本分布与真实样本高度吻合。

【配图：Fig. 10 — 四种方法的t-SNE特征可视化对比】

t-SNE可视化进一步揭示了各方法的本质差异：

DCGAN：Generated 8（粉色）与Real 8完全分离，反而与Generated 4（橙色）混叠，典型的模式崩溃表现
WGAN-GP：不同程度的类间重叠和类内分离
DDPM：避免了类内分离，但仍有轻微特征混叠
ReF-DDPM：生成数据与真实数据在特征空间几乎完全重合，不同类别之间具有良好的可分性

不平衡故障诊断结果

【配图：Fig. 11 — 四种方法在不同不平衡比下的诊断准确率对比】

【配表：Table 4 — 不平衡实验数据集设置（不平衡比1:80至1:1）】

值得注意的是，在极度不平衡（1:40和1:20）时，GAN类方法反而高于DDPM类方法——这是因为GAN的模式崩溃在样本极少时反而变成了"优势"：单调的生成样本提高了对该单一模式的分类概率。然而随着数据量增加，GAN的多样性缺陷暴露无遗。

当不平衡比达到1:10时，ReF-DDPM准确率56.7%，已开始领先（DCGAN 54.3%、WGAN-GP 55%、DDPM 44.6%）。到达平衡状态（1:1）时，差距急剧拉开：

方法	准确率
DCGAN	81.3%
WGAN-GP	87.5%
DDPM	95.6%
ReF-DDPM	99.5%

【配图：Fig. 12 — 平衡数据下四种方法的混淆矩阵】

消融实验

【配图：Fig. 13 — 四个控制模型的训练准确率/损失曲线及分类结果】
【配图：Fig. 14 — 四个控制模型的t-SNE特征可视化】

为验证各模块的贡献，设计四个控制模型：

Model A：原始DDPM（无RepRFN，无MRLA）
Model B：仅加MRLA，无RepRFN
Model C：仅加RepRFN，无MRLA
Model D：完整ReF-DDPM（RepRFN + MRLA）

结果显示：

Model A精度最低、损失最高
Model C优于Model B，说明RepRFN对诊断精度的提升比MRLA更显著
Model D（完整方案）精度最高，且t-SNE特征图中呈现出最强的类内聚合和类间分离

5.2 Case 2：MFPT数据集（更复杂场景）

【配表：Table 5 — MFPT数据集详情】

使用机械故障防治技术学会（MFPT）提供的数据，在1500 r/min转速下选取7个数据集：

内圈（IR）故障：50/100/250 lbs三种负载
外圈（OR）故障：50/100/250 lbs三种负载
正常（N）：270 lbs
样本长度2048点，每类故障初始训练样本10个

MFPT数据的频率成分比CWRU更为复杂，是对方法泛化能力的更严苛考验。

【配图：Fig. 15 — MFPT数据集原始时域和频域波形（可见更复杂的频率成分）】
【配图：Fig. 16 — IR故障（50 lbs）TFDW对比】
【配图：Fig. 17 — OR故障（50 lbs）TFDW对比】

尽管数据复杂度增加，ReF-DDPM生成信号的波形特征仍与原始信号高度一致，WGAN-GP则在高频域产生了不相关的频率成分，DDPM的时域幅值依然不够明显。

【配图：Fig. 18 — MFPT数据集四种方法在不同不平衡比下的诊断准确率】

【配表：Table 6 — MFPT不平衡实验数据集设置】

平衡状态（1:1）下的诊断结果：

方法	准确率
DCGAN	53.1%
WGAN-GP	53.6%
DDPM	75.3%
ReF-DDPM	78.4%

在更复杂的数据场景下，ReF-DDPM仍保持最优性能，GAN类方法与DDPM类方法的差距也进一步拉大，体现了扩散模型的本质优势。

5.3 Case 3：MFS真实实验平台数据集

【配图：Fig. 19 — MFS实验平台实物图】

【配表：Table 7 — MFS数据集详情】

为进一步验证实际应用价值，使用机械故障模拟器（MFS）实验平台采集的真实数据，在1800 rpm转速下，采样频率24 kHz，包含：

正常（N）
球故障（BA）
内圈故障（IR）
外圈故障（OR）
复合故障（C）——这是前两个案例中没有的故障类型，增加了诊断难度

样本长度2048点，每类故障初始训练样本10个。

【配图：Fig. 20 — MFS数据集原始时域和频域波形】
【配图：Fig. 21 — IR故障TFDW对比（WGAN-GP、DDPM、ReF-DDPM）】
【配图：Fig. 22 — MFS数据集平衡状态下四种方法的混淆矩阵】
【配图：Fig. 23 — MFS数据集四种方法的t-SNE特征分布】

MFS实验结果与前两个案例一致：混淆矩阵和t-SNE特征分布均显示ReF-DDPM在类间分离性和类内聚合性上最优，进一步验证了方法在复杂真实场景中的有效性和泛化能力。

六、三大数据集结果横向对比

综合三个案例，ReF-DDPM展现出一致的规律：

生成质量方面：无论是简单的CWRU数据，还是频率成分更复杂的MFPT和MFS数据，ReF-DDPM生成的振动信号在时频波形上均能忠实还原原始信号的主要特征，且定量指标（MMD/JSD/COSINE）始终优于DCGAN、WGAN-GP和DDPM。

诊断精度方面：在极度不平衡时，各方法差距有限；随数据量增加到平衡状态，ReF-DDPM的优势越来越明显，最终在CWRU达到99.5%、MFPT达到78.4%的最优准确率。

关键规律：GAN类方法在样本极度稀少时因模式崩溃反而获得短暂优势，但本质上这是一种"虚假"的精度，随着样本增加，其多样性不足的缺陷就会暴露出来。

七、局限性与未来工作

作者明确指出了现有方案的主要局限：

采样速度慢：扩散模型的推理过程需要完整运行T步去噪（本文扩散步数设置为1000），相比GAN一步生成，采样时间显著更长，这在需要实时生成大量样本的场景下是一个实际瓶颈。

未来工作方向：进一步优化时间步策略，减少采样步数（如采用DDIM等快速采样方法），在保持生成质量的前提下大幅提升采样速度，使ReF-DDPM更适用于工程部署场景。

八、总结

本文针对滚动轴承故障诊断中的数据不平衡问题，提出了基于改进DDPM的数据增强方法ReF-DDPM。核心思路是：在DDPM稳定、多样的生成框架基础上，通过RepRFN增强局部特征提取（层内特征），通过MRLA优化跨层特征交互（层间特征），并引入类别标签实现条件生成，从而提升振动信号的生成质量，最终改善不平衡场景下的故障分类精度。

三个数据集的验证结果表明，ReF-DDPM在生成质量和诊断精度两个维度上均全面超越DCGAN、WGAN-GP和标准DDPM，尤其在平衡状态下的CWRU数据集上达到99.5%的高准确率，充分验证了方法的有效性和良好泛化能力。