尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

即插即用系列 | CVPR 2025:SCSegamba:轻量级结构感知 Mamba,重新定义裂缝分割 SOTA

即插即用系列 | CVPR 2025:SCSegamba:轻量级结构感知 Mamba,重新定义裂缝分割 SOTA
📅 发布时间:2026/6/19 20:35:11

论文标题:SCSegamba: Lightweight Structure-Aware Vision Mamba for Crack Segmentation in Structures

论文原文 (Paper):https://arxiv.org/pdf/2503.01113
代码 (code):https://github.com/Karl1109/SCSegamba


GitHub 仓库链接(包含论文解读及即插即用代码):https://github.com/AITricks/AITricks
哔哩哔哩视频讲解:https://space.bilibili.com/57394501?spm_id_from=333.337.0.0

目录

      • 1. 核心思想
      • 2. 背景与动机
        • 2.1 文本背景总结
        • 2.2 动机图解分析
      • 3. 主要创新点
      • 4. 方法细节
        • 4.1 整体网络架构
        • 4.2 核心创新模块详解:SAVSS Module
        • 4.3 理念与机制总结:SASS 扫描策略
        • 4.4 图解总结
      • 5. 即插即用模块的作用
      • 6. 实验部分简单分析
      • 7. 获取即插即用代码关注 【AI即插即用】

1. 核心思想

本文提出了一种名为SCSegamba的轻量级裂缝分割网络,旨在解决现有 CNN 和 Transformer 方法在处理结构裂缝时难以兼顾“形态细节捕捉”与“计算效率”的问题。其核心思想是构建一个结构感知视觉状态空间(SAVSS)模块,该模块巧妙地融合了门控瓶颈卷积(GBC)来提取局部形态信息,以及结构感知扫描策略(SASS)来捕捉全局纹理线索。通过这种设计,SCSegamba 在保持极低参数量(约 1M)的同时,能够精确分割出细微、不规则且拓扑复杂的裂缝。


2. 背景与动机

2.1 文本背景总结

结构裂缝分割是基础设施维护的关键。现有方法面临两大挑战:

  1. 特征表达的局限性:CNN 受限于局部感受野,难以捕捉长距离的裂缝连续性;Transformer 虽然有全局视野,但计算复杂度高(O ( N 2 ) O(N^2)O(N2)),且容易丢失有利于定位边缘的高频信息。
  2. 现有 Mamba 的不足:虽然 Vision Mamba(如 VMamba)引入了线性复杂度的全局建模,但其标准的扫描方式(水平/垂直)往往会破坏裂缝这种具有特定方向性的细长结构的连续性,导致分割结果出现断裂。
2.2 动机图解分析

看图说话与痛点分析:

  • 现有方法的局限性:
    • 左下角区域:传统的轻量级 CNN(如某些轻量化 UNet 变体)虽然 GFLOPs 低,但精度(mIoU,纵轴)也较低,属于“快而不准”。
    • 右侧区域:基于 Transformer 的方法(如 Swin-UNet)或者重型的 CNN,虽然精度较高,但圆圈非常大(代表参数量大)且位于横轴右侧(GFLOPs 高),存在严重的效率瓶颈,难以在便携式检测设备上部署。
  • 本文的突破:
    • SCSegamba(红色五角星):位于图表的左上角。这意味它在消耗极低计算资源(极低的 GFLOPs)的同时,达到了最高的分割精度。这直观地展示了本文解决的核心问题:如何在极致轻量化的前提下,实现 SOTA 级别的裂缝特征表达。

3. 主要创新点

  1. SCSegamba 架构:提出了一种基于 Mamba 的 U 型纯视觉架构,专门针对裂缝分割任务进行了轻量化和性能优化。
  2. 结构感知视觉状态空间模块 (SAVSS):这是网络的核心构建块,集成了卷积的局部归纳偏置和 SSM 的全局建模能力。
  3. 门控瓶颈卷积 (GBC):设计了一种轻量级的卷积模块,利用门控机制抑制背景噪声,专注于提取裂缝的局部形态学特征。
  4. 结构感知扫描策略 (SASS):提出了一种四向扫描机制(水平、垂直、两条对角线),克服了传统 SSM 单向扫描导致的信息丢失问题,增强了对任意方向裂缝的纹理捕捉能力。

4. 方法细节

4.1 整体网络架构

数据流详解:
SCSegamba 采用了经典的U-Shape(编码器-解码器)结构,但将内部模块替换为了高效的 SSM 组件:

  1. 输入 (Input):H × W × 3 H \times W \times 3H×W×3的裂缝图像。
  2. 编码器 (Encoder):
    • 图像首先经过一个 Stem 层(卷积层)进行初步特征映射。
    • 随后经过 4 个阶段的下采样。每个阶段包含Patch Merging(降低分辨率,增加通道)和堆叠的SAVSS 模块。
    • 关键点:随着网络加深,分辨率从H / 4 H/4H/4降至H / 32 H/32H/32,通道数增加,提取从细节到语义的特征。
  3. 解码器 (Decoder):
    • 通过Patch Expanding进行上采样。
    • 利用Skip Connections(跳跃连接)将编码器的浅层高分辨率特征与解码器的深层语义特征融合,以恢复裂缝的边缘细节。
  4. 输出 (Output):最后通过一个投影层输出二进制分割掩码。
4.2 核心创新模块详解:SAVSS Module

SAVSS 模块采用了双分支设计,旨在融合局部和全局信息:

  • 上分支:结构感知扫描 (Global Texture)

    • 输入特征经过 LayerNorm 后进入VSS (Visual State Space)部分。
    • 核心组件:内部使用了SASS (Structure-Aware Scanning Strategy)。
    • 流动机制:特征图被展开并沿着 4 个特定方向(0°, 45°, 90°, 135°)进行扫描。这使得 SSM 能够捕捉裂缝在任意方向上的连续性,建立长程依赖。
    • 目的:解决裂缝“断裂”问题,确保分割出的裂缝是连续的。
  • 下分支:门控瓶颈卷积 (Local Morphology)

    • 核心组件:GBC (Gated Bottleneck Convolution)。
    • 内部结构:包含深度可分离卷积(DWConv)和1 × 1 1 \times 11×1卷积。引入了Gating 机制(通过 SiLU 激活函数实现),即O u t p u t = C o n v 1 ( X ) ⊙ σ ( C o n v 2 ( X ) ) Output = Conv_1(X) \odot \sigma(Conv_2(X))Output=Conv1​(X)⊙σ(Conv2​(X))。
    • 目的:门控机制类似于注意力,能够过滤掉复杂的背景纹理(如墙面污渍、光影),只保留裂缝的形态结构信息。
  • 特征融合:两个分支的输出相加,并通过残差连接输出。

4.3 理念与机制总结:SASS 扫描策略

  • 传统痛点:标准的 1D 扫描(Raster Scan)在处理垂直或弯曲裂缝时,空间上相邻的像素在序列中可能相距很远,导致 SSM 难以捕捉其相关性。
  • SASS 机制:
    • 多方向覆盖:如图所示,SASS 引入了对角线方向的扫描。
    • 公式解读:y = S A S S ( x ) y = SASS(x)y=SASS(x)。通过四个方向的 SSM 处理,最后将结果聚合:y t o t a l = y h o r + y v e r + y d i a g 1 + y d i a g 2 y_{total} = y_{hor} + y_{ver} + y_{diag1} + y_{diag2}ytotal​=yhor​+yver​+ydiag1​+ydiag2​。
    • 协同工作:无论裂缝是横向、纵向还是斜向,总有一个扫描方向能与其走向对齐,从而最大程度地保留裂缝的拓扑结构。
4.4 图解总结

回到“动机图解”的核心问题:

  • GBC解决了“语义鸿沟”中的局部细节丢失问题,确保裂缝边缘清晰。
  • SASS解决了“长程依赖”问题,确保长裂缝不中断。
  • 整个Mamba 架构解决了“效率瓶颈”,实现了图 1 中左上角的极致性能。

5. 即插即用模块的作用

本论文提出的 SAVSS 模块是一个高度封装的单元,具有极强的通用性。

  • 适用场景:
    • 细长物体分割:除了裂缝,还适用于血管分割(医学影像)、道路标线检测(自动驾驶)、电缆/绳索检测等。
    • 轻量化模型改造:任何基于 U-Net 或 ViT 的分割网络,如果需要部署在移动端,都可以用 SAVSS 模块替换原有的卷积块或 Transformer 块。
  • 具体应用:
    • 在工业缺陷检测中,可以将 SAVSS 插入 YOLO 的骨干网络中,增强对细微划痕的特征提取能力。

6. 实验部分简单分析

论文在 DeepCrack, Crack500, CFD 等主流数据集上进行了验证。

  1. 定量分析 (Quantitative Analysis):
    • 在 DeepCrack 数据集上,SCSegamba 的mIoU 达到 88.58%,优于 VM-UNet (87.27%) 和 Swin-UNet (86.42%)。
    • 关键指标:参数量仅1.08 M,GFLOPs 仅1.45 G。相比 VM-UNet 减少了约 96% 的计算量,这对于工程应用意义重大。

  1. 定性分析 (Qualitative Analysis):

    • 可视化结果显示,SCSegamba 在处理极细裂缝和复杂背景干扰(如水渍、阴影)时表现更好。
    • 相比其他方法,SCSegamba 分割出的裂缝连通性更好,断点更少,验证了 SASS 扫描策略的有效性。
  2. 消融实验:

    • 去除 SASS 或 GBC 模块后,性能均有显著下降,证明了两者在处理形态和纹理信息上的互补性。

到此,所有的内容就基本讲完了。如果觉得这篇文章对你有用,记得点赞、收藏并分享给你的小伙伴们哦😄。

7. 获取即插即用代码关注 【AI即插即用】

相关新闻

  • (36)通知与切面
  • 外卖骑手实时就近派单全攻略:SpringBoot + GeoHash 高效实现
  • Java计算机毕设之基于VUE的旅游信息分享管理平台基于Springboot+Vue的旅游攻略分享平台系统(完整前后端代码+说明文档+LW,调试定制等)

最新新闻

  • 从零开始:PaddleX如何让AI开发像搭积木一样简单?
  • 抖店无货源铺货怎么不违规?拼多多商品违规检测新手合规教程 - 抖掌柜
  • 专业级Canvas富文本编辑器:5分钟实现高质量文档编辑与PDF导出
  • MMC2001 UART与OnCE模块深度解析:寄存器配置、硬件调试与实战避坑
  • 5分钟上手SimLOD:让海量点云数据实时渲染变得简单
  • MC68340定时器与JTAG边界扫描:嵌入式系统时序控制与硬件诊断核心技术解析

日新闻

  • 信任的进化:技术实现详解——如何用JavaScript构建博弈论模拟器
  • Terrakube自定义工作流:如何集成OPA、Infracost等工具扩展IaC能力
  • grunt-concurrent快速入门:5分钟学会并行运行Grunt任务

周新闻

  • 3步解锁iOS设备:applera1n激活锁绕过完全指南
  • 39 2026 人工智能证书终极盘点,普通人选 AI 证书可以从这些方向入手
  • Redis 暴露公网有多危险?从端口检查到补救步骤

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号