当前位置: 首页 > news >正文

LDC

image

这篇论文旨在解决,CLIP存在类间混淆问题。

CLIP通过对比学习在大规模图文对上进行预训练,而不是直接优化分类边界,因此在分类任务中区分类别能力不足,存在明显的类间混淆。
而且,下游数据与预训练数据之间存在显著域差异进一步加剧了类间混淆,特别是类别间相似度较高时。

我们可以通过一个可学习模块来建模类间混淆,然后通过残差结构消除这些混淆。

下面是方法:

传统CLIP:

image

先计算每个图文对的余弦相似度(第3个),然后归一化这个值(第2个),然后最大值就是预测值(第1个)。

改进:

但是这时候是有类间混淆的,所以我们在最后比较最大值之前,应该用去除混淆的干净值来比较。所以要在归一化之后去除混淆,即:

image

混淆是怎么得到的呢?

将图像xi作为先验,然后通过归一化得到的值来学习类间混淆,即:

image

然后,我们方法中的参数通过最小化干净值(去了混淆的干净值)与标签值的交叉熵损失来优化:

image

最后,为了防止过度去混淆,采用了L1正则化的相似损失,以确保干净值(预测值)与原始值(预测值)保持相似:

image

总损失(交叉熵损失 + λ × 相似损失):

image

下面介绍一下模型及各个模块:

总体逻辑:

首先通过CLIP得到原始值

下面的MAF会融合图像编码器的不同层的特征,以融合低层细节信息和高层语义信息,得到增强特征

增强特征经过MLP得到 MAF的s值(特征值)

ICD模块以增强特征为先验,通过残差结构从原始值来学习类间混淆得到 ICD的s值(类间混淆值)

最后,ALF模块将 MAF的s值ICD的s值 融合,其中 权重α 由 α Generator 得到。

MAF模块:

image

其中 Fusion 步骤有 WF 和 LF 两种方式:

image

WF中的 β 是预置权重;LF首先通过跨特征通道维度进行特征串接,然后使用 Adapter 降维。

image

ICD模块:

首先,A1 Adapter原始值 学习类间混淆模式,
A2 Adapter增强特征学习类间混淆的先验,
然后 A1 和 A2 的输出 一起输入到 A3 Adapter,联合学习 原始值增强特征 的类间混淆模式。
最后,通过残差结构去除学习到的混淆模式,得到干净值

image

ALF模块:

MAF的s值(特征值)ICD的s值(类间混淆值) 结合起来,权重α 由 α Generator 得到。

image

image

可以从公式注意到:α Generator的输入是增强特征

优化:

image

image

最后,总损失:

image

下面是实验部分:
图像分类数据集(11个):ImageNet、Caltech101、DTD、EuroSAT、FGVCAircraft、Flowers102、Food101、OxfordPets、StanfordCars、SUN397、UCF101

比较的SOTA(基于CLIP的FSL方法)(11个):CoOp、VT-CLIP、Tip-Adapter、SuS-X、FAR、CALIP-FS、SGVA-CLIP、Proto-CLIP-F、APE、DAC-V、LP++

image

11个数据集和1个平均性能,红线是本文的LDC。

消融实验:

三个模块:

image

MAF中的四层特征、β取值、Projector:

image

ICD中的三个Adapter:

image

ALF中的α取值(通过α Generator自适应取值最好):

image

http://www.rkmt.cn/news/30765.html

相关文章:

  • 完整教程:由JoyAgent观察AI Agent 发展
  • Spark计算引擎
  • 173天隧道技术篇防火墙组策略ICMPDNSSMB协议出网判断C2上线解决方案
  • 实用指南:3DGS 如何理解它?
  • 面试总被追问k8s调度器工作原理, 收藏 == 学废
  • 题解:十二重计数法
  • 2025 年 10 月厨房排烟、厨房排烟罩、厨房排烟系统厂家最新推荐,资质、案例、售后三维测评与选购指南
  • # Ubuntu 根目录空间扩展操作手册(基于 RAID 关联磁盘 /dev/sdb2)
  • Perplexity Comet AI浏览器「等待网络链接」解决方案
  • 新地球
  • 实用指南:Android 常见界面布局详解
  • 2025 年 10 月食堂厨房设备厂家最新推荐,聚焦资质、案例、售后的食堂场景深度解读
  • 基于深度学习神经网络协同过滤模型(NCF)的视频推荐体系
  • 给安卓设置背景色的时候保持默认按钮样式(关于使用setBackgroundColor导致丢失默认按钮样式的问题)
  • 分片上传与断点续传实现详解
  • Kanass入门到实战(6) - 如何进行缺陷管理 - 指南
  • 数据处理方法汇总
  • 2025 年 10 月展示柜厂家最新推荐,技术实力与市场口碑深度解析!
  • 2025年10月益生菌品牌推荐榜:全维度对比与榜单解读
  • 2025年10月美容仪品牌推荐:无创无痛对比评测榜
  • 2025年10月中国遗产继承律师推荐榜:五强对比全解析
  • php特性
  • 2025年10月深圳近视手术医生推荐榜:五强对比与口碑评价
  • php_sha1函数特性
  • php非法参数
  • php原生类的使用
  • 2025 年 10 月仿石漆厂家最新推荐,精准检测与稳定性能深度解析
  • 下午选歌
  • 分治算法在查找第k小元素中的应用与分析
  • 2025年10月中国装饰公司对比榜:十家口碑与实力排行