当前位置：首页 > news >正文

大模型安全：共享 GPU 本地内存泄露

news 2026/6/17 18:23:56

大模型安全：共享 GPU 本地内存泄露（LeftoverLocals）

威胁描述

在某些 GPU 架构中，每个计算单元（Compute Unit）都配备专属的私有本地内存（local memory）。若 GPU 在进程结束后未自动清除该本地内存中的数据，则攻击者在后续使用同一计算单元的新进程中，可直接读取先前进程残留的敏感信息。
这可能导致 AI 关键资产泄露，包括：

用户输入/输出数据（如私密对话）
模型中间计算结果（如推理向量）
模型权重参数（尤其在开源模型场景下可辅助重构）

威胁场景

满足以下两个条件即可构成风险场景：

GPU 具备本地内存机制，且缺乏进程隔离后自动清零的安全设计；
存在多用户或多进程共享 GPU 的环境，例如：
- 未启用 vGPU 或 MxGPU 的云服务器（物理 GPU 被多个租户/容器共享）
- 多应用共存的桌面或移动设备（如 macOS/iOS/Android 上的后台与前台应用交替使用 GPU）

威胁触发条件

攻击者只需具备以下任一能力：

能运行 GPU 计算程序（如通过 OpenCL、Vulkan、Metal 等 API）
无需 root 或高权限，普通用户或容器内进程即可部署监听程序

通过读取未初始化的本地内存，即可获取前一进程遗留的敏感数据。

缓解措施

技术措施

云环境：在共享 GPU 场景中，应使用具备硬件级隔离的 GPU 虚拟化技术（如 NVIDIA vGPU、AMD MxGPU），避免多个租户直接共享物理计算单元。
设备选型：优先选择支持内核退出时自动清零本地内存的 GPU 产品。若不可行，应在应用层强制清零。

管理措施

及时更新 GPU 固件、驱动及操作系统安全补丁，以修复已知漏洞（如 CVE-2023-4969）。
采购评估：在 AI 计算设备选型阶段，将“GPU 本地内存自动清零机制”纳入安全基线要求。

威胁案例：LeftoverLocals 漏洞（CVE-2023-4969）

案例摘要

2024 年 1 月，Trail of Bits 安全团队披露了名为 LeftoverLocals 的 GPU 安全漏洞。
该漏洞影响 Apple、Qualcomm、AMD 和 Imagination 等厂商的多款 GPU，其根本原因是：

GPU 在内核执行结束后未清空本地内存（local memory），导致后续进程可读取前一进程残留数据。

关键事实：

Local memory 是一块软件可控的高速缓存（类似 CPU 的 L1 Cache），容量通常为 16–64 KB/计算单元。
即使两个进程属于不同用户、不同容器或不同 App，只要共享同一物理 GPU，攻击者即可窃取数据。
实测在 AMD Radeon RX 7900 XT 上，单次内核调用可泄露约 5.5 MB 本地内存；运行 LLM 查询时累计泄露达 181 MB，足以高精度重构模型输出。

漏洞详情：https://blog.trailofbits.com/2024/01/16/leftoverlocals-listening-to-llm-responses-through-leaked-gpu-local-memory/

案例分析

1. 攻击场景

攻击者可在以下环境中实施窃听：

本地多用户系统：普通用户进程窃取另一用户正在运行的 LLM（如 llama.cpp）的私密对话结果。
云多租户环境：同一物理 GPU 上的恶意虚拟机或容器窃取邻近租户的 AI 推理输出。
移动设备：恶意 App 在后台或快速切换至前台时，读取其他 App（如 AI 助手）使用 GPU 的残留数据。

2. 验证过程（PoC 核心逻辑）

2.1 写入者（The Writer）

写入测试标记值（如 123）到本地内存：

__kernel void writer(__global volatile int *canary) {local volatile int lm[LM_SIZE];for (uint i = get_local_id(0); i < LM_SIZE; i += get_local_size(0)) {lm[i] = canary[i];}
}

2.2 监听者（The Listener）

读取未初始化的本地内存并转存至全局内存供 CPU 分析：

__kernel void listener(__global volatile int *dump) {local volatile int lm[LM_SIZE];for (int i = get_local_id(0); i < LM_SIZE; i += get_local_size(0)) {dump[((LM_SIZE * get_group_id(0)) + i)] = lm[i];}
}

注：使用 volatile 关键字防止编译器优化掉未定义行为的内存访问。

验证逻辑：

写入者与监听者分别由不同用户、容器或 App 启动；
若监听者能稳定读取写入者的标记值，则判定该平台存在 LeftoverLocals 漏洞。

3. 监听 LLM 响应（高级利用）

攻击分两步实现对 LLM 输出的高保真窃听：

模型指纹提取
- 攻击者多次监听 GPU 本地内存，收集各层线性代数运算（如 GEMM）的权重与输入片段；
- 累计约 80 MB 数据足以匹配 Hugging Face 等开源模型库，精准识别受害者使用的模型（如 wizardLM-7B）。
输出层窃取
- LLM 最后一层为矩阵-向量乘法（MatVec），其输入向量较小（约 4 KB）且完整驻留本地内存；
- 攻击者通过特征识别（如“4KB 浮点数组前后为零”）定位输出层数据；
- 结合已知模型权重，本地重算输出 logits，还原原始 token 响应。

尽管存在重复 token、缺失 token 或语义相近误判（如“Google”→“Facebook”），整体窃听准确率仍足以泄露敏感内容。

4. 消减与修复建议

厂商	修复状态与建议
Apple	A17 / M3 系列已修复；建议升级至 iOS 17.3 / macOS 14.3 或更高版本。
AMD	仍在调查；建议关注官方安全公告（参考漏洞 ID: AMD-SE-2023-01）。
Qualcomm	部分设备已通过 Firmware v2.07 修复；建议用户及时安装 OEM 提供的安全更新。
Imagination	DDK 23.3 版本已包含修复。
NVIDIA / Intel / Arm	经测试未受影响，因其驱动或硬件默认清零本地内存。

通用编程防御（适用于所有开发者）：
在 GPU 内核结束前显式清零本地内存：

__kernel void safe_kernel(...) {local float buffer[64];// ... 正常计算逻辑 ...// 退出前清零，防止数据泄露for (int i = 0; i < 64; i++) {buffer[i] = 0.0f;}
}

注意：需使用 volatile 或编译器屏障防止优化删除清零操作。

总结

LeftoverLocals 揭示了当前 GPU 生态在进程隔离与内存安全方面的严重缺失。
尤其在大模型本地部署、边缘 AI、多租户云推理等趋势下，GPU 本地内存泄露已成为新型供应链攻击面。

查看全文

http://www.rkmt.cn/news/69040.html

2025年12月AI SEO优化公司推荐：解锁智能搜索流量新密码

2025年12月ChatGPT优化排名公司推荐

2025年AI教育培训课程推荐榜：覆盖AI培训全场景指南

2025年12月西安装修家装公司TOP5推荐：老房翻新/室内设计优选企业

模切机厂家有哪些？国内知名企业推荐

Webpack/Vite等构建工具打包后，线上代码报错但本地正常，怎么办？

哪些品牌的妇科炎症外用药效果好

2025年热镀锌带钢口碑厂家TOP10，实力见证，镀锌打包扣/镀锌打包钢带/烤漆打包带/冷镀锌打包带/打包铁条热镀锌带钢生产厂家

漆面保护膜品牌公司排名：国内优质车膜品牌推荐

推荐专业的北京离婚财产纠纷律师及服务解析

推荐靠谱的车衣品牌：市场热门选择及特点解析

争取孩子抚养权找哪个律师靠谱？专业选择参考

北京口碑好的涉外离婚律师选择指南与实务解析

哪些AI企业有投资价值？聚焦行业潜力标的

第十周第三天10.3

北京知名婚姻律所推荐：聚焦婚姻家事法律服务机构

国内游旅行社哪家有优惠活动？2025年热门选择参考

OOP实验四

2025 十大艺术涂料厂家推荐：品质与美学的巅峰对决

2025年最新垃圾分类设备厂家TOP5优选指南

专业的工作手机推荐：红鹰工作手机专业靠谱之选

CentOS9上Let’s Encrypt自动续签

微波烘干设备哪家好？国内优质企业及业务特点解析

高频使用的adb命令二

2025 教培系统科普指南：十大优质工具助力机构数字化转型

2025年原创家具品牌TOP10推荐：谁更懂高端与轻奢？

2025年内豆包AI营销服务商排行榜，专业豆包AI营销数字服务商

详细介绍：jmeter --＞后置处理器 --＞ BeanShell后置处理程序

安防监控EasyCVR视频汇聚平台RTSP流播放异常的原因排查