当前位置：首页 > news >正文

别再折腾了！手把手教你解决PyTorch CUDA报错：no kernel image is available for execution on the device

news 2026/6/6 19:01:04

彻底解决PyTorch CUDA报错：no kernel image is available for execution on the device

当你满怀期待地安装好PyTorch，准备开始深度学习之旅时，突然遇到RuntimeError: CUDA error: no kernel image is available for execution on the device这个错误，确实令人沮丧。特别是当torch.cuda.is_available()返回True，让你以为一切正常时，这个错误更显得莫名其妙。本文将带你一步步理解问题根源，并提供切实可行的解决方案。

1. 理解错误背后的原因

这个错误的核心在于显卡计算能力(Compute Capability)与PyTorch预编译二进制包支持的计算能力列表不匹配。简单来说，你的显卡太"老"了，而安装的PyTorch版本太"新"。

计算能力是NVIDIA显卡的一个重要指标，用sm_xx表示，例如sm_35表示计算能力3.5。PyTorch的每个预编译版本都会明确支持哪些计算能力的显卡。如果你的显卡计算能力不在PyTorch版本的支持列表中，就会出现这个错误。

常见的老显卡及其计算能力：

GeForce 920M: 3.5
GeForce 940M: 5.0
GeForce GTX 750 Ti: 5.0
GeForce GTX 960M: 5.0

2. 如何查询显卡计算能力

方法一：使用NVIDIA官方工具

打开命令提示符(Windows)或终端(Linux/Mac)
导航到CUDA安装目录下的demo_suite文件夹：
```
cd "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\vX.X\extras\demo_suite"
```
其中X.X是你的CUDA版本号
运行deviceQuery工具：
```
deviceQuery
```
在输出中查找"CUDA Capability Major/Minor version number"，例如"3.5"表示计算能力3.5

方法二：查阅NVIDIA官方文档

访问NVIDIA官方计算能力表格： https://developer.nvidia.com/cuda-gpus

在页面中找到你的显卡型号，查看对应的计算能力。

3. 选择合适的PyTorch版本

知道了显卡计算能力后，下一步是选择支持该计算能力的PyTorch版本。以下是针对常见老显卡的推荐版本组合：

显卡计算能力	推荐PyTorch版本	对应CUDA版本
3.5	1.3.1	9.2
5.0	1.7.1	10.2
5.2	1.8.1	11.1

提示：对于计算能力3.5的显卡(如GeForce 920M)，PyTorch 1.3.1 + CUDA 9.2是最稳定的组合。

4. 安装指定版本的PyTorch

使用conda安装

对于计算能力3.5的显卡：

conda install pytorch==1.3.1 torchvision==0.4.2 torchaudio==0.3.2 cudatoolkit=9.2 -c pytorch

对于计算能力5.0的显卡：

conda install pytorch==1.7.1 torchvision==0.8.2 torchaudio==0.7.2 cudatoolkit=10.2 -c pytorch

使用pip安装

对于计算能力3.5的显卡：

pip install torch==1.3.1+cu92 torchvision==0.4.2+cu92 -f https://download.pytorch.org/whl/torch_stable.html

对于计算能力5.0的显卡：

pip install torch==1.7.1+cu102 torchvision==0.8.2+cu102 torchaudio==0.7.2 -f https://download.pytorch.org/whl/torch_stable.html

5. 验证安装是否成功

安装完成后，运行以下Python代码验证：

import torch # 检查CUDA是否可用 print(torch.cuda.is_available()) # 应该返回True # 检查计算能力是否匹配 print(torch.cuda.get_arch_list()) # 应该包含你的显卡计算能力 # 尝试在GPU上创建张量 test_tensor = torch.tensor([1, 2, 3], device='cuda') print(test_tensor) # 应该能正常输出，不报错

6. 常见问题及解决方案

问题一：安装后仍然报错

可能原因：

系统中存在多个CUDA版本，PyTorch使用了错误的CUDA版本
虚拟环境中没有正确继承系统CUDA

解决方案：

确认环境变量CUDA_HOME指向正确的CUDA安装目录
在虚拟环境中重新安装与PyTorch版本匹配的cudatoolkit

问题二：需要更高版本的PyTorch功能

如果因为项目需求必须使用较新的PyTorch版本，可以考虑：

从源码编译PyTorch：在编译时添加对老显卡计算能力的支持
```
export TORCH_CUDA_ARCH_LIST="3.5 5.0 5.2" # 添加你需要的计算能力 python setup.py install
```
但这种方法耗时较长，且需要一定的技术基础。
使用Google Colab：Colab提供免费的GPU资源，通常是比较新的显卡

7. 性能优化建议

对于使用老显卡进行深度学习训练的用户，以下建议可以帮助提升体验：

减小batch size：老显卡显存有限，适当减小batch size可以避免内存不足

使用混合精度训练：虽然老显卡对FP16支持有限，但仍可以尝试：

scaler = torch.cuda.amp.GradScaler() with torch.cuda.amp.autocast(): outputs = model(inputs) loss = criterion(outputs, labels) scaler.scale(loss).backward() scaler.step(optimizer) scaler.update()

考虑模型轻量化：使用更小的模型架构，如MobileNet、EfficientNet等

8. 升级硬件前的过渡方案

如果你暂时无法升级显卡，但又需要使用较新的PyTorch功能，可以考虑以下替代方案：

CPU训练：虽然速度慢，但对于小模型和数据集仍然可行
```
device = torch.device('cpu') model.to(device)
```
云端GPU服务：如Google Colab、AWS EC2等，按需付费使用更强的GPU

模型量化：将模型参数从FP32转换为INT8，减少计算量和内存占用

model = torch.quantization.quantize_dynamic( model, {torch.nn.Linear}, dtype=torch.qint8 )

9. 长期解决方案规划

虽然降级PyTorch版本可以解决眼前的问题，但从长远来看，考虑以下方向更为可取：

显卡升级路线图：了解不同价位显卡的计算能力，制定升级计划
- 入门级：GTX 1660 (sm_75)
- 中端：RTX 3060 (sm_86)
- 高端：RTX 3090 (sm_86)
多设备开发策略：
- 本地使用老显卡进行原型开发和调试
- 云端使用强大GPU进行大规模训练

容器化开发环境：

FROM pytorch/pytorch:1.7.1-cuda10.2-cudnn7-runtime WORKDIR /workspace COPY . . RUN pip install -r requirements.txt

使用Docker可以确保环境一致性，避免版本冲突。

遇到这个问题时，最重要的是不要气馁。深度学习社区中有很多人都在使用各种配置的设备，通过合理的版本选择和优化，即使是老显卡也能发挥出不错的性能。

查看全文

http://www.rkmt.cn/news/1475024.html

实战指南：利用快马AI生成具备自动更新与静默安装功能的生产级软件安装包

一站式高效开源游戏编辑器：Harepacker-resurrected技术解析与实战指南

老显卡（如GTX 920M）玩转PyTorch GPU加速的终极指南：从算力查询到版本匹配

2026年6月武汉奢侈品回收分级评分：S/A/B三级实测，谁才是真正的实力派？ - 薛定谔的梨花猫

Android 11权限适配：从‘单次授权’到‘软件包可见性’，一份给老项目的避坑清单

青岛找靠谱防水师傅，老牌防水机构楼长修楼全城快速上门 - 青岛防水品牌推荐

TikTok短视频生成工具哪家好？跨境出海如何用 AI 实现爆款视频复刻

Orca 2：小语言模型推理能力提升的结构化教学法

Flowable任务监听器实战：如何动态分配审批人？以Create监听器为例

STM32串口DMA接收数据只收一次？别急着改循环模式，先检查这个中断处理细节

别再复制粘贴了！手把手教你从源码编译安装Google glog到Ubuntu 22.04

Umi-OCR终极指南：5分钟掌握免费开源离线OCR文字识别工具

高校课程设计可用的废品回收微信小程序源码（含云函数+完整页面）

博弈论重构PCA：面向加密市场策略建模的特征降维新范式

终极宝可梦随机化工具教程：Universal Pokemon Randomizer ZX 完全指南

武汉品牌首饰回收分级评分榜（2026年6月实测）：谁是你的S级选择？ - 薛定谔的梨花猫

【2026年6月深度实测】宁波本地防水堵漏企业名录｜宁波卫生间屋顶防水维修商家宁波靠谱防水补漏公司推荐，卫生间免砸砖/外墙/楼顶/地下室/阳光房渗漏修缮靠谱品牌盘点 - 防水空鼓维修家

出国探亲必办！亲属关系公证海牙认证线上办理全攻略与要点 - 速递信息

2026西安黄金回收价格解密看懂大盘行情，卖黄金比别人多赚钱 - 奢侈品回收测评

2025 年 8 次飞行实测 5 款耳机：谁才是航空旅行与度假的最佳伴侣？

别再手动改参数了！用Comsol参数化扫描，5分钟搞定反应器多工况分析

大连奢侈品黄金回收排名连锁实体合规高价变现安全有保障 - 奢侈品回收评测

终极Windows内存清理指南：用Mem Reduct让旧电脑重获新生 [特殊字符]

离线安装dify 1.7

Amber模拟含膜体系，从力场选择到盒子设置：我的lipid14/17实战踩坑与避坑全记录

ABAP开发避坑指南：获取表字段和内表结构的3种方法对比与实战选型

零基础新手必看：在快马平台轻松创建你的第一个md文件编辑器

MAX7219驱动8位数码管：从硬件连接到软件驱动的完整指南

STM32 SPI驱动W25Q64避坑指南：从ID读取到跨页写入的完整流程