尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

CANN/ge LLM-DataDist错误码

CANN/ge LLM-DataDist错误码
📅 发布时间:2026/7/4 6:36:28

# error-code

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

error-code是通过如下宏定义的。

namespace llm_datadist { constexpr Status LLM_SUCCESS = 0x0U; constexpr Status LLM_FAILED = 0xFFFFFFFFU; constexpr Status LLM_WAIT_PROC_TIMEOUT = 0x5010B001U; constexpr Status LLM_KV_CACHE_NOT_EXIST = 0x5010B002U; constexpr Status LLM_PARAM_INVALID = 0x5010B005U; constexpr Status LLM_NOT_YET_LINK = 0x5010B007U; constexpr Status LLM_ALREADY_LINK = 0x5010B008U; constexpr Status LLM_LINK_FAILED = 0x5010B009U; constexpr Status LLM_UNLINK_FAILED = 0x5010B00AU; constexpr Status LLM_NOTIFY_PROMPT_UNLINK_FAILED = 0x5010B00BU; constexpr Status LLM_CLUSTER_NUM_EXCEED_LIMIT = 0x5010B00CU; constexpr Status LLM_PROCESSING_LINK = 0x5010B00DU; constexpr Status LLM_DEVICE_OUT_OF_MEMORY = 0x5010B00EU; constexpr Status LLM_EXIST_LINK = 0x5010B018U; constexpr Status LLM_FEATURE_NOT_ENABLED = 0x5010B019U; constexpr Status LLM_TIMEOUT = 0x5010B01AU; constexpr Status LLM_LINK_BUSY = 0x5010B01BU; constexpr Status LLM_OUT_OF_MEMORY = 0x5010B01CU; } // namespace llm_datadist

具体error-code含义如下。

枚举值含义是否可恢复解决办法
LLM_SUCCESS成功无无
LLM_FAILED通用失败否保留现场,获取Host/Device日志,并备份。
LLM_WAIT_PROC_TIMEOUT处理超时是- 如果是PullKvCache、PullKvBlocks等传输相关接口报该错误,该链路不可恢复,需重新建链。
- 其他接口报该异常,加大超时时间并重试。
LLM_KV_CACHE_NOT_EXISTKV不存在是- 检查cache_id是否正确。
- 检查是否Cache已经释放。
- 检查对应全量侧报错日志中的请求是否完成。
- 检查是否存在重复拉取。
LLM_PARAM_INVALID参数错误是基于日志排查错误原因。
LLM_NOT_YET_LINK没有建链是上层排查Decode与Prompt建链情况。
LLM_ALREADY_LINK重复建链是上层排查Decode与Prompt建链情况。
LLM_LINK_FAILED建链失败是LinkLlmClusters第二个返回值中有该error-code时,需要检查对应集群之间的网络连接。
LLM_UNLINK_FAILED断链失败是UnlinkLlmClusters第二个返回值中有该error-code时,需要检查对应集群之间的网络连接。
LLM_NOTIFY_PROMPT_UNLINK_FAILED通知Prompt侧断链失败是1. 排查Decode与Prompt之间的网络连接。
2. 主动调Prompt侧的UnlinkLlmClusters接口清理残留资源。
LLM_CLUSTER_NUM_EXCEED_LIMIT集群数量超过限制是检查LinkLlmClusters和UnlinkLlmClusters传入参数,clusters数量不能超过16。
LLM_PROCESSING_LINK正在处理建链是当前正在执行建链或断链操作,请稍后再试。
LLM_DEVICE_OUT_OF_MEMORYDevice内存不足是检查申请的内存是否没有释放。
LLM_EXIST_LINK设置角色时,存在未释放的链接是检查在SetRole前是否已经调用UnlinkLlmClusters断开所有的链接。
LLM_FEATURE_NOT_ENABLED特性未使能是检查初始化LLM-DataDist时是否传入了必要option。
如果是SetRole时抛出该异常,排查初始化时是否设置了OPTION_ENABLE_SET_ROLE = "1"
LLM_TIMEOUT处理超时否保留现场,获取Host/Device日志,并备份。
LLM_LINK_BUSY链路忙是预留error-code,暂不会返回。
LLM_OUT_OF_MEMORY内存不足是检查内存池或系统内存是否充足。

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关新闻

  • 如何扩展eldarion-ajax:创建自定义处理器和事件监听器
  • Python三维数学建模
  • Autopilot-Notes:高精地图与SLAM技术的融合应用深度解析

最新新闻

  • 锂离子电池保护与BQ29200选型设计指南
  • 国产云平台高效处理大规模结构化数据实战
  • D-FOT源码解析:深入理解动态反馈优化框架的核心实现机制
  • 基于KMX63与PIC18F4550的嵌入式人机界面开发指南
  • Qwen3.6在vLLM与SGLang上的部署差异与选型指南
  • 基于Zero-DCE和PyQt5的低光照图像增强系统开发

日新闻

  • STM32F745VG与MC6470 IMU的高性能姿态控制系统设计
  • 机器不消费,人何以生存
  • AI项目操作手册编写规范与最佳实践

周新闻

  • Windows字体自定义终极方案:No!! MeiryoUI完全指南
  • Deepin Boot Maker:告别命令行,3分钟制作Linux启动盘的智能解决方案
  • Plain Craft Launcher 2:重新定义你的Minecraft游戏体验

月新闻

  • 2026年6月公司网站搭建最新热门渠道测评:四大低成本/零代码平台对比+避坑
  • 【Linux】Linux arm 编译QT程序,出现expected “}“报错
  • 【MATLAB例程】四基站二维AOA定位与距离辅助增强对比仿真。基于角度观测和测距修正的固定目标平面定位精度分析

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号