尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

CANN/GE LLM-DataDist PullKvCache接口

CANN/GE LLM-DataDist PullKvCache接口
📅 发布时间:2026/6/20 11:28:55

PullKvCache

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

产品支持情况

产品是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品√
Atlas A2 推理系列产品√
Atlas A2 训练系列产品x

函数功能

从远端节点拉取Cache到本地Cache,仅当角色为Decoder时可调用。

函数原型

Status PullKvCache(const CacheIndex &src_cache_index, const Cache &dst_cache, uint32_t batch_index = 0U, int64_t size = -1, const KvCacheExtParam &ext_param = {})

参数说明

参数名称输入/输出取值说明
src_cache_index输入远端源Cache的索引。
dst_cache输入本地目的Cache。
batch_index输入本地目的batch的下标。
size输入设置为>0的整数,表示要拉取的大小。
或设置为-1,表示完整拉取。
默认为-1。
ext_param输入当前支持ext_param中src_layer_range的sencond与first的差值和dst_layer_range的sencond与first的差值一致。src_layer_range和dst_layer_range的first和second默认值都是-1,表示全部的层。取值范围都是[0, 最大可用层索引],且first小于等于second。 最大可用层索引值的计算公式如下。
(CacheDesc::num_tensors / KvCacheExtParam::tensor_num_per_layer) - 1
当前支持tensor_num_per_layer取值范围是[1, 当前cache的tensor总数],默认值为2。当src_layer_range或dst_layer_range取值为非默认值时, tensor_num_per_layer可以保持默认值,也可以输入其他值,输入其他值的时,tensor_num_per_layer的取值还需要被当前cache的tensor总数整除。

调用示例

CacheIndex cache_index; cache_index.cluster_id = 0; cache_index.cache_id = cached_tensors.cache_id; cache_index.batch_index = 0; Status ret = llm_datadist.PullKvCache(cache_index, cache)

返回值

  • LLM_SUCCESS:成功
  • LLM_PARAM_INVALID:参数错误
  • LLM_NOT_YET_LINK:与远端cluster没有建链
  • LLM_TIMEOUT:拉取超时
  • LLM_KV_CACHE_NOT_EXIST:本地或远端KV Cache不存在
  • 其他:失败

约束说明

该接口调用之前,需要先调用Initialize接口完成初始化。dst_cache必须为AllocateCache接口申请出的Cache。

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关新闻

  • C语言数学库深度解析:从误差函数到指数运算的工程实践
  • 五金轻微磨损不恶意折价,青岛同城包包回收亲测透明交易指南 - 讯息早知道
  • 异地工作不用返乡线下授课,2026 电大中专全线上学习毕业新规出炉 - cc江江

最新新闻

  • 快速部署!2026 OpenClaw Windows 一键安装,稳定不卡顿
  • Cesium 键盘控制飞行教程 | WebGL·源码三维可视化源码
  • spss ultra算法免费数据分析平台
  • 2026唐山本地正规瓷砖空鼓维修服务商盘点|无损免拆砖修复,全域上门售后有保障 - 宅安选房屋修缮
  • emWin内存设备与GUI_MEMDEV_SetDrawMemdev16bppFunc深度优化指南
  • 2026青岛防水行业标杆测评!楼长修楼红色合伙人优势解读 - 青岛防水品牌推荐

日新闻

  • 信任的进化:技术实现详解——如何用JavaScript构建博弈论模拟器
  • Terrakube自定义工作流:如何集成OPA、Infracost等工具扩展IaC能力
  • grunt-concurrent快速入门:5分钟学会并行运行Grunt任务

周新闻

  • 3步解锁iOS设备:applera1n激活锁绕过完全指南
  • 39 2026 人工智能证书终极盘点,普通人选 AI 证书可以从这些方向入手
  • Redis 暴露公网有多危险?从端口检查到补救步骤

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号