当前位置: 首页 > news >正文

【Triton 教程】triton_language.store

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境,以高效编写自定义 DNN 计算内核,并能够在现代 GPU 硬件上以最大吞吐量运行。

更多 Triton 中文文档可访问 →triton.hyper.ai/

triton.language.store(pointer, value, mask=None, boundary_check=(), cache_modifier='', eviction_policy='')

将数据张量存储到由指针定义的内存位置。

1.如果pointer是单元素指针,则加载 1 个标量。在这种情况下:

  • mask必须是标量,
  • boundary_checkpadding_option必须为空。

2.如果pointer是 1 个 N 维指针张量,则会存储 1 个 N 维张量。在这种情况下:

  • mask会被隐式地广播到pointer.shape
  • boundary_check必须为空。

3.如果pointer是由make_block_ptr定义的块指针,则会存储 1 个张量。在这种情况下:

  • mask必须为None
  • 可以指定boundary_check以控制越界访问的行为。

value会被隐式地广播为pointer.shape,并转换为pointer.element_ty类型。

参数**:**

  • pointer(triton.PointerType, 或 dtype=triton.PointerType 的块) - 存储 value 元素的内存位置。
  • value(Block) - 要存储的元素张量。
  • masktriton.int1 的块,可选)- 如果 mask[idx] 为 false,则不将 value[idx] 存储在 pointer[idx] 处。
  • boundary_check整数元组,可选)- 整数元组,表示应该进行边界检查的维度。
  • cache_modifier(str,可选,应为 {“”(空字符串)、“.wb”(表示缓存回写所有一致性层级)、“.cg”(表示全局缓存)、“.cs”(表示缓存流)、“.wt”(表示缓存直写)} 中的一个)更多详情请参见缓存操作符)—— 在 NVIDIA PTX 中更改缓存选项。
  • eviction_policystr可选应为 {“”, “evict_first”, “evict_last”} 中的一个)- 更改 NVIDIA PTX 中的驱逐策略。

这个函数也可作为tensor的成员函数调用,使用x.store(...)方式而不是store(x, ...)

http://www.rkmt.cn/news/159191.html

相关文章:

  • linux上面能对pdf注释嘛?推荐Okular,亲测好用
  • 机器人自主学习新技巧:强化学习的革命
  • LuatOS平台下USB系统可靠性设计:硬件基础与开发进阶!
  • 基于正弦余弦算法-LSSVM的电涡流传感器温度补偿方法附Matlab代码
  • 动态可视化报告制作:DeepSeek+Mermaid生成交互式流程图/甘特图
  • 高中语法练习解析100篇-005-Huaweis Green 5G Development Strategy 华为的绿色5G发展战略 - new
  • 计算机毕设项目之基于Springboot vue的社区养老服务小程序
  • 具有多种最大功率点跟踪(MPPT)方法的光伏发电系统(PO-增量法-人工神经网络-模糊逻辑控制-粒子群优化)之使用粒子群算法的最大功率点追踪(MPPT)(Simulink仿真实现)
  • Simulink风储调频:风机混合储能电池与超级电容储能联合一次调频的系统频率特性研究
  • 【配送路径规划】基于鳄鱼伏击算法CAOA求解带时间窗的骑手外卖配送路径规划问题(目标函数:最优路径成本 含服务客户数量 服务时间 载量 路径长度)附Matlab代码
  • 义乌企业出海首选三家服务商 助力香港公司高效合规注册
  • rk3588变频策略等参数 - M
  • 【电力系统优化调度】计及源荷两侧不确定性的含风电电力系统低碳调度(Matlab代码实现)
  • 存储压缩:不是“挤水分”,而是让数据“轻装上阵
  • zz为什么样本方差无偏估计要除以n-1
  • 基于IWOA-GRNN的激光熔覆质量预测建模方法附Matlab代码
  • 基于大数据的教育评价与研究成果的可视化分析系统(毕设源码+文档)
  • 天猫代运营TP是什么意思?
  • Shopee店铺如何起一个好名字
  • 基于大数据的精品小说推荐与可视化分析系统(毕设源码+文档)
  • 基于Python的购物管理系统毕设源码+文档+讲解视频
  • P3195 [HNOI2008] 玩具装箱 斜率优化
  • 2025年12月绵阳米粉/米线加工厂综合比较 - 2025年品牌推荐榜
  • 2025年12月江苏徐州别墅庭院设计、屋顶花园设计、公园绿地设计、市政广场设计、生态园区设计服务商排行榜 - 2025年品牌推荐榜
  • R-CNN文献阅读笔记
  • PipProcessStartPhase3中的PpQueryCompatibleIDs和IopPnPDispatch函数分析以ftdisk.sys为例
  • 什么是 RESTful API?凭什么能流行 20 多年?
  • IRC协议:穿越时光的互联网实时聊天奠基者
  • ModelEngine测评——Aido在线Agent应用创建测试
  • 《ESP32-S3使用指南—IDF版 V1.6》第五十七章 乐鑫AI库简介