当前位置: 首页 > news >正文

CANN/catlass GEMV AIV搬运模板

TileCopyGemvAiv

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

代码位置

[TOC]

功能说明

TileCopyGemvAiv为 AIV(AI Vector)芯片提供 GEMV 搬运子组件的聚合模板。数据通路为 GM↔UB↔GM,引用 GEMV 专有的搬运组件。

  • 适用范围:AtlasA2
  • 不直接执行算子,以类型成员方式暴露子组件引用

模板原型

template <class ArchTag, class AType, class XType, class YType, class BiasType = void> struct TileCopyGemvAiv;
模板参数说明
ArchTag架构标签
ATypeA 矩阵类型GemmType<ElementA, RowMajor/ColumnMajor>
XTypeX 向量类型GemmType<ElementX, VectorLayout>
YTypeY 向量类型GemmType<ElementY, VectorLayout>
BiasType偏置类型,默认void

成员类型定义

成员类型对应子组件说明
VecCopyGmToUbGemv::Tile::VecCopyGmToUB向量 X: GM→UB
VecCopyUbToGmGemv::Tile::VecCopyUBToGm向量 Y: UB→GM(可选 atomic add)
MatrixCopyGmToUbGemv::Tile::MatrixCopyGmToUB矩阵 A: GM→UB

调用示例

#include "catlass/gemv/tile/tile_copy.hpp" using namespace Catlass::Gemv::Tile; using ElementA = half; using ElementX = half; using ElementY = half; using AType = Gemm::GemmType<ElementA, layout::RowMajor>; using XType = Gemm::GemmType<ElementX, layout::VectorLayout>; using YType = Gemm::GemmType<ElementY, layout::VectorLayout>; using Copy = TileCopyGemvAiv<Arch::AtlasA2, AType, XType, YType>; // 子组件: // typename Copy::VecCopyGmToUb // typename Copy::VecCopyUbToGm // typename Copy::MatrixCopyGmToUb

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.rkmt.cn/news/1426698.html

相关文章:

  • Windows右键菜单管理终极指南:如何快速掌握ContextMenuManager
  • XLMRoBERTa微调实战:huangjingwang/roberta-ner-multilingual模型训练全流程
  • 从状态机到运行时:聊聊 .NET 11 的 Runtime Async 和老 Async/Await 到底差在哪
  • 如何用ok-ww实现3倍效率提升:鸣潮自动化工具完全指南
  • PoE Overlay终极指南:3个核心功能解决流放之路玩家最头疼的三大问题
  • 2026 年广州装修公司推荐与行业避坑解析 - 商业新知
  • 2026年成都公司注销代办手续究竟是怎样的流程? - 企业推荐官
  • 华硕笔记本性能优化解决方案:G-Helper深度配置指南
  • 上海回升交通设施工程:宝山专业的热熔道路划线公司找哪家 - LYL仔仔
  • 3分钟搞定《空洞骑士》模组管理:Scarab开源工具让游戏增强变得简单
  • 武安市建龙废钢基地物资:曲周专业的建筑废料回收公司选哪家 - LYL仔仔
  • ML工程师与MLOps工程师:从模型研发到生产落地的角色分工与技能对比
  • 告别内存溢出!用Go的excelize/v2流式API处理百万行Excel数据实战
  • 2026 上新:西安名表回收 / 手表回收 - 出价高的店面排名观察 - 合扬奢侈品交易中心
  • 浙江高复学校名录2026全新整理!全省优质复读院校汇总,择校不踩坑【附联系方式】 - 品牌榜中榜
  • 路由器:网络世界里的“超级邮局局长“
  • 蜂鸟 E203 处理器内核优化模块 综合说明书(可拿去混毕业设计)
  • 2026年成都校园宣传片拍摄制作究竟是怎样的流程? - 企业推荐官
  • 金山区驾校选哪家更合适?3个实用维度帮你选对驾校 上海振安驾校金山区报名点地址:上海市金山区金山工业区市中路118号 招生电话:15301777936 - 企业推荐官【官方】
  • 别再只盯着电源了!有刷电机EMI整改,搞定电火花高频噪声才是关键(附实测频谱分析)
  • 湖北国泓环境工程:江岸正规的工程开荒公司有哪些 - LYL仔仔
  • 视频去水印软件哪个好用2026全场景工具适配与标准操作指南 - 科技热点发布
  • SpringBoot中的RESTfulAPI设计最佳实践
  • 极限性能基准Qwen3-235B-A22B-Thinking-2507-FP8:全面评测报告
  • 黄金、K金、铂金回收价差多少?2026年5月29日中山全品类回收指南,余生黄金回收一文讲透 - 润富黄金珠宝行
  • 2026年广州企业宣传片拍摄,到底哪家更值得选择? - 企业推荐官
  • DownKyi哔哩下载姬:轻松获取B站高清视频的终极解决方案
  • 别再手动启动Minio了!用Systemd在Ubuntu 22.04上配置开机自启服务(附用户权限管理)
  • AI与PTaaS:构建动态智能风险管理体系应对社交化网络威胁
  • 保姆级避坑指南:在RK3588上从零部署YOLOv5模型(含环境配置、模型转换全流程)