当前位置: 首页 > news >正文

CANN/asc-devkit矩阵计算实践

Matrix Compute Practices 样例介绍

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

概述

基于 Matrix Compute API 的矩阵计算优化样例,通过<<<>>>直调方式,介绍 Matmul 与 MxFP4 Matmul 在高阶 API、基础 API、Tensor API 场景下的高性能实践。

样例列表

目录名称功能描述支持的产品
matmul_high_performanceMatmul 高阶 API 递进式性能优化样例,展示多核切分、MDL、L1/L2 Cache、常量 tiling、UnitFlag 等优化方法。Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
matmul_basic_api_high_performanceMatmul 基础 API 最佳实践样例,基于静态 Tensor 编程展示基础 API 下的高性能实现细节。Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
matmul_mxfp4_high_performanceMxFP4 Matmul 高阶 API 性能调优样例,展示常量化 tiling 与 scale 数据搬运优化方法。Ascend 950PR / Ascend 950DT
matmul_mxfp4_basic_api_high_performanceMxFP4 Matmul 基础 API 高性能样例,基于静态 Tensor 编程展示已验证的基础 API 实现路径。Ascend 950PR / Ascend 950DT
matmul_mxfp4_tensor_api_high_performanceMxFP4 Matmul Tensor API 高性能样例,基于静态 Tensor 编程展示已验证的 Tensor API 实现路径。Ascend 950PR / Ascend 950DT

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.rkmt.cn/news/1430137.html

相关文章:

  • AI服务合规生死线:Gemini条款生成必须绕过的7个致命漏洞(2024最新监管判例实录)
  • HarmonyOS SnapshotUtil 窗口截图与系统截屏监听:snapshot() 和 onSnapshotListener 详解
  • 创业者必看:柳州螺蛳粉技术培训哪家靠谱?实力全测评 - 资讯纵览
  • 告别密密麻麻!ECharts饼图图例太多怎么优雅分页?scroll配置全解析
  • ControlNet-XS with Stable Diffusion XL完全指南:从安装到生成高质量图像的简单教程
  • 三协议合一:如何用LuckyLilliaBot打造你的全能QQ机器人助手
  • xss-filters实战教程:保护HTML数据与属性的10个最佳实践
  • 鸣潮自动化工具终极指南:如何实现后台智能战斗与资源收集
  • 基于ESP8266与PI算法的公交车智能限速系统设计与实现
  • 日喀则本地专业防水TOP5靠谱推荐:家里漏水不用愁,免费上门不求人。本地最新防水企业资讯:专业师傅持证上门,收费透明无隐藏收费,质保5-10年,售后有保障 - 企业资讯
  • 如何零成本将3D视频变2D?VR-Reversal让你告别VR设备也能享受沉浸体验
  • 房地产AI合规红线清单(含住建部新规+GDPR+生成式AI备案要求),错过即停用
  • 西安本地专业防水TOP5靠谱推荐:家里漏水不用愁,免费上门不求人。本地最新防水企业资讯:专业师傅持证上门,收费透明无隐藏收费,质保5-10年,售后有保障 - 企业资讯
  • CatPPT部署实战:从本地环境到云端服务的完整配置指南
  • 为什么选择StableDiffusionXL_instruct_pix2pix?对比其他AI图像编辑工具的10大优势
  • 【Gemini安全审计报告深度解密】:20年攻防专家亲授3大高危漏洞识别法与72小时应急响应清单
  • 终极指南:如何用HS2-HF_Patch一键解决Honey Select 2所有烦恼
  • GPT2_PMC部署实战:从模型加载到API服务的完整教程
  • 中国(甘肃)-哈萨克斯坦特色产业合作对接会在兰举行
  • 医院商用净水服务商哪家专业:深度专业实力解析 - 19120507004
  • 【车辆SLAM】Rao-Blackwellized粒子滤波器两辆自动驾驶车辆的协作SLAM(距离承载、仅方位、数据关联 全EKF SLAM配合传感器融合策略)【含Matlab源码 1
  • 如何快速上手bert-large-portuguese-cased:5分钟葡萄牙语NLP入门教程
  • 曲靖本地专业防水TOP5靠谱推荐:家里漏水不用愁,免费上门不求人。本地最新防水企业资讯:专业师傅持证上门,收费透明无隐藏收费,质保5-10年,售后有保障 - 企业资讯
  • Aya-101安全与偏见评估:多语言环境下的AI伦理挑战
  • 荆州本地专业防水TOP5靠谱推荐:家里漏水不用愁,免费上门不求人。本地最新防水企业资讯:专业师傅持证上门,收费透明无隐藏收费,质保5-10年,售后有保障 - 企业资讯
  • 终极指南:如何在Ollama中部署Qwen3-235B-A22B-Thinking-2507-FP8推理模型
  • 高并发实战:河南豫爱驿站婚恋服务有限公司直播相亲系统的流媒体架构与流量分发策略
  • 具身智能问题边界:不是学科拼盘,而是新问题边界具
  • 医院商用净水服务商哪家服务好:官方服务榜单测评 - 13724980961
  • HRNet-W18图像分类模型完全指南:21.3M参数的高分辨率表示学习神器