尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

CANN/asc-devkit Exp函数API

CANN/asc-devkit Exp函数API
📅 发布时间:2026/6/20 22:54:18

Exp

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

  • Ascend 950PR/Ascend 950DT:支持
  • Atlas A3 训练系列产品/Atlas A3 推理系列产品:不支持
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品:不支持
  • Atlas 200I/500 A2 推理产品:不支持
  • Atlas 推理系列产品AI Core:不支持
  • Atlas 推理系列产品Vector Core:不支持
  • Atlas 训练系列产品:不支持

功能说明

头文件路径:"basic_api/reg_compute/kernel_reg_compute_vec_unary_intf.h"。

该接口根据mask,对源操作数srcReg进行按元素指数操作,将结果写入目的操作数dstReg。计算公式如下:

$$dstReg_i = e^{srcReg_i}$$

函数原型

template <typename T = DefaultType, auto mode = MaskMergeMode::ZEROING, typename U> __simd_callee__ inline void Exp(U& dstReg, U& srcReg, MaskReg& mask)

参数说明

表 1模板参数说明

参数名描述
T操作数数据类型。支持的数据类型请参考数据类型。
mode可配置为MaskMergeMode枚举类型的枚举或ExpSpecificMode的结构体指针。
• MaskMergeMode,选择MERGING模式或ZEROING模式。
• ZEROING模式下,mask未筛选的元素在dstReg中置零。
• MERGING模式当前不支持。
• ExpSpecificMode,定义如下:
enum class ExpAlgo {
INTRINSIC = 0,
PRECISION_1ULP_FTZ_TRUE,
PRECISION_1ULP_FTZ_FALSE,
};
struct ExpSpecificMode{
MaskMergeMode mrgMode = MaskMergeMode::ZEROING,
ExpAlgo algo = ExpAlgo::INTRINSIC;
};
• mrgMode:选择MERGING模式或ZEROING模式。
• algo:用于配置Subnormal模式,具体参考关键特性说明。
• ExpAlgo::INTRINSIC、ExpAlgo::PRECISION_1ULP_FTZ_TRUE,使用单指令计算得出结果,所有Subnormal被近似为0。
• ExpAlgo::PRECISION_1ULP_FTZ_FALSE,支持Subnormal数据计算。
U源操作数和目的操作数的RegTensor类型,例如RegTensor<half>,由编译器自动推导,用户不需要填写。

表 2参数说明

参数名输入/输出描述
dstReg输出目的操作数。
类型为RegTensor。
srcReg输入源操作数。
类型为RegTensor。
mask输入源操作数元素操作的有效指示,详细说明请参考MaskReg。

数据类型

目的操作数与源操作数的数据类型需要保持一致。支持的数据类型为:half、float。

返回值说明

无

约束说明

无

关键特性说明

最大精度误差:

  • ExpAlgo::INTRINSIC、ExpAlgo::PRECISION_1ULP_FTZ_TRUE、ExpAlgo::PRECISION_1ULP_FTZ_FALSE,最大精度误差为1ULP。
  • ExpAlgo::PRECISION_1ULP_FTZ_FALSE,最大精度误差为1ULP。

配置Subnormal模式:
FTZ(Flush To Zero):一种浮点运算模式,当结果为Subnormal时,将其直接清零(近似为0),而非保留其精确的微小数值。
只有将algo设置为ExpAlgo::PRECISION_1ULP_FTZ_FALSE时,Exp接口才会保留并正确输出Subnormal结果;其他模式下Subnormal均被FTZ。
一般场景推荐使用性能更好的ExpAlgo::INTRINSIC、ExpAlgo::PRECISION_1ULP_FTZ_TRUE;需要精确 Subnormal输出的场景(如特定数据精度要求的算法、避免除零错误)使用ExpAlgo::PRECISION_1ULP_FTZ_FALSE。

表 3Exp Subnormal示例

输出输入输出二进制输入二进制数据类型
6.0975551605e-05-9.7031250 00000 11111111111 10010 0011011010half
5.9604644775e-08-16.6406250 00000 00000000011 10011 0000101001half
1.1754942107e-38-87.33654785156250 00000000 111111111111111111111111 10000101 01011101010110001010000float
1.401298464324817e-45-103.27893066406250 00000000 000000000000000000000011 10000101 10011101000111011010000float

调用示例

template<typename T> __simd_vf__ inline void ExpVF(__ubuf__ T* dstAddr, __ubuf__ T* srcAddr, uint32_t count, uint16_t oneRepeatSize, uint16_t repeatTimes) { AscendC::Reg::RegTensor<T> srcReg; AscendC::Reg::RegTensor<T> dstReg; AscendC::Reg::MaskReg mask; // Subnormal模式 // static constexpr AscendC::Reg::ExpSpecificMode mode = {Reg::MaskMergeMode::ZEROING, ExpAlgo::PRECISION_1ULP_FTZ_FALSE}; for (uint16_t i = 0; i < repeatTimes; i++) { mask = AscendC::Reg::UpdateMask<T>(count); AscendC::Reg::LoadAlign(srcReg, srcAddr + i * oneRepeatSize); AscendC::Reg::Exp(dstReg, srcReg, mask); // Subnormal模式 // AscendC::Reg::Exp<T, &mode>(dstReg, srcReg, mask); AscendC::Reg::StoreAlign(dstAddr + i * oneRepeatSize, dstReg, mask); } }

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关新闻

  • Binding库单元测试终极指南:如何编写可靠的绑定测试用例
  • 2026年中国出海展会展台设计搭建服务商选型指南 覆盖美洲欧洲东南亚非洲中东市场 - 寻茫精选
  • 2026找汕头代理记账公司,这5个关键点你必须知道! - 企业品牌

最新新闻

  • 形式化方法与大象thinking in uml 读书总结
  • D2DX:三步解决《暗黑破坏神2》在现代Windows上的三大核心痛点
  • 5分钟打造完美暗黑2角色:d2s-editor免费存档编辑器完全指南
  • 中兴光猫权限解锁工具:zteOnu完整使用指南与教程
  • CNN实战:古籍日文字符识别中的数据挑战与模型调优
  • 2026临沂漏水检测维修本地口碑防水商家榜单:厨卫/阳台/屋面/地下室渗漏水维修,持证施工+明码实价,防水补漏公司TOP5推荐 - 即刻修防水

日新闻

  • Visual C++运行库修复终极指南:5分钟快速解决Windows软件启动错误
  • 手把手教你构建统计局地区经济数据爬虫:从环境搭建到数据持久化全指南
  • 2026多Agent深度解析:用AI团队替代单一模型,四种架构实战落地

周新闻

  • Visual C++运行库修复终极指南:5分钟快速解决Windows软件启动错误
  • 手把手教你构建统计局地区经济数据爬虫:从环境搭建到数据持久化全指南
  • 2026多Agent深度解析:用AI团队替代单一模型,四种架构实战落地

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号