尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

CANN/mat-chem-sim-pred SOPDT基准测试报告

CANN/mat-chem-sim-pred SOPDT基准测试报告
📅 发布时间:2026/7/4 7:19:27

PidSopdtBasisGemmFit 测试报告

【免费下载链接】mat-chem-sim-pred面向工业领域,聚焦计算仿真、预测两大核心场景,构建面向流程工业"机理+数据"双轮驱动的领域计算层,推动AI for Science在材料化学领域的深度应用。项目地址: https://gitcode.com/cann/mat-chem-sim-pred

测试环境

  • 设备:Ascend910B3,device 3
  • 机器:node202
  • 构建:cmake -S . -B build -DCMAKE_BUILD_TYPE=Release -DSOC_VERSION=Ascend910B3
  • CPU 基线:64 线程完整 fit,包含dot = y_centered @ basis_t和 best reduce

测试命令

source /usr/local/Ascend/ascend-toolkit/set_env.sh cd prediction/ProcessControl/PIDModelFit/pid_sopdt_basis_gemm_fit cmake -S . -B build -DCMAKE_BUILD_TYPE=Release -DSOC_VERSION=Ascend910B3 cmake --build build -j 2 export LD_LIBRARY_PATH="$PWD/build:$PWD/build/lib:${LD_LIBRARY_PATH:-}" ./build/test_aclnn_pid_sopdt_basis_gemm_fit 3 ./build/benchmark_pid_sopdt_basis_gemm_pipeline 3 64 1024 256 5 2 64

正确性

smoke 已通过:

PidSopdtBasisGemmFit smoke best_sse=[1, 12] best_k=[1.5, 2] best_idx=[2, 1] PASSED

pipeline benchmark 与 CPU reference 对比:

max_abs_sse=0.00378418 max_rel_sse=0.00378418 max_abs_k=1.54972e-06 idx_diff_count=0

性能结果

B=64,N=1024,M=256:

口径耗时对 CPU 64T 加速比
CPU 64T 完整 fit10.3824 ms1.00x
NPU resident e2e0.166816 ms62.24x
NPU cold e2e0.406088 ms25.57x

口径说明

  • resident e2e:输入已在 Device,只统计aclnnMatmul + custom reduce + best result D2H。
  • cold e2e:统计输入 H2D、aclnnMatmul + custom reduce和 best result D2H。
  • dot[B, M]常驻 Device,不回传 Host,直接作为 reduce 算子的输入。

结论

SOPDT 候选空间通常比 FOPDT/IPDT 更大,更适合矩阵化MatMul + reducepipeline。当前实测显示 SOPDT pipeline 在 resident 和 cold e2e 两种口径下均显著快于 CPU 64 线程完整 fit。

【免费下载链接】mat-chem-sim-pred面向工业领域,聚焦计算仿真、预测两大核心场景,构建面向流程工业"机理+数据"双轮驱动的领域计算层,推动AI for Science在材料化学领域的深度应用。项目地址: https://gitcode.com/cann/mat-chem-sim-pred

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关新闻

  • GPT-5 不存在?揭穿AI模型代际炒作真相
  • CANN/ge Shape类API文档
  • Elm-platform安全指南:确保Elm应用安全性的最佳实践

最新新闻

  • 深入解析DES算法:从Feistel网络到C语言实现
  • Enchanted架构解析:构建跨平台私有化LLM聊天应用的技术实践
  • CANN/GE Python内存分配器API
  • Duix.Avatar本地部署实战:打造属于你的AI数字人工作室
  • IpaDownloadTool使用技巧:二维码扫描与URL Scheme深度应用
  • Each定时器库深度解析:为什么它是Swift开发者必备的10个理由

日新闻

  • STM32F745VG与MC6470 IMU的高性能姿态控制系统设计
  • 机器不消费,人何以生存
  • AI项目操作手册编写规范与最佳实践

周新闻

  • Windows字体自定义终极方案:No!! MeiryoUI完全指南
  • Deepin Boot Maker:告别命令行,3分钟制作Linux启动盘的智能解决方案
  • Plain Craft Launcher 2:重新定义你的Minecraft游戏体验

月新闻

  • 2026年6月公司网站搭建最新热门渠道测评:四大低成本/零代码平台对比+避坑
  • 【Linux】Linux arm 编译QT程序,出现expected “}“报错
  • 【MATLAB例程】四基站二维AOA定位与距离辅助增强对比仿真。基于角度观测和测距修正的固定目标平面定位精度分析

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号