当前位置: 首页 > news >正文

打破手机跑大模型壁垒,面壁智能联合清华开源端侧新品BitCPM-CANN


面壁智能近日联合清华大学、OpenBMB开源社区,正式发布并开源了在低比特大模型训练方向的最新突破成果——BitCPM-CANN。该成果在华为昇腾平台上原生完成,标志着端侧AI大模型在轻量化与工程落地方面迈出了关键一步。

释放六倍显存红利打破硬件限制

本次开源的BitCPM-CANN包含0.5B、1B、3B、8B四个模型尺寸,与同尺寸全精度家族模型进行逐项对照评测,表现十分优异。相比传统BF16 精度,该模型在推理阶段能够释放约 6 倍的显存红利,让大模型运行的硬件门槛大幅降低。

对于手机产业而言, 6 倍的显存红利意味着原本对配置要求极高的8B参数级别大模型,如今也可以轻松流畅地运行在主流旗舰手机之上。这种对内存空间的极致释放,将直接加速端侧AI技术在移动设备上的普及与商用落地。

高能力保留率证实工程可复现性

在精简模型体积的同时,BitCPM-CANN依然保持了极高的性能水准,其模型能力保留率成功维持在90%至97.2%之间。其中,三个主要尺寸模型的能力保留率均达到了95.7%—97.2%,即使是体积最小的0.5B模型,其保留率也超过了90%。

这一亮眼的评测结果,系统性地证明了低比特训练技术路线具备极强的可扩展性与工程可复现性。面壁智能基于相关主干搭建了完整的低比特训练底座,涵盖环境适配、32K长序列支持及融合算子等完整工程体系,为后续面向昇腾的低比特训练工作筑牢了公共基础设施。

http://www.rkmt.cn/news/1449084.html

相关文章:

  • 使用 TypeScript 递归条件类型实现深只读(DeepReadonly)
  • Lab of Things:构建标准化物联网研究平台的核心架构与实践
  • 如何将微信对话转化为个人数字资产:WeChatMsg数据自主管理指南
  • 基于Arduino与光敏电阻的智能感应装置:从传感器到执行器的IoT实践
  • AI时代的品牌罗盘:2026年国内三大GEO监测工具深度横评与选型指南
  • 5分钟搞定洛雪音乐音源配置:免费音乐播放器的终极解决方案
  • 保姆级教程:用Docker容器一键部署Maven开发环境,彻底告别‘Command not found‘
  • 基于Arduino与光敏电阻的智能窗帘自动控制系统设计与实现
  • 用Python+灰色关联度分析,手把手教你量化低碳建筑全生命周期的碳排放(附代码)
  • Flutter跨小程序开发:如何用一套Dart代码征服微信小程序生态
  • 类型体操实战:Promise.all 类型实现
  • 2026年济南黄金回收实用科普:素军奢品汇贵金属回收闲置处置参考文稿 - GrowthUME
  • 2026年赤峰劳动工伤律师推荐:5位实战经验丰富值得信赖的维权专家 - 本地品牌推荐
  • 如何通过OmenSuperHub优化惠普OMEN游戏本的性能和散热
  • 7次碰壁、4个版本:我在一个浏览器插件里看到Agent该有的样子
  • Axure9.0中继器-初识篇
  • 3.4 Linux目录操作
  • Buck 滑模变结构控制(SMC)仿真
  • Outfit字体:9种字重几何无衬线字体的完整免费解决方案
  • yuzu模拟器流畅运行终极方案:告别卡顿闪退的7个关键技巧
  • 告别网盘限速:LinkSwift 终极下载助手完全指南
  • 2026年6月国内热门的普拉提学校推荐,普拉提,普拉提机构哪家好 - 品牌推荐师
  • 解锁B站宝藏:用Python开源工具打造你的个人视频图书馆
  • Obsidian插件翻译终极指南:5分钟让任意插件说中文
  • 微信QQ消息防撤回实战指南:保护你的聊天记录不被消失
  • 微信聊天记录终极备份指南:永久保存你的数字记忆
  • 2026指纹浏览器字体指纹溯源机制:系统私有字体栈引发的隐性集群风控详解
  • 告别单调命令行:手把手教你用PS1变量打造高颜值Linux终端(附常用配色方案)
  • AI智能体领域术语乱象终结者!超全词汇表帮你秒懂Harness、Scaffold、Agent等核心概念!
  • 鸣潮模组终极指南:15+强力功能解锁,5分钟打造你的专属游戏体验