尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

OpenAI与Broadcom联合推出专为AI推理打造的定制芯片Jalapeno

OpenAI与Broadcom联合推出专为AI推理打造的定制芯片Jalapeno
📅 发布时间:2026/6/26 1:47:46

OpenAI今日正式发布了一款名为Jalapeno的定制芯片,将用于驱动其旗下的大语言模型。

该处理器由OpenAI与Broadcom联合开发。Broadcom在定制芯片设计领域经验丰富,此前曾协助谷歌开发TPU系列AI加速器,谷歌还于今年4月将与Broadcom的芯片合作协议延长至2031年。

英伟达的旗舰Rubin显卡既能处理训练任务,也能承担推理工作负载。相比之下,Jalapeno专为推理场景设计——即AI模型在响应用户查询时的运行过程。据OpenAI介绍,早期测试结果显示,Jalapeno在每瓦性能方面显著优于"当前最先进水平",这一表述可能是在暗指英伟达的芯片产品。

目前OpenAI公开的关于Jalapeno设计细节仍十分有限。不过,官方博客文章提到,其底层"架构旨在减少数据移动"。这一表述暗示,Jalapeno的架构可能着力降低逻辑电路与片外存储器之间的数据传输量——这正是推理集群中的主要性能瓶颈之一。

AI芯片供应商通常采用多种方式来减少数据移动,其中最常见的方案是为加速器配备大容量片上SRAM(一种高速存储器)。芯片集成的SRAM越多,需要传输至片外存储器的数据量就越少。Cerebras Systems和Groq均采用了这一技术路线。

OpenAI表示,基于Jalapeno的推理集群将采用多项Broadcom网络技术,其中包括Tomahawk芯片系列——该系列专为以太网交换机供电而设计,支持同机架内服务器之间以及跨机架的数据传输。

Broadcom最新推出的Tomahawk 6可实现每秒高达1.6太比特的流量处理,并内置拥塞管理引擎,能有效解决可能拖慢连接速度的网络瓶颈问题。

OpenAI计划将Jalapeno芯片与Broadcom提供的网络设备部署于定制服务器机架中,并与总部位于多伦多的数据中心设备设计服务商Celestia Inc.合作开发相关系统。Celestia还可协助客户优化服务器生产线。

OpenAI计划于今年年底前上线首批Jalapeno服务器,并逐步扩大该芯片的应用规模。其博客文章将Jalapeno定位为"多代计算平台的第一步",暗示未来可能还将开发更多推理处理器,甚至为模型训练等相邻场景设计定制芯片。

Jalapeno还有望为OpenAI开辟新的营收来源。英伟达目前以DGX一体机的形式销售显卡产品,这类系统集成了CPU、散热模块及其他硬件。OpenAI具备推出搭载Jalapeno的竞争性一体机产品的实力,甚至可借助此类系统为企业客户提供本地化部署其AI模型的能力。

进军利润丰厚的AI硬件市场,不仅有望推动OpenAI的营收增长,还可能在其即将到来的公开募股过程中提升投资者兴趣。其主要竞争对手Anthropic近期已提交上市申请。对OpenAI而言,一套推理硬件产品将成为路演过程中极具价值的差异化筹码,尤其是在Anthropic可能抢先上市的情况下。

Q&A

Q1:Jalapeno芯片和英伟达的GPU有什么区别?

A:英伟达的旗舰Rubin显卡既能处理AI训练任务,也能承担推理工作负载,是一款通用型AI加速器。而Jalapeno专为推理场景设计,即专注于AI模型响应用户查询时的运行过程。据OpenAI早期测试数据,Jalapeno在每瓦性能方面显著优于当前最先进水平,这可能意味着其能效比英伟达芯片更高。不过由于Jalapeno目前仅用于推理,并不支持模型训练任务。

Q2:Jalapeno芯片在架构设计上有什么特别之处?

A:OpenAI透露,Jalapeno的底层架构着力"减少数据移动",即降低芯片逻辑电路与片外存储器之间的数据传输量。这是推理集群中的主要性能瓶颈。业内常见的解决方案是在芯片内集成大容量SRAM高速存储器,Cerebras和Groq均采用了类似思路,Jalapeno也可能沿用这一方向,但OpenAI目前尚未公开更多具体设计细节。

Q3:OpenAI推出Jalapeno芯片对其上市有什么影响?

A:Jalapeno芯片有望帮助OpenAI打入利润丰厚的AI硬件市场,并开辟新的营收来源。OpenAI可以效仿英伟达DGX一体机的模式,推出搭载Jalapeno的AI推理一体机,甚至支持企业客户在本地部署其AI模型。在竞争对手Anthropic已提交上市申请的背景下,拥有自研推理硬件产品将成为OpenAI路演时的重要差异化优势,有助于提升投资者信心。

相关新闻

  • Elasticsearch迁移到Qdrant实战指南:向量搜索性能优化与生产落地
  • 星载深度学习实战:深空探测中的模型压缩与实时部署
  • MeTube:自托管的 yt-dlp 下载管理界面

最新新闻

  • C++大成之路:右值引用 move 语义
  • 【JetBrains认证工程师亲授】:Ubuntu下IntelliJ IDEA免sudo安装+全局命令行启动+Shell集成三步到位(实测11种发行版兼容)
  • 【软工方法论22】代码重构原则与实践
  • 拆解RAG分层架构:文档解析、切片、向量检索、问答逻辑解耦(原理+案例+Java代码)
  • 高维点集密度分析:Jensen不等式与凸性原理的应用
  • 2026 洗衣液十大名牌最新资讯汇总 主流品牌定位与家用场景指南

日新闻

  • Qwen2.5-Turbo百万上下文实战指南:百炼平台长文本处理全解析
  • 怎么监控对标账号更新,2026年作者监控工作流,5款深度对比
  • EdgeRemover:专业级Windows Edge浏览器管理工具,彻底解决顽固软件卸载难题

周新闻

  • Visual C++运行库修复终极指南:5分钟快速解决Windows软件启动错误
  • 手把手教你构建统计局地区经济数据爬虫:从环境搭建到数据持久化全指南
  • 2026多Agent深度解析:用AI团队替代单一模型,四种架构实战落地

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号