尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

AI算力基础设施的去中心化——从GPU霸权到ASIC群雄并起

AI算力基础设施的去中心化——从GPU霸权到ASIC群雄并起
📅 发布时间:2026/6/25 19:36:09

2026年6月,全球AI芯片市场迎来了几个标志性事件。当地时间6月24日,英伟达召开年度股东大会,CEO黄仁勋宣告“有用的AI时代”已经到来,并将这一轮计算范式转变定性为“60年来规模最大的行业重置”。同一天,OpenAI与博通联合发布首款自研推理芯片Jalapeño,宣称可将推理成本降低约50%。也正是在这一天,高通在纽约投资者日活动上正式宣布全面进军AI数据中心市场,微软和Meta双双成为其首批客户。

三件大事同频共振,映射出一个正在加速兑现的产业判断:AI算力基础设施正在经历一场深刻的去中心化变革。英伟达GPU的统治地位并未被颠覆,但一个多元化、多极化的算力新格局已然成形。

一、推理时代:从“训练军备竞赛”到“推理成本战争”

理解这场变革,首先要看清一个根本性的需求结构转变。

2023年,推理仅占AI总算力需求约三分之一;到2026年,这一比例已升至三分之二。预计到2028至2030年,推理将占AI总算力需求的70%至85%。AI产业的底层逻辑,正从实验室里的“不计代价训练”,转向面向全球用户的“极致推理成本战”。

为什么这一转变如此关键?训练是大规模并行的矩阵运算,可以在数万个GPU核心上同时进行,这正是GPU的绝对优势领域。但推理,尤其是代理式AI(Agentic AI)的推理,涉及任务编排、工具调用、多步逻辑判断和顺序决策。这些工作负载并非纯粹的并行计算,而是大量依赖CPU擅长的复杂逻辑控制与串行处理能力。

黄仁勋在股东大会上给出了一个精辟的比喻:传统数据中心存储和传输文件,而AI工厂的核心功能是“制造token”——每一个token都是可货币化的智能单元。在这一逻辑下,竞争的关键维度不再是“谁的芯片算力最强”,而是“谁的token成本最低、吞吐量最高”。

推理需求爆发带来的直接后果是:云服务商发现,继续用昂贵的GPU跑推理,惊人的电费与采购成本正在吞噬利润。摩根大通在最新报告中指出,推动这场转变的根本因素甚至不是资金成本,而是电力供应——在电力日益吃紧的背景下,“每瓦效能”正成为AI时代最关键的竞争指标。

二、ASIC崛起:从“小众替代品”到“主力玩家”

正是在这一背景下,定制ASIC芯片迎来了爆发式增长。

市场研究机构TrendForce的数据显示,2026年云服务商自研ASIC的出货增速预计达44.6%,首次大幅超越GPU的16.1%--。2024年和2025年,GPU的成长表现原本仍领先ASIC,而这个增速拐点的出现,意味着ASIC已从“小众替代品”成长为AI算力市场的主力玩家之一。

摩根大通的预测更为激进:2026年ASIC占全球AI芯片出货量的比重约为42%,2027年将一举达到53%,正式超越GPU。该行预计2026年ASIC出货量年增109%,远高于GPU约39%的增速。

各大云厂商的自研芯片正在全面铺开。谷歌TPU出货量预计从2026年的450万颗跳升至2027年的800万颗;亚马逊Trainium系列从190万颗增至330万颗;微软与Meta的自研芯片也进入量产阶段。谷歌已向苹果、Meta等企业开放TPU算力租赁服务。亚马逊更是与AI巨头Anthropic签下十年合约,后者承诺未来10年花费超过1000亿美元购买AWS算力服务,且全数绑定在Trainium系列自研AI芯片上。

在AI推理市场中,ASIC份额预计将从2024年的15%增长至2026年的40%-。TrendForce预测,2026年AI服务器中定制芯片的渗透率将从2025年的20.9%提升至27.8%,而GPU市场份额则从75.9%下降至69.7%-。

三、Jalapeño的启示:最大客户开始“自己造芯”

在所有ASIC案例中,OpenAI的Jalapeño芯片最具象征意义。

自2022年生成式AI热潮兴起以来,OpenAI一直是英伟达最大的GPU买家之一。而如今,这家头号客户正亲手打造替代方案。Jalapeño由OpenAI工程师与博通联合设计,耗时仅九个月完成流片,是一款专为大语言模型推理设计的全新架构,而非对早期AI加速器的改造。博通CEO陈福阳称,Jalapeño的性能可与英伟达Blackwell芯片和谷歌TPU相媲美-。

早期测试显示,Jalapeño的每瓦性能“显著优于”当前最先进的芯片。基于Jalapeño的系统预计于2026年底前以吉瓦级规模首次部署。OpenAI总裁布罗克曼表示:“Jalapeño是我们长期全栈基础设施战略的一部分,旨在让算力变得更加充足。”

这一合作的战略意义不止于芯片本身。博通提供了Tomahawk网络芯片及芯片实现技术,伟创力负责板卡、机架和系统集成。OpenAI还与亚马逊AWS就Trainium芯片达成协议,并与AMD和Cerebras展开合作——这是一项有意为之的多元化战略,旨在摆脱对单一供应商的依赖。

摩根大通预测,博通凭借深度参与谷歌TPU、Meta MTIA以及OpenAI定制芯片项目,其来自AI ASIC与网络业务的营收将从2026年约600亿美元,在2027年增长逾倍至1500亿美元以上。博通管理曾透露,2027年在手订单金额已超过1000亿美元。

四、高通入局:手机芯片巨头的数据中心野望

如果说OpenAI造芯是“客户自研”的样本,那么高通的全面入局则是“新玩家跨界”的标志性事件。

6月24日,高通在纽约投资者日上正式发布面向AI数据中心市场的Dragonfly产品家族,涵盖CPU、AI加速器和数据中心互联解决方案。最重磅的消息来自Meta——CEO扎克伯格亲自确认,高通将成为Meta未来的数据中心CPU供应商。Meta将采用Dragonfly C1000数据中心CPU及后续产品世代,双方签署的是覆盖多个产品周期的长期战略合作协议。

与此同时,微软Azure宣布部署高通的高带宽计算(HBC)芯片。值得注意的是,高通HBC方案依托的是手机、笔记本通用的平价普通内存,而非英伟达使用的高价HBM高带宽内存。高通预计,数据中心业务最快将在2027财年带来数十亿美元收入。

高通CEO安蒙表示:“AI正在从数据中心扩展到边缘设备和终端设备,整个行业需要新的计算架构来支撑这种变化。”高通将Dragonfly定位为“智能体AI时代的数据中心计算平台”,这一定位与英伟达Vera Rubin“为智能体打造”的表述形成了直接对标。

高通还同步宣布以接近40亿美元的全股票交易收购AI初创公司Modular-。Modular拥有一套可跨芯片运行AI模型的软件技术,无需为每种处理器单独编写代码-。这笔收购被视为高通在软件层面直接挑战英伟达CUDA生态的关键布局。

五、英伟达的护城河还坚固吗?

面对ASIC的围攻和高通的突袭,英伟达的统治地位是否正在松动?

从市场份额看,英伟达依然占据绝对优势。SemiAnalysis数据显示,2026年第一季度,英伟达在AI训练芯片市场占有率为92%,推理芯片市场占有率为78%,与一年前几乎持平-。IDC估计英伟达控制着约81%的AI芯片市场份额-。即便市场份额预计到2026年将下降至约75%,但绝对收入仍在增长,因为整体市场扩展速度远快于任何单一竞争者的捕获能力-。

黄仁勋在股东大会上强调,英伟达系统的核心优势不在于采购价格最低,而在于“最低token成本、最高token吞吐量和最强收入能力”。Blackwell平台被第三方评测认定为“推理之王”,token吞吐量较次优平台高出30倍。Vera Rubin已全面投产,每个主要的模型开发商、公有云和超大规模云厂商都准备基于Vera Rubin进行建设。

但护城河正在被侵蚀,而非被摧毁。

摩根大通认为,尽管英伟达GPU出货量仍会持续增长,但市占率势必遭到稀释。CNBC的报道也指出,行业专家普遍认为英伟达的风险目前仍然很小,但“英伟达对AI芯片市场的控制力正在受到考验”-。

更深层的变化在于客户关系的重构。过去,所有AI公司都是英伟达的客户;现在,谷歌、亚马逊、微软、Meta、OpenAI——这些曾经最大的买家——正在变成英伟达的竞争对手。它们不再只是单纯采购现成芯片,而是逐步建立属于自己的芯片生态。

六、新格局:从“单极世界”到“多极生态”

AI算力基础设施正在从“单极世界”走向“多极生态”。这个新格局呈现几个鲜明特征:

第一,市场蛋糕在持续扩大,而非简单的存量博弈。AI加速器市场2025年约为1600亿美元,2026年正朝向2000亿美元以上迈进-。TrendForce预测,2026年全球AI服务器出货量将年增20%以上-。即便英伟达份额下降,其收入绝对值仍在增长。

第二,“CPU+GPU+ASIC”的三极算力格局正在形成。在AI训练阶段,CPU与GPU的配置比例通常维持在1:8的极端状态。而进入推理时代后,这一比例正快速拉近至1:1到1:2之间。英伟达自身也在2026年3月承认:“CPU正在成为AI工作流中的瓶颈”——这来自一家以“GPU是AI唯一需要的芯片”为产业信念的公司。

第三,软件生态成为新的竞争高地。英伟达的CUDA生态被黄仁勋称为“皇冠珠宝”。高通收购Modular、推出全栈数据中心方案,正是试图在软件层面打破CUDA的垄断-。未来芯片战争的胜负手,可能不在于硬件性能的毫厘之差,而在于谁能构建更完善的开发者生态。

第四,竞争从芯片延伸到整个基础设施堆栈。黄仁勋以“五层蛋糕”描述AI产业——能源、芯片与系统、基础设施、模型、应用。英伟达的业务覆盖远不止芯片,而是贯穿整个AI生产链条。高通也在构建“CPU+AI加速器+网络”的全栈方案。未来的赢家将是能提供完整基础设施堆栈的企业,而非单一的芯片供应商。


2026年6月24日这一天,英伟达在股东大会上看多AI基建,OpenAI发布自研芯片挑战GPU,高通跨界入局数据中心——三件事同频共振,共同指向一个清晰的产业趋势:AI算力基础设施的去中心化已经不可逆转。

英伟达不会在一夜之间失去王座,但垄断的时代正在远去。一个由GPU、ASIC、CPU共同驱动的多极化算力新时代,已然拉开帷幕。对于云厂商和AI企业而言,这意味着更多的选择、更低的成本和更强的议价能力;对于整个AI产业而言,这意味着更快的创新速度和更可持续的发展路径。正如黄仁勋所言,这轮AI基建周期“将以数十年为单位来衡量”——而在这场长达数十年的长跑中,多元化的算力生态,或许比任何单一霸主的统治都更具生命力。

相关新闻

  • 2025-2026上海室内木门定制源头工厂选型指南及行业五强深度解析
  • 2025-2026上海木门定制工厂行业白皮书:五强价值评估与选型指南
  • Q-learning实战解密:从FrozenLake环境到Q-table调试全链路

最新新闻

  • 128k 长上下文实测,Strix Halo 如何轻松读懂十万字小说
  • Python的__getattr__中的应用AOP
  • Shiro反序列化漏洞手工复现:从原理到实战的完整指南
  • Java毕设项目: 于 SpringBoot 的网上书店管理系统设计与实现 SpringBoot 框架下在线图书销售管理系统设计与实现(源码+文档,讲解、调试运行,定制等)
  • 2026算得准的命理软件推荐怎么看?八字排盘App要看时间规则校验
  • 嵌入向量与向量数据库实战:语义搜索落地核心指南

日新闻

  • 利用微PE工具箱进行系统安装教程
  • 渗透测试十大核心工具实战指南:从信息搜集到报告生成全流程解析
  • 暗黑破坏神2存档编辑器:网页版角色修改工具完全指南

周新闻

  • Visual C++运行库修复终极指南:5分钟快速解决Windows软件启动错误
  • 手把手教你构建统计局地区经济数据爬虫:从环境搭建到数据持久化全指南
  • 2026多Agent深度解析:用AI团队替代单一模型,四种架构实战落地

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号