AI动态简报之算力基建篇（2026.06.25）-尧图网站建设

📅 发布时间：2026/6/26 23:12:07

⚡ 第1条：OpenAI 首款自研 AI 芯片"Jalapeno"横空出世，联手博通九个月完成流片

核心信息：

北京时间 2026 年 6 月 25 日，OpenAI 正式对外发布其首款自研 AI 推理芯片，命名为 Jalapeño（哈拉贝诺辣椒）。该芯片由 OpenAI 与半导体巨头博通（Broadcom）联合开发，专为大语言模型推理场景设计，从设计到流片仅用时九个月，创下行业纪录。

性能/价格对比：

定位：推理专用芯片，非训练芯片，主打高性价比推理部署
合作模式：OpenAI 提供架构设计，博通负责物理实现与量产
战略意义：OpenAI 从此摆脱对英伟达 GPU 的单一依赖，推理成本有望大幅下降

对开发者/企业的影响：

OpenAI 自研芯片量产后，API 推理成本有望进一步降低，开发者的调用费用可能迎来新一轮下调；同时也标志着 AI 巨头向上游芯片环节延伸成为行业新趋势。

信息来源：Weste.net | 2026-06-25

⚡ 第2条：英伟达 Blackwell Ultra 发布，FP8 算力高达 20 petaFLOPS

核心信息：

2026 年 6 月 1 日，英伟达 CEO 黄仁勋在台北国际电脑展上揭晓新一代 AI 芯片 Blackwell Ultra，FP8 算力高达 20 petaFLOPS，较上一代 Blackwell 芯片实现显著性能跃升，AI 基础设施进入全新算力量级。

性能/价格对比：

FP8 算力：20 petaFLOPS（Blackwell Ultra）vs 上代 Blackwell 约 10-14 petaFLOPS
内存：搭载 HBM3e 最高 288GB，带宽超过 8 TB/s
系统级：GB300 NVL72 机架方案可提供超过 1 ExaFLOP 的 FP4 推理算力

对开发者/企业的影响：

Blackwell Ultra 的量产将大幅提升大模型训练与推理效率，单位算力成本持续下降；云服务商将在 2026 年下半年开始规模部署，开发者可期待更快的 API 响应速度和更低的延迟。

信息来源：Raybyte.cn | 2026-06-02

⚡ 第3条：AI 大模型"超级 6 月"：GPT-5.6、Claude Opus 4.8、Gemini 3.5 扎堆发布

核心信息：

2026 年 6 月，全球 AI 大模型赛道迎来史无前例的密集发布潮。Anthropic 发布 Claude Fable 5（即 Claude Opus 4.8），谷歌推出 DiffusionGemma，月之暗面更新 Kimi K2.7 Code，智谱发布 GLM-5.2，微软更是一次性发布七款自研 MAI 系列模型（从 170 亿参数到 1.8 万亿参数 MoE 架构），标志着大模型竞争从"单点突破"进入"生态集群"较量阶段。

性能/价格对比：

微软 MAI-Orion：1.8 万亿参数 MoE 架构，直接对标 GPT-5 级别
微软 MAI-Mini：170 亿参数，面向端侧部署，可在手机运行
Claude Opus 4.8：推理能力大幅提升，代码生成准确率创新高
本月发布/更新的主流模型数量超过 10 款，创历史纪录

对开发者/企业的影响：

模型选择空前丰富，开发者可根据场景选择性价比最优的模型；竞争加剧也将推动各大厂商 API 价格持续下行，企业 AI 应用落地成本将进一步降低。

信息来源：搜狐科技 / 掘金 | 2026-06-14

⚡ 第4条：豆包大模型日均 tokens 调用量飙升至 180 万亿，一年增长超 10 倍

核心信息：

在 2026 火山引擎 Force 原动力大会上，火山引擎总裁谭待透露：截至 2026 年 6 月，豆包大模型的日均 tokens 调用量已攀升至 180 万亿次。这一数字较模型发布初期实现了超过 1500 倍的爆发式增长，过去一年内也实现了超过 10 倍的显著提升，刷新国内大模型调用量纪录。

性能/价格对比：

日均 tokens 调用量：180 万亿（2026 年 6 月）vs 发布初期不足 0.12 万亿
年增长率：超过 10 倍
累计调用：已服务超过 30 万企业客户，覆盖营销、客服、代码等核心场景

对开发者/企业的影响：

豆包大模型的大规模商用验证了其稳定性和性价比，企业可放心将核心业务构建在国产大模型之上；调用量激增也意味着火山引擎的算力基础设施投入持续加大，服务可用性将进一步提升。

信息来源：MSN 科技 / 火山引擎 | 2026-06-25

⚡ 第5条：算力需求持续井喷，6 月以来国内算力合同签约金额已超 160 亿元

核心信息：

进入 2026 年 6 月，国内算力服务市场迎来新一轮签约高潮。短短半个月内，多家上市公司披露百亿级、十亿级算力服务合同，涵盖算力租赁、项目总包、智慧运维等多个环节。行云科技子公司签署 5 年期算力服务协议，合同含税总金额达 10 亿元；预计 6 月全月签约金额将超过 160 亿元，算力服务市场高景气度持续攀升。

性能/价格对比：

6 月以来签约金额：已超 160 亿元人民币（半月数据）
典型合同：行云科技 5 年期算力服务协议，含税 10 亿元
市场预测：2026 年全年算力服务市场规模有望突破 2000 亿元

对开发者/企业的影响：

算力供给持续扩张将缓解大模型训练和推理的算力瓶颈，中小企业获取优质算力的门槛和成本有望降低；同时也意味着 AI 应用落地的硬件基础更加坚实，更多创新应用将加速涌现。

信息来源：新浪财经 | 2026-06-17

📌 本简报由英辰朗迪GEO整理