小米跟进DeepSeekAPI永久降价据悉DeepSeek刚宣布API永久降价小米也迅速跟进。5月27日小米正式宣布MiMo-V2.5系列API价格永久下调并同步升级新版Token Plan计费体系。相比原始定价新价格最高降幅达到99%且不再区分上下文窗口长度。就在几天前DeepSeek宣布从6月1日起DeepSeek-V4-Pro当前促销价将直接转为正式价格不再恢复原价。此前DeepSeek已将V4-Pro API价格降至2.5折并把输入缓存命中价格进一步压到原价1/10。短短一周内两家国产大模型厂商先后选择“永久降价”国内API价格战再次升温。而这一次小米MiMo几乎直接对标了DeepSeek当前API的价格。更新后的价格表显示MiMo-V2.5输入缓存命中价格已经降至0.02元/百万tokens未命中输入为1元/百万tokens输出价格为2元/百万tokensMiMo-V2.5-Pro则分别为0.025元、3元和6元。值得注意的是MiMo此次还取消了此前按上下文长度区分价格的策略无论是256K还是1M上下文窗口均统一采用同一价格。国内大模型厂商套餐体系调整昨日对国内外数十家主流大模型厂商的订阅制套餐与API调用计费进行了深度梳理和对比。其中DeepSeek选择“永久降价”阿里则暂停了Coding Plan中的Lite低价套餐字节下架低价Coding Plan智谱2026年一季度API调用定价提升83%。不完全统计近半年至少已有小米、字节、阿里、智谱和腾讯等5家国产大模型厂商对自家套餐体系进行过明显调整。部分厂商开始缩减低价套餐、减少额度整体价格有所上涨。有意思的是不久前小米MiMo大模型负责人罗福莉还曾公开“开怼”行业价格战但另一边小米MiMo又靠着“100万亿Token免费计划”一度冲上Hermes全球调用量第一。如今小米MiMo也正式加入了这场长期价格战。Token Plan大改版套餐容量提升除了API永久降价这次变化最大的是Token Plan套餐体系。小米称新版计费规则进行了重新梳理在价格不变的情况下套餐Credits大幅提升用量普遍达到原来的5 - 8倍。从国内主流大模型订阅制套餐来看小米此次调整后入门档方面小米Lite套餐与Kimi、字节、阶跃星辰等厂商的最低档位接近但并不是市场最低腾讯混元Hy目前仍有28元/月的Lite档。而高阶档方面小米Max套餐也并非最高。目前阿里尊享版达到1398元/月字节Agent Plan Max档位为950元/月MiniMax Ultra极速版则接近750元/月。与此同时小米还公布了新版Credits与Token换算关系并公开给出了高缓存命中场景下不同套餐大致对应的实际Token规模。按照小米给出的95%以上缓存命中场景测算如果使用MiMo-V2.539元Lite套餐理论上已经可以跑到5亿Token以上99元Standard档位超过13亿Token329元Pro档位达到47亿Token以上659元Max档位则突破100亿Token。即便是更贵的MiMo-V2.5-Pro在高缓存命中场景下39元Lite档位也能达到1.9亿Token以上99元套餐超过5亿Token329元档位约18亿Token659元Max档位则接近40亿Token。小米特别强调在Agent与Code类场景下由于缓存命中率通常更高实际可使用Token数量会明显增加。小米“百万亿Token创造者激励计划”也一度引发开发者圈关注。小米披露截至5月26日下午4点08分100T Tokens已经全部提前发放完毕活动提前收官。所有当前仍在有效期内的Token Plan用户无论此前套餐已经使用到什么程度其Credits额度都将在5月27日0点全部重置并自动切换至新计费规则。针对已经过期的历史付费用户小米后续也将提供额外福利。小米降价背后的推理优化方案这次小米专门解释了背后的推理优化方案。小米团队基于SGLang HiCache完整支持SWASliding Window Attention将KV Cache在GPU显存、CPU内存、SSD等多级存储间的数据搬运量降低至优化前的约1/7可缓存Token数量提升至约5倍。与此同时小米还优化了专家并行方案、输入长度分桶策略等机制进一步提升集群输入吞吐能力从而降低单位Token成本。简单来说小米这次的核心逻辑其实和DeepSeek类似一边是更激进的缓存命中策略一边是更高的推理吞吐效率。价格战背后本质仍然是推理系统与基础设施能力的竞争。模型能力提升小米MiMo补上价格牌今年4月23日小米正式开启Xiaomi MiMo-V2.5系列大模型公测推出MiMo-V2.5、V2.5-Pro、V2.5-TTS Series以及V2.5-ASR等多个版本。其中MiMo-V2.5-Pro重点面向Agent、复杂软件工程以及长程任务等场景。目前MiMo-V2.5-Pro在Artificial Analysis综合智能榜中位列全球开源模型并列第一同时进入全球大模型总榜前五其Agent指数同样位列全球开源模型并列第一。4月28日小米进一步将MiMo-V2.5系列以MIT协议正式开源支持商用部署与二次训练无需额外授权。而真正让MiMo在开发者圈快速出圈的还是此前那轮“100万亿Token免费计划”。5月9日Hermes Agent“爱马仕”首次超越OpenClaw“龙虾”登顶OpenRouter全球应用调用量榜首。当时Hermes月调用量排名前五的模型中MiMo-V2-Pro排在第一后面依次是MiniMax M2.7、英伟达Nemotron 3 Super、阶跃星辰Step 3.5 Flash以及腾讯Hy3 preview。不过榜单变化也非常快。截至5月27日上午9点OpenRouter本周调用榜中MiMo-V2.5-Pro位列第十四在Hermes Agent模型月调用榜里MiMo-V2-Pro也已从此前榜首掉到第16名。目前排名前三的分别是DeepSeek-V4-Flash、匿名模型Owl Alpha以及DeepSeek-V4-Pro。某种程度上这也能看出当前国内大模型竞争的激烈程度一边是榜单和调用量变化越来越快另一边则是价格战开始直接靠拢DeepSeek的“地板价”。结语营收利润双降小米仍下场价格战价格战之外小米昨日的财报也让这轮降价多了一层“大放血”的意味。一季度小米营收991亿元同比下降10.9%经调整净利润61亿元同比下降43.1%。另一边小米对AI的投入并没有放缓。财报显示其当季研发开支达到90亿元同比增长33.4%截至2026年3月31日小米研发人员数量达到26048人创下历史新高。小米管理层也在财报会上频繁提到AI。当被问到雷军此前提出的160亿元AI投资计划时小米集团CFO林世伟认为未来对于AI的投资计划会根据AI业务的发展状况进行调整预期会有所上涨。卢伟冰则专门提到在当前内存上涨周期里“抓住AI非常重要”。从MiMo开源、100万亿Token免费计划到冲击OpenRouter Agent榜单再到如今直接跟进DeepSeek永久降价小米过去一个多月在AI上的动作明显频繁。而随着国内模型价格继续下探这场竞争也已经不只是模型能力本身的比拼背后更是一场围绕推理系统、算力效率以及长期资金投入的持续消耗战。