首页 > 教程攻略 > ai资讯 >小米紧跟DeepSeek宣布大模型API永久降价，最高降幅99%

小米紧跟DeepSeek宣布大模型API永久降价，最高降幅99%

来源：互联网时间：2026-05-28 09:17:24

图片来源：界面图库

大模型市场的价格战，又添了一把猛火。就在今天，小米技术发布公告，宣布其MiMo-V2.5系列API实施永久降价，最高降幅直接拉到了惊人的99%。这距离DeepSeek宣布永久降价才过去没多久，看来，一场围绕API调用成本的“地板价”争夺战，已经全面打响。

这次降价，小米不仅动了价格，还改了规则。他们取消了传统定价中区分上下文窗口长度的做法，同时对Token Plan计费体系做了优化。简单来说，在同等付费价格下，开发者能用的Token量，最高可以提升到原来的5到8倍。性价比这三个字，算是被小米玩明白了。

具体来看降价细节，力度确实不小。以高性能的MiMo-V2.5-Pro为例，调价后，输入缓存命中的价格仅为0.025元/百万tokens。这是个什么概念？对比原价中≤256k规格的1.40元，降幅高达98%；如果对比原来256k-1M长窗口规格的2.80元，降幅更是触及了99%的关口。至于输入未命中缓存和输出的价格，也分别有57%-86%不等的显著下调。

标准版的MiMo-V2.5降价力度同样不含糊。其输入缓存命中价格调整至0.020元/百万tokens，相比原价最高降幅达98%；输入未命中缓存和输出的价格，降幅也都在64%到93%之间。对于广大中小开发者而言，这样的价格无疑大大降低了试错和创新的门槛。

需要留意的是，本次调价主要聚焦在MiMo-V2.5这个核心系列上。MiMo-V2.5-TTS系列依旧维持限时免费接入的政策，而更早的MiMo-V2-Pro与MiMo-V2-Omni两款高阶模型，其API价格则保持原价不变。同时，旧系列的Token Plan套餐也不再参与调整并即将下线。这一系列动作的意图非常清晰：就是引导开发者全面转向性价比更高的V2.5系列。

小米的AI野心与人才牌

MiMo-V2.5系列的快速迭代，离不开背后的关键人物——罗福莉。这位曾在DeepSeek任职的95后AI技术人才，于2025年11月正式加盟小米，出任MiMo大模型负责人。她组建的研发团队平均年龄仅25岁，清北毕业生占比超过六成。有市场消息称，雷军是以千万年薪的诚意，才将这位年轻的技术领军人物招致麾下。

在罗福莉的统筹下，小米MiMo大模型完成了多代快速迭代。今年3月，小米正式推出MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS三大基础模型，随后又快速迭代出V2.5进阶版本，补齐了高性能推理、轻量化通用交互、语音合成等全场景能力。如今，V2.5系列已成为小米大模型阵列中面向商用普惠市场的主力产品。

目前，小米已经构建起一个层次较为清晰的MiMo大模型产品矩阵：MiMo-V2.5-Pro主打高性能复杂推理，面向企业级智能体开发、深度业务分析等高阶场景；MiMo-V2.5聚焦轻量化通用需求，服务广大中小开发者；MiMo-V2.5-TTS则以免费策略主攻语音合成赛道，意在抢占音频生态的入口。此外，还有定位旗舰基座的MiMo-V2-Pro和专注全模态融合的MiMo-V2-Omni，共同组成技术高地。

就在降价公告发布的前一天，小米创始人雷军还对外透露，“Xiaomi MiMo-V2.5-Pro在Artificial Analysis榜单的综合智能指数、Agent指数上，已取得全球开源模型并列第一的成绩”。他同时宣布，未来三年小米在AI领域的投入计划高达600亿元。这无疑向市场释放了一个强烈的信号：小米在AI大模型赛道，是认真的。

降价潮背后的行业逻辑

小米并非第一个吹响降价号角的玩家。在此之前，国内头部大模型公司DeepSeek已经率先开启了“永久降价”模式，主要针对其DeepSeek-V4-Pro模型。该模型API在5月31日结束限时优惠后，整体价格将调整为原定价的四分之一。调价后，其输入缓存命中价格同样为0.025元/百万tokens，整体实现了75%的降幅。

DeepSeek-V4于今年4月下旬发布，凭借百万字超长上下文、领先的Agent能力和推理性能，在国内与开源领域都引起了广泛关注。其调用成本远低于GPT-4o、Claude等国际主流模型，这种高性价比策略帮助它快速抢占了大量开发者与企业用户，也为小米等厂商的跟进降价提供了现实的市场范本。

实际上，放眼整个国内大模型市场，一场“K型分化”正在悄然形成。一边是阿里云通义千问、字节跳动豆包等通用型大模型相继下调API价格，走“以价换量”的路线；另一边，智谱GLM、腾讯混元等主打企业级深度定制和私有化部署服务的模型，则维持价格稳定甚至有小幅上调，坚守“溢价保值”的高端市场。通用模型降价走量，高端模型溢价保值——这已成为当前市场的新格局。

这一现象的背后，远不是简单的价格战可以概括。它标志着整个行业正从初期的无序营销竞争，转向深层次的技术效率竞争。降价，不再是单纯的市场手段，而是底层算法持续优化、推理技术不断升级、以及算力成本稳步下行等多重因素共同驱动的必然结果。

AI聚合平台AI.cc发布的《2026年AI API基础设施报告》也印证了这一趋势。报告显示，过去一年，企业级大模型的Token调用成本同比暴跌了67%。与此同时，开源模型已经占据了企业Token调用量38%的份额。这些数据都清晰地指向一个结论：在技术快速普及的阶段，性价比，已经成为决定市场胜负的核心要素。

可以预见，随着技术红利持续释放和规模效应进一步显现，大模型API的调用成本还有继续下探的空间。这场由头部厂商引领的降价潮，或许才刚刚开始。对于整个生态而言，更低的门槛意味着更繁荣的创新，最终受益的，将是整个产业。

小米紧跟DeepSeek宣布大模型API永久降价，最高降幅99%

小米的AI野心与人才牌

降价潮背后的行业逻辑

相关阅读

相关下载