最高降99%,小米大模型API永久降价
大模型市场的价格战,又迎来了一位重量级玩家。5月27日,小米技术发布公告,宣布其MiMo-V2.5系列API实施永久降价,最高降幅达到了惊人的99%。这距离DeepSeek宣布永久降价没过多久,意味着国内大模型的“性价比”之争,已经进入白热化阶段。
此次调价即刻生效,小米不仅取消了传统定价中按上下文窗口长度收费的复杂模式,还对Token Plan计费体系做了深度优化。简单来说,在同等付费价格下,开发者能使用的Token量,最高可以提升到原来的5到8倍。这无疑让MiMo系列在开发者眼中的吸引力直线上升。
价格“腰斩”再“腰斩”,性价比成新标尺
具体来看这次堪称“激进”的调价细节。旗舰级的MiMo-V2.5-Pro,调价后输入缓存命中的价格仅为0.025元/百万tokens。对比原价,这相当于比≤256k规格的1.40元降低了98%,比256k-1M长窗口规格的2.80元更是直接“砍”掉了99%。即便是输入未命中缓存的情况,定价也降至3.000元/百万tokens,降幅在57%到79%之间。输出定价为6元/百万tokens,相比原价最高降幅达86%。

标准版的MiMo-V2.5降价力度同样不小。其输入缓存命中价格调至0.020元/百万tokens,相比原价降幅高达96%-98%。输出定价更是低至2元/百万tokens,最高降幅达到93%。
值得注意的是,本次调价主要聚焦于MiMo-V2.5这一核心系列。MiMo-V2.5-TTS系列目前仍维持限时免费接入政策,而上一代的MiMo-V2-Pro与MiMo-V2-Omni两款高阶模型则保持原价不变。同时,旧的Token Plan套餐将不再参与调整并即将下线。这一策略意图非常明显:引导所有开发者向更具性价比的V2.5系列迁移,加速新版本的生态普及。
“天才少年”掌舵,小米AI的激进迭代
MiMo-V2.5系列的快速迭代与市场策略,离不开其背后的关键人物——罗福莉。这位曾任职于DeepSeek的95后AI技术人才,于2025年11月正式加盟小米,出任MiMo大模型负责人。有消息称,雷军以千万年薪力邀其加入。在她的带领下,小米迅速组建起一支平均年龄仅25岁、清北毕业生占比超六成的精锐研发团队。
在罗福莉的统筹下,小米MiMo大模型完成了多代快速迭代。今年3月,小米正式推出MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS三大基础模型,随后又快速迭代出V2.5进阶版本,补齐了高性能推理、轻量化通用交互、语音合成等全场景能力,成为小米面向商用普惠市场的主力产品阵列。
目前,小米已构建起一个层次清晰的大模型产品矩阵:MiMo-V2.5-Pro主打高性能复杂推理,面向企业级智能体开发与深度业务分析;MiMo-V2.5聚焦轻量化通用需求,服务广大中小开发者;MiMo-V2.5-TTS则以免费策略抢占语音合成生态入口。此外,MiMo-V2-Pro作为旗舰基座模型探索性能极限,MiMo-V2-Omni则专注全模态融合技术。
就在降价宣布的前一天,小米创始人雷军还对外表示,“Xiaomi MiMo-V2.5-Pro在Artificial Analysis榜单的综合智能指数、Agent指数上,已跻身全球开源模型并列第一。”并宣布未来三年将在AI领域投入600亿元。此番降价,可视为其宏大投入计划在市场上的第一次强力出击。
从DeepSeek到小米:降价潮背后的行业逻辑
小米并非第一个吹响降价号角的厂商。就在不久前,国内头部大模型公司DeepSeek已率先对其DeepSeek-V4-Pro模型API开启“永久降价”,计划在5月31日限时优惠结束后,将价格整体调整为原价的四分之一。调价后,其输入缓存命中价格同样为0.025元/百万tokens,与小米的旗舰型号定价持平。
DeepSeek-V4系列自今年4月发布以来,凭借百万字超长上下文、领先的Agent能力和推理性能,迅速获得了大量开发者与企业的青睐。其调用成本本就远低于GPT-4o、Claude等国际主流模型,此次进一步降价,无疑为整个市场树立了新的性价比标杆,也为小米等厂商的跟进提供了直接的范本和压力。
事实上,国内大模型市场正呈现出清晰的“K型分化”特征。一边是阿里云通义千问、字节跳动豆包等通用型大模型相继下调API价格,走“以价换量”的普及路线;另一边,智谱GLM、腾讯混元等主打深度定制与企业级服务的模型,则维持价格稳定甚至小幅上调,坚守“高端溢价”的价值定位。市场格局正从早期的混战,演变为“通用模型降价走量、高端模型保值增值”的双轨并行态势。
这一现象背后,绝非简单的价格战。它标志着行业竞争核心,正从无序的市场营销转向深层次的技术效率比拼。降价,越来越成为底层算法优化、推理技术突破、以及算力成本持续下行后的一个自然结果,是技术红利的直接释放。
AI聚合平台AI.cc发布的《2026年AI API基础设施报告》也印证了这一趋势。报告显示,过去一年,企业级大模型的Token调用成本同比暴跌了67%。同时,开源模型已占据企业Token调用量38%的份额。这一切都指向一个明确的结论:在技术快速 democratize(民主化)的今天,