首页 > 教程攻略 > ai资讯 >最高降99%，小米大模型API永久降价

最高降99%，小米大模型API永久降价

来源：互联网时间：2026-05-27 12:34:11

大模型市场的价格战，又迎来了一位重量级玩家。5月27日，小米技术发布公告，宣布其MiMo-V2.5系列API实施永久降价，最高降幅达到了惊人的99%。这距离DeepSeek宣布永久降价没过多久，意味着国内大模型的“性价比”之争，已经进入白热化阶段。

此次调价即刻生效，小米不仅取消了传统定价中按上下文窗口长度收费的复杂模式，还对Token Plan计费体系做了深度优化。简单来说，在同等付费价格下，开发者能使用的Token量，最高可以提升到原来的5到8倍。这无疑让MiMo系列在开发者眼中的吸引力直线上升。

价格“腰斩”再“腰斩”，性价比成新标尺

具体来看这次堪称“激进”的调价细节。旗舰级的MiMo-V2.5-Pro，调价后输入缓存命中的价格仅为0.025元/百万tokens。对比原价，这相当于比≤256k规格的1.40元降低了98%，比256k-1M长窗口规格的2.80元更是直接“砍”掉了99%。即便是输入未命中缓存的情况，定价也降至3.000元/百万tokens，降幅在57%到79%之间。输出定价为6元/百万tokens，相比原价最高降幅达86%。

标准版的MiMo-V2.5降价力度同样不小。其输入缓存命中价格调至0.020元/百万tokens，相比原价降幅高达96%-98%。输出定价更是低至2元/百万tokens，最高降幅达到93%。

值得注意的是，本次调价主要聚焦于MiMo-V2.5这一核心系列。MiMo-V2.5-TTS系列目前仍维持限时免费接入政策，而上一代的MiMo-V2-Pro与MiMo-V2-Omni两款高阶模型则保持原价不变。同时，旧的Token Plan套餐将不再参与调整并即将下线。这一策略意图非常明显：引导所有开发者向更具性价比的V2.5系列迁移，加速新版本的生态普及。

“天才少年”掌舵，小米AI的激进迭代

MiMo-V2.5系列的快速迭代与市场策略，离不开其背后的关键人物——罗福莉。这位曾任职于DeepSeek的95后AI技术人才，于2025年11月正式加盟小米，出任MiMo大模型负责人。有消息称，雷军以千万年薪力邀其加入。在她的带领下，小米迅速组建起一支平均年龄仅25岁、清北毕业生占比超六成的精锐研发团队。

在罗福莉的统筹下，小米MiMo大模型完成了多代快速迭代。今年3月，小米正式推出MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS三大基础模型，随后又快速迭代出V2.5进阶版本，补齐了高性能推理、轻量化通用交互、语音合成等全场景能力，成为小米面向商用普惠市场的主力产品阵列。

目前，小米已构建起一个层次清晰的大模型产品矩阵：MiMo-V2.5-Pro主打高性能复杂推理，面向企业级智能体开发与深度业务分析；MiMo-V2.5聚焦轻量化通用需求，服务广大中小开发者；MiMo-V2.5-TTS则以免费策略抢占语音合成生态入口。此外，MiMo-V2-Pro作为旗舰基座模型探索性能极限，MiMo-V2-Omni则专注全模态融合技术。

就在降价宣布的前一天，小米创始人雷军还对外表示，“Xiaomi MiMo-V2.5-Pro在Artificial Analysis榜单的综合智能指数、Agent指数上，已跻身全球开源模型并列第一。”并宣布未来三年将在AI领域投入600亿元。此番降价，可视为其宏大投入计划在市场上的第一次强力出击。

从DeepSeek到小米：降价潮背后的行业逻辑

小米并非第一个吹响降价号角的厂商。就在不久前，国内头部大模型公司DeepSeek已率先对其DeepSeek-V4-Pro模型API开启“永久降价”，计划在5月31日限时优惠结束后，将价格整体调整为原价的四分之一。调价后，其输入缓存命中价格同样为0.025元/百万tokens，与小米的旗舰型号定价持平。

DeepSeek-V4系列自今年4月发布以来，凭借百万字超长上下文、领先的Agent能力和推理性能，迅速获得了大量开发者与企业的青睐。其调用成本本就远低于GPT-4o、Claude等国际主流模型，此次进一步降价，无疑为整个市场树立了新的性价比标杆，也为小米等厂商的跟进提供了直接的范本和压力。

事实上，国内大模型市场正呈现出清晰的“K型分化”特征。一边是阿里云通义千问、字节跳动豆包等通用型大模型相继下调API价格，走“以价换量”的普及路线；另一边，智谱GLM、腾讯混元等主打深度定制与企业级服务的模型，则维持价格稳定甚至小幅上调，坚守“高端溢价”的价值定位。市场格局正从早期的混战，演变为“通用模型降价走量、高端模型保值增值”的双轨并行态势。

这一现象背后，绝非简单的价格战。它标志着行业竞争核心，正从无序的市场营销转向深层次的技术效率比拼。降价，越来越成为底层算法优化、推理技术突破、以及算力成本持续下行后的一个自然结果，是技术红利的直接释放。

AI聚合平台AI.cc发布的《2026年AI API基础设施报告》也印证了这一趋势。报告显示，过去一年，企业级大模型的Token调用成本同比暴跌了67%。同时，开源模型已占据企业Token调用量38%的份额。这一切都指向一个明确的结论：在技术快速 democratize（民主化）的今天，

性价比，已经成为决定大模型市场胜负的核心要素

。小米的这次降价，既是竞争压力下的应对，更是技术自信的体现。这场由技术驱动的新一轮洗牌，才刚刚开始。

最高降99%，小米大模型API永久降价

价格“腰斩”再“腰斩”，性价比成新标尺

“天才少年”掌舵，小米AI的激进迭代

从DeepSeek到小米：降价潮背后的行业逻辑

性价比，已经成为决定大模型市场胜负的核心要素

相关阅读

相关下载