首页 > 教程攻略 > ai资讯 >小米紧跟DeepSeek宣布大模型API永久降价,最高降幅99%

小米紧跟DeepSeek宣布大模型API永久降价,最高降幅99%

来源:互联网 时间:2026-05-28 09:17:24

图片来源:界面图库

大模型市场的价格战,又添了一把猛火。就在今天,小米技术发布公告,宣布其MiMo-V2.5系列API实施永久降价,最高降幅直接拉到了惊人的99%。这距离DeepSeek宣布永久降价才过去没多久,看来,一场围绕API调用成本的“地板价”争夺战,已经全面打响。

这次降价,小米不仅动了价格,还改了规则。他们取消了传统定价中区分上下文窗口长度的做法,同时对Token Plan计费体系做了优化。简单来说,在同等付费价格下,开发者能用的Token量,最高可以提升到原来的5到8倍。性价比这三个字,算是被小米玩明白了。

具体来看降价细节,力度确实不小。以高性能的MiMo-V2.5-Pro为例,调价后,输入缓存命中的价格仅为0.025元/百万tokens。这是个什么概念?对比原价中≤256k规格的1.40元,降幅高达98%;如果对比原来256k-1M长窗口规格的2.80元,降幅更是触及了99%的关口。至于输入未命中缓存和输出的价格,也分别有57%-86%不等的显著下调。

标准版的MiMo-V2.5降价力度同样不含糊。其输入缓存命中价格调整至0.020元/百万tokens,相比原价最高降幅达98%;输入未命中缓存和输出的价格,降幅也都在64%到93%之间。对于广大中小开发者而言,这样的价格无疑大大降低了试错和创新的门槛。

需要留意的是,本次调价主要聚焦在MiMo-V2.5这个核心系列上。MiMo-V2.5-TTS系列依旧维持限时免费接入的政策,而更早的MiMo-V2-Pro与MiMo-V2-Omni两款高阶模型,其API价格则保持原价不变。同时,旧系列的Token Plan套餐也不再参与调整并即将下线。这一系列动作的意图非常清晰:就是引导开发者全面转向性价比更高的V2.5系列。

小米的AI野心与人才牌

MiMo-V2.5系列的快速迭代,离不开背后的关键人物——罗福莉。这位曾在DeepSeek任职的95后AI技术人才,于2025年11月正式加盟小米,出任MiMo大模型负责人。她组建的研发团队平均年龄仅25岁,清北毕业生占比超过六成。有市场消息称,雷军是以千万年薪的诚意,才将这位年轻的技术领军人物招致麾下。

在罗福莉的统筹下,小米MiMo大模型完成了多代快速迭代。今年3月,小米正式推出MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS三大基础模型,随后又快速迭代出V2.5进阶版本,补齐了高性能推理、轻量化通用交互、语音合成等全场景能力。如今,V2.5系列已成为小米大模型阵列中面向商用普惠市场的主力产品。

目前,小米已经构建起一个层次较为清晰的MiMo大模型产品矩阵:MiMo-V2.5-Pro主打高性能复杂推理,面向企业级智能体开发、深度业务分析等高阶场景;MiMo-V2.5聚焦轻量化通用需求,服务广大中小开发者;MiMo-V2.5-TTS则以免费策略主攻语音合成赛道,意在抢占音频生态的入口。此外,还有定位旗舰基座的MiMo-V2-Pro和专注全模态融合的MiMo-V2-Omni,共同组成技术高地。

就在降价公告发布的前一天,小米创始人雷军还对外透露,“Xiaomi MiMo-V2.5-Pro在Artificial Analysis榜单的综合智能指数、Agent指数上,已取得全球开源模型并列第一的成绩”。他同时宣布,未来三年小米在AI领域的投入计划高达600亿元。这无疑向市场释放了一个强烈的信号:小米在AI大模型赛道,是认真的。

降价潮背后的行业逻辑

小米并非第一个吹响降价号角的玩家。在此之前,国内头部大模型公司DeepSeek已经率先开启了“永久降价”模式,主要针对其DeepSeek-V4-Pro模型。该模型API在5月31日结束限时优惠后,整体价格将调整为原定价的四分之一。调价后,其输入缓存命中价格同样为0.025元/百万tokens,整体实现了75%的降幅。

DeepSeek-V4于今年4月下旬发布,凭借百万字超长上下文、领先的Agent能力和推理性能,在国内与开源领域都引起了广泛关注。其调用成本远低于GPT-4o、Claude等国际主流模型,这种高性价比策略帮助它快速抢占了大量开发者与企业用户,也为小米等厂商的跟进降价提供了现实的市场范本。

实际上,放眼整个国内大模型市场,一场“K型分化”正在悄然形成。一边是阿里云通义千问、字节跳动豆包等通用型大模型相继下调API价格,走“以价换量”的路线;另一边,智谱GLM、腾讯混元等主打企业级深度定制和私有化部署服务的模型,则维持价格稳定甚至有小幅上调,坚守“溢价保值”的高端市场。通用模型降价走量,高端模型溢价保值——这已成为当前市场的新格局。

这一现象的背后,远不是简单的价格战可以概括。它标志着整个行业正从初期的无序营销竞争,转向深层次的技术效率竞争。降价,不再是单纯的市场手段,而是底层算法持续优化、推理技术不断升级、以及算力成本稳步下行等多重因素共同驱动的必然结果。

AI聚合平台AI.cc发布的《2026年AI API基础设施报告》也印证了这一趋势。报告显示,过去一年,企业级大模型的Token调用成本同比暴跌了67%。与此同时,开源模型已经占据了企业Token调用量38%的份额。这些数据都清晰地指向一个结论:在技术快速普及的阶段,性价比,已经成为决定市场胜负的核心要素。

可以预见,随着技术红利持续释放和规模效应进一步显现,大模型API的调用成本还有继续下探的空间。这场由头部厂商引领的降价潮,或许才刚刚开始。对于整个生态而言,更低的门槛意味着更繁荣的创新,最终受益的,将是整个产业。