降价75%,DeepSeek“错峰定价”,压力给到了豆包们?
这可能也是 DeepSeek 有意为之的策略布局。
毕竟,推理模型成为大模型厂商的共识已经是板上钉钉的事。通过设定优惠时段来拉齐定价,DeepSeek 不仅降低了开发者使用 R1 的成本顾虑,事实上也在模糊两种模型的边界,鼓励开发者按需灵活调用。这让人联想到 Anthropic 前两天推出的全球首款混合推理模型 Claude 3.7 Sonnet,它同样结合了传统模型的“快速响应”与推理模型的“深度思考”,目的是提供更具弹性的计算和更贴合实际场景的 AI 体验。

图/ Claude
不过,这次调整真正的核心,还是“错峰定价”这种运营策略的引入。它带来的好处可以说是“肉眼可见”,不仅可能引发豆包、通义千问等头部大模型的跟进,甚至可能成为又一场大模型价格战的导火索——一如 2024 年初,DeepSeek-V2 发布后掀起的那场价格风暴。
DeepSeek-R1 杀价!比豆包们便宜吗?
需要说明的是,DeepSeek-V3 此前其实已经“降过价”。雷科技之前报道过,V3 的“优惠体验期”在本月初已经结束,而此前全时段的优惠价,甚至比现在优惠时段的价格还要更低。

2 月初结束了,图/ DeepSeek
但 DeepSeek-R1 却不同,发布以来价格一直没变:输入(缓存命中)1 元/百万 tokens、输入(缓存未命中)4 元/百万 tokens、输出 16 元/百万 tokens。正因如此,这次 R1 高达 75 折的“错峰降价”,才显得格外有分量。
坦白讲,到了今天这个节点,DeepSeek-R1 的能力想必已经不需要再多做强调。无论是产品层面思维链的创新,还是工程层面实现极致成本的突破,都让它成为当下最成功的模型之一。在此基础上,降价无疑是最直接有效的手段之一,既能降低开发者的调用门槛,也能间接将更好的 AI 体验推广到更多应用之中。
事实上,即便在标准时段,DeepSeek 的价格也已经比不少厂商的大模型更便宜,而优惠时段的价格更是碾压很多主力模型:

单位为每百万 tokens,图/雷科技
以字节跳动的豆包通用模型为例,火山引擎平台显示:doubao-pro-32k 输入 0.8 元/百万 tokens,输出 2 元/百万 tokens;doubao-pro-128k / doubao-pro-256k 输入 5 元/百万 tokens,输出 9 元/百万 tokens。更夸张的是,火山引擎上 deepseek-r1-distill-qwen-32b(蒸馏版)的价格是:输入 1.5 元/百万 tokens、输出 6 元/百万 tokens。

也就是说,DeepSeek-R1 官方满血版在优惠时段的价格,甚至比 32b 蒸馏版还要便宜。
这还只是国内。DeepSeek-R1/V3 在海外也同步推出了同样的策略,同样有 50% 到 75% 的大幅降价,优惠时段直接对应北京时间 00:30 至 08:30。换算一下,伦敦时间 16:30 至 00:30、纽约时间 11:30 至 19:30,都能直接享受到 DeepSeek 官方的优惠时段价格。换句话说,对于不少面向海外市场的开发者来说,DeepSeek 的吸引力更强了——相当于在高峰时段,享受了优惠时段的价格。
错峰优惠很动人,豆包们将如何迎战?
错峰定价本身并不稀奇,最熟悉的例子就是错峰电价——不同时段用电,价格差不少。为了缓解高峰时段的用电压力,同时避免低谷时段的电能浪费,国内通过峰谷价差来鼓励用户错峰用电,从而优化电网资源配置、降低用户成本、挖掘更多经济与生态效益。
DeepSeek 官方在新闻稿中也提到,推出错峰优惠活动的目的是:“鼓励用户充分利用这一时段,享受更经济更流畅的服务体验。”

从开发者的角度来看,这种定价策略几乎称得上“百利而无一害”。而对于大模型厂商和云计算平台而言,其实也是利大于弊——可以更充分地利用服务器资源。所以,目前来看,其他大模型跟进错峰定价几乎是题中应有之义,只是具体策略上会有所调整,比如前文提到的不同时区问题。
不过,DeepSeek 这次会引发行业连锁反应,甚至复刻一年前的大模型价格战吗?恐怕还有待观察。
关注 AI 圈动态的读者可能还记得,2024 年 5 月初,当时还“名不见经传”的 DeepSeek 发布了第二代 MoE 大模型 DeepSeek-V2,并首次引入多头潜在注意力(MLA)机制。2360 亿参数,每个 token 210 亿个活跃参数,堪称当时最强的开源 MoE 模型。

DeepSeek V2 技术论文摘要,图/雷科技
但更重要的是,DeepSeek-V2 的价格定在了:输入 1 元/百万 tokens、输出 2 元/百万 tokens。现在看可能不算惊艳,但当时这个价格仅为 ChatGPT 主力模型 GPT-4 Turbo 的近百分之一,性价比直接秒杀了国内外一众大模型。也正是从那时起,“DeepSeek(深度求索)”这个名字被更多人记住,并被冠以“AI 界拼多多”的称号。
更让人印象深刻的是,DeepSeek-V2 之后,中国大模型价格战一触即发。字节、腾讯、百度、阿里等大厂纷纷降价,通义千问对标 GPT-4 的主力模型 Qwen-Long,API 输入价格甚至从 20 元/百万 tokens 直降至 0.5 元/百万 tokens。
“错峰定价”的运营策略或许很难单独推动新一轮价格战,但考虑到 DeepSeek 在开源周展现的一系列能力——比如长上下文的突破、芯片利用效率的提升等——未必不会成为又一轮价格战的“新开端”。
写在最后
DeepSeek 毫无疑问是今年以来 AI 行业最大的那条鲶鱼。就连业界领头羊 OpenAI,也被迫做出了诸多回应。根据多家媒体爆料,OpenAI 近期计划推出“酝酿已久”的 GPT-4.5。
当然,其他厂商的追赶与超越,也在倒逼 DeepSeek 自己加快节奏。路透社最新报道指出,新一代 R2 推理模型确实要来了,原计划 5 月推出,但 DeepSeek 最近已经在考虑提前。
这些变化,都在推动 AI 的迭代与进步,也在悄然改变着今日的世界。