DeepSeekV4永久降价！缓存命中再打1折，实测编程成本骤降83%

来源：互联网时间：2026-06-22 18:32:26

DeepSeek又出手了，而且这次是连续两天、两次降价。在输入输出价格已经打了2.5折的基础上，针对命中缓存的输入部分，又来了个“折上折”，直接再打一折。

这里有个关键点值得划出来：输入缓存的折扣，并没有规定任何时限。

这一点也得到了DeepSeek研究员陈德里的确认——输入缓存是永久降价。官方还为此打上了“AGI for Everyone”的标签，意图相当明确。

有行业学者评价，这一举措可能会彻底改变人们处理AI记忆和上下文的方式。毕竟，成本一直是制约长上下文应用普及的关键门槛之一。

现在回头再看当初发布时那句“迈入百万上下文普惠时代”的口号，似乎有了更实在的注脚。这不仅仅是技术能力的普惠，更是使用成本的普惠。

实测编程整体节省83%

那么，打折后到底能省多少钱？实际算下来，可能比表面看到的数字还要可观。

以Agent编程任务为例，这类场景有一个显著特点：输入token的比例远高于输出。同时，DeepSeek在缓存优化方面本就做得相当出色，其V4-Pro模型的输入缓存命中率大约在95%，V4-Flash也达到了91%左右。

这意味着，在实际花费中，绝大部分token都是按照“命中缓存的输入”这一最低档价格来计算的。细看价目表会发现，在这一档位上，V4-Pro每百万token只比V4-Flash贵了0.5分钱，性能与成本的权衡变得非常微妙。

此前有测试显示，消耗约3500万token，花费了31.73元。

若将同样的数据交给DeepSeek模型按新价格计算，结果与真实花费相差无几。但关键在于，如果按照这次降价后的新价格来算，完成同样的工作只需要5.34元。

整体节省幅度高达约83%。换句话说，现在只需花费原来17%的成本，就能获得同等的产出。这个降幅，对于高频用户而言，感受会非常直接。

另一项实际测试也印证了这一点。在消耗了1300万V4-Pro token的任务中，缓存命中率小幅提升至96%左右，输出token的占比与降价前测试的情况基本一致。

最终实际花费为2.36元，与理论计算结果基本吻合。这充分说明了新定价策略的稳定性和可预测性。

DeepSeek再次祭出降价大招，在行业内引发震动，这已经不是第一次了。纵观其发展路径，这种激进的商业策略与其技术理念一脉相承：通过底层架构和算法的持续创新，不断压低模型推理的边际成本，并毫不犹豫地将这些成本优势转化为凌厉的市场竞争力。

回溯到2024年8月，DeepSeek就曾对其V3模型大幅降价，直接引发了阿里云、字节跳动等大厂的跟进，拉开了第一轮大模型token价格战的序幕。随后在R1模型发布时，又通过夜间空闲时段额外打折等策略，让价格战的温度再度攀升。

而这一次V4系列的价格调整，对海外用户产生的心理冲击可能更为强烈。如果按美元计价，那小数点后的位数，恐怕得多看几眼才能数清。

有网友总结得很到位，学生、AI初学者以及小型企业将成为最直接的受益者。极高的性价比，使得大规模、长时间调用模型进行实验、开发和部署，不再是一件需要精打细算、畏首畏尾的事情。

这往往预示着更大的动作还在后头。

市场已经开始期待，等到下半年DeepSeek大规模部署华&为算力之后，价格方面还能带来怎样的惊喜。这场围绕“普惠”的竞赛，显然才刚刚进入一个新的阶段。