究竟该如何给DeepSeek估值
三周时间,一家公司的估值能翻几番?DeepSeek给出了一个令人咋舌的答案。从四月初传闻的百亿美元,到四月下旬突破两百亿,再到五月初的四百五十亿,直至上周传出的超五百亿美元上限——如果成真,这无疑将刷新中国AI公司的单轮融资纪录。
更值得玩味的是融资结构。根据多方报道,本轮融资中最大的一张支票,并非来自风投机构或互联网巨头,而是出自创始人梁文锋本人。据称,他个人可能出资最高200亿元软妹币,占融资总额的40%。通过增资,其直接持股比例将从1%大幅提升至34%,加上间接持股,合计控制约84.29%的股权。
另一个打破常规的参与者,是全称“国家集成电路产业投资基金”的“大基金”。这支投出过中芯国际、长江存储等半导体产业核心项目的国家级资本,此前从未公开注资大语言模型厂商。它的入场,标志着某种战略层面的认可。
这一切,与DeepSeek过去留给市场的印象形成了鲜明反差。这家公司最鲜明的标签一度是“不融资、不商业化、不路演”,背靠母公司幻方量化的资金储备,它几乎没有任何主动的商业化动作。因此,当如此高的估值摆在面前时,用衡量其他模型公司的“市梦率”框架来看,显得格外“神奇”。
于是,几个核心问题浮出水面:估值为何能在三周内翻五倍?“大基金”为何破例入场?创始人又为何要自己掏出最大一笔钱?
把这些线索拼在一起,你会发现,用“又一家模型公司”的视角已经无法解释这场融资。它需要另一套解读框架。一个逐渐清晰的答案是:
DeepSeek或许从来就不是一家单纯的“模型公司”,它更像是一家“长成了模型公司模样”的基础设施公司。
1. 核心命题的转移:从“做好模型”到“重建体系”
梁文锋在2024年谈到融资时曾有一句直白的表述:“我们面临的问题从来不是钱,而是高端芯片被禁运。”这句话很关键,它点明了DeepSeek思考问题的原点。
对于典型的模型公司而言,核心命题是数据、算法和人才,芯片是重要的成本项,但并非战略生死项。而将芯片禁运视为“核心问题”,意味着DeepSeek从第一天起,其注意力分配就发生了偏移:除了思考“如何把模型做得更好”,更多精力可能放在了“如何在算力受制于人的条件下,重建一套能跑起来、甚至能跑赢的体系”。
如果回溯DeepSeek那些标志性的技术创新——从MLA(混合专家注意力)到MoE(混合专家模型),从FP8低精度训练到极致的推理效率优化——本质上都是同一个核心问题的不同解法:
如何用更少、更受限的算力,做出顶级的模型。
那么,如果DeepSeek不是一家纯粹的模型公司,该给它怎样的定价?参考系又该是谁?答案显然不是Kimi、智谱或MiniMax。此次传出的融资结构,恰恰为我们提供了判断的思路。
2. 融资的三重逻辑:战略、生态与掌控
时间线值得仔细审视。4月24日,DeepSeek-V2发布,其技术报告里出现了一行具有里程碑意义的文字:“我们在英伟达GPU和华&为昇腾NPU两个平台上均验证了细粒度EP方案。”这是万亿参数级别的大模型,首次在正式技术文档中完成对国产AI芯片的官方认定与验证。发布当天,包括华&为昇腾、寒武纪在内的8家国产芯片即宣布完成适配,打破了以往需要数月调试的行业惯例。
为了这一行字,团队过去数月与华&为、寒武纪等厂商进行了密切合作。有报道称,这也是其专门推迟发布计划的重要原因——需要对模型底层进行大量调整与重写。
而融资的启动,就发生在这期间。
接下来的融资传闻中,其实隐含着
三笔钱,三种截然不同的投资逻辑,它们彼此独立,互不交叉。
第一笔,来自“大基金”。
而DeepSeek用V2的国产芯片适配,解开了这个心结。它证明了自己不仅仅是一个模型提供商,更是一个能带动国产算力生态跑通的关键“应用牵引力”。大基金现在可以用另一套语言来描述这笔投资:它投的是“国产芯片+国产模型”自主闭环的战略节点,是用顶尖模型需求倒逼和加速国产算力应用迭代的基础设施环节。这件事,在它的投资逻辑里,与投资一家晶圆厂具有同等级别的战略意义。
第二笔,可能来自腾讯等产业资本。
3. 设计的“割裂”:长期战略与商业节奏的并行
这就带来一种奇特的“割裂感”:一边引入锁定国家长期战略的资本,确认自身的基础设施身份;另一边引入寻求产业协同和商业回报的资本,打开商业化入口。这两件事在多数公司身上往往是矛盾的,但从融资结构看,DeepSeek似乎试图让它们彼此独立运转,互不拖累。
也就是说,融资之后,DeepSeek的商业化进展快慢,与“算力自主”这类宏大叙事能否做成,在理论上可以不相干。
大基金对应的,是五年、十年为周期的长期命题,它不需要季度性的财务回报;腾讯等产业资本对应的,则是另一条线,商业化节奏完全可以跟随市场,与其他模型公司同台竞技。
事实上,在讨论DeepSeek“商业化困境”时,外界常常忽略一些事实:其API定价已击穿行业底线,例如V2-Flash缓存命中输入成本低至0.02元/百万词元,综合成本仅为GPT-4等模型的极小比例。将推理成本压到这种程度,意味着API这门生意本身就有望实现盈亏平衡。同时,a16z最新的《Top 100 Gen AI Consumer Apps》报告显示,DeepSeek的网页流量在中美之间分布,移动端用户基本盘稳固。这意味着,理论上其他模型公司能走通的商业化路径,它都能跟上,且边际成本可能更低。
其实,这种“割裂”恰恰是DeepSeek区别于其他公司的核心特质,是它主动设计出来的,并且从幻方时代就已存在。
然而,这种精妙的平衡高度依赖梁文锋个人同时掌握两边的方向盘。它本质上是人格化的,而非结构化的。一旦大量外部资本进入,平衡被打破的风险将真实存在。
因此,这次融资所做的,正是试图将这种依赖个人意志的“割裂”,第一次通过股权结构“写死”。
这就引出了最独特的那部分——第三笔钱,梁文锋个人的巨额出资。
梁文锋一个人出的钱,已经足以匹配大多数模型公司单独一轮的融资额。
这笔个人出资,买的是对整个公司核心方向和治理结构的“锁定权”。无论引入多少外部战略或财务资本,核心决策权不会被稀释。外部那60%的资金进来,不是为了让它作为一家模型公司“活下去”——幻方的钱够,梁文锋自己的钱也够。每一个外部投资方选择进入,恰恰是因为DeepSeek正在演变为某种超越模型公司范畴的存在。

4. 人才流失:被夸大的叙事?
此次融资,此前也被部分解读为应对核心人才流失的举措。但若仔细观察,情况可能并非如此。
离职的核心成员确实重要,覆盖了基座模型、推理、OCR、多模态等关键技术主线。然而,根据《财经》等机构整理的详尽数据,在27篇核心论文中间出现频率最高的15位作者中,仅2人离职;DeepSeek-LLM发布时的86人核心团队,仍有71人出现在V2的论文作者名单中。以约300人的研发团队规模计算,核心人员离职率约为3.3%——关注AI人才争夺战的人会明白,这个数字在业内处于极低水平。
期权定价对留住人才确有实际价值,但这更像是融资顺带解决的问题。DeepSeek的逻辑似乎一直是:坚持做正确且长期的事,许多眼前的具体问题(包括留人)会在过程中自然消解。这或许是理解其所有决策的一个通用视角。
5. 真正的坐标系:定价尚未发生的未来
要彻底理解这场融资和500亿美元估值,最后一个关键问题是:DeepSeek的竞争对手究竟是谁?
英伟达定义了当前AI时代的算力游戏规则,几乎所有模型公司都活在这个边界内。而DeepSeek,是一家试图重新划定这个边界的公司。V2完成昇腾适配的那一刻,就是这个判断第一次得到公开验证。
DeepSeek最在意的对标对象,或许从来就不是国内的模型厂商,而是英伟达。
500亿美元的估值,定价的显然不是当前的模型能力、年度经常性收入(ARR)或用户规模。全球范围内,Kimi最新投后估值约200亿美元,有真实收入支撑;Anthropic估值高达数千亿美元,年化收入已突破百亿。相比之下,DeepSeek商业化收入几乎从零开始,估值却能达到Kimi的两倍以上,并且最大一部分资金来自半导体国家基金——这本身就说明,
差价定价的不是商业化预期,而是“基础设施溢价”。
如果DeepSeek最终做成了它试图做的事——构建一套不依赖英伟达的前沿AI算力体系,成为一个以开源为基础的中国AI基础设施——那么它的比较对象,应该是某个介于“星际之门”级别的OpenAI和英伟达之间、目前尚未被明确定义的位置:既做顶级前沿模型,又试图用新方法解决算力基础设施的根本问题。放眼全球,目前找不到第二家这样的公司。
从这个坐标系回望,500亿美元是破纪录的,但可能仍然是“便宜”的。此次融资,本质上是在为一件尚未发生、但已初见轮廓的未来定价。这件事能否最终实现,取决于梁文锋能否做成他从第一天起就在坚持的那件事。而从幻方到DeepSeek的整个路径来看,他是一个将长期主义执行得极为彻底的人。坚持做正确且长期的事,很多具体问题会在过程中迎刃而解。这轮融资,或许正是他第一次让外部世界清晰地看到这件事完整的轮廓与惊人的潜力。