DeepSeek“变胖了”:融资500亿,买国产算力、招人、冲刺AGI
来源:互联网
时间:2026-07-02 14:17:12
6月29日晚,DeepSeek发布消息,V4正式版将于7月中旬上线。公告中提到,为了更合理地分配资源、提升服务稳定性,正式版发布后API定价策略将同步调整,引入峰谷定价机制。
过去两周,DeepSeek身上还发生了两件大事。一件是6月16日,公司完成了成立以来的首轮外部融资,总额510亿元,估值接近4000亿元。这一举动直接打破了创始人梁文锋此前“不融资、不上市、不商业化”的原则。另一件则是融资后仅十几天,6月27日,DeepSeek团队与北京大学联合发表了一篇论文,梁文锋本人也在作者名单中。
如果说DeepSeek的上半场,是在证明自己能做出世界一流的大模型;那么下半场,当资本和技术交汇,它需要拿着这笔钱,向外界证明自己是一家真正意义上的商业公司。
融资消息传出后,DeepSeek Harness团队的新负责人崔添翼一天都没闲着。6月25日晚,DeepSeek在多个社交平台发布大规模招聘信息,覆盖算法、研发、运维、产品、数据工程及职能部门等七大类,共33个岗位,工作地点设在北京和杭州,所有岗位均接受实习生。
在DeepSeek官网、Boss直聘、X、小红书等各类平台上,都能看到这位梁文锋的浙大校友、今年3月才加入团队的负责人亲自下场招人,顺便还抽空“辟谣”。

图为 崔添翼在小红书上回应“DeepSeek招人卡清华级学历,还卡豆包经历”的评论
要知道,过去的DeepSeek更像一个沉默、低调、闷头干活的技术员,背靠梁文锋创立的量化私募“幻方量化”。幻方量化2025年年化收益率达到56.55%,管理规模超过700亿元,这让DeepSeek一度不需要依赖外部资本,在外界看来,它似乎“并不缺钱”。
那么,是什么让梁文锋改变了融资态度?核心原因可能在于核心人才的流失风险,以及外部抢人大战的加速。
作为参照,已经抢先上市的“大模型第一股”智谱,截至6月30日,总市值已接近万亿港元;MiniMax的市值也超过了1300亿港元。反观DeepSeek,员工手里的期权还是一张白纸——公司不融资、不上市,没有外部估值参考。有接近DeepSeek的资深从业者分析:“不融资,估值就不往上走。员工手上的期权不会涨。相比之下,智谱、MiniMax以及一些其他大模型团队,估值要么暴涨,要么上市后暴涨。如果DeepSeek再不动,员工肯定留不住。”
留住人才的成本,是一笔不小的开支。2025年,DeepSeek最大的竞争优势,在于一支百余人的高学历“天才”团队——几十位顶尖研究员,加上极具技术理想主义色彩的创始人梁文锋,共同创造了DeepSeek-R1。但今年,各互联网大厂持续高薪“挖角”顶级AI研究员,市场对AI人才的需求激增。公开数据显示,算法岗位月薪中位数普遍超过2.4万元,头部人才月薪超过5万元,AI人才的溢价正在持续扩大。

前程无忧《2026届校招市场AI人才需求报告》
值得注意的是,在这次大规模招聘的岗位中,除了全栈开发、算法、AI核心系统研发、运维、产品等,HR、法务、财务、采购、行政等职能部门也在同步扩招。这种全方位“扩编”释放的信号很明确:DeepSeek正在补齐自己作为一家科技公司的组织能力。
从“产品驱动”迈向“组织驱动”,是许多科技公司必经的成长路径——在组织逐步成熟、平台不断完善、人才激励机制建立之后,大规模的产品红利才会真正释放。完成500亿融资,一方面是留人的需要,另一方面则为补全组织架构提供了基础条件。但在这个过程中,DeepSeek能否“轻盈转身”?在扩招后,如何保持“小团队作战”的精简高效和决策链的灵活敏捷?这是DeepSeek“下半场”要回答的第一个问题。
在6月25日发布的33个岗位中,有些方向的招聘值得特别关注——IDC(互联网数据中心)团队,涉及基础设施建设。早在4月中旬,DeepSeek就在内蒙古乌兰察布发布了首批数据中心岗位,包括数据中心高级运维工程师和数据中心高级交付经理。到了6月,又新增了“IDC设计规划工程师”岗位。
从数据中心运维、交付,再到设计规划,今年以来,DeepSeek的人才布局已经明确从模型研发延伸到了算力基础设施建设。

图为 DeepSeek IDC数据中心团队招聘岗位信息
这背后的逻辑很清晰:随着大模型进入规模化训练和推理阶段,AI模型公司的竞争,即将、也必然会进入“基础设施”的硬件竞赛。这推动DeepSeek不得不和硅谷最前沿的头部大模型公司一样,加入到自建算力集群的重资产“烧钱”游戏当中。
公开数据显示,美国科技巨头Alphabet、亚马逊、Meta和微软,预计今年将总共投资约6500亿美元来扩大人工智能相关基础设施。Anthropic和OpenAI也多次在公开披露的财务文件中强调,将持续加大算力基础设施投入。例如,Anthropic预计仅数据中心容量租赁,每月就要向SpaceX支付约12.5亿美元,一年就是150亿美元——这还不包括GPU采购、网络、运维等成本。
工信部信息通信经济专家委员会委员盘和林此前在采访中指出,当前AI投资热潮之下,大模型企业融资已是大势所趋:“不仅是DeepSeek,谷歌也融资800亿美元,行业已进入重资本阶段。”
为了不在算力重资本建设上掉队,DeepSeek必须在资金上“开源”——拿到融资,再投入算力、数据中心等基础设施建设。值得注意的是,DeepSeek建设算力基础设施,是在海外先进算力出口受限的背景下进行的。这意味着,上述算力将由国产芯片驱动。在DeepSeek V4发布时,官方页面和技术报告里已经提到了对国产算力的探索。5月底,华&为提出“韬(τ)定律”,试图通过器件、芯片、系统等全栈协同优化,突破摩尔定律放缓带来的瓶颈。国产大模型也正在加速适配国产算力,其探索目标是——“自主可控的AI基础设施”。
对于DeepSeek这样的基础模型公司来说,仅有资本和组织还不够。要想保持长期领先,关键是持续产出原创技术。一位资深算力从业者也强调,DeepSeek本轮大规模融资,本质上就是为了给团队激励、留下核心人才:“只有足够的融资,才能训出好模型,才能奠定头部位置。”
论文是观察DeepSeek在新技术探索方面的一个重要缩影。据不完全统计,近两年,DeepSeek公开发表了约27篇核心技术论文,研究方向覆盖MoE(混合专家)、强化学习、代码大模型、数学推理、多模态等,几乎对应了其每一代核心模型和关键技术突破。
就在6月27日,DeepSeek官方在GitHub上低调更新了一篇关于“DSpark”新技术的论文。

论文中,DeepSeek提出全新的推理加速框架“DSpark”,在不改变模型能力的前提下,大幅提升了大模型推理速度和系统吞吐
与以往不同,这篇论文并非迭代新模型,而是在原有DeepSeek-V4-Pro和DeepSeek-V4-Flash基础上增加了一个推测解码模块,重点在于工程落地层面的优化。DeepSeek的意图是,在将DSpark部署到线上服务系统、承接真实用户流量时,减少无效校验带来的算力浪费。论文中提到:“在不改变底层模型架构的情况下,将生成速度提高了60-85%。”对于每天处理海量API请求的AI公司而言,算力成本每降低一点,利润空间就增加一点。
据VentureBeat今年2月的消息,模型训练的费用只会越来越高。Anthropic的CEO Dario Amodei预测,未来一代前沿模型的培训成本将达到50亿至100亿美元。上述资深算力从业者表示,DeepSeek也将进入同样“烧钱”训练模型的阶段。为了支持模型训练的持续迭代,融资是早晚的事。
更多媒体解读认为,在融资后仅十几天就上线新论文,DeepSeek似乎在向外界证明:公司的核心节奏没有变,研发团队依旧保持着高频输出。
无论是上新模型、建设数据中心,还是从“天才实验室”转变为商业化运营的AI公司,DeepSeek进化的尽头只有一个——AGI。在2024年接受《暗涌Wa ves》采访时,梁文锋就明确表态:“我们做的就是AGI(通用人工智能)。语言大模型可能是通往AGI的必经之路。”
在免费阶段,用户对响应失败、对话中断、API限流等问题尚可容忍。但一旦7月DeepSeek V4正式版上线,用户对稳定性的要求将随之提高。如果问题持续存在,将直接影响用户是否愿意将DeepSeek接入真实工作流和业务系统。进入付费端、开发者生态和企业场景后,DeepSeek的工程能力将面临更严格的考验。模型能否真正走向大规模应用,也是进入AGI时代必须跨越的一道门槛。
当外界希望DeepSeek推动中国大模型降本增效时,它自己心里还盘算着一笔账:现在正处于AGI的关键时期,首要目的是留住人;其次是要持续训练模型、不断在技术层面迭代出新;数据中心的基础设施“仗”也不能输。光靠梁文锋的量化私募基金幻方量化,确实远远不够。
2026年,DeepSeek启动融资是一个必然的选择。正如它在6月25日晚发布的招聘公告中所写的那样:“当今人类正处于AGI的前夜。”下一步,DeepSeek要面对的是更长期、更烧钱的AGI竞赛。它能否像在“大模型”竞赛中间出圈一样,继续在AGI的进程中“领跑”?这是DeepSeek“下半场”要回答的第二个问题。