首页

手游

资讯

专题

首页 > 教程攻略 > ai资讯 >Vera Rubin Pod：黄仁勋甩出的AI终极杀器

Vera Rubin Pod：黄仁勋甩出的AI终极杀器

来源：互联网时间：2026-06-25 07:49:37

当AI正式进入智能体（Agent）时代，大模型之间的交互、长上下文记忆、混合专家（MoE）、强化学习，已经把传统算力集群彻底榨干了。面对这种局面，英伟达没有选择简单升级显卡，而是直接重新定义了整座 AI 工厂——

Vera Rubin Pod

来了。

这可不是一台服务器，也不是一个机架，而是一套从芯片到电网、从计算到存储、从训练到推理，完全重构的POD级AI超级计算机。它的目标只有一个：

把每一度电，都变成AI的token；把每一颗芯片，都跑在智能体的极致效率里。

一、Vera Rubin Pod 到底是什么？

简单来说，这是英伟达用第三代MGX模块化架构，打造的一套“超级AI一体机”。5类专用机架各司其职，7类芯片协同工作，从芯片到电网全链路打通，40个机架共同组成了一座完整的“AI工厂”。其算力高达

60 EFLOPS

，总带宽

10PB/s

。以前的逻辑是买GPU，现在英伟达直接卖给你一整套可以立刻量产智能体AI的超级基础设施。

二、五大机架分工：像器官一样协同，缺一不可

Vera Rubin Pod 最令人惊叹的地方，在于它把AI工作流拆解为5个专属机架，各自专精又全线打通。

1）NVL72 核心计算机架：整座AI工厂的心脏

单机架内塞进了

72颗Rubin GPU + 36颗Vera CPU

，通过第六代NVLink铜背板硬连在一起，相当于一个机架变成了一颗巨型GPU。其训练性能比Blackwell高

4倍

，推理能效高

10倍

，单GPU带宽达

3.6TB/s

，整机架带宽

260TB/s

，甚至超过全球互联网总带宽。这个机架专门负责MoE路由、预训练、大模型推理等核心任务。

2）Groq 3 LPX 低延迟推理机架：智能体“秒回”的关键

英伟达把Groq的LPU直接做成了机架级引擎。256颗LPU硬连，可处理万亿参数模型，做到低延迟、大上下文，token生成速度提升

35倍

。它解决的核心问题是：智能体必须快，必须稳，不能等。

3）Vera CPU 机架：强化学习与沙箱验证底座

智能体需要试错、模拟和决策，这全部依赖CPU沙箱。单机架集成

256颗Vera CPU

，支持

22500个并发沙箱

，能效提升

2倍

，速度快

50%

。这个机架就是AI智能体的“训练场”。

4）BlueField-4 STX 存储机架：AI原生存储，专门存KV Cache

这是全球第一个为AI设计的存储机架。它把KV缓存彻底从GPU剥离出来，实现了上下文容量的无限扩展，吞吐提升

5倍

，能效也提升

5倍

。以后大模型再长的上下文，都不会爆显存了。

5）Spectrum-6 SPX 网络机架：整台超算的“神经中枢”

全机架采用CPO共封装光学技术，配合Spectrum-X和Quantum-X800网络，实现了102.4T交换机、512端口、200G CPO光模块，达到近100%的有效带宽和

零抖动

。它保证了所有机架像一台机器一样同步工作。

三、真正的黑科技：第三代MGX架构，从芯片到电网全优化

Vera Rubin Pod 的强大，不只在于堆芯片，更在于极致的工程设计。

1）无电缆模块化：装机从2小时缩到5分钟

MGX架构用铜质背板取代了成千上万根线缆，计算托盘即插即用。维护性提升了

20倍

，单宽机架的设计也让运输和部署变得极其简单。

2）45℃液冷：不用冷水机，PUE接近极限

支持45℃温水直接冷却，大部分地区可以无压缩机自然冷却，省电、省水、省基础设施，PUE值直逼理论极限。

3）智能电网级电源：峰值电流降25%

通过动态功率导向、机架级电容储能平滑波动、以及动态Max-Q释放闲置功率三层电源黑科技，在同一预算下可以多跑30%的GPU。

四、扩展能力恐怖：从72卡、576卡到1152卡

这套超算是真正能线性扩展的：从单机架的

NVL72（72卡）

，到8机架拼成的

Ultra NVL576（576卡统一域）

，再到下一代

Kyber NVL1152（1152卡超级集群）

。从实验室到千卡超算，一套架构全部打通。

五、Vera Rubin DSX：直接给你一座“AI工厂蓝图”

英伟达甚至怕你不会搭，直接提供了

DSX全栈参考平台

。这个平台包含了从芯片到电网的全套设计、软件、API、库和管理工具，能数倍提升落地速度，并大幅提升电网利用率。用一句话总结：你买的不是超算，是一整套能赚钱的AI工厂。

六、结语：AI基础设施的时代，彻底变了

Vera Rubin Pod 的发布，标志着一个时代的终结。今后，不再是谁的显卡多谁就强，而是谁的AI工厂更强大。它为智能体AI量身定做，集低延迟、高吞吐、高能效、全链路、可扩展、可量产于一身。训练更强、推理更快、上下文更大、成本更低、功耗更优、部署更简单——这就是英伟达的终极答案：不跟你拼芯片，直接定义下一代AI基础设施。