首页
看点啥
插画图片
首页 经济看点 Vera Rubin Pod:黄仁勋祭出的AI终极杀器

Vera Rubin Pod:黄仁勋祭出的AI终极杀器

2026-06-25 0

相关内容请参考“DeepSeek v4:国产化训练从0到1里程碑,战略意义大于性能意义”,AI、芯片、半导体、大模型等“97个技术专栏”,请参考智能计算芯知识

当AI正式进入智能体(Agent)时代,大模型之间的交互、长上下文记忆、混合专家(MoE)、强化学习已经把传统算力集群彻底榨干。英伟达没有选择升级显卡,而是直接重新定义了整座 AI 工厂——Vera Rubin Pod来了。

这不是一台服务器,不是一个机架,而是一套从芯片到电网、从计算到存储、从训练到推理完全重构的 POD 级 AI 超级计算机。它的目标只有一个:把每一度电,都变成 AI 的 token;把每一颗芯片,都跑在智能体的极致效率里。

一、Vera Rubin Pod 到底是什么?

它是英伟达用第三代 MGX 模块化架构做的一套 “超级 AI 一体机”。5 类专用机架,各司其职7 类芯片协同,全链路打通40 个机架组成一整座 “AI 工厂”算力高达

60 EFLOPS

10PB/s

简单说:以前你买 GPU;现在,英伟达直接卖给你一整套可以立刻量产智能体 AI 的超级基础设施

二、五大机架分工:像器官一样协同,缺一不可

Vera Rubin Pod 最恐怖的地方,是它把 AI 工作流拆成 5 个专属机架,各自专精、全线打通。

1)NVL72 核心计算机架:整座 AI 工厂的心脏

单机架塞进72 颗 Rubin GPU + 36 颗 Vera CPU,用第六代 NVLink 铜背板硬连在一起,相当于一整个机架变成一颗巨型 GPU

4 倍

10 倍

3.6TB/s

260TB/s

2)Groq 3 LPX 低延迟推理机架:智能体 “秒回” 的关键

英伟达把 Groq 的 LPU 直接做成机架级引擎:

低延迟、大上下文

35 倍它解决的是:智能体必须快、必须稳、不能等。

3)Vera CPU 机架:强化学习与沙箱验证底座

智能体要试错、要模拟、要决策,全靠 CPU 沙箱。

256 颗 Vera CPU

22500 个并发沙箱

2 倍

 

4)BlueField-4 STX 存储机架:AI 原生存储,专门存 KV Cache

这是全球第一个为 AI 设计的存储机架

5 倍

5 倍

以后大模型再长的上下文,都不会爆显存。

5)Spectrum-6 SPX 网络机架:整台超算的 “神经中枢”

全机架用CPO 共封装光学、Spectrum-X、Quantum-X800 打通:

零抖动它保证:所有机架像一台机器一样同步。

三、真正的黑科技:第三代 MGX 架构,从芯片到电网全优化

Vera Rubin Pod 强,不是强在堆芯片,而是强在工程设计

1)无电缆模块化:装机从 2 小时缩到 5 分钟

MGX 用铜质背板取代几千根线缆,计算托盘即插即用。

20 倍,单宽机架,运输部署极简单

2)45℃液冷:不用冷水机,PUE 接近极限

支持45℃温水直接冷,大部分地区可以无压缩机自然冷却

3)智能电网级电源:峰值电流降 25%

三层电源黑科技:

四、扩展能力恐怖:从 72卡、576 卡到1152 卡

这套超算是真正能线性扩展的:

NVL72:单机架 72 卡Ultra NVL576:8 机架拼成 576 卡统一域Kyber NVL1152:下一代 1152 卡超级集群

从实验室到千卡超算,一套架构打通。

五、Vera Rubin DSX:直接给你一座 “AI 工厂蓝图”

英伟达怕你不会搭,直接给了DSX 全栈参考平台

这就是:你买的不是超算,是一整套赚钱的 AI 工厂。

六、结语:AI 基础设施的时代,彻底变了

Vera Rubin Pod 的发布,标志着一个时代结束:以后不再比谁显卡多,而是比谁的 AI 工厂更强。

它为智能体 AI 量身定做:低延迟、高吞吐、高能效、全链路、可扩展、可量产。

这就是英伟达的终极答案:不跟你拼芯片,我直接定义下一代 AI 基础设施。

免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。

温馨提示:AI、芯片、半导体、大模型等“97个技术专栏”,请参考智能计算芯知识

喜欢(0)

上一篇

高通斥资近40亿美元收购Modular 加速布局AI软件与数据中心

高通斥资近40亿美元收购Modular 加速布局AI软件与数据中心

下一篇

拉上硬件:阿福做成健康AI的概率+1

拉上硬件:阿福做成健康AI的概率+1
猜你喜欢