震惊!NVIDIA一口气放出Vera Rubin“全家桶”:7颗芯片+液冷机架要颠覆AI工厂

620865940543486

NVIDIA在GTC 2026推出面向代理式AI与超大模型的Vera Rubin平台,整合七款晶片与五种机架参考设计,覆盖训练、推理与数据中心能效。核心晶片包括Vera CPU(88核定制Olympus,强化单线程与每瓦效能并开始单独销售)、Rubin GPU(NVFP4每卡约50 petaflops,配HBM4)、NVLink‑6互联、BlueField‑4 DPU、Spectrum‑6交换器、ConnectX‑9 SuperNIC与Groq 3 LPU。NVL72机架整合72颗Rubin GPU与36颗Vera CPU,搭配NVLink‑6与DPU加速,宣称训练大型混合专家模型所需GPU仅为上一代的四分之一,推理每瓦数据传输提升10倍、每词元成本可降至约十分之一。整套平台采用100%液冷、45°C工况与精简线缆,减轻散热与运维负担。Vera CPU机架为MGX架构、可扩展到256颗CPU;Rubin Ultra采Kiber垂直插入设计,单一NVLink下可达144颗GPU。Groq 3 LPX推理机架以256颗LPU、128GB SRAM与640TB/s带宽应对兆级参数推理,可显著提升每瓦推理吞吐。BlueField‑4 STX存储机架通过DOCA Memos将GPU内存延伸至POD,优化KV缓存与读写,推理数据传输效率提高约5倍。Spectrum‑6 SPX采用共同封装光学Spectrum‑X技术,光学能效与韧性显著提升。NVIDIA同时公布Vera Rubin DSX AI工厂参考设计,已与Anthropic、Meta、Mistral、OpenAI合作,HP、Dell、Cisco、联想及华硕、鸿海、技嘉等厂商将推出相关服务器。安托特报员