本文聚焦英伟达在数据中心GPU架构方面的最新动态,介绍了从已确认的下一代“Rubin”架构到下下一代“Feynman”架构的相关信息,包括架构特点、性能提升、产品规划等内容。
在科技发展的浪潮中,英伟达一直是引领数据中心GPU领域前进的重要力量。英伟达创始人兼首席执行官黄仁勋早在去年COMPUTEX 2024主题演讲里就已经明确,下一代数据中心GPU架构被命名为“Rubin”,并且该架构将采用全新的HBM4技术。而在今天凌晨举行的GTC 2025大会上,英伟达不仅更新了数据中心GPU的路线图,还向外界公布了下下一代数据中心GPU架构的名字——“Feynman”。
据TomsHardware的详细报道,黄仁勋在此次活动中透露了一些关键信息。基于Blackwell架构的B200实际上每个GPU配备了两个芯片,这一设计对NVLink拓扑结构产生了改变。当前所提供的解决方案B200 NVL72,从更精准的角度来看,应该被称作“NV144L”。在接下来基于Rubin架构的解决方案方面,英伟达进行了重新的命名和规划。预计在2026年下半年登场的将是Rubin NVL144,它能够与Blackwell NVL72基础设施实现直接兼容。
在性能方面,Rubin NVL144相较于Blackwell Ultra B300 NVL72有着显著的提升。当处于同一配置数量(144个GPU芯片)的情况下,Rubin NVL144的FP4计算性能将从1.1 PFLOPS大幅提升至3.6 PFLOPS。尽管每个GPU对应的显存均为288GB,但由于升级至HBM4技术,带宽从8TB/s提升到了13TB/s。此外,英伟达还会引入速度更快的NVLink,使得总吞吐量提高一倍,达到260TB/s,机架之间新的ConnectX – 9链路速度将达到28.8TB/s。
Rubin产品线的另一项重要更新是CPU的升级。英伟达用Vera CPU取代了当前使用的Grace CPU。Vera CPU是一款相对小巧紧凑的处理器,它拥有88个自定义Arm内核,总共具备176个线程。此外,它还配备了一个1.8TB/s的NVLink核心到核心接口,用于与Rubin GPU进行连接。
到了2027年下半年,英伟达还会推出Rubin Ultra产品。这款产品一方面保留了Vera CPU,另一方面对GPU进行了加强,将其更换为HBM4E,从而进一步提升性能表现。同时,整个机架将被新布局NVL576所取代,这意味着在一个机架规模的解决方案内最多可以容纳576个GPU。这一改进使得FP4推理计算性能飙升至15 ExaFLOPS,FP8训练计算性能达到5 ExaFLOPS,计算能力大约是Rubin NVL144的4倍。
时间来到2028年,英伟达将会带来名为“Feynman”的下下一代数据中心GPU架构,该名字取自著名物理学家Richard Phillips Feynman,这也为英伟达的技术发展增添了一份科学的色彩。
英伟达在GTC 2025大会上更新的数据中心GPU路线图,包括下一代“Rubin”架构及其相关产品的性能提升、CPU升级等情况,还提到了下下一代“Feynman”架构。这些架构的更新和产品规划展示了英伟达在数据中心GPU领域持续创新和提升性能的努力,有望为数据中心带来更强大的计算能力,推动相关领域的发展。
原创文章,作者:Edeline,如若转载,请注明出处:https://www.qihaozhang.com/archives/1519.html