NVIDIA Blackwell在最新MLPerf Training测试结果中展现突破性效能

陈俞萍／台北
2025/06/16
分享

NVIDIA Blackwell在最新MLPerf Training测试结果中展现突破性效能。NVIDIA

NVIDIA正与全球企业并肩建造人工智能（AI）工厂，加快训练及部署采用最新训练与推论技术的下一代AI应用。

NVIDIA的Blackwell架构专为满足这些对效能需求日渐升高的新型应用而打造。在最新一轮MLPerf Training测试中，同时也是自2018年推出这项基准测试以来的第12轮测试，NVIDIA AI平台在每项基准测试中均展现出最大规模效能，并驱动该基准测试中最具挑战性的大型语言模型（LLM）测试项目「Llama 3.1 405B预训练」的所有结果。

NVIDIA平台是唯一在每项MLPerf Training v5.0基准测试中均有提交结果的平台，这凸显其在各种AI工作负载中的卓越效能与任务多样性，包括大型语言模型、推荐系统、多模态大型语言模型、物体侦测与图神经网络（GNN）。

这次大规模提交的测试结果使用两部搭载NVIDIA Blackwell平台的AI超级电脑：Tyche采用NVIDIA GB200 NVL72机架规模系统打造，Nyx则以NVIDIA DGX B200系统为基础。

此外，NVIDIA也与CoreWeave和IBM合作，提交GB200 NVL72的测试结果，共使用2,496颗Blackwell GPU与1,248颗NVIDIA Grace CPU。

在最新的Llama 3.1 405B预训练基准测试中，Blackwell的效能较上一代架构在相同规模下高出2.2倍。

在Llama 2 70B LoRA微调基准测试中，搭载8颗Blackwell GPU的NVIDIA DGX B200系统效能，较上一轮使用相同数量GPU的测试结果提升达2.5倍。

这些效能上的跃进凸显Blackwell架构的优势，包括高密度液冷机架、每个机架搭配13.4TB的一致性存储器、用于垂直扩展的第五代NVIDIA NVLink及NVIDIA NVLink Switch互连技术，以及用于横向扩展的NVIDIA Quantum-2 InfiniBand网络技术。

此外，NVIDIA NeMo Framework软件堆叠的创新技术，提升了下一代多模态大型语言模型训练的水准，这对于将代理型AI应用推向市场而言至关重要。

这些由代理型AI驱动的应用，有朝一日将在AI工厂中运行，而这些AI工厂正是推动代理型AI经济的引擎。这些全新应用将产生各种词元（token）与宝贵的智能，可应用于几乎所有产业与学术领域。

NVIDIA数据中心平台包含GPU、CPU、高速互连架构和网络技术，以及种类丰富的软件，包括NVIDIA CUDA-X函式库、NeMo Framework、NVIDIA TensorRT-LLM与NVIDIA Dynamo。这套高度最佳化的硬件与软件，使得组织能更快速地训练及部署模型，显着加快创造价值的时间。

NVIDIA的合作夥伴生态系广泛参与这轮MLPerf测试。除了与CoreWeave和IBM合作提交的测试结果外，华硕、思科、戴尔科技集团、技钢科技、Google Cloud、慧与科技、Lambda、联想集团、Nebius、Oracle Cloud Infrastructure、云达科技和美超微亦交出亮眼的测试结果。进一步了解MLPerf基准测试。

加入已选取到「关键字追踪」什麽是「关键字追踪」