NVIDIA Blackwell在最新MLPerf Training测试结果中展现突破性效能 智能应用 影音
Digikey
DForum0808

NVIDIA Blackwell在最新MLPerf Training测试结果中展现突破性效能

  • 陈俞萍台北

NVIDIA Blackwell在最新MLPerf Training测试结果中展现突破性效能。NVIDIA
NVIDIA Blackwell在最新MLPerf Training测试结果中展现突破性效能。NVIDIA

NVIDIA正与全球企业并肩建造人工智能(AI)工厂,加快训练及部署采用最新训练与推论技术的下一代AI应用。

NVIDIA的Blackwell架构专为满足这些对效能需求日渐升高的新型应用而打造。在最新一轮MLPerf Training测试中,同时也是自2018年推出这项基准测试以来的第12轮测试,NVIDIA AI平台在每项基准测试中均展现出最大规模效能,并驱动该基准测试中最具挑战性的大型语言模型(LLM)测试项目「Llama 3.1 405B预训练」的所有结果。

NVIDIA平台是唯一在每项MLPerf Training v5.0基准测试中均有提交结果的平台,这凸显其在各种AI工作负载中的卓越效能与任务多样性,包括大型语言模型、推荐系统、多模态大型语言模型、物体侦测与图神经网络(GNN)。

这次大规模提交的测试结果使用两部搭载NVIDIA Blackwell平台的AI超级电脑:Tyche采用NVIDIA GB200 NVL72机架规模系统打造,Nyx则以NVIDIA DGX B200系统为基础。

此外,NVIDIA也与CoreWeave和IBM合作,提交GB200 NVL72的测试结果,共使用2,496颗Blackwell GPU与1,248颗NVIDIA Grace CPU。

在最新的Llama 3.1 405B预训练基准测试中,Blackwell的效能较上一代架构在相同规模下高出2.2倍。

在Llama 2 70B LoRA微调基准测试中,搭载8颗Blackwell GPU的NVIDIA DGX B200系统效能,较上一轮使用相同数量GPU的测试结果提升达2.5倍。

这些效能上的跃进凸显Blackwell架构的优势,包括高密度液冷机架、每个机架搭配13.4TB的一致性存储器、用于垂直扩展的第五代NVIDIA NVLink及NVIDIA NVLink Switch互连技术,以及用于横向扩展的NVIDIA Quantum-2 InfiniBand网络技术。

此外,NVIDIA NeMo Framework软件堆叠的创新技术,提升了下一代多模态大型语言模型训练的水准,这对于将代理型AI应用推向市场而言至关重要。

这些由代理型AI驱动的应用,有朝一日将在AI工厂中运行,而这些AI工厂正是推动代理型AI经济的引擎。这些全新应用将产生各种词元(token)与宝贵的智能,可应用于几乎所有产业与学术领域。

NVIDIA数据中心平台包含GPU、CPU、高速互连架构和网络技术,以及种类丰富的软件,包括NVIDIA CUDA-X函式库、NeMo Framework、NVIDIA TensorRT-LLM与NVIDIA Dynamo。这套高度最佳化的硬件与软件,使得组织能更快速地训练及部署模型,显着加快创造价值的时间。

NVIDIA的合作夥伴生态系广泛参与这轮MLPerf测试。除了与CoreWeave和IBM合作提交的测试结果外,华硕、思科、戴尔科技集团、技钢科技、Google Cloud、慧与科技、Lambda、联想集团、Nebius、Oracle Cloud Infrastructure、云达科技和美超微亦交出亮眼的测试结果。进一步了解MLPerf基准测试