使用 NVIDIA Spectrum™-X 网络平台轻松调配和管理功能强大的 AI 应用。凭借 NVIDIA Spectrum-4 以太网交换机和 NVIDIA® BlueField®-3 SuperNIC 的紧密耦合,Spectrum-X 可为 AI、机器学习、自然语言处理以及各种行业应用带来卓越性能。
为了构建全新的AI云需要使用单独的AI网络架构,AI工作负载非常独特,会产生大量的网络数据流。从而对网络产生巨大影响。
在基于传统以太网构建的现有云基础架构上运行这些工作负载会引发严重拥塞、增加延迟并造成带宽分配不公平。这会导致性能下降无法有效利用系统的 GPU
NVIDIA Spectrum-X网络平台是全球首个专为 AI 工作负载而构建的以太网网络架构与传统以太网相比能够提供高达两倍的 AI 集群性能。
这种端到端的 NVIDIA 解决方案始于采用 Spectrum-4 交换机它内置令人印象深刻的 Spectrum-4 ASIC,在 NVIDIA 创新的支持下此 ASIC 提供了许多突破性的功能而使其独树一帜。
Spectrum-4 交换机与 BlueField-3 DPU 紧密配合,以确保在 AI集群内实现最佳的资源利用和高效的数据传输。它具有增强的 ROCE 功能例如自适应路由、性能隔离和拥塞控制,所有这些都包含在一个经过优化的全栈解决方案中。
Spectrum-X网络平台通过标准以太网协议提供加速技术,实现最高效的带宽并降低抖动和短尾,从而最大限度地提高 AI性能。
在这个真实的示例中,在每个 GPU 的性能、能效、训练时间和总拥有成本相同的情况下Spectrum-X实现了 1.7 倍的性能提升。
此外,利用 NCCL AllReduce 的 AI模型可将有效带宽提高 2.5 倍,从而实现更快、更可预测的训练。
跨软件堆栈、库和操作系统的持续优化,可确保 AI 基础设施的最佳性能和互操作性。
NVIDIA Spectrum-X网络平台由 Spectrum-4 交换机和 BlueField-3 DPU 提供支持。作为首个专为 AI构建的以太网网络架构可提升性能,并缩短计算时间。