咨询热线 4001616691
联系我们 中国大陆 CNY

解决方案

SOLUTION DETAIL

NVIDIA Quantum MQM8790-HS2F 系列 InfiniBand 交换机(Quantum HDR平台) 面向超大规模 AI 云与高性能计算的 200G InfiniBand 解决方案

随着AI大模型从千亿参数迈向万亿参数,集群规模的指数级增长对网络交换容量、低延迟和无损通信提出了严苛要求。NVIDIA Quantum MQM8790-HS2F作为 Quantum HDR InfiniBand 平台的高性能固定配置交换机,专为AI工厂和高性能计算设计,提供业界领先的200G InfiniBand 吞吐能力,是构建低延迟、无损网络基础设施的理想核心或边缘

当前位置:首页 > 解决方案
NVIDIA Quantum MQM8790-HS2F 系列 InfiniBand 交换机(Quantum HDR平台) 面向超大规模 AI 云与高性能计算的 200G InfiniBand 解决方案
解决方案
SOLUTION OVERVIEW

NVIDIA Quantum MQM8790-HS2F 系列 InfiniBand 交换机(Quantum HDR平台) 面向超大规模 AI 云与高性能计算的 200G InfiniBand 解决方案

随着AI大模型从千亿参数迈向万亿参数,集群规模的指数级增长对网络交换容量、低延迟和无损通信提出了严苛要求。NVIDIA Quantum MQM8790-HS2F作为 Quantum HDR InfiniBand 平台的高性能固定配置交换机,专为AI工厂和高性能计算设计,提供业界领先的200G InfiniBand 吞吐能力,是构建低延迟、无损网络基础设施的理想核心或边缘

  • 方案分类 解决方案
  • 内容形式 场景方案 / 技术解析
  • 服务支持 咨询、测试申请、实施建议

如果你正在评估对应场景,我们可以基于当前方案继续细化产品组合、测试路径与实施节奏。

浏览更多相关方案
DETAIL MODULES

方案详情

查看方案背景、关键能力与适配场景,帮助你更快判断下一步应进入测试、咨询还是部署阶段。

随着AI大模型从千亿参数迈向万亿参数,集群规模的指数级增长对网络交换容量、低延迟和无损通信提出了严苛要求。NVIDIA Quantum MQM8790-HS2F作为 Quantum HDR InfiniBand 平台的高性能固定配置交换机,专为AI工厂和高性能计算设计,提供业界领先的200G InfiniBand 吞吐能力,是构建低延迟、无损网络基础设施的理想核心或边缘交换机。

市场背景与挑战行业痛点

  • AI集群规模扩展瓶颈:大模型分布式训练中,All-to-All 和 Collective 通信频繁,传统以太网易出现拥塞和丢包,限制GPU集群的线性扩展。

  • 网络拥塞导致算力浪费:高性能计算中,GPU 因等待数据而空转,利用率难以提升。

  • 运维复杂性:超大规模 InfiniBand 网络的管理需要专业工具,传统手段难以保障极低延迟和 SLA。

产品核心特性

  1. 极致性能参数

参数

规格

端口形态

40 x 200G QSFP56(HDR InfiniBand)

接口速率

200G / 100G(HDR100,通过 splitter) / 56G / 40G 等向下兼容

交换容量

16 Tb/s(非阻塞,双向聚合吞吐)

外形尺寸

1U 标准机箱

软件支持

MLNX-OS(外部管理版本),支持 NVIDIA UFM 统一织物管理

  1. 为AI/HPC量身定制的 InfiniBand 增强
    MQM8790-HS2F 基于 NVIDIA Quantum 芯片,深度优化 InfiniBand 协议,实现极致 AI/HPC 通信:

  • 超低延迟:端口到端口延迟低于 130ns,显著优于以太网方案。

  • 自适应路由与拥塞控制:动态选择最优路径,减少热点,最大化有效带宽。

  • 集体通信卸载(SHARP):硬件加速 MPI/SHMEM 等集体操作(如 All-Reduce),大幅降低 CPU/GPU 开销,提升训练效率。

  • 无损网络:原生支持可靠传输和流量控制,构建零丢包织物。

  1. 高可用与管理特性

  • 冗余设计:1+1 热插拔电源、N+1 热插拔风扇(P2C 气流版本)。

  • 外部管理:MQM8790-HS2F 为外部管理型号(unmanaged/smart),可搭配 NVIDIA Unified Fabric Manager (UFM) 实现集中监控、故障预测和自动化运维。

  • 高密度扩展:支持端口拆分至 80 x 100G HDR100,灵活适应不同集群规模。

应用场景与价值场景一:AI工厂与HPC集群的 Spine/Leaf 架构
场景描述:千卡/万卡级 GPU 集群,后端网络用于 GPU 间 All-to-All 和集体通信。
价值:

  • 消除网络瓶颈,实现极致计算通信比优化。

  • SHARP 集体卸载显著提升 GPU 利用率,加速大模型训练。

场景二:高性能计算与存储网络
场景描述:HPC 系统、分布式存储或并行文件系统的高速互连。
价值:

  • 亚微秒级延迟和无损特性保障长训任务稳定运行。

  • 高密度 200G 端口简化布线,提供可靠的扩展空间。

订购信息与服务关键信息

关键信息

说明

产品型号

MQM8790-HS2F(P2C 气流,双 AC 电源,标准深度,含导轨)

兼容线缆

NVIDIA 200G QSFP56 HDR InfiniBand 光模块及 AOC/DAC 线缆(支持 splitter 至 HDR100)

配套服务

 提供端到端的解决方案交付服务,包括: • 架构设计:基于算力规模设计最优 Fat-Tree 或 Dragonfly 拓扑。 • 部署调优:InfiniBand 无损网络配置、SHARP 优化与性能压测。 • 运维培训:MLNX-OS 操作、UFM 管理和自动化运维培训。