咨询热线 4001616691
联系我们 中国大陆 CNY

解决方案

SOLUTION DETAIL

基于NVIDIA DSX架构的AI工厂设计与运营

一、AI工厂基础设施参考设计解决方案名称:NVIDIA Vera Rubin DSX AI Factory参考设计核心目标:构建协同设计的AI基础设施,实现更高的每瓦Token数,加速首次投产时间。覆盖范围:计算、NVIDIA Spectrum-X以太网网络、存储电力、冷却、控制系统的设计与运营最佳实践开放、模块化、可组合的软件堆栈,连接集群硬件与电源、冷

当前位置:首页 > 解决方案
基于NVIDIA DSX架构的AI工厂设计与运营
解决方案
SOLUTION OVERVIEW

基于NVIDIA DSX架构的AI工厂设计与运营

一、AI工厂基础设施参考设计解决方案名称:NVIDIA Vera Rubin DSX AI Factory参考设计核心目标:构建协同设计的AI基础设施,实现更高的每瓦Token数,加速首次投产时间。覆盖范围:计算、NVIDIA Spectrum-X以太网网络、存储电力、冷却、控制系统的设计与运营最佳实践开放、模块化、可组合的软件堆栈,连接集群硬件与电源、冷

  • 方案分类 解决方案
  • 内容形式 场景方案 / 技术解析
  • 服务支持 咨询、测试申请、实施建议

如果你正在评估对应场景,我们可以基于当前方案继续细化产品组合、测试路径与实施节奏。

浏览更多相关方案
DETAIL MODULES

方案详情

查看方案背景、关键能力与适配场景,帮助你更快判断下一步应进入测试、咨询还是部署阶段。

一、AI工厂基础设施参考设计

解决方案名称:NVIDIA Vera Rubin DSX AI Factory参考设计
核心目标:构建协同设计的AI基础设施,实现更高的每瓦Token数,加速首次投产时间。
覆盖范围

  • 计算、NVIDIA Spectrum-X以太网网络、存储

  • 电力、冷却、控制系统的设计与运营最佳实践

  • 开放、模块化、可组合的软件堆栈,连接集群硬件与电源、冷却系统

关键软件组件

  1. DSX Max-Q:在固定功耗预算内最大化计算输出和每瓦Token性能。

  2. DSX Flex:连接电网服务,动态调整用电量,协调混合现场发电,节约能源并保持电网稳定。

  3. DSX Exchange:实现IT、运营技术(OT)和运营智能体之间计算、网络、能源、电力、冷却设备信号的安全可扩展集成。

  4. DSX Sim模型 + DSX Air平台:通过高保真数字孪生验证AI工厂,建模GPU、网络及合作伙伴基础设施。

  5. DSX SimReady:连接详细3D几何结构、物流和系统行为,加速首次营收并确保首发日性能。

二、AI工厂数字孪生蓝图

解决方案名称:NVIDIA Omniverse DSX Blueprint
核心功能

  • 为设计和运营大型AI工厂提供开放、全面的框架。

  • 构建物理精准的AI工厂数字孪生,实时模拟运营,在施工或部署前优化性能。

  • 整合电力、冷却、网络和运营于同一环境,允许模拟布局、电力拓扑、散热行为和运营策略,评估硬件或工作负载变化而不中断生产。
    兼容性:完全兼容Vera Rubin DSX AI Factory参考设计,现已正式发布。

三、行业专用集成与资产

1. 设计与工程平台集成

  • 达索系统:将参考设计和蓝图集成到其基于CATIA软件的系统工程平台,构建AI工厂虚拟孪生。

  • Cadence:将NVIDIA Grace Blackwell Ultra机架系统的SimReady模型集成到其Reality Data Center Digital Twin Platform,模拟散热和流体数据。

  • 西门子:开发框架平衡AI基础设施高密度计算与供电、散热、自动化。

  • PTC:将蓝图集成到Windchill PLM解决方案,结合工程数据与高保真实时仿真,管理跨供应商物料清单。

  • Procore Technologies:集成Omniverse库和DSX蓝图到Procore平台,创建贯穿施工生命周期的连续数字线程。

2. 电力与冷却基础设施

  • 施耐德电气:集成ETAP平台模拟和优化配电系统;提供发电机、电气设备的SimReady资产。

  • Eaton、Trane Technologies、Vertiv:提供发电机、电气设备、冷却系统的SimReady资产,用于施工前验证和仿真。

  • Vertiv:使用Omniverse DSX Blueprint构建Vertiv OneCore Rubin DSX预制融合数据中心基础设施解决方案,加速部署和提高每瓦AI输出。

  • Trane Technologies:使用蓝图优化超大规模AI工厂散热管理,减少冷却能耗。

  • Phaidra:集成DSX Max-Q到自主学习AI智能体,通过降低冷却峰值提供约10%额外计算能力,释放电力用于Token生产。

3. 能源与电网解决方案

  • Emerald AI:集成DSX Flex到Conductor平台,实时管理电力,通过软件负载控制加快电网连接批准。

  • GE Vernova:将数字孪生扩展至从电网到AI工厂的整个电力堆栈,统一功耗和计算建模,加速基础设施部署。

  • 日立:结合物理AI、电力系统与计算平台,加速电网规划,为十亿瓦级AI工厂提供可靠电力。

  • 西门子能源:在其Noedra数字孪生平台使用NVIDIA RAPIDS库、Metropolis平台和Isaac Sim框架,实时监测电网,预测故障风险,减少计划外停机。

4. AI工厂建设与运营

  • Jacobs:使用Omniverse DSX Blueprint开发Data Center Digital Twin解决方案,优化AI工厂从规划、设计到交付和运营各环节。

  • Switch:借助蓝图构建EVO AI工厂和LDC EVO操作系统,实现实时遥测、基于Rubin DSX规范的数字孪生自动更新,优化供电、冷却和工作负载。

  • Nscale + Caterpillar:将DSX Vera Rubin参考设计带到西弗吉尼亚州吉瓦级工厂。

  • CoreWeave:使用NVIDIA DSX Air在云端构建并测试AI工厂数字孪生,在实际交付前进行运营预演,缩短验证时间。

四、生态系统支持与资源

合作伙伴贡献

  • 行业领导者(Cadence、达索系统、Eaton、Jacobs、Nscale、Phaidra、Procore、PTC、施耐德电气、西门子、Switch、Trane Technologies、Vertiv)通过集成平台、提供SimReady资产、连接软件,支持设计、构建和优化AI工厂。

  • 能源领域领先企业(Emerald AI、GE Vernova、日立、西门子能源)使用DSX参考架构释放电网容量,为AI工厂提供所需电力。