一、核心仿真平台
解决方案名称:NVIDIA DSX Air
平台性质:面向AI工厂进行逻辑仿真的软件即服务(SaaS)平台,属于DSX平台中NVIDIA DSX Sim的组成部分。
核心功能:
为NVIDIA GPU、SuperNIC、DPU及交换机等硬件基础设施提供高保真数字仿真。
通过基于API的开放接口,与合作伙伴在存储、路由、安全、编排等领域的解决方案实现集成。
构建完整的AI工厂生态系统,将NVIDIA基础设施与合作伙伴技术相结合,提供全栈仿真能力。
关键价值:
在服务器开箱之前,即可为AI工厂构建完整的数字孪生(涵盖计算、网络、存储、编排和安全)。
将系统集成与故障排查转移到仿真环境中,首次生成Token的时间从数周或数月缩短至数天乃至数小时。
部署周期从数月缩短到几天。
二、面向生态系统的协同验证方案
解决方案名称:DSX Air生态系统验证平台
支持对象:服务器制造商、编排供应商、存储厂商、安全合作伙伴。
能力说明:
服务器制造商:无需搭建成本高昂的物理实验室,即可对其参考架构进行建模和验证;可针对特定客户需求创建数字孪生,测试软件堆栈,交付经过验证的解决方案。
编排供应商:可规模化测试多租户环境。示例:在GTC 2026上展示的完全运行于仿真环境中的多租户RTX PRO服务器环境,由Netris(网络编排)、Rafay(主机编排)和NVIDIA Run:ai(GPU分配优化)共同验证。
存储厂商:可基于NVIDIA计算、网络和软件基础设施构建完整AI工作流模型。示例:展示了基于VAST AI Operating System运行的视频检索增强生成工作负载,包括DataEngine节点集群及视频搜索/摘要前端。
安全厂商:可在逼真环境中测试多租户策略、DPU加速隔离和威胁检测功能。示例:演示了Check Point在仿真BlueField DPU上运行的分布式防火墙、TrendAI Vision One威胁检测,以及Keysight Cyperf生成的真实流量。
三、全生命周期运营模式
解决方案名称:基于DSX Air的AI工厂变更管理与运营验证
流程说明:
部署前验证:在仿真环境中完整构建预期的生产环境,配置网络、计算、存储、编排、安全及调度策略,验证整套系统协同工作。
部署执行:经验证后放心部署,显著提升顺利上线概率,团队专注于运行工作负载而非故障排除。
持续变更管理:长期运行的仿真环境作为安全测试区,用于测试升级方案、演练维护窗口、验证补丁程序、预测运营影响。只有仿真成功的变更才应用于真实环境,最大限度延长系统正常运行时间。
四、客户成功案例
案例1:Siam.AI(泰国最大的AI云服务提供商)
借助DSX Air加速基础设施部署。
提前完成NVIDIA最佳实践的部署验证,确保系统上线首日运行能力。
在硬件到位前,通过虚拟环境验证了其架构。
案例2:Hydra Host
借助DSX Air加速其AI工厂操作系统Brokkr(面向裸金属GPU配置)的开发。
在部署到生产环境前,于DSX Air中仿真全栈环境,在多样化的网络和硬件配置下大规模验证Brokkr的自动化和编排工作流。
能够更快地将经过验证的基础设施交付给全球客户,同时降低生产系统风险。
五、合作伙伴采用
已率先采用的企业:CoreWeave(构建全球最先进AI基础设施的企业之一)等,在硬件运达数据中心装卸区之前,即完成环境仿真与验证。
生态系统共识:合作伙伴认为DSX Air提供了一种全面、可扩展且经济高效的方式,能够在NVIDIA基础设施环境下并与其他合作伙伴协同,验证各自的解决方案。
WeChat
Profile