随着 Agentic AI 进入大规模训练、推理与部署阶段,AI 基础设施正在从传统算力平台演变为面向智能体协作的"AI 工厂"。在这一过程中,系统不仅要处理模型、数据和推理任务,还要承载更多工具调用、运行时交互和多组件协同,安全边界也随之扩大。
NVIDIA 最新技术文章提出,传统依赖主机软件的安全架构已难以满足 AI 工厂在性能、复杂度和实时性上的要求。为此,NVIDIA 将 BlueField DPU 作为独立于主机系统的硬件安全层,通过芯片内安全机制,把监控、策略执行和遥测能力从主机侧卸载出来,在主机或工作负载受影响时仍可维持安全控制。
该方案的核心在于基于 BlueField-4 和 NVIDIA DOCA 构建统一安全栈,为 AI 基础设施提供运行时威胁检测、文件级数据访问控制以及高速网络策略执行能力。相较传统软件方式,相关能力可在更少占用主机资源的同时,兼顾 AI 工作负载所需的吞吐与时延表现。
其中,DOCA Argus 主要面向运行时威胁检测。它可以在不依赖主机代理的情况下观察系统运行状态,帮助企业识别异常进程、可疑行为、执行漂移以及潜在入侵迹象。对于容器化 AI 应用和多智能体环境而言,这类持续性的运行时可见性有助于提高基础设施的完整性与可审计性。
在数据安全层面,DOCA Vault 提供面向文件存储访问的细粒度控制机制。该方案可结合工作负载上下文,对不同进程访问特定文件的读写行为进行授权判断,从而让训练任务、推理服务和智能体仅访问自身被允许使用的数据范围。这种设计有助于在多租户、多任务并行的 AI 环境中降低数据暴露风险。
整体来看,NVIDIA 正在把安全能力更深地嵌入 AI 基础设施本身,使其与网络、存储和计算节点协同工作。对于正在建设 AI 工厂或推进 Agentic AI 应用落地的企业来说,这类以硬件隔离和加速框架为基础的安全方案,代表了面向下一代 AI 基础设施的一种重要演进方向。
WeChat
Profile