咨询热线 4001616691
联系我们 中国大陆 CNY

新闻中心

NVIDIA Vera CPU:为 AI 工厂智能体工作负载设计的新一代处理器 NEWS DETAIL

当前位置:首页 > 新闻中心
资讯分类 · 新闻中心 发布时间 · 2026-06-05

随着 Agentic AI 和强化学习进入规模化阶段,CPU 正在从单纯的"喂数据给 GPU"的角色演变为 AI 工厂的关键执行环节。NVIDIA 最新发布的 Vera CPU 正是为这一新设计点打造的处理器,目标是在 AI 工厂中为智能体工作负载提供更高吞吐量和更低延迟。

Vera CPU 搭载 88 颗 NVIDIA Olympus 核心,配合最高 1.2 TB/s 的 LPDDR5X 内存带宽,专门针对 AI 智能体场景中的沙箱代码执行、工具调用、数据检索和编排调度等任务进行优化。这些任务虽然不直接在 GPU 上运行,却是智能体工作流中不可或缺的串行瓶颈环节。

NVIDIA 表示,随着智能体变得越来越强大,它们会执行更多步骤、调用更多工具、运行更多检查,CPU 执行时间在整个请求路径中不断累积。这意味着 CPU 已不再是简单的宿主处理器,而是影响加速器利用率、AI 工厂每瓦和每美元产出的关键因素。

与过去十年以"每美元核心数"为指标的云计算 CPU 不同,Vera CPU 的设计指标是"每美元 Token 数"——即 AI 工厂能产生多少智能输出。这要求 CPU 既具备高核心数以支持数千并发智能体,又需要强单核性能来保证串行执行步骤不成为瓶颈,同时还要有高能效内存带宽来避免数据搬运卡死流水线。

在微架构层面,NVIDIA Olympus 核心相比前代 Grace 实现了最高 50% 的 IPC 提升,通过更宽的前端、先进分支预测、深度乱序指令调度以及专用内存预取来维持在重负载下的一致性性能。对于分支密集的智能体代码和数据处理任务而言,这意味着更短的任务完成时间,从而在相同时间内服务更多请求。

对于 AI 工厂运营者来说,Vera CPU 的意义在于让加速器不再等待编排、工具执行或数据搬运。在强化学习场景中,这意味着每个训练窗口可以完成更多评估、产出更多有效数据,帮助模型更快达到更高的质量水平。