立即咨询

新闻中心 NEWS CENTER

围绕 AI 基础设施、网络、算力与行业动态整理最新资讯，帮助你更快把握趋势变化、技术方向与项目启发。

当前位置：首页 > 新闻中心

2026.06.11
NEWS UPDATE
NVIDIA Dynamo Snapshot：将 Kubernetes 推理冷启动从分钟级降至秒级

在生产推理部署中，请求量随时间波动，需要推理副本弹性扩缩容。

发布时间 2026-06-11 阅读全文 »
2026.06.11
NEWS UPDATE
NVIDIA Model Optimizer 模型量化实战：FP8 训练后量化降低显存占用

模型量化是一种高效降低显存占用并提升推理性能的方法，尤其适合在资源受限的环境中运行 AI 模型通过降低计算和内存需求的同时保持模型质量，量化技术帮助 AI 模型在消费级 GPU 上更高效地运

发布时间 2026-06-11 阅读全文 »
2026.06.10
NEWS UPDATE
Step 3.7 Flash 登陆 NVIDIA GPU：198B 参数企业级多模态 AI 模型

AI 应用正在超越纯文本生成，迈向能够实时感知、搜索和推理图像、文档、视频和语言的多模态系统。

发布时间 2026-06-10 阅读全文 »
2026.06.10
NEWS UPDATE
NVIDIA Alpamayo 发布：自动驾驶模型的闭环后训练平台

开发自动驾驶策略需要在训练和部署之间架起一座重要桥梁视觉-语言-动作（VLA）模型主要在开环模式下训练，即模型输出直接与真实行为对比，不考虑其对环境的影响。

发布时间 2026-06-10 阅读全文 »
2026.06.09
NEWS UPDATE
NVIDIA DynoSim 开源发布：1500 倍速仿真 LLM 服务部署的 Pareto 最优解

发布时间 2026-06-09 阅读全文 »
2026.06.09
NEWS UPDATE
NVIDIA MCG 工具包：一分钟自动生成符合监管要求的 AI 模型文档

随着 AI 模型日益复杂以及加州 AB-2013、欧盟 AI 法案等监管框架的推进，软件团队面临一个全新挑战：在模型发布之前，必须生成全面且可审计的模型文档。

发布时间 2026-06-09 阅读全文 »

首页 < 1 2 3 4 5··· 2/62 > 尾页