借助 iGenius 和 NVIDIA DGX 云,继续为主权 AI 和受监管行业预训练先进的 LLM
2025-02-05近年来,大语言模型(LLMs)在推理、代码生成、机器翻译和摘要等领域取得了非凡的进步。然而,尽管基础模型具有先进的功能,但在涉及特定领域的专业知识(例如金融或医疗健康)或捕捉英语以外的文化和语言细微差
NVIDIA TensorRT-LLM 在推荐广告及搜索广告的生成式召回的加速实践
2025-02-05推荐系统的主要任务是根据用户的历史行为预测其兴趣点,并向其推荐相应的商品。
构建 AI 销售助理的经验教训
2025-02-05在 NVIDIA,销售运营团队为销售团队提供将先进的硬件和软件推向市场所需的工具和资源。通过 NVIDIA 的各种技术来管理这一点是许多企业都面临的复杂挑战。
FP8 在大模型训练中的应用、挑战及实践
2025-02-05越来越多的技术团队开始使用 FP8 进行大模型训练,这主要因为 FP8 有很多技术优势,比如在新一代的 GPU 上,FP8 相对于 BF16 对矩阵乘算子这样的计算密集型算子
NVIDIA Blackwell 在 MLPerf 训练 v4.1 中将 LLM 训练性能提高一倍
2025-01-22随着模型规模的扩大以及使用更多数据进行训练,它们的能力也随之提升,实用性也随之提升。
探索采用自主 AI 和 NVIDIA 机密计算的超级协议案例
2025-01-22机密和自主的 AI 是一种新的 AI 开发、训练和推理方法,其中用户的数据是去中心化的、私有的,并由用户自己控制。本文将探讨如何通过使用区块链技术的去中心化来扩展 Confidential Compu