Google与NVIDIA合作,将Gemma 4开放模型针对NVIDIA GPU优化,覆盖从数据中心到RTX PC、DGX Spark及Jetson Orin Nano的全系列设备。
Gemma 4家族涵盖E2B、E4B、26B、31B四种变体。E2B和E4B专为边缘推理打造,可在Jetson Nano上完全离线运行。26B和31B适合代理式AI任务,可在RTX GPU和DGX Spark上高效运行。
NVIDIA与Ollama、llama.cpp合作提供最佳本地部署体验。CUDA软件栈确保广泛兼容。
文章来源:NVIDIA英伟达博客
WeChat
Profile