英偉達正式開源旗艦級550B模型Nemotron 3 Ultra：首創Mamba-Transformer混合MoE架構，專為長程智慧體而生

据動察 Beating 監測，英偉達於 6 月 4 日正式開源 5500 億參數、啟動 550 億的旗艦大語言模型 Nemotron 3 Ultra，針對複雜規劃、推理和工具呼叫等長程智慧體任務進行了優化。

在第三方基準平台 Artificial Analysis 的智能指數中，Nemotron 3 Ultra 得分 47.7 分，是目前美國本土性能最強的開源權重模型，但在全球開源模型中仍落後於 Kimi K2.6（53.9 分）、MiMo-V2.5-Pro（53.8 分）以及 DeepSeek V4 Pro（51.5 分）等多款中國開源模型。

技術架構上，模型採用 Mamba-Transformer 混合專家架構 MoE，通過交替使用 Mamba-2 狀態空間模型層與 Transformer 自注意力層，規避了超長上下文下 KV 緩存呈二次方增長的內存瓶頸，在極低內存開銷下支持 100 萬 token 的上下文視窗。混合架構在智慧體任務下實現了最高 5 倍的吞吐量提升與 30% 的推理成本降低。

生態配套上，英偉達同步發布了包含 NemoClaw 編排藍圖與 OpenShell 運行時的智慧體工具包 Agent Toolkit。開源內容直接包含模型權重、數據集與訓練配方。模型已在 Hugging Face、NVIDIA NIM 及 OpenRouter 上線，企業級 AI 搜索服務商 Glean 等已宣布接入，用作商業閉源大模型的替代方案。

原文鏈接

糾錯/舉報