据動察 Beating 監測,英偉達於 6 月 4 日正式開源 5500 億參數、啟動 550 億的旗艦大語言模型 Nemotron 3 Ultra,針對複雜規劃、推理和工具呼叫等長程智慧體任務進行了優化。
在第三方基準平台 Artificial Analysis 的智能指數中,Nemotron 3 Ultra 得分 47.7 分,是目前美國本土性能最強的開源權重模型,但在全球開源模型中仍落後於 Kimi K2.6(53.9 分)、MiMo-V2.5-Pro(53.8 分)以及 DeepSeek V4 Pro(51.5 分)等多款中國開源模型。
技術架構上,模型採用 Mamba-Transformer 混合專家架構 MoE,通過交替使用 Mamba-2 狀態空間模型層與 Transformer 自注意力層,規避了超長上下文下 KV 緩存呈二次方增長的內存瓶頸,在極低內存開銷下支持 100 萬 token 的上下文視窗。混合架構在智慧體任務下實現了最高 5 倍的吞吐量提升與 30% 的推理成本降低。
生態配套上,英偉達同步發布了包含 NemoClaw 編排藍圖與 OpenShell 運行時的智慧體工具包 Agent Toolkit。開源內容直接包含模型權重、數據集與訓練配方。模型已在 Hugging Face、NVIDIA NIM 及 OpenRouter 上線,企業級 AI 搜索服務商 Glean 等已宣布接入,用作商業閉源大模型的替代方案。