据動察 Beating 監測,聚合服務商 OpenRouter 披露,開源模型與閉源前沿模型的性能差距已穩定在 3 至 6 個月。在過去 18 個月中,前沿閉源實驗室未能如預期般拉開身位,而以中美新玩家為代表的開源力量正憑借極高的性價比加速平替閉源模型。
DeepSeek V4 Flash 發布僅兩個月就成為平替首選。擁有 2840 億參數的 DeepSeek V4 Flash 在 SWE-bench Verified 評測中取得 79.0% 的成績,表現逼近 GPT-5.5 級別。官方第一方輸入/輸出定價僅為 0.14/0.28 美元/百萬 token,輸出成本比 GPT-5.5 便宜約 150 倍。即使加上不保留數據訓練的西方雲托管溢價,實際成本也僅在閉源前沿模型的 1.3% 左右。
除了價格優勢,智譜 2026 年 6 月發布的 GLM 5.2 在 Artificial Analysis 開源權重智能指數中排名第一,並在真實智能體評測中比肩 GPT-5.5 級別,成為長程編程規劃的替換方案。不過,GLM 5.2 在深度思考時較為消耗 token,企業部署時需平衡輸出成本。多模態開源模型 MiniMax M3 則憑借創新的 MSA 稀疏注意力架構,以較低的代幣價格提供了原生圖像與視頻的長上下文處理能力,成為 Gemini Flash 的強勁開源對手。
同時,基於 Mamba-2 混合架構的英偉達 Nemotron 3 Ultra 成為最強的美國本土開源力量,旨在通過開放生態拉動英偉達硬件與微服務生態的市場需求。
OpenRouter 強調,雖然前沿閉源模型最終仍會向前推進,但固定智能水平的代幣成本將持續走低,為企業提供了重大的成本優化空間。