智譜GLM-5.2加冕AA智能指數開源第一：GDPval跑分與GPT-5.5平起平坐

据動察 Beating 監測，智譜 AI 最新 MoE 旗艦模型 GLM-5.2 在 Artificial Analysis 大模型智能指數 v4.1 評測中斬獲 51 分，超越 MiniMax-M3 （44 分）、 DeepSeek V4 Pro （max， 44 分）和 Kimi K2.6 （43 分），登頂全球開源模型榜首。

在模擬真實世界知識工作的 GDPval-AA v2 測試中， GLM-5.2 獲 1524 分（人類基準分 1000 分），領先 MiniMax-M3 （1418 分）與 DeepSeek V4 Pro （max， 1328 分），與閉源前沿大模型 GPT-5.5 （xhigh reasoning）平起平坐。相較前代 GLM-5.1，科學推理 CritPt 提升 16 個百分點至 21%， HLE 提升 12 個百分點至 40%， TerminalBench v2.1 提升 16 個百分點至 78%， GPQA Diamond 達 89%。

GLM-5.2 在「智能 - 任務成本」帕累托前沿佔據最佳性價比位置。由於單次任務平均輸出 43k token （GLM-5.1 為 26k）， GLM-5.2 單任務平均成本上升至約 0.46 美元，高於 GLM-5.1 （0.25 美元）和 DeepSeek V4 Pro （max， 0.05 美元），但仍遠低於同智能梯隊的閉源模型。

GLM-5.2 總參數 744B，激活參數 40B，上下文窗口由前代 200K 升至 1M，遵循 MIT 協議開源。目前，智譜官方 API （定價輸入 1.4、輸出 4.4 / 每百萬 token）與 SiliconFlow、 DeepInfra、 Nebius AI 等平台已上線服務。

原文鏈接

糾錯/舉報