据動察 Beating 監測,智譜 AI 最新 MoE 旗艦模型 GLM-5.2 在 Artificial Analysis 大模型智能指數 v4.1 評測中斬獲 51 分,超越 MiniMax-M3 (44 分)、 DeepSeek V4 Pro (max, 44 分)和 Kimi K2.6 (43 分),登頂全球開源模型榜首。
在模擬真實世界知識工作的 GDPval-AA v2 測試中, GLM-5.2 獲 1524 分(人類基準分 1000 分),領先 MiniMax-M3 (1418 分)與 DeepSeek V4 Pro (max, 1328 分),與閉源前沿大模型 GPT-5.5 (xhigh reasoning)平起平坐。相較前代 GLM-5.1,科學推理 CritPt 提升 16 個百分點至 21%, HLE 提升 12 個百分點至 40%, TerminalBench v2.1 提升 16 個百分點至 78%, GPQA Diamond 達 89%。
GLM-5.2 在「智能 - 任務成本」帕累托前沿佔據最佳性價比位置。由於單次任務平均輸出 43k token (GLM-5.1 為 26k), GLM-5.2 單任務平均成本上升至約 0.46 美元,高於 GLM-5.1 (0.25 美元)和 DeepSeek V4 Pro (max, 0.05 美元),但仍遠低於同智能梯隊的閉源模型。
GLM-5.2 總參數 744B,激活參數 40B,上下文窗口由前代 200K 升至 1M,遵循 MIT 協議開源。目前,智譜官方 API (定價輸入 1.4、輸出 4.4 / 每百萬 token)與 SiliconFlow、 DeepInfra、 Nebius AI 等平台已上線服務。