header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
掃碼下載APP

智譜GLM-5.2加冕AA智能指數開源第一:GDPval跑分與GPT-5.5平起平坐

動察 Beating 監測,智譜 AI 最新 MoE 旗艦模型 GLM-5.2 在 Artificial Analysis 大模型智能指數 v4.1 評測中斬獲 51 分,超越 MiniMax-M3 (44 分)、 DeepSeek V4 Pro (max, 44 分)和 Kimi K2.6 (43 分),登頂全球開源模型榜首。

在模擬真實世界知識工作的 GDPval-AA v2 測試中, GLM-5.2 獲 1524 分(人類基準分 1000 分),領先 MiniMax-M3 (1418 分)與 DeepSeek V4 Pro (max, 1328 分),與閉源前沿大模型 GPT-5.5 (xhigh reasoning)平起平坐。相較前代 GLM-5.1,科學推理 CritPt 提升 16 個百分點至 21%, HLE 提升 12 個百分點至 40%, TerminalBench v2.1 提升 16 個百分點至 78%, GPQA Diamond 達 89%。

GLM-5.2 在「智能 - 任務成本」帕累托前沿佔據最佳性價比位置。由於單次任務平均輸出 43k token (GLM-5.1 為 26k), GLM-5.2 單任務平均成本上升至約 0.46 美元,高於 GLM-5.1 (0.25 美元)和 DeepSeek V4 Pro (max, 0.05 美元),但仍遠低於同智能梯隊的閉源模型。

GLM-5.2 總參數 744B,激活參數 40B,上下文窗口由前代 200K 升至 1M,遵循 MIT 協議開源。目前,智譜官方 API (定價輸入 1.4、輸出 4.4 / 每百萬 token)與 SiliconFlow、 DeepInfra、 Nebius AI 等平台已上線服務。

举报 糾錯/舉報
糾錯/舉報
提交
新增文庫
僅自己可見
公開
保存
選擇文庫
新增文庫
取消
完成