据 1M AI News 监测,今日全球权威 AI 评测平台 LMArena(百万用户参与盲测)更新 Code Arena 专项榜单,GLM-5.1 登顶全球開源模型第一,位列全球模型第三。
GLM-5.1 不僅繼承了上一代模型的開源 SOTA 編碼能力,還在長程任務(Long-Horizon Task)上取得突破,實現了:
1、8 小時從零構建 Linux 桌面;
2、655 次迭代打破向量數據庫優化瓶頸;
3、1000 輪工具調用優化真實機器學習模型負載。
值得一提的是,在 METR 榜單的同等評估標準下,GLM-5.1 是唯一達到 8 小時級持續工作的開源模型,也是全球範圍內除 Claude Opus 4.6 外少數具備這一能力的模型。