据動察 Beating 監測,螞蟻集團百靈大模型團隊上線兆參數旗艦思考模型 Ring-2.6-1T(啟動參數 630 億)。該模型專為複雜任務和生產環境設計,核心新增「動態思考強度」機制,系統可在認知深度、Token 成本和執行速度之間靈活平衡。
基於不同的計算負載需求,模型提供 high 和 xhigh 兩種運行模式。在主打多步執行和工具調用的 Agent 模式(high)下,其 PinchBench 跑分達 87.60,高於 GPT-5.4 xHigh 和 Gemini-3.1-Pro high,ClawEval 測試得分 63.82。在針對數學推理和科研的深度思考模式(xhigh)下,其 AIME 26 得分為 95.83,GPQA Diamond 得分 88.27。
官方表示,文本格式轉換與數學競賽對算力需求截然不同,設計該機制是為了降低 Token 開銷,讓模型能充當工具編排、編程和多輪互動等高頻場景的默認底座。模型即日起聯合 Novita 在 OpenRouter 平台提供為期一周的免費 API 試用(至 5 月 15 日),並將於近期開源權重。