快訊深度數據 Skill&API

更多

header-langage

GLM 5.2登頂智慧體微調評量，零崩潰擊敗Opus 4.8

据動察 Beating監測，在最新發布的 AI 研發自動化評測 PostTrainBench 中，推理模型 GLM 5.2 Max 以 34.29% 的得分奪得第一，以微弱優勢擊敗了 Claude Opus 4.8 Max 的 34.08%。

評測模擬大模型在 10 小時和單卡 H100 算力限制下自主執行後訓練微調的全流程，包含數據清洗、編寫訓練腳本與超參優化。在 84 次完整運行中，GLM 5.2 取得了 0% 的運行崩潰率，而 Claude Opus 系列 Agent 則有約 10% 的任務卡死或崩潰率。

分析顯示，新一代推理模型能夠更精準地解析終端報錯，自癒環境與訓練腳本問題，並在本地 GPU 上拉起更大參數量的本地教師模型（如 14B 到 72B Qwen）進行動態合成數據蒸餾，從而規避了傳統智能體長航時任務的邏輯死鎖。

糾錯/舉報

熱門文章

DeFi保險為何沒人買？

Anthropic推出Claude Tag，為何先協助競爭產品漲紅註冊？

資料飛輪還是重複樣本？物理人工智慧該告別「小時數崇拜」了

「木頭姐」Cathie Wood押注的AVS，將真實美股搬進了Bitget

鏈上偵探持續監控

12小時前

某新建錢包向 HyperLiquid 存入 63 萬枚 USDC，開設 290 萬枚 XRP 空單

14小時前

某巨鯨再次開啟價值7076萬美元BTC和ETH空單，浮虧約142萬美元

14小時前

「BTC OG Inside Whale」代理人再次做空ZEC，其比特币多单已浮虧超2000萬美元

16小時前

SharpLink Gaming兩天內購入1萬枚ETH，價值約1573萬美元

24H重要資訊

2026-06-28

美國上市 ETF 今年流入已超 1 萬億美元，全年有望突破 2 萬億美元創歷史新高

Base複盤網路中斷事件：使用者資金安全，根本因素為排序器區塊建構邏輯存在漏洞

蘋果Vision Pro兼智慧眼鏡主管 Paul Meade 將加盟 OpenAI

分析：散户似乎正在将资金从黄金和比特币转向半导体股票

糾錯/舉報

提交

新增文庫

僅自己可見

公開

保存

選擇文庫

新增文庫

取消

完成