快訊深度數據 Skill&API

更多

header-langage

DeepSeek V4在Putnam-2025获得120分，形式化数学推理堪比公理。

据动察 Beating 监测，DeepSeek V4 公布了两组形式化数学推理评测。Putnam（普特南竞赛）是北美最高水平本科数学竞赛。

在实用场景（Practical Regime）下，V4-Flash-Max 在 Putnam-200 Pass@8 基准上拿到 81.00 分，使用开源工具 LeanExplore 和受限采样。作为对比，Seed-2.0-Prover 为 35.50，Gemini 3 Pro 和 Seed-1.5-Prover 均为 26.50。

在前沿场景（Frontier Regime）下，V4 采用混合形式-非形式推理方案，先用 informal reasoning 生成候选自然语言解，经自我验证过滤后，再由 formal agent 在 Lean 中完成严格证明。V4 在 Putnam-2025 拿到 120/120 满分，与 Axiom 并列第一，高于 Seed-1.5-Prover 的 110/120 和 Aristotle 的 100/120。前沿场景使用了大规模计算扩展，实用场景结果更能反映常规部署能力。

糾錯/舉報

熱門文章

付鵬2026首場公開演講：我為何加入加密資產行業？

圈內OG楊海坡的悲觀推演：比特幣和加密貨幣走到了終局

对话付鹏：比特币不是數字黃金，它是AI資產

市值跌去 97% 後，爱奇藝打算用 AI 強行續命

鏈上偵探持續監控

20分鐘前

某巨鯨「All in」BTC及ETH：已開立2500萬倉位試多，現價下方部署4000萬規模買單

1小時前

交易员「neoyokio.eth」將 CHIP 多單平倉至 3,400,000 美元，平均價格為 0.098 美元

2小時前

Base生態代幣REPPO市值突破2000萬美元，24小時漲幅達40%

3小時前

Balancer黑客將1100枚ETH兌換為BTC

24H重要資訊

2026-04-24

某巨鯨「All in」BTC及ETH：已開立2500萬倉位試多，現價下方部署4000萬規模買單

寒武紀完成DeepSeek-V4適配，程式碼已開源，帶動國產芯片股走強

3個智慧金錢帳戶投入1.57萬美元認為霍爾木茲海峽交通將在7月前恢復正常

「華為晶片拖慢DeepSeek V4上線」？同一內核通吃英偉達昇腾還加速近2倍

糾錯/舉報

提交

新增文庫

僅自己可見

公開

保存

選擇文庫

新增文庫

取消

完成