header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
掃碼下載APP

DeepSeek V4 引發美國兩派爭論:智庫稱靠違禁晶片落後半年,矽谷 CEO 稱是開放創新

動察 Beating監測,美國外交關係委員會(CFR)中國與新興技術高級研究員 Chris McGuire(前白宮國安會、國防部成員)發文稱 V4 未改變中美 AI 競爭格局。他引用 V4 報告原文指出,DeepSeek 自身承認推理能力「落後前沿模型約 3 到 6 個月」,對標的是半年前發布的 GPT-5.2 和 Gemini 3.0 Pro。他還質疑 V4 報告雖披露推理端適配 NVIDIA GPU 和華為昇腾 NPU,卻未公開訓練使用的具體 GPU 型號和成本(V3 曾聲稱使用 2000 張 H800、成本 557 萬美元),認為沉默暗示使用了受出口管制的 NVIDIA Blackwell 芯片。此前美國政府官員曾在 2 月匿名提出類似說法,NVIDIA 稱其「牽強」;DeepSeek 否認使用 Blackwell,稱模型在 NVIDIA H800 和華為昇腾 910C 上訓練。

Replit CEO Amjad Masad 針鋒相對,稱美國政客和遊說者在炒作「中國蒸餾」恐慌時,中國科學家正在公開分享真正的 AI 突破。他引用 DeepSeek 官方推文中列出的結構性創新,包括 token 級注意力壓縮(DeepSeek Sparse Attention)和長上下文計算效率的大幅提升,指出 V4-Pro 在 1M 上下文時的單 token 推理算力和 KV 緩存佔用均遠低於 V3.2。Masad 認為這類架構層面的創新與訓練數據蒸餾完全無關,所有人都能從開源中受益,包括美國大小實驗室。

举报 糾錯/舉報
糾錯/舉報
提交
新增文庫
僅自己可見
公開
保存
選擇文庫
新增文庫
取消
完成