据 1M AI News 监测,Anthropic 周二宣布 Project Glasswing 网络安全计划,同时正式公布此前泄露的新模型 Claude Mythos Preview。这个模型没有公开发售,Anthropic 认为它的网络攻防能力太强,需要先让防御方用起来。苹果、微软、谷歌、AWS、英伟达等 11 家机构作为创始合作方,将用 Mythos Preview 扫描自家系统的安全漏洞,另有 40 多家关键软件基础设施机构也拿到了访问权限。
Anthropic CEO Dario Amodei 在发布视频中说:「我们没有专门训練它擅长網路安全,我们訓練它擅长編程,但擅長編程的副作用就是也擅長網路安全。更強大的模型會不斷從我們和其他公司手中誕生,我們需要一個應對方案。」
過去數周,Mythos Preview 在所有主流操作系統和瀏覽器中找到了數千個高危零日漏洞,大部分完全自主完成,不需要人類引導。三個已修復的案例:
1. OpenBSD(以安全著稱,廣泛用於防火牆的操作系統)中一個藏了 27 年的漏洞,攻擊者連上目標機器就能遠程讓它崩潰
2. FFmpeg(被大量軟體用於視頻編解碼的開源庫)中一個 16 年的漏洞,自動化測試工具跑過那行代碼 500 萬次都沒發現
3. Linux 內核中多個漏洞的鏈式利用,能從普通用戶權限一路提到完全控制整台機器
創始合作方完整名單:AWS、蘋果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux 基金會、微軟、英偉達、Palo Alto Networks。Anthropic 投入最高 1 億美元模型使用額度,另捐 400 萬美元給開源安全組織(250 萬給 Linux 基金會下的 Alpha-Omega 和 OpenSSF,150 萬給 Apache 軟體基金會)。
基準測試上,Mythos Preview 全面拉開了與上一代旗艦 Claude Opus 4.6 的差距:
1. 網路安全漏洞複現 CyberGym:83.1% vs 66.6%
2. SWE-bench Verified:93.9% vs 80.8%
3. SWE-bench Pro:77.8% vs 53.4%
4. GPQA Diamond:94.6% vs 91.3%
5. Humanity's Last Exam(含工具):64.7% vs 53.1%
1 億美元額度用完後,合作方按每百萬輸入 token 25 美元、輸出 125 美元付費,支持 Claude API、Amazon Bedrock、Vertex AI 和 Microsoft Foundry。Anthropic 計劃先在下一版 Claude Opus 上部署安全防護,為日後開放 Mythos 級別的模型鋪路。
Anthropic 前沿紅隊負責人 Logan Graham 對《連線》說:「6 到 24 個月內這種能力就會普及,我們現有安全體係依賴的很多假設都可能失效。」Anthropic 承諾 90 天內公開研究成果。
同日 Anthropic 披露年化營收已破 300 億美元(2025 年底約 90 億),並宣布與谷歌和博通達成數 GW 級算力協議,據報導最早可能今年 10 月 IPO。