header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
掃碼下載APP

阿里開源首個語言世界模型Qwen-AgentWorld,為AI智能體打造虛擬飛行模擬器

动察 Beating 监测,通义实验室开源原生語言世界模型 Qwen-AgentWorld。模型首次將環境建模作為訓練目標,通過訓練 AI 預測環境的下一步響應,為 AI 智能體(Agent)構建了類似於飛行模擬器的虛擬空間。虛擬模擬避免了智能體在真實環境或網路沙箱中試錯的高昂成本與安全風險。

Qwen-AgentWorld 統一覆蓋文本與圖形介面共七大領域。對於 Web、OS 和 Android 等圖形環境,模型並不生成視頻幀,而是將觀測轉化為 HTML 和無障礙樹 XML 等程式碼文本,實現超高速且精確的邏輯模擬。在綜合性評量基準 AgentWorldBench 上,Qwen-AgentWorld-397B-A17B 取得最高的整體均分(58.71),超越 GPT-5.4、Claude Opus 4.8 與 Gemini 3.1 Pro。

模型在智能體訓練中展現出兩種應用價值。一方面,作為解耦的環境模擬器,模型能零成本模擬數千個未涉及的虛擬環境,在 WideSearch 任務中追平甚至超越真實搜索引擎的訓練效果。另一方面,預測能力可內化為智能體的元推理模式,使同一個模型在行動前能模擬環境響應,在完全未涉及的領域湧現出顯著增益(Claw-Eval 提升 +11.3,函數呼叫 BFCL v4 提升 +9.0)。相關模型、基準與程式碼已全部開源。

举报 糾錯/舉報
糾錯/舉報
提交
新增文庫
僅自己可見
公開
保存
選擇文庫
新增文庫
取消
完成