xAI 發佈 Grok Imagine 影片 1.5：支援音畫同頻生成，速度翻倍

根據動態 Beating 監測，xAI 正式發布圖像與文字生成視頻模型 Grok Imagine Video 1.5，並在 API（grok-imagine-video-1.5）、網頁端（grok.com/imagine）及移動客戶端全量上線。

模型實現音視頻一體化同步生成，在單次推理階段同步產生音效、環境音與角色對話，提高語音清晰度並優化唇形同步。同時，模型改進了物理引擎與運動一致性，提升鏡頭長周期內物體運動與物理重量的可信度，減少畫面扭曲等偽影。在生成速度上，輕量版 Video 1.5 Fast 生成 6 秒 720p 視頻的耗時縮短至約 25 秒。

網頁端配套工作流同步更新：新增項目管理（Projects）以分類整理素材，支持多智慧體並行（Multiple Agents）運行多個提示詞，並提供媒體庫語義搜索（Search）。數字藝術家 David Thompson 團隊使用 Grok Imagine 1.5 製作了完全由 AI 生成的電影預告片《Odyssey》。

原文鏈接

糾錯/舉報