根據動態 Beating 監測,xAI 正式發布圖像與文字生成視頻模型 Grok Imagine Video 1.5,並在 API(grok-imagine-video-1.5)、網頁端(grok.com/imagine)及移動客戶端全量上線。
模型實現音視頻一體化同步生成,在單次推理階段同步產生音效、環境音與角色對話,提高語音清晰度並優化唇形同步。同時,模型改進了物理引擎與運動一致性,提升鏡頭長周期內物體運動與物理重量的可信度,減少畫面扭曲等偽影。在生成速度上,輕量版 Video 1.5 Fast 生成 6 秒 720p 視頻的耗時縮短至約 25 秒。
網頁端配套工作流同步更新:新增項目管理(Projects)以分類整理素材,支持多智慧體並行(Multiple Agents)運行多個提示詞,並提供媒體庫語義搜索(Search)。數字藝術家 David Thompson 團隊使用 Grok Imagine 1.5 製作了完全由 AI 生成的電影預告片《Odyssey》。