header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
掃碼下載APP

前OpenAI研究員發布Flipbook原型:跳過HTML,用AI視頻模型直接生成每個像素

動察 Beating 監測,前 OpenAI 研究員 Zain Shah 及團隊發布 Flipbook,一个用 AI 模型直接生成屏幕像素的實驗性原型,取代 HTML、CSS 等傳統網頁技術。用户看到的每个「頁面」都是一張 AI 生成的圖像,點擊圖像中任意區域即生成新圖像繼續深入,整個界面無 HTML 代碼、無固定鏈接、無預定義按鈕,連文字也是圖中像素。

視頻模式基於以色列公司 Lightricks 的開源 DiT(擴散 Transformer)視頻生成模型 LTX Studio,經優化後可以 1080p 24fps 通過 WebSocket 實時流式傳輸到用戶屏幕,後端接 Modal Labs 的無伺服器 GPU。Shah 稱目前 Flipbook 功能有限,團隊圍繞視覺解釋來設計,但展示了更大的方向:隨著模型更準確、更有狀態,未來可擴展到結構化 UI,包括編程場景。

Shah 曾在 OpenAI 從事 AI 與機器人研究,之後任三星創意技術專家,也是 YC S13 校友。團隊成員還包括前 Humane 和 Slack 工程師 Eddie Jiao、前蘋果工程師 Drew O'Carr。

举报 糾錯/舉報
糾錯/舉報
提交
新增文庫
僅自己可見
公開
保存
選擇文庫
新增文庫
取消
完成