据動察 Beating 監測,開發者 @DevAdventur3s 近日從 OpenAI Codex 的程式庫中挖出 1536 行尚未啟動的 Rust 代碼,曝光了 Codex 正在內測的即時語音模式。這次更新最大的變化是徹底切分了互動與執行,實現了前台連麥與後台寫程式的雙線並行。
從洩露的介面和原始碼註釋來看,使用者用語音下達重構等複雜指令後,前台會立刻喚起一個代號為 gpt-realtime-1.5 的語音模型,通過 WebRTC 與使用者即時通話並口頭匯報進度。與此同時,真正拉取檔案、修改程式碼和執行測試的重勞力活,則全部交由後台另一個參數量更大的模型靜默完成。
AI 程式設計的互動體驗正從回合制文本問答,走向類似結對程式設計同事的即時通話。目前這套底層邏輯和配套 UI 均已合併進主幹程式碼,只等 OpenAI 伺服器端開啟權限即可啟動上線。