据動察 Beating 監測,OpenAI 發布官方部落格,詳細披露了其內部如何安全管控自主編程 Agent(Codex),為產業提供了一份實操指南。
自主編程 Agent 能自動讀寫程式庫、執行終端命令,直接觸及企業 IT 命脈,安全風險是阻礙其落地的最大卡點。為此,OpenAI 給 Codex 設定了四道物理與系統圍欄:限制在特定沙箱目錄讀寫;切斷預設外網訪問,實行域名白名單制;將 gh pr view 等查詢命令與高危命令分級處理;所有憑證強制綁定企業級工作區。
這套架構的核心突破在於「用 AI 管控 AI」,解決了安全審批卡死開發效率的矛盾。OpenAI 部署了一個獨立的「審批子 Agent」自動放行低風險操作,只在遇到高危動作時才呼叫人工。在審計環節,傳統安全系統只能看到「發生了一次網路連線」,而 OpenAI 的架構會連同「使用者提示詞」和「工具呼叫鏈」一並抓取。當警報響起時,另一個「AI 安全分診 Agent」會先根據完整上下文,判斷這是 AI 的無害失誤還是惡意入侵,初篩後再交由人類複核。
這套方案解答了企業「想用 Agent 又不敢給權限」的痛點,給出了可直接落地的參考標準。