原文標題:Inside OpenAI 的追趕之路
原文作者:Maxwell Zeff,Wired
翻譯:Peggy,BlockBeats
編者按:在 AI 編程代理迅速崛起的當下,曾憑 ChatGPT 引領生成式 AI 浪潮的 OpenAI,卻在這一關鍵賽道上意外成為「追趕者」。與之形成鮮明對比的是,由前 OpenAI 成員創立的 Anthropic,憑藉 Claude Code 在開發者社區和企業市場迅速走紅,成為 AI 編程工具領域的重要領先者之一。
本文通過對 OpenAI 高管、工程師以及多位開發者的採訪,揭示了這場競賽背後的真實過程:從早期 OpenAI Codex 項目被拆分、資源轉向 ChatGPT 與多模態模型,到內部團隊重新整合、加速推出 AI 編程產品,OpenAI 正在經歷一次從戰略忽視到全面追趕的轉折。某種意義上,這並非技術能力的落後,而是戰略節奏的錯位:ChatGPT 的爆發改變了公司優先級,與 Microsoft 的合作關係限制了產品路徑,而 Anthropic 則更早押注 AI 編程賽道。
在這場競賽背後,更深層的問題也逐漸浮現:當 AI 代理開始承擔越來越多的認知型工作時,軟體開發流程乃至白領勞動本身,都可能被重新定義。
以下為原文:
OpenAI 首席執行官 Sam Altman 把雙腿盤在辦公椅上,仰頭望著天花板,像是在思考某個尚未成形的答案。某種程度上,這也與環境有關。
OpenAI 位於舊金山 Mission Bay 的新總部,是一座由玻璃與淺色木材構成的現代建築,氣質近乎「科技聖殿」。前台後的展示架上擺放著介紹「AI 時代」(Eras of AI)的手冊,仿佛在描繪一條通往技術啟示的路徑。樓梯牆面上貼滿了人工智能發展的里程碑海報,其中一張記錄著這樣一個時刻:成千上萬名觀眾通過直播見證,一台機器在《Dota 2》比賽中打敗頂級電競戰隊。走廊裡,研究員穿著印有標語的團隊周邊衫來來往往,其中一件寫著:「好的研究需要時間。」當然,理想情況下,不必太久。
我們坐在一間巨大的會議室裡。我向 Altman 拋出的問題,與正在席捲行業的 AI 編程革命有關,以及為什麼 OpenAI 似乎並未在這一波濤中佔據領先位置。
如今,數以百萬計的軟體工程師已經開始將部分編程工作交給 AI 處理,這讓矽谷許多人第一次真正直面一個現實:自動化可能會觸及他們自己的岗位。編程代理(coding agents)也因此成為少數幾個願意為 AI 支付高價的應用場景之一。按理說,這樣的時刻完全可能,甚至應該成為 OpenAI 樓梯牆上海報中的下一次「勝利時刻」。但現在,佔據頭條位置的名字卻並不是它。
這家公司的對手是 Anthropic,一家由前 OpenAI 成員創立的 AI 公司。憑藉其編程代理產品 Claude Code,Anthropic 獲得了爆發式增長。公司在 2 月披露,該產品已貢獻近五分之一的業務規模,對應年化收入超過 25 億美元。相比之下,據一位知情人士透露,截至 1 月底,OpenAI 自家的編程產品 OpenAI Codex 的年化收入僅略高於 10 億美元。
問題在於:為什麼在這場 AI 編程競賽中,OpenAI 反而落在了後面?
「先發優勢的價值非常大。」Sam Altman 沉思片刻後說道,「這一點,我們在 ChatGPT 上已經體驗過。」
不過,在他看來,現在正是 OpenAI 全面發力 AI 編程的時機。他認為,公司現有的模型能力已經足夠強大,可以支撐高度複雜的編程代理(coding agents)。當然,這樣的能力並非偶然,公司為此投入了數十億美元用於模型訓練。
「這將會是一門巨大的生意,」Altman 說,「不僅因為它本身帶來的經濟價值,也因為編程所能釋放的通用生產力。」他停頓了一下,又補充道:「我很少輕易使用這個詞,但我認為,這很可能是那種規模達到數萬億美元的市場之一。」
更進一步,他認為,OpenAI Codex 或許是通向通用人工智能(AGI)的「最可能路徑」。按照 OpenAI 的定義,所謂 AGI,是一種能夠在絕大多數具有經濟價值的工作中超越人類表現的 AI 系統。

Sam Altman,OpenAI 首席執行官。攝影:Mark Jayson Quines。
不過,儘管 Altman 以一種從容不迫的姿態做出自信判斷,過去幾年公司內部的真實情況卻要複雜得多。為了了解更完整的內部故事,我採訪了 30 多位知情人士,包括在公司批准下接受採訪的現任 OpenAI 高管與員工,以及一些在匿名條件下介紹公司內部運作情況的前員工。綜合這些敘述,可以看到一個並不常見的局面:OpenAI 正在奮力追趕。
時間回到 2021 年。當時,Altman 和其他 OpenAI 高管邀請《WIRED》記者 Steven Levy 來到他們位於舊金山 Mission 區的早期辦公室,觀看一項新技術演示。這是一項基於 GPT-3 衍生出來的項目,使用來自 GitHub 的大量開源代碼進行訓練。
在現場演示中,高管們展示了這款名為 OpenAI Codex 的工具如何接收自然語言指令,並生成簡單的程式碼片段。
「它實際上可以在電腦世界裡替你執行操作,」當時,OpenAI 總裁兼聯合創始人 Greg Brockman 這樣解釋,「你擁有的是一個能夠真正執行命令的系統。」即便在當時,OpenAI 的研究人員也已經普遍認為,Codex 將成為構建「超級助手」(super assistant)的關鍵技術。
那段時間,Altman 和 Brockman 的日程幾乎被與 Microsoft 的會議填滿——這家軟體巨頭正是 OpenAI 最大的投資方。微軟計劃利用 Codex 為其首批商業化 AI 產品之一提供技術支持:一款名為 GitHub Copilot 的程式碼補全工具,可以直接嵌入程序員日常使用的開發環境中。
一位早期 OpenAI 員工回憶說,在那個階段,Codex「基本只能做自動補全」。但微軟高管仍將其視為 AI 時代到來的重要信號。
2022 年 6 月,當 GitHub Copilot 正式公開發布時,短短幾個月內便吸引了數十萬用戶。

Greg Brockman,OpenAI 總裁。攝影:Mark Jayson Quines。
最初負責 Codex 的 OpenAI 團隊隨後被調往其他項目。一位早期員工回憶稱,公司當時的判斷是:未來模型本身就會具備編程能力,因此沒有必要長期維持一個獨立的 Codex 專案團隊。一部分工程師被調去參與 DALL-E 2 的開發,另一部分則轉向訓練 GPT-4。在當時看來,這是讓 OpenAI 更接近 AGI 的關鍵路徑。
隨後,2022 年 11 月 ChatGPT 上線,並在兩個月內獲得超過 1 億用戶。公司內部幾乎所有其他項目都因此被迫暫停。此後的幾年裡,OpenAI 實際上沒有一支專門負責 AI 編程產品的團隊。一位曾參與 Codex 專案的前成員表示,在 ChatGPT 走紅之後,AI 編程似乎不再屬於公司新的「消費級產品優先」戰略範疇。與此同時,業內普遍認為這一領域已經被 GitHub Copilot「覆蓋」,而那本質上是 Microsoft 的主場。OpenAI 主要只是提供底層模型支援。
因此,在 2023 年和 2024 年,OpenAI 的資源更多投向多模態 AI 模型與智能代理(agents)。這些系統被設計為能夠同時理解文本、圖像、視頻和音頻,並像人類一樣操作光標與鍵盤。這一方向在當時看起來更符合行業趨勢:Midjourney 的圖像生成模型在社交網路上迅速走紅,而行業普遍認為,大語言模型必須能夠「看見」和「聽見」世界,才能真正邁向更高層次的智能。
相比之下,Anthropic 選擇了一條不同路徑。雖然該公司同樣在開發聊天機器人和多模態模型,但它似乎更早意識到編程能力的潛力。在最近的一檔播客中,Brockman 也承認,Anthropic 從很早階段就「高度專注於編程能力」。他指出,Anthropic 在訓練模型時不僅使用了學術競賽中的複雜編程題,還加入了來自真實程式碼倉庫的大量「混亂」碼問題。
「這是我們後來才意識到的一課,」Brockman 說。
2024 年初,Anthropic 開始使用這些真實程式碼倉庫數據訓練 Claude 3.5 Sonnet。當該模型在 6 月發布時,許多用戶對其編程能力印象深刻。
這種表現尤其在一家名為 Cursor 的新創公司中得到驗證。這家由一群二十多歲年輕人創立的公司,開發了一款 AI 程式設計工具,允許開發者用自然語言描述需求,由 AI 直接修改程式碼。當 Cursor 接入 Anthropic 的新模型後,其使用者規模迅速增長,一位接近該公司的知情人士透露。
幾個月後,Anthropic 開始在內部測試自己的程式設計代理產品,Claude Code。
隨著 Cursor 的人氣不斷上升,OpenAI 一度試圖收購這家新創公司。但據多位接近該公司的消息人士透露,Cursor 的創始團隊在談判尚未深入之前就拒絕了這一提議。他們認為 AI 程式設計行業潛力巨大,因此希望繼續保持獨立發展。

Andrey Mishchenko,OpenAI Codex 研究負責人。攝影:Mark Jayson Quines。
當時,OpenAI 正在訓練其首個所謂的「推理模型」,OpenAI o1。這類模型能夠在給出答案之前,對問題進行逐步推理。OpenAI 在發布時表示,該模型在「準確生成與除錯複雜程式碼」方面表現尤為突出。
Mishchenko 解釋說,AI 模型之所以在程式設計能力上取得明顯進步,一個重要原因在於:程式設計是一種「可驗證任務」(verifiable task)。程式碼要麼能運行,要麼不能運行,這為模型提供了非常明確的反饋信號。一旦出錯,系統就能迅速知道哪裡出了問題。OpenAI 正是利用這種反饋迴圈,不斷讓 o1 在更複雜的程式設計問題上進行訓練。
「如果沒有在程式碼庫中自由探索、實施修改並測試自身結果的能力——這些都屬於『推理』能力的一部分——那麼今天的程式設計代理不可能達到現在的水準。」他說。
到 2024 年 12 月,OpenAI 內部已經出現多個小團隊開始專注於 AI 程式設計代理。其中一個團隊由 Mishchenko 與 Thibault Sottiaux 共同領導。Sottiaux 曾任職於 Google DeepMind,如今是 OpenAI 的 Codex 負責人。
起初,他們對程式設計代理的興趣主要來自內部研發需求,希望利用 AI 自動化完成大量重複性的工程工作,例如管理模型訓練任務、監控 GPU 集群運行狀態等。
另一項並行的嘗試則由 Alexander Embiricos 主導。他此前負責 OpenAI 的多模態代理項目,如今擔任 Codex 的產品負責人。Embiricos 曾開發過一個名為 Jam 的示範項目,並在公司內部迅速傳播開來。

Thibault Sottiaux,OpenAI Codex 負責人。攝影:Mark Jayson Quines。
與通過滑鼠和鍵盤控制電腦不同,Jam 可以直接訪問電腦的命令行。2021 年的 Codex 示範還只是展示 AI 為人類生成代碼,由人類手動運行;而 Embiricos 的版本則可以自己執行這些代碼。他回憶說,當時看著一頁實時記錄 Jam 操作行為的網頁在自己筆記本電腦上不斷刷新更新,內心幾乎被震撼到。
「有一段時間,我一直在想,多模態互動可能是實現我們使命的路徑。比如人類整天與 AI 共享屏幕、一起工作。」Embiricos 說,「後來突然變得非常清晰:也許,讓模型直接獲得對電腦的程序化訪問權限,才是實現這一目標的真正方式。」
這些分散的項目花了幾個月時間才逐漸整合成一個統一方向。到 2025 年初,當 OpenAI 完成對 OpenAI o3 的訓練時,這是一款在程式設計任務上比 OpenAI o1 更進一步優化的模型,公司終於擁有了構建真正 AI 程式設計產品的技術基礎。但與此同時,Anthropic 的 Claude Code 已經準備公開發布。
在 Claude Code 發布之前(2025 年 2 月以「有限研究預覽」形式推出,5 月全面上線),當時 AI 程式設計領域的主流模式還被稱為「vibe coding」。開發者通過 AI 輔助工具推動專案進展,由人類掌控方向,而 AI 在過程中補充具體實現。這類工具已經吸引了數億美元投資。
但 Anthropic 的新產品改變了這一模式。像 Jam 示範一樣,Claude Code 可以直接通過電腦的命令行運行,這意味著它能夠訪問開發者的全部檔案與應用程序。程式設計不再只是「AI 輔助」,而是開發者可以把整項工作直接交給 AI 代理完成。
面對這一變化,OpenAI 開始加速推出競爭產品。Sottiaux 回憶說,他在 2025 年 3 月組建了一支「衝刺團隊」(sprint team),任務是在幾周內整合公司內部多個團隊,盡快推出 AI 程式設計產品。
與此同時,Altman 還嘗試通過收購來實現「彎道超車」,以 30 億美元收購 AI 程式設計初創公司 Windsurf。OpenAI 高層認為,這筆交易將為公司帶來一個成熟的 AI 程式設計產品、一支經驗豐富的團隊,以及現成的企業客戶基礎。
但這筆收購案隨後陷入停滯。据 The Wall Street Journal 報道,問題出在 OpenAI 的最大合作夥伴 Microsoft。微軟希望能夠獲得 Windsurf 的知識產權訪問權。自 2021 年以來,微軟一直使用 OpenAI 的模型為 GitHub Copilot 提供技術支持,這一產品也成為微軟財報電話會議中的亮點之一。但隨著 Cursor、Windsurf 以及 Claude Code 推出新的 AI 程式設計代理體驗,GitHub Copilot 開始顯得停留在上一代 AI 工具階段。如果 OpenAI 再推出一款新的程式設計產品,對微軟來說未必是好消息。
這筆收購談判正好發生在 OpenAI 與微軟關係最緊張的時期。雙方當時正在重新談判合作協議,而 OpenAI 試圖削弱微軟對其 AI 產品與算力資源的控制權。最終,Windsurf 收購案成為這場博弈的犧牲品。到 7 月,OpenAI 放棄了這筆交易。隨後,Google 聘請了 Windsurf 的創始團隊,而其餘員工則被另一家 AI 程式設計公司 Cognition 收購。
「我當時當然很希望這筆交易能夠完成,」Altman 說,「但並不是每一筆交易都能掌控。」他表示,雖然原本希望 Windsurf 的收購「能在一定程度上加速我們的進展」,但他對 Codex 團隊的發展勢頭同樣印象深刻。在談判進行的同時,Sottiaux 和 Embiricos 仍在持續開發產品並推出更新。
到 8 月,Altman 決定全面加速推進。

Alexander Embiricos,OpenAI Codex 產品負責人。攝影:Mark Jayson Quines。
Greg Brockman 衡量 AI 能力最喜歡的一種方式,是他自己設計的一款小遊戲,「反向圖靈測試」(Reverse Turing Test)。幾年前他親手寫下了這個遊戲的程式碼,如今則會把任務交給 AI 代理,從零開始重新實現。
遊戲規則很簡單:兩名人類玩家分別坐在不同電腦前,每個人螢幕上都會看到兩個聊天視窗。其中一個視窗連接另一名人類玩家,另一個則連接 AI。玩家需要猜出哪個視窗是 AI,同時又要設法讓對手誤以為自己才是 AI。
Brockman 說,在去年大部分時間裡,OpenAI 最強的模型要花上數小時才能搭建出這樣一個遊戲,而且過程中還需要大量明確的人類指令和協助。但到去年 12 月,Codex 已經能夠通過一條精心設計的提示詞(prompt),直接生成一個完全可運行的版本,底層使用的是新的 GPT-5.2 模型。
這種變化並不只被 Brockman 注意到。世界各地的開發者也開始意識到,AI 程式設計代理的能力突然出現了明顯躍升。圍繞 AI 程式設計的討論,最初主要集中在 Claude Code,很快突破矽谷技術圈,成為主流媒體關注的話題。
甚至一些沒有程式設計經驗的普通用戶,也開始利用 AI 直接創建自己的軟體項目。
這波使用量激增並非偶然。在這段時間裡,Anthropic 和 OpenAI 都投入了大量資金,以獲取更多 AI 程式設計代理使用者。多位開發者告訴《WIRED》,他們每月 200 美元的 Codex 或 Claude Code 訂閱計畫,實際能獲得超過 1000 美元價值的使用額度。這種相當「慷慨」的限額,本質上是一種市場策略:先讓開發者在日常工作中習慣使用 AI 程式設計工具,再在企業場景中按使用量收費。
據多位知情人士透露,2025 年 9 月時,Codex 的使用量只有 Claude Code 的約 5%。但到 2026 年 1 月,Codex 的使用者規模已經上升到 Claude Code 的約 40%。
在科技初创公司工作了 10 年的开发者 George Pickett 最近甚至开始组织以 Codex 為主题的線下聚會。
「我覺得很明顯,我們正在用 AI 代理取代白領工作,」Pickett 說,「至於這對社會意味著什麼,說實話誰也說不準。它肯定會帶來巨大衝擊,但我對未來總體還是比較樂觀的。」
與此同時,估值約 110 億美元的效率軟件公司 Notion 聯合創始人 Simon Last 表示,在 GPT-5.2 發布之後,他和公司的核心工程團隊已經轉向使用 Codex,主要原因是穩定性更好。
「我發現 Claude Code 經常會『騙我』,」Last 說,「它會說任務正在運行,但實際上並沒有。」

Katy Shi,OpenAI 研究員。攝影:Mark Jayson Quines。
在 OpenAI 負責研究 Codex 模型行為的 Katy Shi 表示,雖然有人把 Codex 的默認風格形容為「乾巴巴的麵包」(dry bread),但越來越多用戶反而開始欣賞這種不刻意討好的交流方式。「很多工程工作,本質上就是能夠接受批評性的反饋,而不會把它當成冒犯。」她說。
與此同時,一些大型企業也已經開始採用 Codex。OpenAI 應用業務 CEO Fidji Simo 表示:「ChatGPT 已經成為 AI 的代名詞,這讓我們在 B2B 市場擁有巨大優勢。企業更願意部署員工已經熟悉的技術。」她補充說,OpenAI 銷售 Codex 的核心策略,是把它與 ChatGPT 以及其他 OpenAI 產品一起打包提供。
Cisco 總裁兼首席產品官 Jeetu Patel 則向員工明確表示,不必擔心使用 Codex 的成本,因為關鍵是要盡快熟悉這種工具。當員工擔心「使用這些工具會不會讓自己失業」時,Patel 的回答是:「不會。但我可以保證,如果你不使用它們,你就會失業,因為你會變得不再有競爭力。」
如今,圍繞 AI 編程代理的焦慮已經遠遠超出矽谷技術圈。The Wall Street Journal 上個月曾將一輪規模達 1 萬億美元 的科技股抛售部分歸因於 Claude Code,投資者擔心軟件開發可能很快被 AI 大規模取代。幾周後,在 Anthropic 宣布 Claude Code 可以用於改造運行 COBOL 的舊系統(這種系統在 IBM 機器上十分常見)後,IBM 股價經歷了 25 年來最糟糕的一天。
與此同時,OpenAI 也在努力將 AI 程式設計代理推入公眾討論中心。公司甚至花費數百萬美元,在超級盃(Super Bowl)期間投放了一則關於 OpenAI Codex 的廣告,而不是推廣 ChatGPT。
在 Mission Bay 的 OpenAI 總部內部,幾乎沒有人需要被說服使用 Codex。我採訪的許多工程師表示,他們如今已經很少親自敲碼了,大部分時間只是與 Codex 對話。有時,他們甚至會「集體交流」。
在總部,我旁聽了一場 Codex 黑客松。大約 100 名工程師擠在一個大房間裡,每個人有四小時,用 Codex 做出最好的示範項目。一位 OpenAI 高管站在前方,一邊看著手中的筆記型電腦,一邊用麥克風宣布團隊名稱。各團隊代表緊張地走上講台,用略顯顫抖的聲音介紹自己的 AI 項目。最終的獲勝者獲得了 Patagonia 背包作為獎勵。
許多項目既是用 Codex 開發的,也旨在幫助工程師更好地使用 Codex。例如,有團隊開發了一個工具,可以把 Slack 訊息自動整理成每週報告;另一組則做出了一個類似 Wikipedia 的內部 AI 指南,用來解釋 OpenAI 各項內部服務。過去,這類原型往往需要幾天甚至幾周時間才能完成,而現在,一個下午就足夠。
離開時,我在門口遇到了 Kevin Weil,前 Instagram 高管,如今負責 OpenAI 的「OpenAI for Science」部門。他告訴我,Codex 正在替他通宵完成一些項目任務,他會在第二天早上查看結果。這樣的工作方式已經成為他以及數百名 OpenAI 員工的日常。OpenAI 在 2026 年的目標之一,是開發一個「自動化實習生」,用於研究 AI 本身。
Simo 表示,未來 Codex 不只是用於編程,而是希望成為 ChatGPT 及所有 OpenAI 產品中的任務執行引擎,為用戶完成各種實際工作。Altman 也表示,他很希望推出一個通用版本的 Codex,但仍然擔心安全風險。
他說,2026 年 1 月底,一位沒有技術背景的朋友曾請他幫忙安裝一款爆紅的 AI 程式設計代理 OpenClaw。Altman 拒絕了這一請求,因為在他看來,「現在顯然還不是個好主意」,例如 OpenClaw 可能會誤刪重要文件。
諷刺的是,幾週後,OpenAI 宣布已經聘請了 OpenClaw 的開發者。
許多開發者告訴我,如今 Codex 與 Claude Code 之間的競爭從未如此激烈。但隨著這些工具能力不斷提升,並被企業管理者越來越多地引入工作流程,社會需要面對的問題早已不只是「該使用哪款 AI 編程工具」這麼簡單。

Amelia Glaese,OpenAI 研究副總裁兼對齊負責人。攝影:Mark Jayson Quines。
一些監督機構擔心,OpenAI 在追趕 Claude Code 的競爭中,可能會讓安全問題退居次要位置。一個名為 Midas Project 的非營利組織指責 OpenAI 在發布 GPT-5.3-Codex 時弱化了其安全承諾,未充分披露該模型在網路安全方面的潛在風險。
對此,Glaese 反駁稱,OpenAI 並沒有為了推進 Codex 而犧牲安全性,公司方面也表示,Midas Project 對其安全承諾存在誤讀。
即便是 Greg Brockman,這位去年為支持 AI 發展向一個親 AI 的超級政治行動委員會(Super PAC)和一個支持 Donald Trump 的組織分別捐贈 2500 萬美元,並且依然樂觀表示「我們正按計畫邁向 AGI」的 OpenAI 聯合創始人也對這一新現實抱有複雜情緒。
在矽谷工程師圈子裡,Brockman 一直以「極度投入」的管理風格著稱:那種會在產品發布前一晚仍然深入程式庫檢查細節的老闆。某種程度上,如今這種更加「放手」的工作方式讓他感到輕鬆。「你會意識到,過去大腦被許多其實不必要的細節所佔據,」他說。
但與此同時,當一個人變成「數十萬 AI 代理艦隊的 CEO」,由這些系統去執行你的目標與願景時,你也很難再深入到每個問題解決的具體細節之中。
「在某種意義上,這會讓人感覺自己正在失去對問題本身的『脈搏』。」Brockman 說。
[原文連結]
歡迎加入律動 BlockBeats 官方社群:
Telegram 訂閱群:https://t.me/theblockbeats
Telegram 交流群:https://t.me/BlockBeats_App
Twitter 官方帳號:https://twitter.com/BlockBeatsAsia