原文標題:The Wu Tapes
原文作者:Jeremy Stern
編譯:Peggy,BlockBeats
編者按:在大型模型能力持續外溢、AI agent 從概念走向產品化的背景下,行業討論正在從「模型到底有多強」轉向「AI 如何真正接管複雜工作」。但當程式碼生成、自動修復 bug、長期自主執行任務逐漸成為現實,一個更關鍵的問題開始浮現:AI 的下一階段競爭,究竟是模型能力之爭,還是組織、產品與基礎設施之爭?
本文來自 Jeremy Stern 對 Cognition 創始人兼 CEO Scott Wu 的長篇專訪。Scott Wu 是國際資訊學奧林匹克競賽金牌得主,也是 AI 程式設計智能體 Devin 背後最核心的創業者之一。Cognition 以 Devin 切入軟體工程自動化,嘗試將 AI 從「輔助工具」推向「自主同事」。
註:Devin 是 Cognition 推出的 AI 程式設計智能體,可以理解為一個「AI 軟體工程師」。
在這場對談中,Scott Wu 並不是簡單講述一個天才少年創辦 AI 獨角獸的故事,而是將 AI agent 的崛起拆解為一組更底層的結構性問題:模型能力如何轉化為真實生產力,技術天才如何變成創業組織,軟體工程為何成為 AI 改造現實世界的第一入口,以及當認知本身被自動化,人類的價值應如何重新定位。
第一,是技術範式從「補全」轉向「代理」。過去,生成式 AI 的主流想像仍停留在文字補全、問答和程式碼輔助上,AI 更像一個響應式工具。但在 Wu 看來,真正的變化在於 agent 形態的出現:它不是等待使用者逐字提示,而是像同事一樣接收任務、理解程式庫、除錯、測試,並提交可審查的結果。這意味著,AI 產品的核心不再只是模型呼叫,而是能否嵌入真實工作流,持續完成高上下文任務。
第二,是軟體工程從「人力密集型勞動」轉向「可被擴展的認知流程」。過去,撰寫程式碼依賴工程師的時間、經驗和團隊帶寬,一個團隊永遠有做不完的項目,只能在有限資源中取捨。Devin 所代表的方向,是讓 AI 承擔大量執行層工作,將工程師從重複性編碼、除錯和維護中釋放出來。這並不意味著軟體創造消失,而是軟體生產的瓶頸從「誰來寫」轉向「誰來定義問題、設計架構和判斷取捨」。
第三,是 AI 創業者畫像的變化。過去,科技公司常被理解為喬布斯式產品直覺、商業敘事和組織魅力的結合;而在 AI 與加密貨幣等高度技術化領域,新的創始人群體越來越多來自數學、編程競賽和量化訓練體系。他們的優勢不只是智力,而是長期競賽環境篩選出的分析能力、好勝心和自我迭代機制。這意味著,AI 時代的創業競爭,正在更深地綁定技術判斷、研究理解和產品落地能力。
第四,是 AI 風險從抽象末日敘事轉向現實適應摩擦。Wu 對 AI 的擔憂,並不主要來自技術本身,而來自技術擴散速度過快所帶來的不均衡:少數精英率先獲得能力,而普通組織、教育體系和安全防禦機制尚未跟上。尤其在網絡安全、軟體基礎設施和企業生產系統中,如果進攻能力先於防禦能力擴散,社會將面臨更複雜的失衡。
第五,是人類價值從「解決問題的能力」轉向「提出目標與表達自我」。如果 AI 最終能夠承擔越來越多原始腦力勞動,那麼人類不再只以計算能力、邏輯推理或執行效率定義自身。Wu 的回答帶有強烈技術樂觀主義:AI 將把人類從「生存模式」推向「創造模式」。但這也提出了更深的問題:當認知被複製、執行被自動化,人類真正不可替代的部分,可能不再是能力本身,而是記憶、語境、慾望、尊嚴,以及我們選擇如何使用能力。
如果將這場對談壓縮為一個判斷,那就是:Devin 的意義不只是一個 AI 編程產品,而是 AI agent 進入真實生產系統的一次早期嘗試。在這個意義上,本文討論的對象,已經不只是 Scott Wu 或 Cognition,而是 AI 行業從模型崇拜走向工作流重構、從能力展示走向生產力基礎設施的結構性轉折。
以下為原文內容(為便於閱讀理解,原內容有所整編):

有一種關於數學天才的經典敘事,曾經長期吸引著大眾想像。
那還是一個美國人仍相信自己能贏得戰爭、校園裡的書呆子會被塞進儲物櫃的年代。技術權力的公共面孔,仍屬於 WASP(白人盎格魯-撒克遜新教徒)、老派精英網路和運動明星。
這類故事通常有一套熟悉的四幕結構。
第一幕:一個新的證明或定理橫空出世,天才憑藉爆炸性的才華顛覆整個領域,也因此冒犯了那些既有權威——學院大佬、獲獎名流,以及所有被他動搖地位的人。
第二幕:他開始為自己正名。論文、講座、公開露面,以及一批忠誠學生和追隨者,構成了一場漫長的申辯運動。過程處處受阻,但最終仍迫使制度機構不情願地承認他的價值。與此同時,政府機構和外國情報人員也開始對他產生興趣,並試圖加以利用。
第三幕:嚴重失眠、偏執和精神失衡的症狀變得無法忽視。離婚、營養不良、自傷、精神病院,或是淪為校園裡的怪誕人物——穿著浴袍隨機闖入研討課,在黑板上寫下令人不安的符號與句子。
第四幕:不可逆轉的精神崩潰、藥物鎮靜,或死亡。隨後,神話開始生成:瘋狂被解釋為天才必須支付的代價,他的故事進入本科課堂和中產階級的文化經典譜系,成為文學獎項、傳記寫作和奧斯卡熱門影片反覆消費的素材。
我們至今仍然喜歡講這樣的故事。《奧本海默》和《後翼棄兵》的成功,喬納森·羅森與本哈明·拉巴圖特近年的寫作,都是例證。但這些故事幾乎都必須回到 20 世紀,這並非偶然。
進入 21 世紀的前四分之一,美國頂級極客的命運已經發生反轉。
今天,與年輕「書呆子天才」身處同一領域的人,不再把他視為個人威脅,而更可能將他視為一筆符合冪律回報的風險投資,或一次九位數規模的人才收購。國內外政府,尤其是情報機構,也不再只是潛在的監視者,而可能成為他的客戶、合作方,甚至業務線。被拒絕的,反而成了常春藤名校。
他也不再需要以偏執和隱居來完成天才敘事。過去那種與家庭、社會和現實徹底斷裂的形象,正在被另一種生活方式取代:高度社交化的關係網路,東方冥想、迷幻體驗、有效利他主義式飲食倫理,以及被優化過的睡眠管理。他不必赤腳遊蕩在校園草坪上,低聲念誦毀滅性的妄想。他只需要走上電視節目,告訴安德森·庫珀,自己正在建造的技術也許會摧毀大量工作崗位,甚至改變人類命運——而無論如何,這都能創造股東價值。
更重要的變化或許在於,老一代書呆子天才對於「真理」的狂熱正在消失。那種狂熱裡,曾同時包含兩件事:希望被理解,以及願意為不被理解而被放逐。
如今,名望、财富和权力不再需要等到死后才被承認。它們可以通過估值、IPO、關鍵基礎設施控制權、國家元首的遊說、對人和系統的調度能力實時顯現。它們也會在 X 的時間線上被每日重新塗抹、放大和合理化:一群被技術崇拜馴化的擁趸,把書呆子天才真實的聰明才智,以及公開展開的人格缺陷,一並包裝進史蒂夫·喬布斯式的創業神話中,並堅稱這不過是一次「創始人模式」的短暫發作。
這也是為什麼,「受人愛戴的 AI 巨頭」本質上是一個雞尾酒會式的矛盾修辭,就像「加拿大反派」或「德國喜劇演員」一樣。
沒有人真正享受這種局面。即便是那些不用擔心白領工作被取代、不必理解數據中心如何消耗水資源、內心也沒有強烈技術仇恨的人,也很难對此感到輕鬆。
因為美國人在文化深處仍然是中產階級。他們本能地相信,書呆子天才的合理歸宿,不是在戛納與媒體名流同席,也不是站在比國家更強的位置上。他應該服務於國家安全,或者探索星辰;之後,也許進入一家像 Costco 這樣「真正的公司」工作;最後退休到一間恆溫、安靜、帶小窗的大學小屋裡,思考如何建造一個「溫和奇點」或「世界大腦」——並提醒人們,如果這個系統落到別人手裡,就可能「殺死所有人」。
持有這種直覺的人,如今可能正在超市裡幫你裝袋,也可能正邀請你參加他們的播客。正如你早就知道的那樣,他們最終也會進入這場技術敘事。但如果你仍希望他們繼續納稅、繼續服從制度安排,甚至繼續在必要時為國家而戰,那麼你想建造的「神」,也必須被放進某種他們能夠理解、能夠接受的盒子裡。
這就說到了 Scott Wu。
Cognition 的創始人兼 CEO Scott Wu,如今掌管著一家 AI 編程智能體公司。這家公司被視為 AI 應用層最受關注的新玩家之一,也是近年增長最快的科技創業公司之一。但至少到目前為止,Wu 更廣為人知的身份,仍然是競技數學與編程圈裡那個令人過目難忘的「麥可·喬丹」式人物。
他成長於路易斯安那州巴吞魯日,一個並不典型的美國技術天才成長地,卻在數學與編程的高壓訓練場中早早成名。他是國際資訊學奧林匹克競賽(IOI)史上最出色的美國金牌得主之一,也是極少數同時在隊友、教練和競賽紀錄上都留下標記的人。他喜歡向別人發起撲克和國際象棋挑戰,也會用撲克牌表演數學戲法。換句話說,他是那種近乎教科書式的書呆子天才。
Wu 第一次在同类人群中聲名鵲起,是在 2003 年。那時他還是一名二年級學生,卻報名參加了一場中學生數學競賽。一個 7 歲孩子進入七年級組,他本以為頒獎典禮上會唸到自己的名字,結果沒有。20 年後,他回憶起這段經歷時,仍像喬丹談起職業生涯中的每一次輕慢一樣,一切都被記在心裡。
第二年,他以三年級學生身份參加九年級組比賽,並拿下第一名。17 歲離開高中之前,他已經在 MathCounts 這項全美最重要的中學生數學競賽中獲得全國第一,並拿下自己三枚 IOI 金牌中的第一枚。當時他的隊友包括 Alexandr Wang、Johnny Ho 和 Jesse Zhang——後來,他們分別成為 Scale AI、Perplexity 和 Decagon 的創始人。
尤金·維格納曾有一個著名說法:狄拉克、西拉德、泰勒,甚至愛因斯坦,都願意承認馮·諾依曼是他們之中最聰明的人。類似地,Wu 當年的 IOI 隊友們——在最後一次共同奪金後的十年裡,這些人創辦的公司合計估值已達到約 800 億美元——似乎也以相近的方式看待他。
Cognition 聯合創始人、同樣是 IOI 金牌得主的 Walden Yan 曾說:「Scott 和我之間的差距,就像我和那些連參賽資格都沒拿到的人之間的差距。」
圍繞 Wu,幾乎每個人都有一個關於「天才」的故事。
Cognition 第三位聯合創始人、前 IOI 隊友 Steven Hao 曾給 Wu 出過一道普特南數學競賽候選題,挑戰他在兩小時內用紙筆解出。結果 Wu 一邊大聲思考,一邊甚至沒有碰筆,只用了 90 秒就給出了解法。
另一次,Wu 向自己最大的投資人 Peter Thiel 和 Napoleon Ta 發起國際象棋與撲克挑戰,嘗試用牌桌和棋盤為公司爭取更好的投資條款。還有關於 IOI 圈層的情感傳聞:那個幾乎所有人都愛慕的女孩,本來差點與中國隊的核心選手在一起,後來卻選擇了 Wu。原文對此下了一個頗具挑釁意味的玩笑:「認輸吧,中國隊。」
還有一次,Founders Fund 舉辦了一場《任天堂明星大亂鬥 Melee》的區域網派對。特邀嘉賓是 Mango,「五神」之首,也是史上最偉大的《Melee》玩家之一。Wu 從來不是這個遊戲的神級玩家,但他出現在那場派對上,並擊敗了 Mango。靠的不是職業級訓練,而是更快的反應速度,以及類似撲克詐唬般的假動作判斷。
重點在於,如果換一個時代,一倀來自密西西比河東岸、白手起家、脾氣不小、精通多項技能、熱衷競爭並偶爾渴望一場「血戰」的程序員和國際智力競賽冠軍,到了 29 歲,或許已經走到了傳統書呆子天才敘事的第二幕與第三幕之間:一邊被體制承認,一邊開始被自己的才華、偏執和孤獨反噬。
如果他是另一種人,他也許已經登上《60 分鐘》,警告公眾說,如果政府不對新興競爭者施加近乎禁止性的監管成本,或者如果他沒有贏下某場關鍵訴訟,他的公司就會在美國社會結構上撕開一道無法修補的裂口。
但現實中的 Wu,並沒有選擇這種戲劇化路徑。他幾乎是在無聲無息地打造 Cognition。
Cognition 的旗艦產品 Devin,是一個自主型 AI 軟件工程師:它運行在自己的機器上,可以接收編程任務,理解既有程式庫,測試並除錯自己的工作,最後提交 pull request 供人類審查。
如果這聽起來無聊到近乎乏味——某種意義上也確實如此——那麼 Cognition 同時成為商業史上增長最快的公司之一,就更值得注意。Devin 的使用量每八週翻一番,並在服務推出後的前 18 個月裏達到 4.45 億美元的收入運行率。背後原因大致有四個。
第一,Wu 比大多數人更早判斷出,AI 行業將向智能體形態收斂。未來的 AI 不再只是自動補全工具,而是會 24 小時在後台運行,像同事一樣接手被分派出去的任務。
第二,他看到,GPT-4 時代的模型能力已經足以支撐這類智能體的早期構建。彼時行業共識仍認為,真正可用的 AI agent 還需要好幾年。
第三,當外界仍然懷疑 AI agent 是否存在產品市場契合時,Wu 認為這根本不是問題。理由很簡單:這個世界每年已經在「肉身計算機」——也就是人類軟件工程師——身上花費數萬億美元。
第四,他願意足夠早地釋出產品,並承受隨之而來的反彈。2024 年 3 月,Wu 推出 Devin。當時它在 SWE-Bench 上的成績只有 13%。SWE-Bench 是一個針對 AI 編程智能體的測試,用來衡量模型能夠獨立修復多少比例的軟體 bug。這個成績引發了大量公開批評,但 Wu 利用這段領先時間持續迭代,最終讓 Cognition 建立起今天的先發優勢。
如今,相關基準測試成績已經在原版 SWE-Bench 上接近 90%,在 SWE-Bench Pro 上接近 80%。Devin 也已成為美國陸軍、高盛、梅賽德斯-奔馳等機構客戶選用的 AI 程式設計智能體。一年半前,Cognition 的客戶數量還是零;如今,這家公司正在以約 250 億美元估值融資。
當 Wu 談論 Cognition,以及更廣義的 AI 時,他並不熱衷於描繪末日式圖景,也不沉迷於關於技術統治的宏大敘事。他更常談的是,如何「讓每個人都能更輕鬆地構建真正好用的軟體」。
他所指的,是讓車管所、國稅局、醫院、航空公司,以及你孩子小學的網站,都能像 Instagram 一樣順滑、直觀地運行。他希望 AI 能消除現代生活中那些令人抓狂的低效、阻滯和系統性摩擦。
正如他喜歡說的那樣:「這樣我們就可以不再活在《我的世界》的生存模式裡,而是開始活在創造模式裡。」對於一位 AI 巨頭、一個「書呆子皇帝」來說,這幾乎是一種令人意外的正常願望。
那麼,Cognition 會成功嗎?
也許不會。也許 AI 本質上就是一個零和市場,而到了 2023 年 11 月才創辦一家智能體實驗室,對 Wu 來說已經太晚。也許這確實是一個充分競爭的市場,但 Cognition 仍可能被 OpenAI 的 Codex、Claude Code,或者 xAI 與 Cursor 組合出的某種混合體碾壓。也許,用一支全由書呆子組成、幾乎沒有「運動員型」人物的超級團隊去贏下這場戰爭,本身就不是一個明智選擇。
也許,Devin 早期評價並不如今天,這一點會長期影響市場判斷。也許這並不重要,但 Cognition 最終仍會像 Cursor 一樣,在更大的模型公司或平台公司面前放棄獨立性。又或者,我們其實只是再一次在談論 NFT 式的泡沫敘事,而這一切從一開始就沒有那麼重要。
作為一名作家,以及某種「稀有人類蝴蝶」的收藏者,我最近去了 Cognition 位於舊金山的總部,與 Wu 進行了一次長談。見面時,他遞給我一個水獺毛絨玩偶——那是 Devin 的動物化形象,名字來自「dev-elop-in」的某種文字遊戲。
我随口提到,进门时注意到公司健身房裡沒有任何員工在使用器械,或許是因為那裡同時也是公司存放濕垃圾的地方。Wu 回答說,他們把濕垃圾放在健身房,是因為他們是數學奧林匹克選手。
我把訪問工具擺到桌上,等 Metronome 創始人兼 CEO Kevin Liu 給 Wu 送完一盒草莓——他說這些草莓「會改變你的人生」——然後按下錄音鍵。
以下是這場對話的文字記錄。對話大約持續了三個小時,內容經過編輯和壓縮,以便閱讀。
Jeremy Stern(主持人):Scott,你現在是一位 AI 大亨,同時圍繞你已經形成了一套相當豐富的個人傳奇:你似乎更像計算機,而不是血肉之軀;而且,你是在一片沼澤地裡長大的。所以我們先往回看。
Scott Wu:我的父母都來自上海,他們是在中國長大的。那時候有很長一段時間,中國正常的高考制度並不存在。大概持續了 10 年。我的父母正好趕上了這個時期,不僅沒有上大學,連初中和高中也基本沒有正常讀完。
後來,考試重新開放。自然出現的情況是:十年積壓下來的學生,都在競爭同樣數量的大學名額。而且因為他們其實並沒有接受過完整教育,我媽媽當時還在一家紡織廠工作。他們白天上班,晚上復習備考,最後考上了大學。他們讀書時成績都非常好。
我爸爸非常喜歡下圍棋,他有一位經常一起下棋的教授。那位教授後來去了美國,給我爸爸寫信,說你應該來美國讀書,這裡好得多,機會也多得多。他幫我爸爸申請學校和相關手續。於是我爸爸先來了美國,六個月後,我媽媽也來了。他們後來都在科羅拉多州立大學學習化學工程。
Jeremy Stern:他們有沒有談起過當時的文化衝擊?
Scott Wu:對他們來說當然很不一樣。但至少在住房和食物方面,美國已經好太多了——那些東西在當時的中國仍然相當稀缺。他們對此非常感激。我爸爸一直說,他這輩子做過的最好決定就是來美國。我覺得這是真的。
他們此前從來沒有離開過中國。甚至後來也是如此——我媽媽幾年前去世了,她一生只去過中國和美國。我爸爸也一樣,直到去年我帶他去了日本。所以,那當然是非常大的文化衝擊。
還有很多小事。當時中國很窮,他們為了來美國攢了好幾個月的錢。我爸爸剛到美國時,身上一共大概只有 80 美元。他給我講過一個故事:他和其他研究生一起從機場打車,大家自然都湊了一點錢給小費。當他拿出一兩美元作為小費時,他突然意識到,那差不多就是自己全部身家的 3%。那一刻對他來說非常震撼,也有點尷尬。
Jeremy Stern:那是哪一年?
Scott Wu:1989 年。
Jeremy Stern:所以,那確實是一個很特殊的時間點:在美國當學生,而不是留在中國。那你們後來怎麼去了巴吞魯日?那裡也不太像傳統意義上的「艾利斯島移民經歷」。
Scott Wu:他們都學化學工程。很自然地,因為路易斯安那有大量石油和天然氣產業,所以他們後來都在那裡找到了工作。我爸爸做空氣質量許可方面的諮詢,我媽媽在政府的環境質量部門工作。
我有一個哥哥 Neal,比我大四歲。我出生於 1996 年。到那時,我們已經有了一棟小房子,在巴吞魯日郊區過著還算典型的中產生活。
我從小就明顯和周圍的人不太一樣。他們大概都比我正常得多。課間大家會踢足球之類的,但我從來不太感興趣。我喜歡數學,而且一直極其好勝。我記得自己大概三四歲時就開始學乘法表。最早的很多數學知識,其實都是在家裡自然學到的。
這也得益於我哥哥比我大四歲。我們有很多共同興趣,我非常崇拜他,因為在路易斯安那州巴吞魯日,像我們這樣的人並不多。
Jeremy Stern:沒有什麼特別理由讓我這麼想,但你小時候被霸凌過嗎?
Scott Wu:當然,有。我經常被霸凌。我就是很不一樣。在我開始通過競賽遇到和自己相似的人之前,我基本上是一個相當孤獨的人。我在巴吞魯日有幾個親近的朋友,但說實話,某種程度上,我更覺得自己是和來自全美、乃至全世界的那些數學和編程競賽選手一起長大的。因為他們遠比身邊的人更像我。
Jeremy Stern:我想稍後再談競賽。但先說說,在課間挑戰其他孩子背乘法表之外,你是怎麼表達自己對數學的熱愛的?
Scott Wu:(笑)我哥哥六年級的時候,我上一年級。那時候他開始接觸中學數學競賽。我自然就跟著去,也想做數學。事情就是這樣真正開始的。
我當時在 Buchanan 小學,我們當地公立小學的天才計畫裡。旁邊有一所初高中,叫 McKinley。我從三年級開始去那裡上高中數學課。有幾年時間,每天都會有一位老師到小學來接我,帶我去 McKinley。到了五年級,我就開始自己走過去。當地學校系統有一點非常好:他們非常願意配合我,想辦法讓這件事能夠運轉起來。
我哥哥大概在我四年級時教我編程。我經常在電腦模擬器上玩《寶可夢》,這也讓我進一步學習編程。我還玩《俄羅斯方塊》。還有一種叫 24 點的紙牌遊戲。各種類似的小遊戲,本質上都是邏輯、謎題或策略,你可以在裡面計算不同選項。這些一直都是我最大的愛好。
我的父母確實在相當程度上推動我學習和練習,但很快,我就進入了一個完全自己想做的階段。我是完全自驅的。如果你不是深深感興趣,很難做到這一點。我一直熱愛數學,因為它非常優雅。當然,父母的推動也很有幫助。
Jeremy Stern:一個小孩子是如何感受到「優雅」的?
Scott Wu:我記得我爸爸給我解釋一元二次方程公式。他在一張紙上寫下:Ax² + Bx + C = 0。然後告訴我,應該這樣處理:先把 A 除出去,再配方,解這個方程,最後得到負 B 加減什麼東西。我非常喜歡這個過程。
我一直很喜歡邏輯,也喜歡把事情一步步推導到它自然的結論。數學最酷的一點在於,如果你真正深入理解這些東西,它們在邏輯上都會講得通。當然,我擅長數學,因此可以打敗別人,這也沒什麼壞處。而我顯然很喜歡打敗別人。
Jeremy Stern:你說「顯然」,但這種好勝心從哪裡來?
Scott Wu:我現在仍然是我們家最強的,但我的父母和哥哥基本上也都是競爭心處在 99 百分位的人。也許我媽媽才是我們之中競爭心最強的那個,如果讓我猜的話。
關於父母有一種刻板印象:他們總是拿你和別人家的孩子比較,比如,「某某家的孩子做得更好」。但我媽媽總是反過來說。比如,「那個聰明孩子其實也沒那麼厲害。那個人的孩子進了普林斯頓,但他其實並不讓人印象深刻。」
她一直非常強烈地向我灌輸一種觀念:你有潛力成為最好的。她從來不是說,「其他人都太厲害了,你應該向他們學習。」她更像是在說:「他們能做到的事,你也都能做到。」
Jeremy Stern:好,我們繼續這個邁克爾·喬丹的類比。James Jordan 在威爾明頓家裡的後院搭好了籃球架。Michael 最早喜歡的是棒球,但後來開始和哥哥 Larry 在院子裡一對一打籃球。他崇拜 Larry,同時也想打敗他。接著就是改變他餘生的那個關鍵時刻:Michael 原本以為自己能進校隊,結果試訓後落選。講講你人生裡類似的那一段吧。
Scott Wu:(笑)我不確定我接受這個前提。有史以來最強的競技程序員是 Gennady Korotkevich,他現在就在 Cognition 工作。
Jeremy Stern:當然,但「像喬丹」並不只是冠軍戒指。還包括數十億美元規模的球鞋生意,把每一件無聊小事都變成競爭遊戲的能力,那種 1000 瓦亮度的笑容,以及一位迷人的古巴裔妻子。順便說一句,我覺得她好像還當過 Alexander Wang 的模特。當然,是另一個 Alexander Wang。
Scott Wu:好吧。我參加的第一次數學競賽,是在巴吞魯日的南方大學。那是一場面向初中生和高中生的比賽——六年級學生參加六年級數學組,七年級學生參加七年級數學組,以此類推。我當時讀二年級,但報名參加了七年級數學組。
頒獎典禮上,他們開始念獲獎者的名字。我一直以為,某個時候會聽到自己的名字。結果沒有。我當時非常不服。真的,非常、非常不服。我到現在還記得這件事。那是我最早的記憶之一。
同一場比賽,我三年級時又回去了。那時我已經在學 Algebra 1,也就是代數一。我參加了九年級組,記得自己好像拿了滿分,並且得了第一名。從很小的時候起,我就一直想打敗所有人。對手比我年紀大,並不重要。
Jeremy Stern:正如我們前面已經確認過的,你小時候確實被霸凌過。
Scott Wu:我二年級時確實沒有多少朋友。但大概到了六年級,也就是初中階段,情況開始發生變化。初中有一個叫 MathCounts 的競賽。學校裡最優秀的孩子會參加城市賽,城市賽優勝者進入州賽,州賽優勝者再進入全國賽。主辦方會把所有人飛到迪士尼世界,整個行程持續三四天。
比賽一開始,是上午的大型筆試環節。所有人坐在一個巨大的房間裡考試。之後,排名前 12 的選手會進入所謂的倒計時輪,也就是一對一對決。
Jeremy Stern:就是那個你和那個可憐女孩的爆熱視頻。
Scott Wu:對。所以我去了全國賽,在那裡認識了很多其他孩子。之後,我們會通過 Google Hangouts 保持聯繫。到了高中,這種聯繫還在繼續。頂尖數學和編程學生還會參加各種夏令營。那些人後來成了我最親近的朋友中的很大一部分。我就是和其中很多人一起創辦了 Cognition。
他們大多數人,你可以想象,要麼來自庫比蒂諾,要麼來自華盛頓特區周邊、就讀於 Thomas Jefferson,要麼來自紐約的 Stuyvesant。我來自路易斯安那,但我仍然覺得自己和他們更相似。我們一直關係非常緊密。
我就是這樣認識了 Jesse Zhang、Johnny Ho、Hyperliquid 的 Jeffrey Yan,還有 Scale 的 Alexandr Wang。Jeff 是我高中和大學時期最好的朋友之一。Alexandr 則像是我初中時最好的朋友。他來自新墨西哥州,從這個意義上說,我們有點相似。

三年級的 Wu 贏下九年級數學組比賽。(2006)
Jeremy Stern:為什麼你後來從「棒球」轉向了「籃球」?
Scott Wu:我一直同時參加數學和編程競賽,但我在編程上更強。我更喜歡編程競賽,有幾個原因。
首先,编程题本身更符合我的兴趣。在数学中,我非常擅长概率、组合数学和计数问题。这些实际上与策略游戏非常相似:您需要计算不同选项,理解导致什么结果。相比之下,我也可以做几何题,但不太喜欢。而编程中的许多问题,本质上更接近组合数学。
另一个要点是,数学中有许多术语。比如这里要用帕斯卡原理,那里要用婆罗摩笈多定理,或者其他定理。有趣的是,对我来说,一个始终稳定的特点是:我从不太记住这些名称。
我一直是在更直觉的层面理解它们。例如,当满足某个条件时,结果就必然是这样。我经常不知道某个东西叫什么,也不知道它对应哪条定理。对我来说,它只是某个更广泛、更普遍真理的一个具体情形。
这件事昨天还发生过一次。我们当时在听一个关于量化感知训练的研究汇报。他们讲了很多术语,我就说:“不好意思,我不知道这些术语是什么意思。但你们说的其实就是先做这个、再做那个的部分,对吧?”我想,我一直都是以更直觉化的方式理解事情。这确实有点不寻常。
而编程还有一个很明显的特点:它非常实用。我记得自己为 MathCounts 全国赛训练时,曾给自己写过一个程序,让它不断提供不同的心算题目。我会玩自己做的游戏,并用它来训练。意识到自己真的可以动手创造东西,这让我非常满足。
Jeremy Stern:所以,你三次在 IOI 赢得金牌,后来又成为年轻选手的教练和导师,还拥有一个由数学和编程天才组成的分布式朋友圈。然后据我了解,你从高中辍学了。这合法吗?
Scott Wu:严格来说,我毕业了,只是高三结束后就离开了高中。加州的童工法规定,在年满 18 岁之前,或者拿到高中毕业证之前,不能在加州全职工作。我当时想去湾区工作,所以基本上弄清楚了自己必须做什么才能拿到毕业证。然后我就照做了。
注:「新布达佩斯」是作者在做一个历史类比。20 世纪初,布达佩斯周围曾集中出现一批极其杰出的匈牙利犹太裔数学家、物理学家;而今天,AI 领域似乎也正在出现一个类似的技术天才与创业者集群。
Jeremy Stern:有一個問題一直存在:為什麼 20 世紀許多最偉大的數學家和物理學家——那些後來一起在洛斯阿拉莫斯或冶金實驗室工作,或者提出現代數學、物理和經濟學基礎模型的人——幾乎都是 1900 年前後出生在布達佩斯及其周邊的匈牙利中產猶太人?我記得,是西拉德把他們統稱為「火星人」。
Richard Rhodes 在那本關於原子彈的書裡猜測,答案大概是一組因素的疊加:快速現代化的布達佩斯、已經同化但仍被舊有身份體系排斥在外的猶太資產階級、優秀的學校和數學競賽、重視智識卓越的文化、被迫遷徙到德國再到美國,以及戰時科學機會。這個解釋幾乎無聊到難以想象,但我猜它可能是準確的。
我剛剛才把你類比為「飛人喬丹」,所以不打算再把你和你的朋友們類比成「火星人」——至少不會當著你的面這麼說。但我確實很好奇,應該如何解釋這樣一個創始人群體:你們一起參加 MathCounts 和 IOI,用 Google Hangouts 保持聯繫,後來從哈佛退學,進入量化公司訓練體系,又抓住 LLM 帶來的機會衝擊;而且,你們大多是華裔美國人,出生在千禧年前後。
Scott Wu:我也經常想這個問題。首先,我覺得我們非常幸運。對我們所有人來說,最酷的一件事,就是能夠站在 AGI 黎明的時刻。我認為,這也許真的是人類歷史上最具變革性的事件。至少,它一定是我們這一代人所經歷的最重要事件。
我有幾個想法。
其中一個是,所有事情發展到某個階段,基本上都會變成《點球成金》。比如撲克。上世紀 70、80、90 年代,撲克圈裡有很多非常原始的人物,帶著一種好萊塢式的「問題人生」氣質。他們玩牌時依靠的是對遊戲非常深層的直覺。當然,他們也會分析,但不會像書呆子那樣系統研究概率。
可隨著時間推移,撲克最終演化出來的東西,其實就是數學。裡面有大量數學,而今天很多最頂尖的撲克玩家,本質上都是數學書呆子。國際象棋也是如此,很多類似的遊戲也是如此。
我有點覺得,創業也經歷了類似的弧線。過去有一種 Steve Jobs 式的人物畫像。但現在,尤其是在 AI 領域,在某種程度上也包括 crypto,創業者畫像已經明顯轉向了高度技術化。
人們現在談論的那些 AI 大公司,很多都是由來自相似社群的人在經營。OpenAI 就是一個例子。比如 Greg Brockman,他比我年長一些,但參加過所有和我們一樣的競賽。他曾是美國數學前 24 名,也進過美國化學隊,在化學奧林匹克競賽中拿過銀牌。OpenAI 研究團隊負責人 Mark Chen,我和他一起執教過美國 IOI 隊。Jakub Pachocki,也就是 OpenAI 的首席科學家,我以前經常和他比賽。他來自波蘭,但我們參加的是同一批國際競賽。Anthropic 的 Dario Amodei,則曾是美國物理隊成員。
長話短說,第一,這裡顯然存在一種可以遷移的深層分析能力。第二,尤其是在 AI 領域,無論好壞,非常強的技術背景已經被證明極其有價值,因為你要解決的問題本身就是高度技術性的。
但對我們這一代人來說,還有一種「感染性」的因素。關於這一點,我非常認可 Alexandr Wang 的作用。因為他確實是我們這群人裡第一個說「好,我要去創辦一家公司」的人。由於我們關係非常緊密,也彼此了解,所以那種感覺很像:我們都應該去做這件事。
我和 Alexandr 初中時還一起寫過一個創業點子文檔,我現在都還記得。那些點子肯定都很糟糕,但我們那時已經在想,某個時候,我們應該創辦一家公司。
Jeremy Stern:好,所以這解釋了時機,也解釋了智商。科技史上並不是每一個階段都如此「智商崇拜」;但 AI 確實有某種特徵,使得那些在 AI 領域做出重要進展的人,比如 Noam Shazeer,相當一部分同時也是數學奧賽冠軍。
也許智商這部分,也解釋了第一性原理推理能力。比如能夠沿著一棵決策樹看得更遠:模型到底會變得多好,或者不會變得多好;規模化和強化學習會如何發揮作用;數據和算力會發生什麼變化,等等。這一點我能理解。
但它仍然沒有解釋另一部分:你還必須是一個領導者。你必須能夠吸引其他非常聰明的人。在一整個舞台的布偶中,你必須明顯是那個主角布偶。在合影裡,你必須看起來像是被另一束光照亮。你還需要產品直覺和人際能力。
如果每年大概有 25 個這樣的金牌選手,而我們假設真正相關的時間窗口是 10 年,那麼在地球幾十億人裡,這最多也只是一個幾百人的池子。可其中絕大多數人,連一點創始人氣質都沒有,更不用說同時具備好幾種能力。
所以我仍然很好奇華裔美國人這一點。因為直到非常近的時期,這都不是事實。我正在努力避開那個顯而易見的答案——我會含蓄地把它類比為猶太人與好萊塢,或者銀行業。
Scott Wu:你這樣好像是在誘導我顯得像個自鳴得意的混蛋。
Jeremy Stern:那是我的問題,不是你的。我保證沒人會混淆這一點。
Scott Wu:我想,我對這個問題的看法是,在我們這些領域裡,真正重要的兩種品質是智力和饑餓感。
你剛才提到的其他東西,都是從這兩個基礎特質往下流出來的。而競賽社群篩選出來的,正是這兩點:第一,你非常聰明;第二,你很不服氣,想把所有人都打倒。
如果你足夠聰明,能夠不斷分析、調整,思考自己哪裡做錯了,並在下一次做得更好;同時,你又有足夠強的動力,可以日復一日、不停地這樣做,持續好幾年。我覺得通常來說,你就可以在其他這些下游能力上變得相當出色。
至於華裔美國人這一點,有一部分就是我前面提到的那種感染性。我們真的非常、非常幸運,能夠擁有彼此。很多人其實沒有意識到,創業也是一個他們可以選擇的選項。我只是覺得,我們很幸運,能夠一起經歷這個過程,並看著彼此開花結果。
Jeremy Stern:我把話題帶偏了。我們稍微加快一點。你 17 歲去了加州,那是哪一年?
Scott Wu:2014 年。
Jeremy Stern:好,所以按照加州法律,你當時仍然算是「童工」,只是你設法拿到了高中畢業證,符合豁免條件,因此 Addepar 才能雇你。你在那裡工作了一段時間,之後又和其他「火星人」一起去了 HRT(Hudson River Trading),然後進入哈佛,又退學,創辦 LunchClub,最後創辦 Cognition。那將近十年裡,最讓你印象深刻的是什麼?
Scott Wu:對。我是通過 Johnny Ho 認識 Vlad Novakovski 的。Vlad 當時是 Addepar 的工程副總裁。我在 Addepar 做軟體工程師,主要負責性能工程和優化。
Addepar 有大量金融分析功能,需要為客戶和財富管理公司計算各種數據。我做的很多工作,就是讓這些計算跑得更快。在我在那裡一年多的時間裡,有些具體指標的運行速度提升了大約 100 倍。
我也花了很多時間參與招聘。那一年,我可能是公司裡排名第二或第三的面試官,經常去 MIT 參加校園活動。所有應徵者都比我年紀大,但我就是站在那裡跟他們解釋:各位,你們真的應該來 Addepar 工作,原因是這些。
Jeremy Stern:那時候你的商業敏感度怎麼樣?
Scott Wu:為零。
我人生中太多時間都花在數學和編程上了。我能做東西,但說到理解這個世界如何運轉,我幾乎沒有任何經驗。一切都是從零開始學。
後來我離開 Addepar,去了哈佛,大概待了兩年。我學的是經濟學專業,這件事現在想起來挺好笑的。我其實多少知道自己不會畢業。我上過寫作課、公共演講課、哲學課,還有一門計算機課。但我並不真的在意學校本身那套東西。
哈佛期末考試前總會有一個 reading week,就是一周時間,大家用來趕論文、複習備考。而我完全不在乎。那一整周,我就是和不同的人見面、聊天、一起玩。很多人整周都在學習,幾乎不見別人。對他們中的不少人來說,我就是他們那一周唯一一次從學習中抽身出來的休息。
後來我退學,搬到舊金山,和 Vlad 一起創辦 LunchClub。那是 2017 年夏天。我們完成了 pre-seed 輪融資,當時在 SPC(South Park Commons)孵化器的第一屆項目裡辦公。
最初的想法叫 Elliot Technologies,是一個用來安排日程、判斷你應該和誰叙舊或建立聯繫的應用。後來,我們做了很多漸進式轉向。它不再只是個人叙舊,而是更偏職業社交;也不再只是安排日程,而是幫助你判斷應該認識哪些新的人。事情就是這樣逐漸變成了 LunchClub。
那是一段非常有趣的經歷。我們一起經營這家公司大約五年,促成了數百萬場會面,團隊最多招到大約 30 個人。確實有一小群人非常喜歡 LunchClub,他們享受不斷見人、不斷建立新連線的過程。
後來發生了很多事。首先當然是 COVID——對於一個促成線下見面的產品來說,這本身就很特殊。再後來,到某個階段,增長和商業化也變得越來越困難。與此同時,我媽媽從 2020 年開始病得很重。我在 2022 年 6 月離開了 LunchClub。
Jeremy Stern:她是什麼時候去世的?
Scott Wu:2023 年 10 月。
Jeremy Stern:當我向別人打聽你時,除了競賽、紙牌戲法和 Cognition,這通常是他們第一個提到的事情。
Scott Wu:她被診斷出四期肺癌。她有一種靶向藥,吃了幾年。後來又出現了其他併發症和問題。
Jeremy Stern:但人們提到的,不只是她去世了,而是你搬回家照顧她。你親自護理她。
Scott Wu:那可能是……那是我人生中非常重大的事件之一。(停頓)抱歉。
(停頓)後來我搬回了路易斯安那。在 COVID 大部分時間裡,我都在那裡陪她。我在家待了一年多。從這個意義上說,COVID 對我和我哥哥來說,反而是一種很大的恩賜。因為它給了我們一個機會,可以在那段時間真正陪伴父母。
2021 年,外部世界開始重新開放後,我開始更多待在其他地方。我在邁阿密住過一段時間,後來又去了紐約。到了 2023 年前後,當我媽媽的病情明顯惡化時,我又回到了家裡。
整體來看,那是一段非常特殊的時期。對我來說,其中很大一部分,是在弄清楚自己究竟想從人生中得到什麼。我已經做過第一家公司,結果還可以,但並不是一次巨大的成功。我休息了一段時間,探索各種其他想法。與此同時,我也在照顧我的母親。
整個過程在情感上非常強烈。但那也是一段適合思考的時間:我重視什麼,我在乎什麼,我希望自己的人生工作是什麼。
Jeremy Stern:你當時探索過哪些想法?
Scott Wu:我和 Steven Hao、Andrew He 折騰過很多東西,也借此了解這個世界。Crypto 里有一些有趣的方向,我們通過它學習市場。安全領域也有一些值得探索的問題,比如零知識證明。
然後,ChatGPT 在 2022 年 11 月發布了。到那一年下半年,我們自然把很多時間花在更深入地研究 AI 上,認真思考這項技術接下來會發生什麼。
但我幾乎把那段時間看作一次休假,因為我也花了很多時間陪母親。我媽媽在 2023 年 10 月 6 日去世。一個月後,我們創辦了 Cognition。

Cognition 位於加州伯林蓋姆的場地。(2025 年 11 月 25 日)
Jeremy Stern:一方面,考慮到你整個人生軌跡,訓練我們的 AI 霸主學會編程,好像就是你來到這個世界上注定要做的事。另一方面,這一切似乎又充滿偶然性。我想從某種程度上說,我們每個人都是如此。但你是怎麼理解這兩者之間的關係的?
Scott Wu:我當然可以講一個事後回看的版本,把整個故事說成一切都是有意為之。但我不覺得那完全是真相。
真實發生的是,我們當時正在探索生成式 AI。ChatGPT 發布後不久,所有人都在討論各種應用。那時,大多數人關心的還是文本補全。很自然的思維模型是:這個東西是在整個互聯網上訓練出來的,所以它應該能夠補全某個互聯網上的人會說的話。ChatGPT 也就是一個問答系統,就像現在這樣。
Jeremy Stern:你好大的膽子。
Scott Wu:但很自然地,從一開始,我們極其感興趣的方向之一就是編程,因為我們都是程式設計師。而教 AI 寫程式,可能是你能嘗試做的最酷的事情。
到了 2023 年底,有一个时间点,人们开始真正看到強化學習正在發揮作用。我把那看作生成式 AI 第二個時代的開始。ChatGPT 是第一個時代,但它相對更基礎。
Jeremy Stern:除了你認識很多實驗室裡的人之外,你怎麼知道強化學習正在起作用?
Scott Wu:確實有這個原因,但我也一直在跟進相關研究,而且你可以從論文裡看出來。
這是 AI 領域一個很有趣的現象。過去,大家會發表幾乎所有研究成果。但到了 2022 年 11 月,當人們意識到這項技術可能具有很高的商業價值後,這種情況幾乎立刻停止了。不過,你仍然可以看到一些圍繞數學題、程式碼等任務訓練模型的工作。
當時有一些很有趣的論文。簡單來說,下一步在邏輯上其實相當明顯,只是那一步並沒有被公開發表。於是,我們開始和一些人交流,進一步理解這件事。後來,我們逐漸形成了一個判斷:AI 會在這類邏輯推理任務上變得極其強大。那麼,接下來會發生什麼?
這就是 Cognition 的種子。
但真正的啟動點,是 2023 年 11 月 17 日,也就是 Sam Altman 被 OpenAI 董事會解雇的那一天。
Jeremy Stern:為什麼那件事會帶來不同?
Scott Wu:那天,我正在紐約和幾個人吃午餐。我當時在講這樣一個想法:推理能力正在明顯增強,強化學習開始奏效,現在可能是創辦一家新實驗室的合適時機。
那時,這個想法還非常偏研究。我們還沒有明確判斷產品會是什麼,商業模式會是什麼。然後那天下午,Sam 被解雇了。我們很自然地想:好吧,如果真有什麼時間點適合做這件事,那大概就是現在。
其實,我們本來已經計劃要做,而且大概率也會做。但這件事成了一個很好的推動力,一個外部觸發,讓我們必須加快速度,也真正認真對待它。有時候,創業就是需要這樣的時刻:一個讓你真正投入進去的瞬間,讓你說,好,我們以前都創過公司,也都當過創始人,但這一次不一樣。這一次是大的。這一次是要用一生去做的。
所以,我們飛去了灣區,組織了一個駭客屋。我們給一批認識的、正在做 AI 的人發郵件、發消息。我們說,嘿,我們正在把這件事搭起來,過來和我們一起 hack 吧,一起探索,看看最後能做出什麼。
那個房子在加州伯林蓋姆。
Jeremy Stern:伯林蓋姆這個小鎮,是以 Abraham Lincoln 派往中國的大使命名的。他曾談判達成一項條約,取消了對中國移民赴美的限制。
Scott Wu:對,這很有趣。我們現在這裡還有一間會議室,就是用當時那棟房子的地址命名的。
我們在那裡待了大約兩周。那段時間正好是感恩節假期。我本來要和爸爸一起過感恩節,那時離我媽媽去世才過去幾周。但我當時覺得,我現在必須做這件事。我們要把它做出來。所以我取消了原來的計劃。
結果,那個感恩節能和朋友們一起寫程式、一起折騰,反而成了一件挺好的事。
後來,我們在 12 月又辦了一次駭客屋。之後就這樣一直推進,直到它真正變成一家公司。事實上,不只是到公司成立為止,而是遠遠超過了那個時間點。我們一直維持著那棟房子的運轉,直到今年 1 月。

攝影:Andria Lo
Jeremy Stern:你們是在什麼時候決定 Devin 最終會採取什麼形態的?
Scott Wu:我們一直都是以「同事」這個形態來思考它的。
當然,AI 同事和人類同事之間會有很多不同。但即便在兩年前——那時可以說我們對這個概念還太早——這也一直是我們的判斷。它應該是一個完整的智能體,有自己的機器,可以自己完成工作,可以在相同的系統裡運行,會和你一起出現在 Slack 裡,也會和你一起出現在 Jira 或其他工具裡,然後像同事一樣和你協作。
甚至連名字也是如此。我們決定叫它 Devin,而不是給它取一個工具式的名字,是有原因的。我們一直把它看作一個可以自己去做事的獨立存在。
隨著時間推移,這一點對我們來說越來越真實。兩年前,它更多還是一種願景。日常使用中,你顯然還需要對Devin做很多手把手的引導。但老實說,我們現在已經到了一個階段:你真的可以把它當作同事來協作。
一個具體例子是,到目前為止,無論是在我們內部,還是客戶運行的Devin會話中,已經有相當一部分不再由人類主動啟動,而是自動運行。
有些Devin會話由特定觸發條件啟動;有些則是Devin以循環方式運行,持續尋找某些行為,或者發現產品裡看起來不對勁的地方,然後自己去修復。也就是說,Devin不僅能完成你交給它的任務,它實際上還會主動尋找自己應該做的任務。
Jeremy Stern:你怎麼判斷一個智能體或模型,是真的在現實中變得更好、更有用,而不是只是針對評測和基準測試被優化了?畢竟,當模型足夠聰明後,基準測試會被刷滿,模型也會學會「鑽」測試的空子。我們都見過那種判斷力極差、能力也不怎麼樣,但SAT考得很高的人。作為一個競賽型考試選手,你大概想過這個問題。
Scott Wu:一旦語言模型開始在AMC(美國數學競賽)上擊敗我們,後面的事情其實就比較明顯了。AMC是一個非常難的高中數學競賽。
正如你說的,沙盒環境中的表現,和真正進入現實世界工作之間,顯然存在巨大差別。不過,我不會把它看作一種直接應用,而更像是一個關於「什麼是可能的」的證明。
為了完成其中一些非常困難的問題,你需要發展出大量基礎邏輯推理能力、創造力,以及把非常長的推理鏈條串聯起來,並確保每一步都能對齊的能力。知道模型在足夠的強化學習和正確訓練數據下能夠做到這些,就已經相當清楚地說明,很多現實中的實用任務也是可以完成的。
這件事最早大概發生在2024年初,當時模型開始在這類數學題上表現得很好。過去兩年裡,你基本上看到的是同一套技術被廣泛應用。
我想特別指出一點:我並不認為過去兩年裡,在注意力規模,甚至強化學習本身上,有什麼巨大的突破。事實上,過去兩年真正發生的變化,主要是另外幾類。
一个當然是規模:更多算力,更多數據。但除此之外,很多工作其實是在搞清楚如何處理世界各地的人每天都在面對的實際問題;如何按照這些評價標準來訓練模型;如何讓模型理解,在某個具體任務中什麼是好的、什麼是不好的;然後再把它部署到現實世界中,並構建真正能把用戶帶到那裡的產品體驗。
過去兩年真正推動 AI 使用爆發、讓人們從 AI 中獲得價值的,實際上是這些混亂、具體、實踐性的工作。它的重要性超過了純研究技術層面的任何單點突破。
Jeremy Stern:模型智能什麼時候才會不再參差不齊?它們什麼時候才會停止犯那些特別愚蠢的錯誤?
Scott Wu:也許可以這麼說:我認為它們永遠都會是參差不齊的,但會到達某個層級,使這種參差不齊開始與人類能力發生交叉。
這很合理。因為如果你問,一個人類是被訓練來做什麼的,那和模型非常不同。因此,自然也應該預期二者會呈現不同的能力分布。最明顯的例子,可能就是在物理世界中工作,和從事知識工作、進行抽象思考之間的差異。
模型是在互聯網上所有 token 上訓練出來的,所以它們當然會先在知識工作上表現更好。而人類最先必須學會的,是走路和說話。我們更多的神經元也投入到了這類問題上。所以我認為,這種參差不齊會一直存在。
這裡有一個有趣的問題:模型相對於人類來說也許仍然是參差不齊的,但在那些人類已經接近完美的能力上,模型是否也能做到同樣好,甚至略微更好?在這些方面,我們已經接近理論上限。而在另一些事情上,人類本來就不是為其而生的,但經過優化和訓練的計算機會表現得非常好。
有趣的是,在編程和數學上,從某種意義上說,人類居然能做數學題,本身就是一件很奇妙的事。我不知道穴居人的生存經驗中,到底是哪一部分教會了我們做數學很重要。但這種能力確實存在。
從這個意義上看,專注於編程的模型能夠訓練到比人類做得更好,也許並不奇怪。畢竟,編程本質上就是和計算機對話,告訴它該做什麼。從這個角度看,編程恰好成為第一個偉大的 AI 使用場景,並沒有那麼瘋狂。但我的重點是:這件事幾乎更多說明了人類智能,而不是計算機智能。
Jeremy Stern:我聽到很多業內人士說,一切都會走向融合:模型公司進入應用層,應用層公司開始構建前沿模型。那是什麼阻止你們變成一家模型公司?
Scott Wu:我認為,對一家公司來說,專注非常重要。
你可以有不同功能、不同垂直方向。但我認為,你只能有一個目標。你不能一邊嘗試做這個、做那個,同時又嘗試解決某個基礎研究問題。
如果你問 Cognition 的唯一目標是什麼,我會說,是讓世界各地每個人都能更輕鬆地構建軟體。這是我們追求的目標,而我認為這和基礎模型實驗室的目標不同。
為了實現這個目標,模型訓練上確實有工作要做,產品上也有工作要做。但這才是我們的根本目標。
我認為,一家公司的 DNA 在某種程度上相當剛性,比人們通常想象得更剛性。使命可以隨時間變化,但變化幅度不會像你想象得那麼大。到了某個階段,公司裡的每個人都會圍繞同一件事思考:你服務的客戶、你構建的產品、你運行的商業模式。所有這些,都紮根在某個特定的核心目標上。
所以,是的,我認為正如你所說,雙方都會繼續移動、繼續向外延展。但像我們這樣的公司,核心 DNA 是把 AI 編程的好處帶給世界各地的人。這和一家真正更專注於推動研究前沿本身的公司,會非常不同。
Jeremy Stern:你們會走 Cursor 那條路線嗎?
Scott Wu:我們真的很喜歡做「瑞士」。這裡有幾個原因。首先,我們認為自己正在構建一種必要的基礎設施,讓公司可以信任我們,把我們當作合作夥伴,一起弄清楚如何跑得更快、交付更多東西。所以老實說,保持中立有很大價值。
你在 Databricks 和各大雲廠商的關係中,某種程度上已經看到過這一點。但在這裡,我認為情況甚至更極端。因為把我們的信任綁定給某一個特定模型,會是一件很可怕的事。沒人知道 12 個月後誰會擁有最好的模型。
因此,通過與所有不同模型合作,在不同模型最適合特定用例時使用它們,我們可以快速適應變化,也可以幫助合作夥伴理解他們應該如何在工作中使用不同模型。這一點非常重要。
除此之外,我還想指出,現在科技行業裡確實存在一種討論,大意是:為什麼還要創辦新的東西?現在真的還是從零開始構建某些東西的時候嗎?
這背後彷彿有一個假設:世界上只能有那麼多家公司,因為現有公司最終會把一切都吃掉。硅谷現在對「是否還能從零開始構建有意義的新事物」這件事,存在一種已經走得太遠的犬儒主義。我認為這是完全錯誤的。
所以,我們也只是很享受這種挑戰和野心:一群人坐在同一個房間裡,靠自己做出一個偉大的東西。
這樣更有趣。


攝影:Andria Lo
Jeremy Stern:在 AGI 的世界裡,人類天才會是什麼樣子?
Scott Wu:我認為,對所有從事 AI 的人來說,一個最重要的參照,就是人腦本身的存在。
我們並不了解人腦的一切,但我認為,我們已經足夠了解它,可以說它歸根結底也是一種電路——基本上是一台由血肉構成的計算機。當然,這裡面有大量細節,也有很多關於它如何形成的有趣問題。但在 AI 領域,我們之所以把這些電路稱為「神經網路」,正是因為它們以大腦中的神經元為原型。
從人腦的連接方式中可以看到,它能夠學習,並解決一些極其困難的問題。由此自然會產生下一個判斷:只要有足夠的時間、足夠的規模和足夠的能量,我們應該能夠製造出以類似方式運行的「電子大腦」。區別在於,我們可以製造出更多這樣的腦,也可以為它們增加更多電路。
人們常常會問:有沒有什麼事情,是人類永遠能做、而 AI 永遠做不到的?這其實有點有趣,因為過去幾年裡,人們給出的很多答案,後來都被證明站不住腳。
我記得以前有人說,計算機也許能下國際象棋,但不可能下圍棋。因為圍棋需要某種深層直覺,以及對世界的深層理解,而這不是計算機能夠掌握的東西。顯然,事實並非如此。
解決數學題、生成程式碼、吸收新資訊並證明新定理,也都是一樣。AI 已經跨過了這些門檻。回到你關於人類心靈角色的問題,我不認為從足夠長的時間尺度來看,會存在某一種能力,是 AI 永遠無法做到、而人類可以做到的。
不過,我認為人類經驗本身仍然具有很多內在價值。我的聯合創始人 Walden 說過:「我們過去一直生活在《我的世界》的生存模式裡,而現在,我們將進入創造模式。」我認為這是對的。
我們都有慾望,有想要建造的東西,有表達自己的方式,也有尋找快樂和意義的方式。我們仍然會想去做這些事情。而現在,我們會擁有 AI,和我們一起解決那些極其困難、也極其重要的問題。
Jeremy Stern:但人類事實上並不是由血肉構成的電腦。我們擁有尊嚴這類東西。而在我們共同所屬的傳統中,尊嚴平等地賦予每一個人,不取決於他們的能力,因此也無法被競爭淘汰。
我們出生在特定時間、特定地點,來自特定的父母,並被賦予名字。我們來自某個地方。我們在很大程度上由記憶塑造,而這些記憶並非我們自己選擇。它們塑造了我們理解意識時最核心的一些東西,比如「家」的概念。
如果這一切都只是可以複製的電路,那麼所謂「內在價值」,難道不只是一種鎮定劑?或者說,是一種逃避?
Scott Wu:我們剛才談到的那個版本,更接近 AI 的長期終局。但在短期和中期,AGI 並不是一個真正二元的概念——它更像是一個逐步上升的過程。
接下來一段時間裡,會不斷出現漸進式進展:好,它已經能做這些事,但還不太能做那件事。然後,我們會把那件事也解決掉。
正因為如此,我認為很多高語境、通用型任務——你必須理解世界各地正在發生的大量事情,吸收海量不同資訊,並得出正確的直覺性結論——在中期內,人類仍然擁有優勢。
隨著時間推移,如果 AI 擁有和人類一樣的語境,並且在相同目標下工作,那麼它最終也應該能做到。
現在,我認為我,或者任何一個人類,最大的優勢之一,就是我們都能接觸到極其豐富的軟性語境。
如果我想想我們每天在 Cognition 做的工作,或者任何一家公司裡的工作,那裡有太多事情並不是從零開始解決一個基礎邏輯問題。在純邏輯層面,AI 在大多數事情上基本已經和任何人類一樣強。
但另一方面,如果我想想我們每天做出的所有小決策,或者我們選擇以某種方式做事的原則,或者某段具體歷史——比如,「這就是為什麼我們最初這樣設計系統架構,但自從某項新技術出現後,我們決定逐漸轉向另一個框架」;又或者,「這是 Cognition 特有的做事方式,和大多數其他公司不同」——所有這些事情裡,人類處理語境、檢索信息、調用經驗的能力,都非常強大。
我有點喜歡說,檢索是人類真正擅長的事情之一。這其實也正好對應你剛才關於記憶的說法。
如果把模型和人腦相比,模型有一個上下文視窗,有它能看到和讀取的 token,有它可以調用的工具,而其中一個工具也許就是檢索。我們的上下文視窗要差得多。關於這一點,我常開的玩笑是雙重認證時用的六位數驗證碼。如果驗證碼變成十位數,我不知道我們還能不能應付。這就是我們的上下文視窗有多短。
但另一方面,作為人類,你擁有一種非常美妙的能力:你打開一份代碼文件,突然被某段記憶擊中——哦,對,四個月前我處理這個問題時,我們遇到過這個 bug,當時是這樣發生的。而這恰好就是你完成當前任務所需要知道的信息。
Jeremy Stern:程序員書呆子的瑪德琳蛋糕蘸進了茶裡。
Scott Wu:或者你正在和某個人說話,突然想起來:哦,對,你七個月前是不是說過這件事?
這和原始上下文不一樣。它更像是在積累和理解我們經歷過的所有軟性語境。我認為,這是目前人類相對於 AI 的主要優勢。
現在,AI 領域有幾類問題正在圍繞這一點展開研究。其中一類是嵌入搜索。某種意義上,它是最直接的對應物:在一個包含過去所有對話、各種代碼文件,或者任何你可能要搜索的數據的大型數據庫裡,如何準確檢索出和當前問題最相關的部分?
還有另一類正在積極推進的問題,業內大多數人稱之為持續學習。它的意思是——我覺得這更接近人類心智的運作方式——AI 如何根據自己學到的東西更新自身權重?
error到某個時間點,你真正受到的限制,只會是你能想像什麼,以及你想如何度過自己的人生。這會是一種非常不同的生活。
回到你的問題,我認為其中很大一部分會是純粹的自我表達。人們將能夠過上他們想過的生活。把夢想轉化為現實的瓶頸,會大幅收窄。
而我們現在的生活方式,屆時看起來會非常瘋狂。
Jeremy Stern:你最害怕什麼?
Scott Wu:我第一次聽到這個問題時,腦子裡立刻想到的,還是過去那些技術革命。
在矽谷,人們通常會想到手機、互聯網、雲計算、個人電腦。但你也可以繼續往前追溯,到電力,甚至工業革命。雖然我認為 AI 的規模更大,形態上也可能不同於這些技術,但從更高層面看,它們其實非常相似。
從長期看,AI 是一種極其強大的能力。它會改變我們所有人的生活,讓我們能夠做更多事情。我想我們都會同意,能夠像今天這樣生活,而不是把人類 90% 的勞動都投入農業,是一項極其偉大的創新。
但另一方面,在短期和中期,我認為確實會出現真實的摩擦。甚至可以說,我最擔心的並不是 AI 本身,而是這一切發展得太快所帶來的摩擦。
這在很大程度上指向一個問題:我們必須非常重視對全世界普通人的教育。人們應該如何使用這項技術?它如何讓人們的生活變得更好?以及,如何讓更多人盡可能同步地接入它?
我認為,最糟糕的結果是,在相當長一段時間裡,只有舊金山的精英,或者類似的小圈層,能夠真正使用這些能力,而其他人被排除在外。
或者舉一個我們過去幾周都在經歷的具體例子:如果模型已經具備很強的網絡攻擊能力,但世界上很多人並沒有用同樣的能力來做防禦,而那些聰明的黑客卻已經在用它們進攻,那麼世界就會進入一種非常棘手的失衡狀態。
所以,真正重要的是,全世界都要理解這項技術,能夠使用它,也能夠與它協作。很大一部分問題,其實在於,我們能以多快的速度讓人類為它做好準備。
工業革命發生在幾代人的時間裡。那是一個非常漸進的轉變,人們會隨著時間慢慢學習,這些變化也會一點點進入他們的生活世界。但我們現在看到的變化,速度要快得多。
我相信人們能夠適應,我們也會找到各種方式,讓新技術改善我們的生活——無論是藥物發現,還是做出既口感完美、營養也完美的比薩,還是改進我們每天使用的所有技術。
但這也確實意味著,人們必須緊跟正在發生的事情。在過去很多次技術革命中,如果你晚兩年或五年再採用,基本上也還來得及。但這一次,適應必須發生得更快。
Jeremy Stern:當你不是那個真正參與 AI 研發的人時,確實很難認真想象這些事情。這也是為什麼我們這些外部人士,往往會覺得很多 AI 領域的重要人物滿口胡話,至少當他們談論未來時是這樣。
Scott Wu:我經常想到的一件事,是 METR 的研究。
那項研究顯示,現在智能體在需要被打斷之前,已經可以完成相當於人類數小時的工作,而且這個時長仍在每隔幾個月翻倍。這就是過去幾年裡,智能體如何從只能工作幾秒,發展到可以持續工作數小時。
顯而易見的問題是:如果這種翻倍繼續下去,會發生什麼?我們談論的就不再是幾個小時,而是幾天、幾周,最後可能是一整年。
有趣的是,我們已經沿著這條曲線,親眼看到它從幾秒走到幾分鐘,再走到幾小時。但即便如此,它仍然讓人感到陌生。說到人類心智不擅長的事情,我們確實非常不擅長理解指數曲線。
一個可以完成一年工作的智能體意味著什麼?你給它一個任務,它說:「我來處理。」然後一年後回來,事情已經完成了。這聽起來很瘋狂,但我認為,我們確實會走到那裡。
我覺得很多 AI 圈外的人,總會有一種感覺:好吧,曲線突然衝上去了,但這裡應該就是它停止並進入平臺期的地方。然後它又繼續上升,他們又會說,好吧,但這次一定是天花板了。
對那些身處 AI 領域、親眼看到這一切的人來說,感受之所以不同,部分原因在於你看到了曲線上的每一個小數據點。你知道它是怎麼走到這裡的。過去三年裡,並不是發生了 14 次突破,也許只有一次。但我們能看到,如果繼續沿著這條路走下去,繼續把能力往前推,我們可以做到什麼。
即便對所有深處 AI 領域的人來說,這仍然是很難真正消化的事情。
Jeremy Stern:你能替我自動化掉多少日常生活裡的苦差事,好讓我回到我最喜歡的消遣?
Scott Wu:(笑)簡單說就是:一個人一天裡會有多少想法?而這些想法裡,又有多少真的能被執行?
只要這個比例還沒有達到 100%,你就知道,在執行層面的瑣碎勞動上,仍然存在一個相當明顯的瓶頸。我不認為這個比例現在接近 100%——它可能只有 5%。你會有各種各樣想做、想造、想嘗試的事情,但在現實中,真正去做它們要困難得多。
我認為,這是 AI 將解鎖的重大能力之一。你在軟體領域尤其能看到這一點。
我從沒見過哪個工程團隊會這樣看待自己的工作:好,我們這個月發布這個項目,下個月就都做完了,不再需要軟體了,我們已經造出了所有想造的東西。
現實總是相反的:你有 85 個項目,但只能選 6 個,因為你的帶寬就這麼多。未來我們會看到,更多人能夠去做所有他們想做的事情。
當人們說自己熱愛構建軟體時,他們真正熱愛的是什麼?現實中,這份工作有 10% 的部分是真正的自我表達:你可以思考每個問題裡要做什麼取捨,使用什麼架構,構建什麼樣的具體產品。
而另外 90%,則是寫程式碼、除錯、執行,以及大量重複性勞動。當人們說他們真的熱愛構建軟體時,通常吸引他們的是前者。
每個領域都是如此。我們會走到一個階段:你可以把自己真正熱愛的那 10%,多做 10 倍。
Jeremy Stern:最後一個問題。我一直對那些以某種方式被神明祝福,或者被神明加負的人感興趣。
他們擁有某種天賦。他們可能也很努力,出生在不錯的家庭,接受過良好教育,遇到過優秀的朋友和導師,也足夠幸運,出生在恰當的時代,或者做了 Malcolm Gladwell 命令他們做的一切,才取得今天的成就。
但歸根結底,那裡有一份天賦。而這就是他們人生中的刀鋒。
它可以被用於善,也可以被濫用。它可以被浪費,也可以被剝削。它可以做到你所說 AI 會做到的事情——讓所有夢想成真。它也可能被一路耗盡,甚至反過來摧毀你。
所以我想知道:作為一個被賦予天賦的人——某種由 16 缸數學大腦,再撒上一點不服氣組成的東西——你認為自己正在選擇用這份天賦做什麼?以及,你覺得自己選擇得明智嗎?
Scott Wu:簡單來說就是……
AI 有可能是人類歷史上最重要的事件,而編程,是它學習如何在現實世界中行動和建造事物的方式。如果我註定要做某件事,如果我來到這裡是有原因的,我想,那就是成為那個教 AI 如何編程的人。
我可能會失敗。如果事實證明,我並不是那個註定承擔這個角色的人,那我當然會很難過。因為我極度不服輸,也非常好勝。
但真正會讓我無法面對自己的,是另一種結果:我明明擁有一件與我一直以來天然熱愛、在乎,並且幸運地有些天賦的事情完美匹配的東西,卻沒有為它傾盡全力。
如果最後的問題是,我沒有足夠努力,或者沒有足夠動力去做這件事,那樣的話,我覺得我就再也無法和自己相處了。
Jeremy Stern:謝謝你,Scott。
Scott Wu:嗯。來,我們應該嘗嘗這些草莓。
[原文連結]
歡迎加入律動 BlockBeats 官方社群:
Telegram 訂閱群:https://t.me/theblockbeats
Telegram 交流群:https://t.me/BlockBeats_App
Twitter 官方帳號:https://twitter.com/BlockBeatsAsia