視頻標題:如何利用人工智慧打造自我改進的公司
視頻作者:YC Root Access
編譯:Peggy
編者按:在這場 YC 最新 batch talk 中,YC 普通合夥人 Tom Blomfield 討論的不是「如何用 AI 提高員工效率」,而是一個更底層的問題:當 AI 不再只是 Copilot,而是能夠感知、決策、調用工具、接受回饋並自我修正時,公司本身應該被重新設計成什麼樣?
Tom 的核心判斷是,傳統公司仍然像「羅馬軍團」一樣運轉:信息依靠層級向上傳遞,命令依靠管理鏈條向下分發。但 AI 正在打破這一組織假設。真正重要的,不是讓工程師多寫 20% 的程式碼,而是把散落在郵件、Slack、會議、文件和人腦中的業務知識提取出來,變成 AI 可讀取、可調用、可迭代的組織上下文。
在他看來,未來的 AI 原生公司會由一系列遞迴、自我改進的 AI loop 構成:系統從客戶郵件、客服工單、產品數據中感知外部變化,再通過規則層、工具層和質量關卡執行決策,最後根據結果自動學習和修正。YC 內部已經在嘗試類似機制:agent 不只是回答問題,還會監控哪些查詢失敗,判斷是否需要新工具、新數據庫或新索引,並自動提交程式碼、審查、合併和部署。也就是說,公司可以在創始人睡覺時繼續優化。
這也意味著,AI 對公司的影響不會停留在工具層,而會進一步改變組織結構。Tom 提出「burn tokens, not headcount」——未來創業公司的瓶頸可能不再是員工數量,而是 token 使用、業務上下文質量和組織知識的可讀性。中層管理承擔的協調功能會被 AI 大幅替代,而 IC、直接負責人和能夠與現實世界處理高風險判斷的人類角色,將變得更加重要。
最值得關注的,不是 AI 讓公司變得更高效,而是它正在改變「公司」這個組織形態本身。當軟體可以臨時生成、流程可以自動改進、經驗可以被持續沈澱為公司大腦,創始人真正要構建的,可能不再是一支層級清晰的團隊,而是一套能夠持續學習和自我優化的智能系統。
以下為原文:
這部分內容有一點基於 Diana 之前的一次演講。週末那段影片已經上線了,非常精彩。另外,Jack Dorsey 大概兩三周前發過一些推文,我覺得也很有意思,所以我「偷」了不少他的想法,塞進了這次分享裡。
這場分享會比較概念化、比較高層次,主要是討論我們應該如何重新思考公司建設。
羅馬軍團的設計,本質上是為了從羅馬這個中心向外投射權力,覆蓋兩個大陸,甚至一直延伸到蘇格蘭附近的哈德良長城一帶。它依靠的是一種嵌套式層級結構,每一層都有穩定的管理幅度。每一個層級都有明確的負責人,他們負責把命令向下傳遞,再把信息向上傳回。
如果你觀察今天大多數公司,會發現它們其實仍然像一支羅馬軍團:人是信息上下流動的通道。Jack Dorsey 那組推文裡讓我印象很深的一點是,我們一直默認,層級化組織就是組織經濟價值單元的最佳方式。但我認為,AI 基本上正在打破這個假設。
一年前,如果你問大家 AI 有什麼用,他們通常會談「生產力」:比如 Copilot 讓工程師效率提升 20%,把 Copilot 接入工作流,幫助團隊交付更多軟體。但我覺得,這其實是一種有問題的理解方式。這就像是在舊的工作方式上,裝了一個更強大的引擎。真正值得思考的,不是如何給舊組織加一個 AI 工具,而是重新想象公司本身是什麼、它該如何運轉。
比如 Garry 剛才講到的內容,我真的相信,他一個人現在能產出的程式碼,可能比一整個工程團隊還多。真正讓我一直在想的,是如何把公司內部的領域知識提取出來,並把它定義成上下文、技能集,或者任何你願意稱呼它的東西。
所謂領域知識、業務知識、know-how,原本散落在人腦裡、Slack 訊息裡、郵件裡、Notion 文件裡。這些資訊共同定義了你的公司如何運作。一旦你能讓這些知識變得清晰、可讀取,你就可以從層級化組織,轉向一種由 AI 原生軟體驅動的智能組織。
人工智慧不是一個外掛在公司旁邊的東西。它不只是給工程師用來提高效率的工具。我認為,我們可以把公司重新想像成一組遞歸、自我改進的人工智慧迴圈。這個點非常重要,因為一旦公司走到這一步,它甚至會在你睡覺的時候持續自我優化。
舉個例子。
Diana 在她的演講裡也提到過這個人工智慧迴圈。它首先有一個「感應器層」。這個詞聽起來很高級,但其實可以很簡單:客戶發來的郵件、客服工單、程式碼變更、用戶取消訂閱、產品遙測數據,這些都是感應器數據,用來從外部世界獲取信息。
然後是策略層或決策層,也就是規則:人工智慧可以做什麼,哪些事情必須請求人類許可,哪些操作必須記錄。再往下是工具層,這有點像 Garry 提到的 skills 和 code,本質上是確定性的 API,例如查詢資料庫、查看行事曆等,也就是人工智慧可以調用的一組工具。
接著是品質關卡,比如 Eva 提到的確定性檢查、安全過濾,以及高風險事項的人類審查。最後是學習機制:系統與真實世界互動,發現自己哪裡不起作用,然後把反饋重新送回迴圈的起點。
如果每一個步驟都能在沒有人類干預,或只有極少人類干預的情況下運行,那麼系統就會在你睡覺的時候變得越來越好。
我可以給你們一些我們現在實際運行中的例子。最開始,我們做了一個 agent,你可以向它提問,它有一些確定性工具,可以查詢我們的資料庫。比如一個很簡單的問題:我上一次和這家公司做 office hours 是什麼時候?
後來它變聰明了一點。比如我正在和某家公司做 office hours,他們需要認識石化行業相關的人。這個系統就可以用不同方式查詢資料庫,結合 RAG 等方法,找出五位相關創始人,推薦給你認識。
但這仍然只是一個 sidekick,一個助手型 agent。它還是去年那種人工智慧使用方式:人工智慧讓我作為 group partner 更有效率,讓我的工作效率提升 20% 或 30%。
真正讓我有「aha moment」的,是我們在這套系統之上加了一個監控 agent。它會查看每一位 YC 員工發起的每一個查詢,判斷哪些查詢成功了,哪些失敗了。然後它會問:為什麼失敗?怎樣才能讓這個查詢成功?我們需要新的確定性工具嗎?需要更新 skills 文件嗎?需要一個新的資料庫嗎?需要新的索引嗎?
這些事情現在真的會在夜裡自動發生。它會寫程式碼,提交 merge request 到 YC 的程式庫,讓另一個 agent 審查,然後合併、部署。於是第二天,當一個人類再來問同樣的問題時,這個查詢就能成功了。
對我來說,這才是關鍵時刻。它不只是讓一個人類變得更有價值 20% 或 30%。而是 AI 自己走完了這個循環,找到了自我改進的方法。
我認為,如果你能識別出公司裡哪些部分可以這樣運轉,並盡可能減少人類在其中的執行和監督角色,那麼你就可以把 token 投入這個問題裡,而公司本身會持續變好。
其他例子也很多。比如你有產品分析數據,就可以讓一個 agent 分析產品數據,找出銷售漏斗中摩擦最大的環節。它可以研究最佳實踐,設置一個 A/B 測試,運行一周,選出表現最好的版本,然後部署上線。
這會一遍又一遍發生。你的產品就會擁有一個自我優化的產品循環。
客服也是一樣。客戶建議不斷進來,你可以用一個 agent 來做分流。這個 agent 某種程度上像你的首席產品官和首席技術官,它要做判斷:這個建議我們不想做,丟掉;但那個建議符合我們的路線圖,可以今晚就完成。那就寫程式碼、部署、上線,直接交付給客戶,全程不需要人類介入。
所以,如果你能把公司每一個部分都看成一個自我改進的遞歸 AI 循環,它就會變成一種和「羅馬軍團式」層級公司完全不同的東西。
那麼,如果你想這樣做,它意味著什麼?
第一點是:消耗 token,而不是堆人頭。我們現在看到,很多公司到 Demo Day 時,人均收入已經比 18 個月前高出大約 5 倍。我認為這個趨勢會繼續延伸到 A 轮和 B 轮階段。很快,你真正受限的不會是員工人數,而是 token 使用量。
現在最粗糙的做法,就是衡量每個人的 token 使用量。當然,這個指標在極端情況下很蠢,也很容易被遊戲化。但方向上,我覺得它是對的。我們現在處在一個探索「到底什麼是可能的」的階段,所以每個人都應該最大限度地實驗,看看這種瘋狂的新智能到底能做什麼。
一旦你把它做成排行榜,并且让晋升或解雇与这个指標掛鉤,它當然會被刷,當然會失真。但從方向上說,搞清楚組織裡誰在把 token 用到極致,誰沒有,確實是判斷你應該把時間花在哪些員工身上的一種方式。
我認為,中層管理結束了。至少對於這種協調問題來說,我不認為還需要中層管理,AI 應該來完成這件事。
對我來說,未來有兩個重要角色。Jack Dorsey 提了三個,但我不太喜歡第三個,所以我刪掉了。我認為真正重要的是兩個角色:每個人都必須成為 IC,也就是個人貢獻者、建設者、操盤手。並且關鍵在於,要有直接負責的個人。任何事情要推進,都需要一個明確具名的人負責,而不是一個委員會,也不是一群人。
我認為,公司完全可以建立在 IC 之上。中層管理真的結束了。而構建一家自我改進的公司,就是這個願景。
順便說一句,我覺得現在大家都還在這件事的最前沿。我也很想知道你們進展到哪裡了。現在感覺所有人都還在探索邊界。我不確定是否已經有人在每一個職能上都建立了真正自我改進的公司。也許我錯了,你們可以證明我錯了。
如果是我,我會先做什麼?
第一件非常重要的事,是讓整個組織對 AI 可讀、可理解。這是什麼意思?意思是你必須記錄一切。
簡單來說,現在我們所有 partner 的郵件,如果你給 YC partner 發郵件,這封郵件就會進入 YC 數據庫。每一條 Slack 消息、每一條 DM、每一次 office hours,我們過去三四個月已經開始全部錄音。所有發生的事情,只要被記錄下來,對 AI 來說它就發生了;如果沒有被記錄下來,對你的智能系統來說,它就沒有發生。
剛才我和一些創始人在這裡聊天,我們聊了很多關於他們公司的好內容。每一次聊天我都會想,我真的應該把這段對話錄下來。因為有個人剛才需要我幫他介紹一個人,現在我甚至已經記不清那個介紹對象是誰了。我當時答應了他說可以,然後又讓他之後給我發郵件,因為我知道我肯定會忘,我接下來還要和 20 個人聊天。
所以,這件事可能需要靠手機、錄音設備、智能眼鏡,或者把每個房間都裝上麥克風。總之,所有東西都需要被記錄下來,這樣 AI 才能讀懂它。
然後,就像 Garry 說的,還需要做說話人分離和摘要整理。你不能把 10 萬小時的錄音直接塞進上下文視窗裡。你必須把它們整理出來,聚合、壓縮、提煉成重要部分,再給 AI 留下一些線索。
舉個例子:你們有誰讀過 YC 的用戶手冊?希望這個房間裡每個人至少都打開過一次。沒關係。那份手冊大部分內容寫於五到十年前,已經有點過時了。
上週末,Harsh 突然想到:既然我們過去三個月已經積累了大約 2000 小時的 office hours 錄音,為什麼不重新生成一版用戶手冊?
於是你可以給系統一組指令,先把錄音整理、壓縮、綜合,再按照融資、招聘、聯合創始人紛爭等主題分類,然後讓它寫一版新的用戶手冊。到週末結束時,他已經生成了一份 150 頁的用戶手冊,質量明顯好於現有版本。
更重要的是,現在我們可以每個月更新一次。於是我們的用戶手冊變成了一個自我改進的系統。每一條新的建議,都會和現有用戶手冊對比,要麼被吸收進去,要麼被丟棄。這樣,用戶手冊就變成了一個持續更新的活的大腦,承載著我們每周給創始人的建議。
當然,它不會停留在用戶手冊這一層。你可以把它作為上下文輸入給 AI agent。於是你突然就可以向一個超級智能 AI 提問,並獲得 16 位 YC partner 的綜合智慧。但前提是,這些知識必須對 AI 可讀。所以你必須記錄一切。
第二點其實類似:如果某件事能創造出一個可以自我改進的 artifact,並且能被 AI 讀取,那就保留它;如果不能,就丟掉。
第三點是,每一個職能都應該能生成自己的軟體。過去我們可能會說「儀表板」,但現在不只是儀表板,而是按需生成的軟體。Codex 5.5 現在已經足夠好,大多數簡單的內部軟體和儀表板,你都可以一次性生成到相當高的質量。我週末用我們的一些內部東西試了一下,效果真的不可思議。
所以,所有內部運營團隊都應該坐在這一層之上:擁有對業務的智能理解,然後自己生成儀表盤和工作流。
而且我會把這些軟體視為完全可丟棄的東西。真正應該被非常珍惜地保存下來的,是數據。就像 Garry 說的,他把所有郵件都存成 Markdown,永遠不丟棄任何東西。但軟體本身是短暫的、臨時的。你可以生成它,也可以重新生成它。
真正有價值的,是人腦裡對業務的理解:這個職能是如何運轉的,我們如何辦一場 YC 活動,等等。至於真正用來執行活動的軟件,你可以為這場活動生成一個,用完丟掉。一個月或兩個月後,模型變得更聰明了,你就把舊軟件丟掉,把原始指令重新給它,再生成一版新的軟件。
所以我認為,有價值的是業務上下文和 skills。建立在它們之上的軟件,是短暫的。
那麼,在這個世界裡,人類的作用是什麼?
我認為,我們討論的其實是一個「公司大腦」。我知道這個房間裡有很多人正在做類似的事情。中間那一部分——你的所有數據、所有郵件、DM、技能、know-how——就是公司大腦。
人類則位於這個大腦的邊緣,負責與真實世界互動。也就是說,人類是這個智能系統接觸現實的地方。人類可以進入模型暫時還無法進入的場景。比如會議現場,或者一些新奇、複雜的情況。電話我本來想作為例子,但現在 AI 其實也很容易進入電話場景了。
更典型的是陌生情境、倫理判斷、高風險時刻。比如一個創始人來找我們,說他正在考慮和聯合創始人分開。這種真正高風險、高情緒濃度的時刻,你還是會希望有一個人類在場。
這就是人類的位置。對你們很多公司來說,銷售對話也是如此。未來 20 年裡,我認為銷售現場仍然會需要一個人類在房間裡。
所以,我認為人類會生活在公司大腦的邊緣,負責把智能帶到現實世界裡。
我已經超時了,主持人可能快要把我拉下臺了。最後我留給你們一個問題:如果你今天重新創辦自己的公司,你會不會一開始就把它設計成這種形態?
你們大多數人公司還足夠小,完全可以這樣做。所以我覺得你們沒有任何借口。而且我知道,現場也有幾位正在拆掉並重建自己的公司。
那我就先講到這裡,把時間交給 Pete。謝謝大家。
[視頻鏈接]
歡迎加入律動 BlockBeats 官方社群:
Telegram 訂閱群:https://t.me/theblockbeats
Telegram 交流群:https://t.me/BlockBeats_App
Twitter 官方帳號:https://twitter.com/BlockBeatsAsia