视频標題:Anthropic 追尋下一個 Claude Code
視頻作者:ACCESS Podcast
編譯:Peggy,BlockBeats
編者按:在大型模型能力持續飛躍、AI 編程工具快速普及的背景下,行業討論正在從「模型能否完成任務」轉向「模型能力如何被組織成產品、工作流和商業系統」。
過去一年,Claude Code、Codex、Co-work 等產品相繼進入開發者和知識工作者場景,AI 不再只是一個回答問題的聊天框,而開始成為可以調用工具、執行任務、驗證結果的生產接口。但當「agent 會成為下一代軟件形態」逐漸成為共識,一個更關鍵的問題開始浮現:誰能率先把模型能力轉化為可重複使用、可分發、可擴展的工作系統?
本文整理自 ACCESS Podcast 對 Mike Krieger 的訪談。Mike Krieger 是 Instagram 聯合創始人,目前是 Anthropic 的首席產品官,負責 Anthropic Labs,旨在帶領團隊探索 Claude Code 之後 Anthropic 的下一批前沿產品方向。

Alex Heath(左)和 Mike Krieger(右)
在這場對談中,Mike Krieger 並不是單純討論 Anthropic 下一個產品會是什麼,而是將 AI 產品競爭拆解為一組更底層的結構性問題:模型能力如何進入真實工作流,AI 公司內部如何組織創新,平台公司如何處理與生態客戶的邊界,以及當 AI 執行能力越來越強,人類判斷力在生產鏈中將被重新放在哪裡。
第一,是產品形態從「聊天」轉向「任務」。過去,大型模型主要以對話框形式存在,用戶輸入 prompt,模型生成回答;現在,Claude Code、Co-work、Claude Design 代表的是另一種產品邏輯:讓 AI 圍繞一個目標持續推進工作,並在過程中調用工具、生成結果、進行驗證。這意味著,AI 產品的關鍵不再只是回答質量,而是任務拆解、上下文連續性、工具調用和結果校驗能力。誰能把這些能力封裝成順暢的工作流,誰就更接近下一代生產力入口。
第二,是组织方法从「大团隊規劃」轉向「小团队试错」。Anthropic Labs 的運轉方式,更像一個嵌入大公司內部的創業單元:兩三個人起步,兩週一次評估,用高頻反饋判斷項目是否繼續推進。過去,大公司創新實驗室容易陷入周期過長、責任模糊和「還可以」的項目被拖延;現在,模型降低了構建成本,真正稀缺的反而是判斷力、品味和決策速度。這意味著,AI 時代的組織效率不只取決於工程人數,而取決於能否用更小團隊更快驗證方向。
第三,是平台與應用的邊界正在重新劃定。Claude Code 的成功讓 Anthropic 不再只是模型供應商,也開始親自定義應用形態;Claude Design 與 Figma 的爭議,則顯示模型公司下場做應用會不可避免地觸碰客戶和生態夥伴的利益。過去,基礎模型公司更多提供底層能力,由 Cursor、Figma 等垂直應用完成用戶界面和場景封裝;現在,模型公司也需要通過自有產品展示 agent-first 的未來形態。這意味著,AI 平台競爭不僅是 API 競爭,也是產品範式競爭。
第四,是 AI 越強,人類判斷越稀缺。Mike 反覆強調,Claude 可以更快寫代碼、生成原型、執行任務,但它無法替代從 0 到 1 過程中最困難的部分:提出正確問題、理解真實用戶、定義產品北極星,以及判斷什麼才是「對的」。過去,執行能力是知識工作的主要瓶頸;現在,執行正在被模型加速,人的價值更集中在前置判斷、創造力、關係網絡和組織能力上。AI 不會自動消除艱難決策,反而會讓錯誤方向被更快放大。
如果將這場對談壓縮為一個判斷,那就是:Claude Code 之後,Anthropic 要尋找的不是單一爆款產品,而是一套讓 AI 從模型能力轉化為生產系統的方法。在這個意義上,本文討論的對象,已經不只是 Anthropic 的下一步產品路線,而是整個 AI 行業從「模型競賽」進入「系統競賽」的結構性轉折。
以下為原文內容(為便於閱讀理解,原內容有所整編):
·AI 產品競爭已從「模型更強」轉向「能力如何落地」,本質是大模型公司開始爭奪工作流入口。
·Claude Code 的意義不僅在於寫程式碼,而是證明了 agent 可以在明確目標下持續執行任務,推動 AI 從聊天工具變·成生產系統。
·Anthropic Labs 的核心價值不在於發布多少產品,而在用小團隊快速驗證模型下一步應該具備什麼能力。
·Co-work 代表 Anthropic 想把 Claude Code 的方法論擴展到非程序員,本質是把「編程能力」抽象成普通人的工作自動化能力。
·OpenAI Codex 的追趕讓 Claude 的優勢不再只是技術領先,而取決於 Anthropic 能否把 Claude Code、Co-work、Claude.ai 整合成統一體驗。
·模型公司親自下場做應用會加劇與客戶的邊界衝突,但這也是它們定義下一代 AI 產品形態的必然路徑。
·AI 越能快速執行,人的價值越集中在前置判斷、產品品味和問題定義上,因為錯誤方向也會被 AI 更快放大。
·AI 對就業的衝擊不是單一公司能解決的問題,本質上會迫使社會重新討論技能重塑、分配機制與人類不可替代能力。
Alex Heath(主持人):Claude Code 之後,Anthropic 的下一個大產品會是什麼?本週節目,我們請到了 Mike Krieger。他是 Instagram 聯合創始人,現在負責 Anthropic 內部做「登月項目」的團隊。
Mike Krieger(Anthropic 首席產品官):
我在 Anthropic 任職期間最黑暗的一天之一,就是把它命名為 3.5 v2。至於我們為什麼最後會取這個名字,我可以解釋。
Alex Heath:我和 Mike 是在舊金山 Anthropic 最近舉辦的 Claude Code 大會期間,線下錄製了這場對話。那次大會上,Anthropic 宣布與 Elon Musk 達成了一項新的大型算力合作。所以,你們現在算是要和 Elon 一起上太空了?
Mike Krieger:完全正確。是的,我們正在尋找新的、甚至有些意想不到的算力來源。
Alex Heath:我們聊到了 Mike 現在正在做什麼,Anthropic 與 OpenAI 之間激烈的競爭,以及 Mike 認為,即使 AI 變得越來越強,人類工作中哪些部分依然會繼續重要。
這裡是《Access》。
Mike,很高興在舊金山的 Claude Code 大會上見到你。我剛才還在回想我們上一次對話。那時候你剛接手 Labs 沒多久,但現在已經過去幾個月了吧?
Mike Krieger:是的,差不多快四個月了。
Alex Heath:差不多四個月。對於不了解 Labs 的人,我想從這裡開始。因為這是一個挺特別的組織架構。幾個月前我去你們辦公室的時候,我們也聊過這個。Labs 到底是什麼?它在 Anthropic 內部的使命是什麼?
Mike Krieger:簡單來說,我對 Labs 的理解是——現在這個版本,我會稱之为 Labs v2。我們也可以之後再展開講 Labs v1 做過什麼,以及 Labs v2 想做什麼。
但我認為 Labs 主要做兩件事。
第一,是縮小 Claude 理論能力與普通人日常使用體驗之間的差距。也就是說,Claude 在理論上能做很多事情,但這些能力如何真正進入人們的日常工作和生活?我們要做哪些產品、原型或項目,才能展示如何釋放更多這種潛力,如何把這中間的差距盡可能縮小?
第二,我們更像是一支「前線偵察隊」,去判斷模型未來需要往哪個方向演進,才能滿足不同用戶的需求。
所以,一個成功的 Labs 項目,不一定是最終發布成產品。它也可能是一個原型。我們做出來之後發現:模型目前還不夠好,暫時無法完成這個任務。那我們就把它先放到一邊,等下一代模型發布時再重新評估,或者把它變成未來模型開發中的一個評測指標,然後繼續迭代。
因此,和純產品公司的產品實驗室不同,那裡衡量成功的標準可能是「你有沒有發布一個產品」。但在 Anthropic,Labs 的價值還可以體現在其他方面:它可以影響 Anthropic 未來的方向。
Alex Heath:Labs 確實做出過一些爆款,對吧?Claude Code 是其中之一,MCP 也是。還有哪些?
Mike Krieger:Agent Skills 也是 Labs 做出的一個很重要的東西。另外我還可以講一個當時沒有發布、但對研究非常有幫助的項目:computer use,也就是讓 Claude 使用電腦。
我是在 2024 年 5 月加入 Anthropic 的。下周就是我加入兩周年,我們內部叫「antiversary」。
Alex Heath:是 anniversary 嗎?
Mike Krieger:是 antiversary。Anthropic 裡面什麼都要和 ant 扯上關係。一開始我還挺抗拒的。我們也不說 dogfood,而是說 antfood。
我加入後,我們開始搭建 Labs。當時最早被提出來的項目之一就是:為什麼不試試看,讓 Claude 來使用一台電腦?
Alex Heath:也就是 computer use。
Mike Krieger:對。
Alex Heath:那是什麼模型時代?
Mike Krieger:那是 Claude Sonnet 3.5。那也是我參與發布的第一代模型。我加入第三周就開始做這個發布。我們經常開玩笑說,Anthropic 沒有所謂 onboarding 項目,它會直接把一個很難的項目丟給你。而我就是第三周直接參與發布。
Sonnet 3.5 是一個很有趣的模型,因為它是最早真正解鎖部分編程場景的模型之一。還不到完整 agentic coding 的程度,但已經能看到一些苗頭。
所以,我們把 Sonnet 3.5 放進來,圍繞它做了一個 computer use 產品。但它有很多問題。比如它使用電腦的速度太慢,準確度也不夠高,視覺能力也不夠好。它會看到屏幕,然後說「我需要點擊那個按鈕」,結果實際點到了別的地方。
但搭建這個「不完全可用」的測試框架本身非常有幫助。因為後來當我們做到 Sonnet 3.5 v2 的時候——這個命名可以以後再展開講,那真的是我在 Anthropic 最黑暗的一天之一——我們就可以把新模型放進這個框架裡測試。
後來我們又試了 3.6,還是不夠好,但已經有一點起色。再到 3.7,我對那一天印象非常深。當時我在紐約出差,去見紐約團隊。突然有人發消息給我說:我們覺得之前 Labs 做的那個東西,也就是當時已經放了九個月的 computer use 專案,在 Sonnet 3.7 上真的開始展現生命蹤跡了。我們認為,是時候把 computer use 作為一項能力,對外開放並公開討論了。
這中間大概經歷了九個月。我們每隔幾個月就把新模型放進同一個測試框架裡試一次。即便 Labs 當時已經把這個專案暫時放下了,它仍然非常有用,因為它成了評估模型中 computer use 能力演進的一套測試集。
Alex Heath:你剛加入 Anthropic 的時候,是首席產品官。我記得當時我還想了一下:Mike Krieger,這個 Instagram 聯合創始人,在我印象裡是非常偏消費者產品的創始人,怎麼會加入一家企業級 AI 公司?
Mike Krieger:是的。
Alex Heath:我們當時可能也聊過這個。我當時覺得,這是一個很有意思的選擇。事後看,這是一個正確的選擇。當然,時機也非常好。
我很好奇,你一開始是作為 CPO 加入,負責整個產品線。而「AI 產品」這個概念本身就有點模糊,而且變化很快。你是怎麼在大概四五個月前轉到 Labs 的?據我了解,你現在更像是一個 IC,也就是個人貢獻者?你現在還管人嗎?
Mike Krieger:我現在不管人。我們剛好要進入績效評估周期了。
Alex Heath:所以這就是你想要的,對吧?你是為了逃離寫績效評估?
Mike Krieger:沒錯。我打開系統,看自己要寫哪些評估,結果發現:你只需要寫自己的自評,以及對你經理的評價。
Alex Heath:Just these?
Mike Krieger:Just these.
Alex Heath:Now Claude is writing the performance reviews?
Mike Krieger:Claude does help with some of the evaluations, which is useful. It doesn't write the whole thing for you, but at least it helps you remember: What have I actually done in the past six months?
I feel that the company has gone through different stages, and the things I am truly passionate about at each stage differ.
When I first joined, the entire product and engineering team was only about 30 people, with maybe half in product and half in engineering. Of course, we also had some engineering teams working on research infrastructure, scalability, etc., but if you only look at the people truly building around the product, it was mainly Claude.ai and what was then called our API—back when it wasn't even called the Claude Platform—there were probably only 30 to 35 people in total, very, very small.
It still felt very much like an early-stage startup at that time, and many things were still in the defining stage. For example, "What is this product really?" was far from being defined. The Claude.ai at that time did not have Projects, did not have Artifacts; it was basically just a list of conversations between you and Claude, with hardly any additional features.
So, joining Anthropic at that time felt like joining a startup that was still looking for its product form. Of course, it had caught some wind.
Alex Heath:When you joined, the Claude 3 series had already been released, right? Including Opus, Sonnet, and Haiku.
Mike Krieger:Yes. That was Anthropic's first time presenting a series of models that were at least close to the cutting edge. There were still many product-level things to do: What is this product going to be?
Although my background is more in consumer products, the reason I was excited is because in the time between Instagram and Anthropic, I made a lot of investments with Instagram's co-founder, Kevin. We had a whole set of investment themes, and one of them was "the future of work"—how work would be accomplished in the future.
And Anthropic seemed very likely to unlock this theme: What happens when you have a very smart assistant to help you work? I didn't even foresee at the time how disruptive this would become.
Alex Heath:當時你可能覺得:這是一家相當有趣的小 AI 公司,也許能幫我理解一些投資主題。
Mike Krieger:是的,可能會幫助我們理解一些正在思考的主題。但實際上,它改變的東西遠比我想象中多得多。
那是第一階段:團隊很小,正在做的項目一只手就能數過來。然後我們快進到去年年底,產品團隊已經有幾百人了。我們有一整個專案組合,很多工作開始變成部署、理解客戶需求、面向客戶、管理層級,以及所有這些隨著公司成長必然出現的事情。
我逐漸意識到,有些人非常喜歡這類工作,也非常擅長。我非常尊重他們。但對我來說,我有一個很好的教練,她把這種狀態稱為「能力區」——也就是你擅長做的事,你做得很好,也能勝任,但它並不是最終真正點燃你、驅動你的事情。
這其實是一個很危險的位置。因為你可以在這個位置上做很久很久,而且看起來表現不錯,但它不是你最有火焰、最有動力的地方。
所以,去年第四季度,我開始和 Daniela 討論這件事。我說,公司已經長大了。我們確實把通常需要五年完成的成長過程壓縮跑完了。雖然實際也就兩年左右。
Alex Heath:是的,我覺得你們增長得還算不錯。
Mike Krieger:是的,增長還可以。團隊規模、產品組合都擴張得很快。於是我說,我覺得自己想去做一家新公司。
Daniela 問我:這是因為你想離開 Anthropic,還是因為你想調整自己在公司裡做的事情?我說,我很喜歡這家公司。這裡的人非常棒,我也很喜歡這項技術、使命等等。
剛好那時候,我們也在重新啟動 Labs。因為 Labs v1 太成功了,所有專案都畢業了,最後一個人也沒留下。於是 Labs 其實就被暫時收起來、放在一邊了。
所以我們決定重新啟動 Labs,而我也回到 builder 的角色。所有在工作內外見到我的人都會說:「Mike,你看起來太開心了。」
Alex Heath:你的一些同事今天早些時候也跟我說了。他們說,Mike 現在狀態太好了,過得特別開心。
Mike Krieger:是的。当然,我仍然是自己最嚴厲的批評者。所以我每天都會想:我怎麼才能做得更好?我們能做什麼?我們能構建什麼?我們到底在驗證什麼?
所以這並不是一件輕鬆的事。但它確實更符合真正驅動我的那些東西。
Alex Heath:我們不用在這個問題上停留太久,但我確實很著迷於科技公司內部做這種「登月式」「從 0 到 1」的實驗室。Alphabet 可能是最典型的例子,但類似嘗試在科技史上其實很多。有些成功了,有些沒有。
Anthropic 的 Labs v1,至少從產品結果來看,顯然是成功的。
Mike Krieger:是的。
目標:找下一個 Claude Code
Alex Heath:我想這也會給你現在帶來很大壓力。因為你會想:好,Claude Code 已經在那裡了,我必須做出一個能與它相比的東西。
Mike Krieger:是的。很有趣的是,我們內部有一個類似使命宣言的說法:我們要找到下一個 Claude Code。
在 Labs v2 啟動時,這個標準已經很高了。但從那以後,Claude Code 又繼續增長,所以這個門檻變得更高了。
我認為有幾件事很重要。對我來說,有創業經驗很有幫助,因為你永遠不可能完全複製那種感覺:兩三個人對抗整個世界,手裡只有一定數量的錢。如果我們不能做出一個可行的東西,就必須關掉公司,把錢還給投資人。
Alex Heath:這就像你和 Kevin 當年那樣。
Mike Krieger:完全一樣。我記得那種生死攸關的問題每天都壓在我身上:如果這件事做不成會怎樣?我還能繼續擁有這種獨立性嗎?我還能繼續做自己真正關心的事情嗎?
這種感覺在大公司內部很難人為製造出來,除非你設計一些非常複雜的結構。我也見過那種做法。在啟動 Labs v2 之前,我研究了很多公司內部實驗室的案例。有些公司會讓團隊獲得他們創造出來的東西的一部分股權,或者設計其他類似激勵機制。
Alex Heath:對,就是各種「補丁式」的安排。
兩週試錯一輪專案
Mike Krieger:是的,它們都是在試圖修補這種感覺。
但我們發現,真正有效的方式其實不完全是激勵機制。因為 Anthropic 本身吸引了很多非常有主動性、有野心,同時又有使命感的人。我們更需要警惕的,不是大家有沒有動力把專案做好,而是如何避免這裡變成一個舒適的地方,讓一些「還可以」的想法被拖上好幾個月。
所以我們的做法是縮短周期。Labs v1 基本是四到六週一次評審,一個專案會獲得支援,然後團隊大概有六週時間去證明一些東西。
現在我們採用兩週 sprint。每兩週,每個專案都要面向整個 Labs 領導團隊匯報。這不是那種「殺戮委員會」式的會議,通常都是比較理性的討論,除非某個專案真的嚴重偏航。
但我們會非常認真地追問每個專案一個問題:過去兩週你學到了甚麼?以及:我們學到的東西夠多了嗎?
有時候,一個專案已經完成了它該完成的事情。你會說,這個專案很棒,它已經證明了該證明的東西,我們其實不需要再多花兩周。
現在變化太快了,而且借助這些模型,構建速度也非常快。所以,讓一個專案多拖四周的機會成本其實很高。
我認為這是 Labs v2 做得最好的一點:我們把飛輪轉得更快了。至少每兩周,我們都會衡量一次自己的學習速度,即便暫時還不能衡量外部影響。
Alex Heath:Labs 里的大多数人,都是前创始人嗎?
Mike Krieger:很多人確實是前創始人。
Alex Heath:這是你們篩選人的標準嗎?
Mike Krieger:我們在 Labs 里大概有兩類角色。我們把所有專案都叫做 bets,因為它們本質上都是高風險、高波動的下注。然後是 bet leads,也就是專案負責人。
如果你是那個精神意義上的直接負責人,也就是 DRI(Directly Responsible Individual),這類人幾乎都是創始人背景。
但 Labs 裡也有其他成員。他們可能不是創始人,而是非常能動手的 builder。比如有人曾經是一家創業公司的早期員工,經歷過從 0 到 1 的過程;或者就是非常喜歡構建東西的人。
我們有一位加入 Labs 的同事,她之前在上一家創業公司很早期就加入了,後來又很早加入 Labs。她具備那種「我可以覆蓋整個技術棧,哪裡需要我就去哪裡」的能力。
我認為這種能力和創始人背景一樣重要。你不能只有純創始人,你還需要那種互補的「創始團隊氣質」。
未來的公司形式:小團隊+AI
Alex Heath:我的聯合主持人 Ellis 今天來不了,但他給我發了一些問題讓我問你。其中一個問題是:你們在 Labs 裡組建的這個「創始人超級團隊」,是不是一種新的公司組織模式?尤其是在 AI 時代。還是說,這只是 Anthropic 這樣公司的特殊情況?
Mike Krieger:這是一個很好的問題。
我認為未來會出現更多這樣的團隊:一個小團隊,配合模型一起工作。模型並不完美,所以你仍然需要有判斷力、有品味、有方向感的創始人型人才。
比如昨天我就花了大約兩個小時,和團隊討論我正在做的一個 Labs 項目。在那個項目裡,我們討論的是產品中的 multiplayer,也就是多人協作形態,應該長什麼樣。
那兩個小時非常有價值,也非常「人類」。我們就是在一個房間裡不斷碰撞、推敲。然後接下來大約 12 個小時,我讓 Claude 異步地去處理這些想法。
但關鍵是,你需要有人有判斷力:哪些問題必須一開始就充分討論?哪些事情應該直接去實現?因為如果你不明確指定,模型會替你做出很多決定。
所以,我認為創始人型人才仍然扮演着非常重要的角色。但一旦你把結構搭對了,就可以做很多事情。
我最近做了一個小複盤,回顧 Labs 過去幾個月做了什麼。其實也才四個月,但有些項目是一月構思出來,二月就進入測試,三月就結束;也有一些項目是二月構思的,現在已經變成 Claude Design。
所以已經發生了很多事情,速度非常非常快。
我認為,未來會有更多公司轉向這種模式:更小的團隊,給他們自主權,讓一個真正有責任感的人來推動項目,而且一開始不要配太多人。
這是我們在 Labs v2 裡學到的很重要一點:不要一上來就給一個項目配五個人。應該先從兩三個人開始,更像一家創業公司。
Alex Heath:接下來就是我最喜歡的部分了:我會儘量從你這裡套出更多關於這些項目的資訊。
今年 3 月我們見面的時候,你跟我說,你在研究讓 Claude 長時間運行,也就是所謂 long-horizon problem,讓它處理更長周期的任務。當時你在負責這個項目。你現在還在負責它嗎?
Mike Krieger:沒有了。這個項目很典型:我們其實已經把它先放到一邊了,但它的學習成果後來進入了今天發布的 Managed Agent 裡的 Outcomes。
這個項目的核心想法是,讓 Claude 基於 rubric,也就是評估標準,去執行一個面向最終結果或目標的任務,而不是只響應一個單獨的 prompt。這和我們之前在 Labs 裡探索的方向,在精神上是非常一致的。
我當時也在梳理這個項目後來延伸到了哪裡。今天早上的發布裡,有兩個主題其實就是從這個 Labs 項目直接派生出來的。
一個是 Outcomes。另一個是在 Boris 的演示裡,你看到 Claude Code 會通過截圖來驗證自己的工作,測試自己做出的東西。
這也是我們當時重點推進的方向之一。因為 Claude 看著自己寫的代碼說「我覺得沒問題」,是一回事;它真正去完整地探索和驗證,又是另一回事。
在我負責的那個項目裡,我們甚至研究過讓 Claude 錄下自己完成工作的全過程,然後自己回看視頻,判斷:「哦,這個動畫是壞的。」有些問題只靠截圖驗證是發現不了的。
所以,是的,3 月時我們聊到的那個專案,當時還在開發中。現在我們已經把它放到一邊了。它內部仍然可以跑,我們有時候還會用它做一些演示。但它最主要的價值,是成為了上游靈感和能力驗證的來源。
Alex Heath:另一個專案,你當時說是讓 Claude 自己選擇自己的形態。比如它會自我判斷:下一段對話,與其用命令行界面,不如變成一個網站。
Mike Krieger:對。
Alex Heath:那就是 Claude Design 嗎?還是別的東西?
Mike Krieger:它和 Claude Design 在精神上有很多一致的地方,但不是同一個東西。
我們現在正在追問的問題是:Claude Design 本質上是一種「agent + canvas」的形態。你可以想象,有很多這樣的組合。
即便是在 Claude Design 裡,我也用它做過很多事情。比如寫技術規格文檔。現在我最喜歡的寫技術文檔方式,其實就是用 Claude Design。因為你可以讓它把信息流可視化:信息是怎麼流動的?還能怎麼流動?然後你可以直接看著它演化。
這可能是我第二喜歡的使用場景。第一是做 slides,我現在經常用 Claude Design 做簡報。但你完全可以想象,canvas 裡還可以承載其他格式。所以這是 Labs 正在探索的一個方向:像 Claude Design 這樣,但面向更多類型、更多應用場景。
我覺得這非常令人興奮。
Alex Heath:所以它本質上是更泛化的生產力軟體嗎?這是核心想法嗎?
Mike Krieger:我覺得這是一個可以繼續拉出來深入探索的主題:一種生產力軟體,而且最好是可以高度個性化、適配你的生產力軟體。我認為這是一個很有趣的趨勢。
Alex Heath:你現在還在思考 AI 裡的哪些空白領域?
Mike Krieger:隨著模型不斷進步,我覺得它們在生命科學這類領域成為有用夥伴的能力,會非常有趣。
我最近看到越來越多這樣的例子。比如 X 上有一個很棒的 thread,有人自己在家做了全基因組測序。後來他甚至把這件事專業化了,現在可以上門幫你做。
我對這個很感興趣,因為我是那種很喜歡「自我認知」的人,想弄清楚這些東西到底怎麼做。
一些真正了解這個領域的人告訴我,幾個月前的模型和現在像 Opus 4.7 這樣的模型之間,已經有很大差距。現在的模型在解析遺傳數據、從中發現推論,或者讀取你的化驗結果方面,真的開始有用了。
以前可能只是「哦,很可愛,它說出了一個醫生看了之後也會說的話」,或者只是重複一些我們根據經驗規則已經知道的東西。但現在它真的開始有價值。
所以,個性化醫療是我很感興趣的一個空白領域。我覺得我們已經站在一個臨界點上。這裡還有很多所謂 overhang,也就是現在技術上已經可能做到、但產品和應用還沒有充分釋放出來的空間。
Alex Heath:現在確實有很多類似創業公司冒出來,比如 Superhuman、Superpower、Ro,還有 Function Health,都在做這類事情。
Mike Krieger:對,完全是這樣。今年 1 月我們做 Claude for Healthcare 的早期探索時,其中一個合作方就是 Function。你可以把自己的化驗結果導入 Claude,然後做進一步分析。
我這週還開始用一個叫 Subco 的補充服務。你把自己吃的所有補充都輸入進去,它會知道這些補充之間怎麼相互作用,然後給你建議,比如:你其實不用吃這八種,可以減到四種。
下一步它們還沒有做,但我可以想象有人會做:結合你最近一次化驗結果,或者結合你的遺傳數據,它可以判斷你是不是對某種補充有超強反應。
所以,這整個領域非常有趣。這還只是偏「優化」的一側。如果再去想那些今天醫療服務覆蓋不足的領域,比如很多人沒有本地優質醫療資源,那麼 AI 也許可以在某種程度上補足這些缺口。
所以這裡有很多非常有趣的空白空間。
Mike Krieger:另一個領域也很有趣。大概一年前,我參加過一個消費者 AI 會議,是 Forerunner 組織的。當時我在台上和一些創始人討論:除了聊天、無盡的助手之外,消費者 AI 的 breakout case,也就是真正破圈的應用,會是什麼?
到現在我還沒有真正看到它。也許健康算一個,但它又不完全符合我剛才描述的那類消費者應用。AI 驅動的約會產品可能有點機會,但裡面天然帶著一點讓人不舒服的感覺。
Alex Heath:所以不會看到 Claude 做一個約會服務?
Mike Krieger:我覺得我們不會做 Claude Dating Service。但也許某個基於 Claude API 的客戶會做類似產品。我不認為我們會在內部做這個。
不過,我仍然覺得這裡有一個有趣的空白問題:AI 是否真的能幫助我們更好地理解自己、理解世界、理解社區,並且讓人與人之間更連接,而不是更疏遠?
舉個例子,我最近開始對公民參與很感興趣:如何把具有代表性的人群組織起來,進行公共議題辯論。我不是這方面專家,但我開始對這個問題感興趣。
在這種場景下,AI 的作用不是替人做決策,而是幫助找到具有代表性的群體。也就是說,把人保留在過程中,但確保我們聽到的是正確的聲音。
Alex Heath:我很好奇,你現在身上還有那種「社交媒體產品」的本能嗎?
Mike Krieger:現在可能沒那麼強了。不過,如果說這個方向裡還有什麼比較有趣的想法,我覺得 Sora 曾經探索過一個點挺有趣:你可以描述自己想要的算法,然後系統為你生成出來。
Alex Heath:這個方向現在到處都在出現。Threads 裡有,X 在某種程度上也有。我覺得這會變成一個標準能力。
Mike Krieger:Spotify 也有。我自己就在 Spotify 裡用過。我會做一些很「邪門」的播放列表。比如我女兒和我沒法就聽什麼達成一致,我們就讓 Spotify 生成一個播放列表,取我們兩個人喜好的交集。最後結果可能是 Pavement 加《冰雪奇緣》的音樂。非常好。
Alex Heath:我喜歡這個。很有趣。
Mike Krieger:Spotify 的 AI DJ 確實挺有想法的。但我覺得,這是一種 AI 正在幫助我們個性化自己的方式。
我最近還在想另一個點。我不確定它是不是一個適合 Labs 的項目,但也許有人應該去做:AI 能不能成為一種有用的過濾器,把外部世界裡的噪音篩掉?
我最近開始用 Dispatch 和 Co-work,原因也是這個。否則我就是一個無可救藥的新聞癮患者。我會不停地查看每一個新聞網站,讀很多東西。這當然有價值,但有時候我也會想:我是不是一直在重複閱讀同樣的故事?
所以,我現在有一個類似每天早報的東西,放在我之前的工作流裡。它會整理我平時會看的那些信息源。很多時候我還是會點進去看原文,但它至少能幫我判斷趨勢是什麼,讓我不需要每天早上第一件事就打開十二個網站。
Alex Heath:只要你還在讀 The Verge 的 Sources newsletter,Mike,你就可以繼續做綜合整理。
Mike Krieger:當然,那個一定會直接進我的收件箱。
Alex Heath:我之前好像在 X 上看到過一個洩漏信息,不知道真假,說你們在考慮做一些更主動的東西。也許叫 Orbit 之類的?可能會更主動地把你剛才說的這些東西帶進 Co-work,或者介面的另一個部分,面向更偏消費者的用戶。
你覺得這是一個機會嗎?
Mike Krieger:我覺得是的。任何時候,當你看到重度用戶自己創造出這類使用場景時,都會自然產生一個問題:如果把這類能力做成內建功能,會是什麼樣子?
比如定時的每日簡報,或者主動監控某些東西。我們在 Anthropic 內部非常依賴 Slack,所以它可以主動監控 Slack;也可以監控郵件。
我自己最近也開始這麼做。我的早晨 Claude routine 裡有幾件事。一個是剛才說的新聞簡報。另一個是讓它掃描 Superhuman,也就是我個人用的郵箱客戶端。因為 MCP 已經發布了,現在它可以掃我的郵箱。
這非常有用,因為它知道不同郵件分類,能告訴我:這封你真的應該看一下;這些可以稍後再讀。所以現在在開啟收件匣之前,我會先看 Claude 給我的摘要。
還有一些購物相關的事情。比如我在等某個東西上架,與其每天早上強迫性地檢查一次,我可以讓 Claude 去看。
Alex Heath:這是在搶球鞋嗎?
Mike Krieger:我應該用它來搶球鞋。但它可能還不夠快,搶球鞋需要更快的系統。
還有很多互聯網 rabbit hole,也就是那些你一不小心就鑽進去的資訊洞穴。當然,這裡有一個平衡:你不想完全移除這種樂趣。偶爾在互聯網上迷路,其實也挺有意思。但也許你可以更有意識地這樣做,而不是在後台無意識地刷來刷去。
Alex Heath:我自己是 Co-work 用戶,每天都用。我甚至用它來準備這次訪問,也用它寫作,幾乎所有事情都用它。它對我來說已經有點改變工作方式了。我還把它推薦給了我妻子和朋友。但我確實覺得它還很早期。大多數人可能還沒有像我這樣使用它。從產品角度看,Co-work 現在和傳統聊天、Claude Code 之間還是有些割裂。我不覺得長期來看它們應該是三個東西。
Mike Krieger:我同意。
Alex Heath:幾個月前我去你們辦公室時,你的一些同事也說,也許 Co-work 最終會成為一切的前端界面。
Co-work 是你加入 Labs 之前就有的 Labs 項目,對吧?但它發布時你還是 CPO。所以我很好奇,當初做 Co-work 的洞察是什麼?是不是你們突然意識到:要把 coding 的能力抽象出來,讓普通人也能用?這是一個機會?還是別的原因?
Mike Krieger:這裡我很想把功勞給 Dario。
Anthropic 在任何一個時間點都會同時思考很多不同事情:研究、產品、商業、算力、政策、社會影響等等。它不是一家典型公司,不是只有產品和 go-to-market 兩件事最重要,CEO 的注意力主要都放在那裡。
Dario 的注意力會根據當下最緊急的問題,在不同領域之間切換。Co-work 發布前不久,他對我們說:我最近看到一個很有趣的趨勢,有人在把 Claude Code 用於個人場景。但對大多數人來說,這件事很難,因為你得打開終端,而終端本身就很有門檻。
所以他提出了一個問題:如果我們做一個「面向所有其他事情的 Claude Code」,會是什麼樣?這是一個非常有用的啟發。也很符合他的工作方式。他不是給你一張產品草圖,也不是把產品完整定義好。
Alex Heath:那就是你的問題了。
Mike Krieger:對。他只是說:這是一個產品問題,你們去解決。後來真正讓 Co-work 成形的,是兩類人格的結合。當然,參與的人很多,但我會特別想到兩個人。
一個是 Felix,他是 Electron 的主要維護者之一,非常了解桌面軟體,或者至少非常了解桌面端 Web 軟體。他一直在思考一個問題:如何讓人在自己的電腦上完成工作?另一個是 Boris,他對 Claude Code 有非常深入的理解。
當我們把他們兩個人和各自團隊放到一起後,只用了幾周時間,就能把 Co-work 發布出來。並不是說所有工作都發生在那幾周,而是因為在 Claude Code 側和桌面側,之前已經積累了大量思考:如何讓不只是程式設計師的人,也能使用這種能力?
因為這些模型本質上已經是非常強大的代理能力引擎。問題在於,如何把這個引擎交給更多人。
但我完全同意你的判斷:現在它給人的感覺,有點像我們不是在發布組織架構圖,而是在發布我們的 harness strategy,或者說測試與運行框架策略。這個東西對大多數用戶來說並不容易理解。
Alex Heath:而且它也是一個不太好的產品體驗。比如,我在 Co-work 裡的線程不能同步到 Claude 移動端 App。也就是說,我沒法把之前一直在 Co-work 裡準備的採訪文檔,直接帶到手機上。
Mike Krieger:對。有些產品會自然指向它下一步應該怎麼演進。
比如我是 Dispatch 的重度使用者。Dispatch 允許你遠端訪問 Co-work,但前提是你的電腦必須開著。所以下一個很自然的問題就是:如果我不用一直讓電腦開著,那就更好了。那我們怎麼往這個方向演進?
Claude Code 已經走在這條路上了,只不過早了半年到一年。比如 Claude Code Remote,我一直在用。我人在外面,也可以啟動一個 coding 任務。很多時候,等我回到電腦前,它已經提交了一個 pull request。
你可以想像,Co-work 也會有類似的方向。
但我同意,我們現在確實處在一個階段:為了創新,我們讓很多東西先自然生長出來。這當然很好。但接下來,從上下文和連續性的角度看,你是在這裡對話,還是在那裡對話,不應該是使用者需要思考的問題。
我妻子就經常會問:我不記得了,那是我在 coding 裡做的?還是在 chat 裡問的?還是在 Co-work 裡做的?這說明抽象層是壞的,我們需要修復它。
Alex Heath:這一點其實很合理。因為我和 OpenAI 團隊交流時,他們現在的 super app 策略,以及他們圍繞 Codex 推進的方向,其實就是你們先用 Co-work 做出來的某種終局形態。
我很好奇,第一,你覺得這種「超級應用」的路徑是不是 AI 產品的正確方向?第二,這會不會給你們帶來更大壓力?因為我覺得 OpenAI 已經意識到,這是一個巨大的機會:把編程的能力帶給那些不會寫程式的人。
Mike Krieger:對,而且他們推進得非常快。
Alex Heath:Codex 也很不錯,新模型也不錯,Codex 對他們來說發展得很好。
Claude 之前在 coding 上有過非常大的增長,而且現在外界仍然普遍認為 Claude 在程式碼能力上領先。但 Codex 確實正在緊追不捨,對吧?
Mike Krieger:是的,它確實變得很強了。
我在 Instagram 最有趣的一些時期,恰恰是遇到像 Snap 這樣的競爭對手時。它和我們處在同一個空間裡,但方法又有所不同。在一個快速發展的市場裡,你會發現,有些想法是你從對方那裡借鑒的,有些想法則是對方從你這裡借鑒的。
Alex Heath:所以在這個類比裡,Anthropic 是 Snap 嗎?
Mike Krieger:我也不知道誰是誰。市場動態不一樣,市值也不太一樣。
Alex Heath:是,有點不一樣。
Mike Krieger:但公司氣質確實非常不同。
至少在我當時的理解裡,不是所有競爭最後都會演化成這樣,但 Instagram 和 Snap 那次競爭,在某種程度上確實是這樣:我們各自都有自己的優勢,也各自以不完全相同、但方向相近的方式看待未來。
問題變成了:每家公司如何演進,去抵達那些不同的位置?
以 Instagram 為例,我們過去給人的印象是,一周發一次非常精緻的照片。我們想走向一個地方:讓用戶更自由地分享。而能夠引入 Stories,對我們來說就非常關鍵。
對 Snap 來說,它們也想擁有更多 influencer 和 celebrity 相關的內容,因為那部分需求正在增長。所以雙方都要管理自己的演進路徑。
這個類比可能有點過度延展了。但回到我們身上,有 OpenAI 在這個空間裡是很有趣的。我覺得對我們來說,最重要的是兩件事。
第一,就是我們剛才討論的:要讓我們的產品體系變得更統一、更合理。無論是在網頁端還是桌面端,未必一定要是一個單一應用或超級應用,但至少你的各個構建模塊之間應該彼此連通,並且放在一起是有意義的。
第二,是繼續縮小能力與使用之間的差距。因為今天即便是 Co-work,或者我們現在的任何產品,也依然存在這個問題。
我剛才還和我們的一位招聘同事聊過。他是公司裡最極端的 Co-work 重度用戶,也是 Anthropic 內部非程序員裡 Co-work 使用量最高的人。你看他的工作流,會覺得非常驚人。
但即便在 Anthropic,大多數招聘團隊成員也不是那樣工作的。
所以,無論最終形態是不是 super app,目標都是一樣的:我們能不能創造出合適的產品形態,讓這位招聘同事的經驗迅速擴散,讓其他人也很容易採用類似工作流?或者讓每個人都能達到那種使用 Claude 的信心和熟練度?
Alex Heath:我本來今天還挺期待聽到更多關於 Co-work 的內容。雖然我知道這是開發者大會。我很好奇,Co-work 相比 Claude Code 發展得怎麼樣?它成長更快嗎?有沒有什麼數據?
Mike Krieger:我不確定相對於整體 coding 產品來說如何,因為 coding 本身成長得非常非常快。但 Co-work 的增長軌跡,至少和當時 Claude Code 的軌跡類似,甚至更快。這非常令人興奮。
我個人也非常興奮,因為我一直希望 Claude 的影響力能超出純碼場景。
現在幾乎每隔幾天,我們內部一個更偏生產力方向的 Slack 頻道裡,就會有人分享 Co-work 的新里程碑。這種增長真的很令人振奮。
我們和企業客戶交流時,他們也會說:很好,我們採用了 Co-work,然後也看到了這種現象——有些人真的理解它,有些人還需要很多手把手幫助,不同部門使用方式也不一樣。
這是一個好問題。因為它說明,在合適的人、合適的場景、合適的產品形態下,這個產品已經能做對事情。但中間確實還有差距。
我認為,一旦我們能讓大多數人不需要太多上手成本,就達到「哦,AI 真的在幫我工作」的狀態,它的增長還會進一步加速。
Alex Heath:說到競爭,我們大概一年半前在一個會議上聊過另一個話題:和客戶競爭。那時候你們還沒有發布 Claude Code 這個產品。
Mike Krieger:對。
Alex Heath:我們當時聊的是,像 Cursor 這樣的大客戶,如果你們自己也做類似產品,會怎麼樣?那時你作為 CPO 需要做這個判斷。現在你已經不是 CPO 了,應該不用再做這種決策了。
但現在情況怎麼樣?我們其實已經繞著這個問題聊了不少。比如 Claude Design 和 Figma 之間的爭議。你當時在 Figma 董事會,也因此退出了。Dylan 後來也說過一些挺友善的話,看起來這件事未必是針對你個人。
但這件事確實是一個例子。市場上很多人看到現在的趨勢,會覺得:天啊,Anthropic 好像要進入每一個關鍵垂直領域。Figma 那件事看起來尤其有點微妙。
Mike Krieger:這件事肯定比以前複雜了。我剛加入 Anthropic 的時候,我們只有 Claude.ai。我當時會覺得,這不太像在和誰競爭,它更像是一種全新的產品形態。
現在我們仍然會非常謹慎、非常認真地思考要做哪些產品。
我認為,只有當我們自己發布一個產品能帶來某種獨特價值時,這件事才成立。因為 Claude Platform 上有很多非常優秀的客戶,公司內部也有很多人非常投入地支持這些客戶成功。
所以問題在於:我們是不是在展示某個方向,讓行業看到一種可能性?理想情況下,這應該是一種水漲船高的效果,讓很多公司都開始採用這種思考方式。
Claude Code 就是一個很好的例子。此前很多注意力更多集中在編輯器裡,而不是終端裡。Claude Code 發布後,尤其是我們以那種方式發布、並給予它那麼多關注之後,整個行業在很大程度上都開始朝這個方向轉移。當然,之前也已經有人在思考終端場景。
這就是我對這些產品的希望。不是說它們要成為各自領域裡唯一的產品。如果那樣反而會很糟糕。我希望有多樣化的產品存在。
更理想的情況是:第一,它們在我們的產品組合裡是有意義的。比如,你在 Claude.ai 裡已經連接了所有 MCP,那麼這應該會讓其他產品也變得更好。
第二,它們能展示一種前進方向。比如 Claude Design,它很 agent-first,也就是非常強調智能體優先,並給 agent 很多控制輸出的空間。這會帶來一種非常具體的產品體驗。
對我來說,它在做 slides 這類事情時很有用。我可以和 agent 一起思考,同時也和它一起生產內容。
Alex Heath:你不認為它會蠶食 Figma 嗎?
Mike Krieger:我認為它們對應的是不同用例。
Figma 很強的地方在於 production、refinement 和 collaboration,也就是正式生產、精細打磨和協作。這些確實是 Figma 的強項。我很喜歡 Figma 團隊,他們把那個產品打磨得非常適合這個場景。
而我使用 Claude Design 的方式不一樣。因為我不是全職設計師。我更多是在生成某種視覺溝通材料,或者做一些交互探索。這裡的目的不是精細度或最終生產,而是早期 mockup 的感覺。
我曾經用 Claude Design 給我們的 iOS App 做過一個原型。它的像素效果和我們最終會發佈的東西差別很大,但它指出了一個方向:我認為我們應該能夠在這個空間裡做到什麼。所以它們都會繼續演進。我這裡用 Claude Design 和 Figma 舉例,但任何類似產品都是這樣:大家都在繼續向前。
我希望我們的好想法會進入其他產品,反過來也一樣。我認為大家其實是在一起探索:我們需要構建什麼樣的產品形態,才能最大化利用 agents?
我這周和一位研究員有過一次很好的對話。他說,越是限制 agent 的行為,越是嘗試對它進行過度具體的約束,裡面那些自然湧現出來的魔法就越不容易發生。
我覺得 Claude Code 很好地體現了這一點,Co-work 也在一定程度上體現了這一點。相比之下,Claude.ai 更像是你在聊天、在執行一些非常具體的事情。
我們會繼續構建這種形態的產品。它最重要的作用,是讓更多人理解這種範式,並把優秀體驗構建進自己的產品裡。
如果這些產品是由 Claude 驅動的,那當然很好。我們也希望 Claude 繼續成為最好的,或者至少是最好的 agentic underpinning 之一,也就是下一代 AI 產品背後的智能體基礎能力。
總結來說,這件事確實比以前複雜得多。但我們仍然會盡量沿用同樣的原則:非常謹慎地思考我們進入哪些領域,並確保平台側的建構模塊依然開放給大家。比如 Managed Agents。現在你可以基於 Managed Agents 構建出來的東西,和我們內部能構建出來的一樣強大。
除非出於安全原因,我們不會因為「保留模型能力能讓我們自己更有優勢」,就不發布某個模型。這是我們一直堅持的原則。
我們只有在認為一個完整產品確實表達了某種新東西時,才會發布它。
Alex Heath:所以你和 Dylan 關係還好?他以前也來過我們節目,所以我得確認一下。
Mike Krieger:我很喜歡 Dylan,也非常尊重他們正在做的事情。
Alex Heath:這是 Ellis 關於這個話題的另一個問題。現在,尤其是在早期創業圈,大家都在討論消費者創業公司是否還可行。大家會想:Anthropic 接下來會做什麼?下一個 Claude Design 會是什麼?OpenAI 接下來又會做什麼?
相比之下,企業級市場看起來好像更安全一點。Dario 今天還提到,他認為今年會出現一家「一個人做到十億美元」的公司。我猜那應該會是一家企業級公司。
但你怎麼看現在消費者創業公司的狀態?如果你回到當年和 Kevin 一起做 Instagram 的那個自己,面對今天這樣的環境,你會有什麼不同的做法?
因為世界已經變化很多了。現在做消費者創業,看起來更難了。
Mike Krieger:我覺得,如果把消費者產品的 breakout,也就是破圈增長,做一個極度簡化的拆解,大概需要兩個東西。
第一,是某種新的能力或新的形態。對我們來說,當年就是拍照手機。現在已經沒有人再叫它「拍照手機」了,因為手機有攝像頭已經是默認功能。或者,也可能是更豐富的媒體形式,比如 TikTok、Reels 這類產品,因為那時候流媒體能力已經成熟了。
第二,是一個能讓你破圈的分發機制。
對我們來說,當年還是一個有點「西部世界」的時代。你可以把 Instagram 照片分享到 Facebook、Twitter、Tumblr,還有 Posterous——這也暴露了 Instagram 是多早期的產品。所有這些平台都允許你自由鏈接回自己的產品,所以你可以形成一個增長循環。
但今天已經完全不一樣了。
我和一些創始人聊天,比如 Locket 的創始人 Matt。他們找到了一些方式,比如你可以進入 TikTok 上的對話場域,由此帶來一些有趣的增長時刻。
但我認為,現在的分發生態更難預測,也更不可控。
所以,比起任何一個 AI 玩家,我覺得這可能才是現在最大的趨勢或者最大挑戰:當你面對這樣的分發生態時,你怎麼實現破圈?
以前你可能是在和 Facebook 競爭用戶時長。我隨口舉個例子,也許當時 Facebook 的日均使用時長是 15 分鐘。但現在你是在和 TikTok 競爭。我猜 TikTok 的日均使用時長可能超過一小時。這其實挺瘋狂的,但現實就是這樣。你要試圖從那裡搶走一部分注意力。
所以,如果你需要那兩個要素:新的能力或形態,以及新的分發機制。那麼在前者上,也許會是某種和 AI 驅動的存在之間的新型互動;或者反過來,是 AI 幫你走出門、去「touch grass」,也就是回到現實世界,產生更多真實互動。
無論是哪種,你仍然必須解決第二個問題:分發。
現在很多注意力正在轉向這些聊天智能體。但我不認為有人真正想清楚了:在聊天裡「病毒式傳播」到底意味著什麼?今天這個問題甚至有點不成立。
也許這裡會出現某種新東西。比如我們推出了 MCP apps,作為一個開放標準。
Alex Heath:這可能會變成一種新的應用商店式分發,對吧?
Mike Krieger:有可能。你可以把應用接進來。也許第一個真正病毒式傳播的 MCP app,會是某種偏消費者的東西。那會很有趣,因為這可能是一種新的分發機制。
我之前和一个非营利 explorer 项目的人聊过。我们曾经写过一篇文章,介绍 MCP 如何被用于某些场景。他说,很有趣的是,他看到了对一个非营利 explorer 项目来说,所谓「病毒式增长」意味着什么。
那个数字当然不是特别大,但他说,他去看 connector 列表的时候,他们有几天排在前五,旁边就是 Gmail 和 Slack。这给他们带来了很多关注。
所以我现在有点是在和你一起边想边说。这也是这种对话有趣的地方。我们未必能马上得到一个完美答案。但也许我们接下来会看到这样的事情:你能不能在 Claude、ChatGPT 或 Gemini 这样的框架里提供足够强的实用价值,然后找到一种有趣的传播方式?
我很期待看到这种事情发生。
Alex Heath:你最近和 Every 的 Dan Shipper 錄過一期播客。我聽了那期,你們聊到你用 Claude 重建了 Burbn。對不了解的人來說,Burbn 是 Instagram 之前的那個應用,後來你們把它轉型成了 Instagram。Claude 幾分鐘內就把它做出來了。
我很好奇,第一,從情感上來說,看著 AI 幾分鐘內做出你和 Kevin 當年花了很久才做出來的東西,你是什麼感受?第二,如果 2010 年的 Mike 能用到今天的 Claude,Instagram 還會出現嗎?
Mike Krieger:這是個很好的問題。
Alex Heath:因為我猜 AI 也許不會自己找到那個方向。
Mike Krieger:對。我當時做完之後的感受是:第一,我非常清楚自己讓它做什麼。而且我也跟 Dan 說過一個很有意思的點:它其實過度構建了。它在 Burbn 里做了濾鏡,但 Burbn 當時並沒有濾鏡。我們是後來發布 Instagram 時才加入濾鏡的。
因為 Burbn 完全是基於 Web 的。當時也沒有像 WebGL 這樣的東西可以做濾鏡。所以看到它會自己補出這個東西,挺有趣的。
但我認為,回到我們剛才關於 Anthropic 內部創始人團隊的討論,產品工作中很大一部分,仍然是提出那些難問題,把產品拿給真實用戶看。
我既喜歡又討厭第一次把產品拿出去時被用戶「迎面打臉」的感覺。有人會說:這是什麼?我完全不知道怎麼用。或者:我好困惑。
我畢業後的第一份工作就是 UX researcher,每週都會把人請進實驗室做測試。我到現在仍然喜歡這件事。你把人帶進來,對最終用戶來說,這個產品是 Claude 寫的,還是人手寫的,其實完全不重要。他們只關心:這個產品有沒有用?能不能用?它有沒有創造出某種令人愉悅的瞬間?
這些事情仍然很難。Claude 不會替你解決這些問題。所以,如果 2010 年我們有 Claude,當然會有很多地方讓我們交付更快,尤其是當要做什麼已經很明確的時候。
比如我們發布後,很快就知道要做 @mentions。那可能需要一周時間,從用戶界面到文本佈局引擎,再到伺服器端持久化,中間要處理很多細節。如果當時有 Claude,我們肯定可以更快完成,並更快給用戶交付價值。
但從 Burbn 到 Instagram 的那段旅程,我不認為 Claude 會改變太多。除了某些 coding 衝刺階段,它會讓我們更快。至少在當時,我並不覺得從 0 到 1 的編碼本身經常是限制因素。真正的限制因素是思考和探索過程。
所以我想說的是:難的事情依然很難。
我有一個擔憂:如果 LLM 開箱即用地替你做了太多決策,它會不會反而阻礙你找到那個更不正交、更意外的產品形態?
當然,你也可以反過來利用它。你可以說,好,幫我生成三個替代方案,然後我來看哪個感覺對。我自己也這麼做過。
但它絕對不會讓你免於做艱難的產品決策。事實上,你更需要做這些決策。
Alex Heath:我覺得這件事變得更重要了。
我在自己的工作裡也有這種感覺。我的工作不是寫軟體,而是做媒體。我可以把更多事情交給 Claude,可以讓 skill file 盡量提醒它我喜歡什麼風格,等等。
但當我真正讀它產出的東西時,我還是會想:嗯,不完全對。然後我會像在編輯部裡和記者溝通一樣和它溝通。
Mike Krieger:是的。
Alex Heath:我覺得,隨著它能力變強,這種能力反而更重要。因為我不想在這個過程中失去自己的直覺。我感覺很多人可能因為 AI 編程太快發展起來,開始有點過度讓渡給它。我希望我們之後能重新回到一種更平衡的狀態。
Mike Krieger:我覺得人的直覺依然非常重要。我很喜歡你說的「記者和編輯」的比喻。除非記者已經完全跑偏,否則大多數時候,編輯面對的是一篇已經接近你想要的稿子。
Alex Heath:我以前確實遇到過完全跑偏的情況。
Mike Krieger:但大多數時候,編輯可能會覺得:這篇稿子已經有 90% 接近我想要的狀態了,再改一改能到 95%;或者它現在是 80 到 85 分。
但如果你從一開始就參與塑造,也許你可以更接近 100%。當然,這些東西並不能被精確量化。
我在 Labs 內部構建東西時也有這種體驗。我現在學到的是:最好在 Claude 寫任何一行代碼之前,先和它進行更充分的對話,把東西推敲清楚。然後我會說,好,現在這個方向感覺對了,我們已經有效地協作出了一份 spec,現在你去實現它。
如果我只是給它一個高層級功能描述,它確實會把功能做出來。我們正在構建的所有驗證機制,也會確保它在功能上能運行。
但之後我再看,就會覺得:如果是我,我會稍微換一種方式做。可問題是,它已經做完了。那種「不完全對」的感覺,我不太喜歡。
所以,我們正在轉向一種方式:先把北極星表達清楚,然後幫助 Claude 高效、有效地收斂到那個北極星。
公司內部有人說得很好:我們用 Claude 編程時,整個工作的核心就是清晰表達 north star,也就是最終方向,然後幫助 Claude 朝這個方向收斂。
這就是一種 guide,某種意義上也是 manager。當然,軟件裡的 manager 通常更多是關於人的發展。所以也許更像 architect。但我還沒有找到一個特別好的詞。
它更像是项目和 Claude 的「嚮導」或「夏爾巴人」:你帶著它一起朝目標前進,而不是指望它一上來就自動完成,也不是你完全不參與早期方向塑造。
Alex Heath:Instagram 和 Anthropic 之間有很多有趣的相似之處。我記得 Instagram 早期有一個問題也讓你們很頭疼:算力,或者說承載 App 的伺服器能力。你們當時沒有足夠的伺服器。有一刻,你們必須想辦法解決這個問題。
Mike Krieger:是的。
Alex Heath:而且那筆交易來得非常快。
現在很有趣的是,十多年過去了,算力依然是問題。雖然我知道你不是直接負責算力的人,但我想,在 Anthropic 內部,算力一定是你們經常要思考的問題。你當初加入這家「小 AI 實驗室」時,可能也沒有預料到這一點。
Mike Krieger:有兩個小片段很能說明這一點。第一個也能說明,這兩年我確實學到了很多。
Claude 3.5 發布的時候,發布當天,雖然那時我們規模遠比現在小,但用戶已經開始快速採用。我們幾乎快把當時分配給我們的晶片資源全部打滿。
我記得我問基礎設施團隊:好,那如果資源用完了,我們怎麼辦?是不是直接加容量就行?
因為在我過去 Instagram 的世界裡,除非你用的是 AWS 上某種非常特殊的硬體,否則外面總還有更多硬體可以用。
結果他們說:不,不,不。如果這些資源用完了,那就真的用完了。那些 GPU 都已經完全分配出去了。當然,我們正在努力拿更多資源。
我當時意識到:哦,這是一個非常不同的環境。你不能像過去那樣直接點一下「新建實例」就解決問題。
Alex Heath:所以這就是你們現在看起來要和 Elon 一起上太空的原因。
Mike Krieger:完全正確。我們確實在尋找新的、甚至有些意想不到的算力來源。那對我來說是一個非常快速的學習過程。我馬上就理解並內化了這件事。
我們現在確實會大量思考算力問題。即便是在單個產品裡,你也不希望牺牲智能水平。所以問題變成了:如何盡可能多地交付智能能力,同時不要浪費算力?比如,哪些事情可以異步處理?什麼時候必須使用最大的模型?什麼時候可以用較小模型?
所以,算力確實是一個重要考量。我覺得從很多角度看,這也是健康的。它還讓我們更接近客戶的處境。你剛才提到客戶問題,他們也生活在一個世界裡:他們本質上是在購買 token,然後再把這些 token 以某種產品形式轉售出去。
所以我們在很多方面和他們是一致的,都希望這個生態是健康的。過去一年,你已經看到市場更明顯轉向 token-based pricing 或 usage-based pricing,也就是按 token 或按使用量計費。
我記得一年前看這個生態時,我會想:我們的客戶想收更高價格,或者說想交付更多價值,但他們受到當前定價模型的限制。
而現在,越來越多客戶可以真正圍繞智能能力交付價值,或者至少讓用戶自定成本和能力之間的關係。比如你可以說:我想優化成本,那我就使用一個沒那麼前沿的模型,但我知道自己能得到什麼價值;或者我真的想把這件事做好,那我就用 fast mode,多消耗 token,因為我有這個可以調節的旋鈕。
所以,是的,在 Anthropic,算力顯然比在 Instagram 時代更重要。但某種程度上又有相似之處:Instagram 當時的增長也像指數級增長,至少如果你去算的話是這樣。
Alex Heath:Dario 說你們 Claude Code 在第一季度大概增長了 80 倍。我不知道 Instagram 有沒有過 80 倍增長。
Mike Krieger:沒有。我覺得除了第一周那種從 100 到 10 萬的階段之外,我們確實有非常穩定、非常不錯的百分比增長,但沒有像這樣。
Alex Heath:我們可以在這裡收尾。你在 Anthropic 已經算很早期了。雖然我說「早期」,其實也已經兩年了,但在 AI 世界裡,這仍然很早。
Anthropic 的文化讓我覺得非常有趣。我與公司裡的人接觸越多,就越能感受到這一點。許多人從外部看 Anthropic,會看到各種標題,看到 Mythos,看到 Dario 談到也許 50% 的工作會消失。許多人會說:他們只是在製造恐慌,或者這裡面有監管俘獲的策略。
但我發現 Anthropic 的文化非常獨特。我很好奇,在你看來,外界對 Anthropic 的理解,與 Anthropic 內部真實相信自己在做什麼之間,最大的斷裂在哪裡?
Mike Krieger:這是一件很難讓別人相信的事。因為我可以一直說:我們是一家非常透明的公司。我們說出來的,就是我們真實想的。
Dario 可能是我見過最直言不諱的人。他說出自己的想法,並不是經過精心計算:「這樣講會不會幫我融下一輪資?」完全不是這樣。
我和他逐漸熟悉之後,看到他在內部和外部如何行事,我很清楚,這不是他溝通或推出產品策略背後的驅動力。當然,說是一回事,長期做出同樣的行為是另一回事。
但也許我可以用一個內部例子來說明。今年從商業增長、使用量增長等角度看當然都很好。但我認為,公司之所以仍然保持 grounded,也就是沒有失去重心,是因為 Anthropic 的目標並不是建立一家龐大的商業公司。
Anthropic 的目標是盡我們所能,把世界推向一個更好的 AI 未來。一旦你從這個視角看所有事情,它就能解釋很多後續決策。
當然,我不能要求別人不要保持懷疑。最終,我們還是必須繼續通過行動證明:我們不是在製造恐慌,也不是因為覺得這樣會讓自己顯得更前沿,就故意壓住某些東西不放。
我舉一個例子。公司內部的信念是:我們應該能夠安全地發布一個 Mythos 級別的模型。而到目前為止我們還沒有做到,這其實是一件不好的事情。我們並不為此感到驕傲。
因為如果我們把這件事做對了,所有正向用例就都可以發生。剛才我們聊到生命科學,在 Mythos 這類模型上,那裡確實可能出現很多有趣的東西。我自己也在內部用 Mythos 寫了很多軟體,它在這方面真的很強。
Alex Heath:你的內部軟件不會有網路安全風險,對吧?
Mike Krieger:對。我們確實已經想辦法盡可能安全地做這件事。但這就是我們看世界的方式。我們想把這些能力交到人們手裡,並不想壓住它們。我們正在非常努力地工作,避免能力因為安全問題而無法釋出。
所以,這確實需要我們證明。我覺得外界要求我們證明這一點,是公平的。
但當我看到有人說:「他們只是想推高下一輪估值」「他們只是想顯得自己很厲害」「他們其實根本不相信這些話」時,至少在你願意相信我的範圍內,我可以說,這不是 Anthropic 內部真正的驅動力。
不過,還是那句話,我們的任務是用時間證明這一點。
Alex Heath:最後一個問題。當有人來找你說:Mike,我很擔心自己的工作。我也擔心我的家人、孩子、祖父母的經濟安全。你會怎麼回答他們?
Mike Krieger:我不會告訴他們「不用擔心」。因為我確實認為,會發生很大的變化。我們不知道它會有多快。大家可以對時間線有不同判斷,但變化已經在發生。
最近我收到一類郵件,很多是我在社交或職業場合認識的人,他們的孩子剛大學畢業。他們會問:我們該怎麼辦?我通常會告訴他們一件我自己相信的事:這個問題不是一家公司,也不是政府的某一個部門可以解決的。它需要一種社會層面的對話。
如果說我們一直在嘗試做什麼,那就是推動這場對話發生。雖然這有時候會被解讀成製造恐慌。無論是不同的稅收結構,還是 reskilling,也就是再培訓和技能重塑,實際上都需要一起發生。我想你也看到,我們最近在一些政策提案上開始變得更具體。
如果真的要回答一個人,這會是一個很長的答案。因為問題本身很複雜。但我會告訴他們:你不是一個人。這是一個共同面對的、複雜的問題。
我也相信,有些東西仍然會保持人類性、難以言說且非常重要。比如關係、好奇心、創造力,以及把一群人組織起來朝某個目標前進的能力。這些仍然會非常非常重要。我不認為 AI 會很快取代這些東西。
如果你能掌握這種能力,或者至少持續培養、持續滋養它,我認為這非常重要。
另外,也不要把現在這個時刻看成一種固定狀態。事情還會繼續變化。即便在當下這個充滿不確定性、甚至有些艱難的時刻,某個朋友的孩子沒有拿到自己最想要的工作,也不代表事情就定型了。沒有什麼是一成不變的。
如果人們能保持好奇,持續主動探索前沿到底是什麼,他們也許會參與創造一個全新的職業類別,或者在自己的公司裡走向另一個位置。
我認為整個格局還會繼續變化。所以,不要把當前這個不確定、困難的階段,看成一個會把所有人鎖死的靜態狀態。
Alex Heath:好,Mike,我就讓你回實驗室了。謝謝你來聊。
Mike Krieger:很高興見到你。
Alex Heath:謝謝。
Mike Krieger:謝謝。
[視頻鏈接]
歡迎加入律動 BlockBeats 官方社群:
Telegram 訂閱群:https://t.me/theblockbeats
Telegram 交流群:https://t.me/BlockBeats_App
Twitter 官方帳號:https://twitter.com/BlockBeatsAsia