header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
掃碼下載APP

a16z AI方向合夥人的八年創業筆記

閱讀本文需 14 分鐘
生成式人工智能的第一階段正在收尾,行業正轉向產品化與規模競爭
原文標題:Notes From 8 Years as a Founder in Generative AI
原文作者:@lishali88
編譯:Peggy,BlockBeats


編者按:本文來自一位生成式 AI 早期創業者的八年復盤。在 GPT 尚未出現的 2018 年,他創立了 Rosebud AI,圍繞「讓創作像玩遊戲一樣簡單」這一目標,連續推出包括 TokkingHeads 在內的多款 AI 創意工具。在模型能力尚不成熟的階段,這些產品通過設計流程與互動,放大「將就但好用」的體驗,完成了早期用戶增長與產品驗證。


這段經歷,幾乎覆蓋了生成式 AI 從「合成媒體」到通用能力基礎設施的完整演進周期:從 CycleGAN、StyleGAN 的實驗性探索,到 GPT-4 打開程式碼生成與互動式創作的邊界,技術進步不斷重寫產品邏輯與創業節奏。作者的路徑也折射出一個更清晰的結構變化——當模型成為變數,真正的分水嶺不再只是技術本身,而是如何圍繞其構建產品、分發與商業化。


在卸任 CEO 並加入 a16tz 後,作者將轉向投資前沿模型棧與相關基礎設施。但比個體路徑更重要的是,這八年的經驗指向一個正在成形的趨勢:生成式 AI 的第一階段(證明能做什麼)正在結束,接下來是更長周期的競爭,將圍繞能力如何被組織、被產品化,以及最終進入真實世界展開。


以下為原文:


我已加入 a16z,擔任合夥人,專注於基礎設施和 AI 方向的投資。同時,在執掌 Rosebud AI 8 年後,我也將卸任 CEO 一職。


下面是我對這 8 年的一些回顧與反思。對於當下仍在一線構建的人,我懷有極大的敬意。一次模型的發布,可能吞掉你原本的產品路線圖,也可能把它整體提前數年。設計、產品、工程——這些職能的形態,與 3 個月前相比都已發生變化,更不用說與 8 年前相比。技術進步的速度,讓這個時代成為最令人興奮的創業時刻,同時也最具挑戰。


在 a16z,我將重點關注前沿模型棧(frontier model stack):包括模型本身,以及圍繞模型構建的基礎設施與開發工具。我對模型能力的快速演進感到興奮——越來越多的進展正由 AI 本身驅動。同時,我也看好 AI 在數學與科學領域所帶來的突破。此外,由於過去 8 年一直在打造 AI 創意工具,我對這一方向始終抱有特別的興趣。


在此之前,我也以天使投資人的身份參與過一些種子輪投資,包括 @fal、@periodiclabs、@SakanaAILabs 和 @ExaAILabs。接下來,我很期待能將全部精力投入到支持那些正在構建這一技術棧的創始人身上。


2018:在 GPT 出現之前,押注生成式 AI。



2018 年 11 月,我用 CycleGAN 處理《Myst》遊戲畫面,嘗試將森林轉化為熱帶叢林的實驗視頻

在生成式 AI 領域做一家創業公司,8 年是一段相當漫長的時間。


我從 2018 年末開始,那幾乎還是一個「上古時代」,當時這個領域還被稱為「合成媒體(synthetic media)」。我在擺弄 CycleGAN 和 StyleGAN,它們生成的內容既奇異又迷人,讓我相信:有一天,創作會像玩遊戲裡的建造模式一樣輕盈自如(「rosebud」這個名字也正是來自 The Sims 模擬人生)。


創作在最理想的狀態下應該是一種玩耍。而生成式 AI 最早的微光,讓我相信,這種「像玩一樣的創作體驗」可以擴展到更多創作形式中。我開始揣想,生成式 AI 會如何重塑電子遊戲(比如我在 2018 年基於《Myst》畫面訓練的那段 CycleGAN 視頻)。


轉眼 8 年過去,如今我們已經可以通過一句提示詞生成視頻、遊戲甚至音樂。那個曾經想象中的未來,終於到來——而這還只是開始。


回頭看,我之所以能在這麼早階段就形成如此強烈的信念,或許是因為我的人生一直處在技術與藝術的交叉點:一邊是數學和深度學習的博士背景,一邊是舞蹈和音樂的藝術熱情。生成式 AI 的創業恰恰需要兩者兼備:技術背景讓我看見了正在到來的東西,藝術倾向讓我迫不及待地想把它建出來。


創業的旅程總比想象中更長、更艱難。找到一件你近乎非理性地相信的事,才能最大化堅持下去的概率。



2017 年的 CycleGAN,我們已經走了很遠

2018—2023 年:用"將就好用"打動用戶



第三款 iOS 應用程式 Tokkingheads 介面截圖。早期生成式 AI 的核心是設計簡潔流程並主動擁抱產品的粗糙感


這一路走來,我們發布了大量產品,目的是磨練對前沿模型能力的直覺,並學會將其包裝成能掩飾早期缺陷的魔法體驗。那個階段我領悟到:當模型輸出遠未完美時,你可以設計出讓用戶快速迭代、快速反饋的消費級體驗。用戶挑剔,但不脆弱——用將就好用打動他們就夠了。


到第三款移動應用時,我們積累了足夠的認知,讓 Tokkingheads 實現了自然增長的病毒式傳播,數周內用戶突破 200 萬。下一個關鍵教訓隨之而來:作為創始人,你必須清楚什麼樣的產品形態能讓自己長期保持動力。Tokkingheads 本可以走向刷屏爆款的路,但我不確定那是不是把這種創作魔法發展成更完整產品的正確土壤,而那個更完整的產品,才是我真正想要的。


於是我們繼續迭代。我們做過 AI 生成圖庫照片、NFT 配套的 AI 藝術(是的……我天真地以為作品品質才是關鍵,結果發現真正重要的技能是炒作投機),以及 AI 遊戲素材生成工具。每一款產品都教會了我一些具體的東西:用戶願意為什麼付費,模型又在以多快的速度改進。夾在這些項目之間的,還有一場全球大流行病,以及硅谷銀行與第一共和銀行擠兌風波——這些提醒我學會感恩。能夠繼續構建,本身就是一種特權。


2023 年:程式碼生成走向成熟


程式碼生成終於足夠好用,時機成熟,可以為非技術創作者打造遊戲工具了。GPT-4 發布之後,那個未來變得具體可感。2023 年 3 月,我向團隊分享了一份備忘錄,並用下面的原型拼湊出 Rosebud 文字轉遊戲功能的最初版本。



2023 年 3 月 23 日推文截圖。我使用 GPT-4 學習 Three.js,結合 Rosebud 生成式 AI 生成天空盒,演示通過文字召喚 3D 場景的早期原型



2023 年初,作者寫給團隊的內部備忘錄,記錄程式碼生成能力突破後的產品判斷。這封內部信的核心判斷是:AI 正處於一個將決定未來數十年的關鍵窗口期,而接下來的兩年將成為高度激烈的競爭階段,節奏快、強度高、淘汰明確。公司將全力投入這場「衝刺」,只適合那些具備強烈內在驅動力、願意承受高壓並長期投入的人參與——因為這不僅是一段工作經歷,更是一次可能改變個人職業軌跡的歷史性機會。


2026 年及以後:你能打造哪些實驗室不願做的事情?



圖:演示視頻——作者通過提示詞在瀏覽器端搭建 3D 城市模擬遊戲


做遊戲,需要同時調動創意直覺與技術能力。生成式 AI 是讓遊戲創作本身變成一種玩耍的關鍵——無論是圖像、視頻、世界模型還是程式碼方面的任何模型進步,都會被立即吸收轉化。遊戲的商業模式也最有可能留在前沿實驗室的視野盲區之外:核心變現路徑依然是玩家付費,而建立玩家側的分發體系,對於奔著 AGI 全速衝刺的實驗室來說,似乎是一條過於迂迴的支線任務。對於創始人而言,選擇構建什麼,永遠是一場在實驗室關鍵路徑之外尋找空間的持續博弈。


Rosebud 勢頭正旺。我們有機地積累起一批規模龐大、高度活躍的創作者社群。我會懷念在 Discord 上與創作者的閑聊,以及每天處理用戶支持郵件的日子(一個願意投訴的用戶,一定是真的在乎你的產品)。下一階段的重心是擴大玩家端的分發規模,因此現在正是將接力棒交給一直並肩作戰的隊友的好時機。


祝賀 @glazworks 接任 Rosebud 新任 CEO!他身上罕見地兼備機器學習天賦與產品審美。


Martin Casado(馬丁·卡薩多)和 a16z 團隊全程陪伴了 Rosebud 的成長。我和 Martin 有過一次關鍵對話,討論 JavaScript 是否是 Rosebud 遊戲的正確技術棧——選 Unity 或 Roblox 或許更熱門,但 JavaScript 的程式碼生成改進速度要快得多,因為訓練數據的可及性更高。這支團隊追求真相,願意押注能夠帶來更多建設者的賭注。這是走向理想未來的路徑:我們必須構建,我們必須創新。


期待從桌子的另一邊與大家繼續共事。私信隨時開放。


[原文鏈接]



歡迎加入律動 BlockBeats 官方社群:

Telegram 訂閱群:https://t.me/theblockbeats

Telegram 交流群:https://t.me/BlockBeats_App

Twitter 官方帳號:https://twitter.com/BlockBeatsAsia

举报 糾錯/舉報
選擇文庫
新增文庫
取消
完成
新增文庫
僅自己可見
公開
保存
糾錯/舉報
提交