首頁

快訊深度數據 Skill&API

中國人工智慧為什麼發展得這麼快？答案藏在實驗室內部

閱讀本文需 27 分鐘

一位美國工程師眼中的中國人工智慧實驗室

原文標題：Notes from inside China's AI labs
原文作者：Nathan Lambert
編譯：Peggy，BlockBeats

編者按：中國 AI 實驗室正在成為全球大型模型競爭中越來越難忽視的力量。它們的優勢不僅是人才多、工程強、迭代快，更來自一種非常現實的組織方式：少談概念，多做模型；少強調個人明星，多強調團隊執行；少依賴外部服務，更傾向於自己掌握核心技術棧。

本文作者 Nathan Lambert 走訪了多家中國頭部 AI 實驗室後發現，中國 AI 生態和美國並不完全一樣。美國更重視原創範式、資本投入和頂尖科學家的個人影響力；中國則更擅長在已有方向上快速追趕，通過開源、工程優化和大量年輕研究者的投入，把模型能力迅速推向前沿。

最值得關注的，不是中國 AI 是否已經超過美國，而是兩種不同的發展路徑正在形成：美國更像是由資本和明星實驗室驅動的前沿競賽，中國則更像是由工程能力、開源生態和技術自控意識共同推動的產業競賽。

這意味著，未來 AI 競爭不只是模型排行榜之爭，也會是組織能力、開發者生態和產業執行力之爭。中國 AI 的真正變化，正在於它不再只是複製硅谷，而是在用自己的方式參與全球前沿。

以下為原文：

坐在從杭州開往上海的新式高鐵上，我望向窗外，看到起伏分明的山脊，山上點綴著風力渦輪機，在落日映照下形成剪影。群山構成了背景，眼前則是大片田野與成片高樓交錯的景象。

我帶著極大的謙遜從中國返回。去到一個如此陌生的地方，卻受到如此熱情的歡迎，這是一種非常溫暖、也非常具有人情味的體驗。我有幸見到了許多 AI 生態中的人，他們是我此前只在遠處知道的人；而他們用燦爛的笑容和熱情迎接我，讓我再次意識到，我的工作以及整個 AI 生態本身，都是全球性的。

中國研究者的心態

正在構建語言模型的中國公司，可以說非常適合作為這項技術的「快速跟隨者」。它們建立在中國長期以來的教育與工作文化傳統之上，同時也有著與西方略有不同的技術公司建設方式。

如果只看產出，也就是最新、最大的模型，以及這些模型所支持的智能體式工作流；再看投入要素，比如優秀的科學家、大規模數據和加速計算資源，那麼中國實驗室和美國實驗室看起來大體相似。真正長期存在的差異，出現在這些要素被如何組織、如何塑造之中。

我一直認為，中國實驗室之所以非常擅長追趕並保持在前沿附近，一個原因在於它們在文化上與這項任務非常匹配。但在沒有直接和人交流之前，我覺得自己不適合把這種直覺歸因於某種重要影響。與中國頂尖實驗室中許多優秀、謙遜且開放的科學家交談之後，我的很多想法變得更加清晰了。

今天要構建最好的大語言模型，很大程度上取決於貫穿整個技術棧的細緻工作：從數據，到架構細節，再到強化學習算法的實現。模型的每一個環節都有可能帶來一些提升，而如何把這些提升組合在一起，是一個複雜過程。在這個過程中，一些非常聰明的個人所做的工作，可能必須被擱置，以便讓整體模型在多目標優化中達到最大化。

美國研究者顯然也非常擅長解決單個組件的問題，但美國更有一種「為自己發聲」的文化。作為科學家，當你主動為自己的工作爭取關注時，你往往會更成功；而當代文化也正在推動一種新的成名路徑，也就是成為「頂尖 AI 科學家」。這會帶來直接衝突。

外界廣泛傳聞稱，Llama 組織曾在這些利益訴求嵌入層級化組織之後，因政治壓力而崩潰。我也聽其他實驗室說過，有時可能需要「安撫」一位頂尖研究者，讓他們停止抱怨自己的想法沒有被納入最終模型。無論這是否完全屬實，意思都很清楚：自我意識和職業晉升欲望，確實會妨礙人們構建最好的模型。美國和中國之間，哪怕只是這種文化上的一個小幅方向性差異，也可能對最終產出產生有意義的影響。

其中一部分差異，和中國到底是誰在構建這些模型有關。在所有實驗室裡，一個很直接的現實是：核心貢獻者中有很大比例是仍在讀書的學生。這些實驗室都相當年輕，這讓我想起我們在 Ai2 的組織方式：學生被視為同伴，並被直接整合進大語言模型團隊。

這和美國頂尖實驗室非常不同。在美國，OpenAI、Anthropic、Cursor 等公司根本不提供實習機會。Google 等其他公司名義上會提供和Gemini 相關的實習，但很多人都會擔心，自己的實習會不會被隔離在真正核心工作之外。

總括來說，這種輕微的文化差異，可能通過以下方式提升模型構建能力：為了提升最終模型，人們更願意去做那些不那麼光鮮的工作；剛開始參與 AI 構建的人，可能不受此前幾輪 AI 炒作周期的影響，因此能夠更快適應新的現代技術方法。事實上，我交談過的一位中國科學家非常明確地把這一點視為優勢；較低的自我意識，讓組織架構在一定程度上更容易擴展，因為人們較少嘗試「玩弄系統」；大量人才非常適合解決那些在別處已經有概念驗證的問題，等等。

這種更有利於構建當下語言模型的能力傾向，與一種已知刻板印象形成對照：人們常認為，中國研究者較少產出那種更具創造性、能夠開拓新領域的「從 0 到 1」的學術研究。

在此次行程中幾次更偏學術的實驗室訪問裡，許多負責人都談到，他們正在培養這種更具雄心的研究文化。與此同時，我們交談過的一些技術負責人則懷疑，這種科學研究方式的重塑在短期內是否可能實現，因為它需要重新設計教育體系和激勵體系，而這個改造太大，很難在當前經濟均衡下發生。

這種文化似乎正在訓練出一批非常擅長「大語言模型構建遊戲」的學生和工程師。當然，他們的數量也極其充足。

這些學生告訴我，中國也正在發生與美國類似的人才外流：許多此前考慮走學術道路的人，如今打算留在產業界。其中最有趣的一句話來自一位原本想當教授的研究者，他說自己想當教授，是因為希望接近教育系統；但他隨後又評論說，教育已經被大語言模型解決了——「學生為什麼還要來找我聊天！」

學生們帶著新鮮眼光進入大語言模型領域，這是一個優勢。過去幾年裡，我們看到大語言模型的關鍵範式不斷變化：從擴展 MoE，到擴展強化學習，再到支持智能體。要把這些事情中的任何一件做好，都需要極其快速地吸收大量背景信息，既包括更廣泛的文獻，也包括所在公司內部的技術棧。

學生習慣於做這類事情，也願意帶著謙遜心態放下對「什麼應該有效」的所有預設。他們一頭扎進去，把人生投入其中，只為獲得改進模型的機會。

這些學生也非常神奇地直接，並且沒有一些會讓科學家分心的哲學閒談。當我問他們如何看待模型的經濟影響或長期社會風險時，擁有複雜觀點，並希望在這些議題上施加影響的中國研究者明顯少得多。他們認為自己的角色就是構建最好的模型。

這種差異很微妙，也很容易被否認。但當你和一位優雅、聰明、能夠用英語清晰表達的研究者進行長時間交談時，它最容易被感受到：當你問起一些關於 AI 的更哲學層面的問題，這些基礎問題會懸在空氣中，而對方流露出一種簡單的困惑。對他們來說，這是一種範疇錯誤。

甚至有一位研究者引用了 Dan Wang 的著名判斷：相較於由律師主導的美國，中國是由工程師治理的。在談到這些問題時，他用這個類比強調他們想要建設的願望。在中國，並沒有一種系統性路徑，能夠像 Dwarkesh 或 Lex 這類超級主流播客那樣，培養中國科學家的明星影響力。

我試圖讓中國科學家評論由 AI 引發的未來經濟不確定性、超越簡單 AGI 能力的問題，或者模型應該如何表現的道德爭論；這些問題最終都讓我看到了這些科學家的成長背景和教育背景（已編輯 1）。他們極其專注於自己的工作，但他們成長於一個並不鼓勵討論和表達社會應如何組織、如何改變的體系。

把視角拉遠看，尤其是北京，給我的感覺很像灣區：一個有競爭力的實驗室，可能就在步行或打車幾分鐘之外。我下飛機之後，在去酒店的路上順便去了阿里巴巴北京園區。接下來的 36 小時裡，我們去了智譜 AI、月之暗面、清華大學、美團、小米和 01.ai。

在中國坐滴滴出行很方便。如果你選擇 XL 車型，經常會被分配到帶按摩椅的電動小型面包車。我們向研究者詢問人才爭奪戰，他們說這和我們在美國經歷的非常相似。研究者跳槽很正常，而人們選擇去哪裡，很大程度上取決於當下哪裡的氛圍最好。

在中國，大語言模型社區給人的感覺更像一個生態系統，而不是彼此交戰的部落。在許多非公開對話中，我聽到的幾乎全是對同行的尊重。所有中國實驗室都很戒備字節跳動及其流行的豆包模型，因為它是中國唯一一家前沿閉源實驗室。與此同時，所有實驗室都非常尊重 DeepSeek，認為它是在執行層面最具研究品味的實驗室。在美國，當你和實驗室成員進行非公開交流時，火花往往很快就會四濺。

中國研究者的謙遜中，最讓我印象深刻的一點是，他們在商業層面也經常耸耸肩，說那不是他們的問題。而在美國，似乎每個人都沈迷於各種生態層面的產業趨勢，從數據賣方，到算力，再到融資。

中國 AI 產業與西方實驗室的不同與相似之處

今天構建一個 AI 模型之所以如此有趣，是因為這已經不只是把一群優秀研究者聚在同一棟樓裡、共同打造一個工程奇蹟。過去確實更像這樣，但為了維持 AI 業務，大語言模型正在變成一種混合體：它涉及構建、部署、融資，以及推動這一創造物被採用。

頂級 AI 公司存在於複雜生態系統之中。這些生態系統提供資金、算力、數據以及更多資源，以便持續推動前沿向前發展。

西方生態系統中，圍繞創造和維持大語言模型所需各種投入要素的整合方式，已經被相對充分地概念化和繪製出來。Anthropic 和 OpenAI 就是典型代表。因此，如果我們能發現中國實驗室在這些問題上的思考方式有明顯不同，就能看出不同公司可能在未來押注於哪些有意義的差異。當然，這些未來也會受到融資和／或算力約束的強烈影響。

我把與這些實驗室交流後得到的幾個最大「AI 產業層面」的收穫整理如下：

第一，國內 AI 需求已經出現早期跡象。
有一種被廣泛討論的假設認為，中國 AI 市場會更小，因為中國公司通常不願為軟體付費，因此永遠無法釋放一個足以支撐實驗室的巨大推理市場。

但這個判斷只適用於與 SaaS 生態相對應的軟體支出。而 SaaS 生態在中國歷史上一直很小。另一方面，中國顯然仍然有一個龐大的雲市場。

一個關鍵且尚未回答的問題是：中國企業在 AI 上的支出，到底會更像 SaaS 市場，也就是規模較小；還是更像雲市場，也就是基礎性支出。這個問題連中國實驗室內部也在討論。總體來看，我感覺 AI 正在更接近雲市場，而沒有人真正擔心圍繞新工具形成的市場無法增長。

第二，大多數開發者都深受 Claude 影響。
儘管 Claude 名義上在中國被禁用，但中國大多數 AI 開發者都非常迷戀 Claude，以及它如何改變了他們構建軟體的方式。僅僅因為中國過去不太願意購買軟體，並不意味著我會認為中國不會出現一輪巨大的推理需求增長。

中國技術人員非常務實、謙遜且有動力。這一點給我的感覺，比任何「不花錢買軟體」的歷史習慣都更強。

一些中國研究者會提到他們使用自己的工具進行構建，比如 Kimi 或 GLM 的命令行工具，但所有人都會提到他們使用 Claude。令人意外的是，很少有人提到 Codex，而 Codex 在灣區顯然正在迅速流行。

第三，中國公司有一種技術所有權心態。
中國文化正在與一個轟鳴運轉的經濟引擎結合，產生一些難以預測的結果。我留下的一個深刻感受是，數量眾多的 AI 模型，反映的是這裡許多技術企業在現實中的一種務實均衡。並不存在一個總規劃。

這個產業由一種對字節跳動和阿里巴巴的尊重所定義。它們是被認為會憑藉強大資源贏下許多市場的大型在位者。DeepSeek 是受到尊敬的技術領導者，但遠不是市場領導者。它們設定方向，但並不具備經濟上贏得市場的結構。

這就留下了像美團或螞蟻集團這樣的公司。西方人可能會驚訝於它們為什麼也在構建這些模型。但實際上，它們顯然把大語言模型視為未來技術產品的核心，因此它們需要一個強大的基礎。

當它們對一個強大的通用模型進行微調時，開放社區對模型的反饋會讓它們的技術棧更堅固，同時它們也可以為自己的產品保留內部微調版本。這個行業中的「開放優先」心態，很大程度上由務實主義定義：它能幫助模型獲得強反饋，能回饋開源社區，也能賦能它們自身的使命。

第四，政府支持是真實存在的，但規模尚不清楚。
人們經常斷言，中國政府正在積極幫助開放大語言模型競賽。但這是一個由許多層級構成的、相對去中心化的政府體系，而每一層並沒有一套清晰的操作手冊，規定自己到底應該做什麼。

北京不同街區之間會競爭，爭取讓科技公司把辦公室設在那裡。提供給這些公司的「幫助」，幾乎可以肯定包括移除許可證等官僚流程中的繁文縟節。但這種幫助能走多遠？政府的不同層級能否幫助吸引人才？它們能否幫助走私晶片？

在整個訪問過程中，確實有許多關於政府興趣或幫助的提及，但相關信息遠遠不足以讓我以斷言的方式報告細節，也不足以讓我對政府究竟能如何改變中國 AI 發展軌跡形成一個自信的世界觀。

當然，也完全沒有跡象表明中國政府最高層在影響模型的任何技術決策。

第五，数据產業遠不如西方發達。
我們此前聽說，Anthropic 或 OpenAI 會為單個環境花費超過 1,000 萬美元，每年為了推動強化學習前沿而進行的累計支出達到數億美元量級。因此，我們很想知道，中國實驗室是否也在從性美國公司購買同樣的環境，或者是否有一個鏡像式的國內生態在支持它們。

答案並不是完整意義上的「沒有資料產業」，而是說，根據它們的經驗，資料產業質量相對較差，因此很多時候更好的做法是內部自建環境或資料。研究者自己會花大量時間製作強化學習訓練環境，而字節跳動、阿里巴巴等較大的公司，則可以擁有內部資料標註團隊來支持這件事。這一切都呼應了前面提到的「自建而非購買」的心態。

第六，對更多英偉達芯片的渴求非常強烈。
英偉達算力是訓練的黃金標準，而每個人的進展都受限於沒有更多算力。如果供應充足，顯然它們會購買。包括但不限於華為在內的其他加速器，在推理方面得到了正面評價。無數實驗室都可以使用華為芯片。

這些要點描繪出一個非常不同的 AI 生態系統。如果快速把西方實驗室的運作方式套用到中國同行身上，往往會造成範疇錯誤。關鍵問題在於，這些不同生態系統是否會產出有實質差異的模型類型；還是說，中國模型始終會被解釋為類似於 3 到 9 個月前的美國前沿模型。

結論：全球均衡

在這次旅行之前，我對中國了解得太少；而離開時，我感覺自己才剛剛開始學習。中國不是一個可以用規則或配方來表達的地方，而是一個有著非常不同動力機制和化學反應的地方。它的文化如此古老、如此深厚，並且仍然與國內技術建設的方式完全交織在一起。我還有很多東西需要學習。

美國當前權力結構中的許多部分，都把它們現有的中國觀當作決策中的關鍵心理工具。在我與中國幾乎每一家頭部 AI 實驗室進行過正式或非正式的面對面交流之後，我發現中國有許多品質和本能，是西方決策方式很難建模的。

即便我直接詢問這些實驗室為什麼要開放發布它們最強的模型，我仍然很難把「所有權心態」和「真誠支持生態」之間的交集完全串聯起來。

這裡的實驗室非常務實，並不一定是開源方面的絕對主義者，並不是它們構建的每一個模型都會開放發布。但它們在支持開發者、支持生態，以及把開放作為進一步了解自身模型的方式上，有著很深的意圖。

幾乎每一家中國大型科技公司都在構建自己的通用大語言模型。我們已經看到，美團這樣的平台型服務公司、小米這樣的大型消費科技公司，都發布了開放權重模型。美國的同類公司通常只會購買服務。

這些公司構建大語言模型，並不是為了在熱門新事物中刷存在感，而是出於一種深層且根本的願望：控制自己的技術棧，並發展當下最重要的技術。當我從筆記本電腦上抬頭，總能在地平線上看到一簇簇起重機時，這顯然與中國更廣泛的建設文化和建設能量相契合。

中國研究者身上的人情味、魅力和真誠溫暖，非常令人感到親近。在個人層面上，我們在美國習慣的那種殘酷地緣政治討論，完全沒有滲透到他們身上。這個世界可以擁有更多這種簡單的積極性。作為 AI 社區的一員，我現在更擔心的是，圍繞國籍標籤，成員和群體之間正在出現裂縫。

如果我說自己不希望美國實驗室在 AI 技術棧的每一個部分都成為明確領導者，那是在撒謊。尤其是在我投入大量時間的開放模型領域，我是美國人，這是一個誠實的偏好。

與此同時，我希望開放生態本身能夠在全球範圍內繁榮發展，因為這可以為世界創造更安全、更可訪問、也更有用的 AI。而眼下的問題是，美國實驗室是否會採取行動，佔據這種領導位置。

在我寫完這篇文章時，關於行政命令影響開放模型的更多傳聞正在流傳。這可能會進一步複雜化美國領導力與全球生態之間的協同關係——這並沒有讓我更有信心。

感謝我在月之暗面、智譜、美團、小米、通義千問、螞蟻靈光、01.ai 以及其他機構中有幸交談的所有優秀人士。每個人都如此熱情，也如此慷慨地付出了自己的時間。隨著我的想法逐漸成形，我會繼續分享關於中國的觀察，包括更廣泛的文化層面，也包括 AI 領域本身。

顯然，這些知識將與 AI 前沿發展正在展開的故事直接相關。

[原文链接]

歡迎加入律動 BlockBeats 官方社群：

Telegram 訂閱群：https://t.me/theblockbeats

Telegram 交流群：https://t.me/BlockBeats_App

Twitter 官方帳號：https://twitter.com/BlockBeatsAsia

#AI

糾錯/舉報

下載 BlockBeats

iOS Android

選擇文庫

新增文庫

取消

完成

新增文庫

僅自己可見

公開

保存

糾錯/舉報

提交