header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
掃碼下載APP

中國人工智慧為什麼發展得這麼快?答案藏在實驗室內部

閱讀本文需 27 分鐘
一位美國工程師眼中的中國人工智慧實驗室
原文標題:Notes from inside China's AI labs
原文作者:Nathan Lambert
編譯:Peggy,BlockBeats


編者按:中國 AI 實驗室正在成為全球大型模型競爭中越來越難忽視的力量。它們的優勢不僅是人才多、工程強、迭代快,更來自一種非常現實的組織方式:少談概念,多做模型;少強調個人明星,多強調團隊執行;少依賴外部服務,更傾向於自己掌握核心技術棧。


本文作者 Nathan Lambert 走訪了多家中國頭部 AI 實驗室後發現,中國 AI 生態和美國並不完全一樣。美國更重視原創範式、資本投入和頂尖科學家的個人影響力;中國則更擅長在已有方向上快速追趕,通過開源、工程優化和大量年輕研究者的投入,把模型能力迅速推向前沿。


最值得關注的,不是中國 AI 是否已經超過美國,而是兩種不同的發展路徑正在形成:美國更像是由資本和明星實驗室驅動的前沿競賽,中國則更像是由工程能力、開源生態和技術自控意識共同推動的產業競賽。


這意味著,未來 AI 競爭不只是模型排行榜之爭,也會是組織能力、開發者生態和產業執行力之爭。中國 AI 的真正變化,正在於它不再只是複製硅谷,而是在用自己的方式參與全球前沿。


以下為原文:


坐在從杭州開往上海的新式高鐵上,我望向窗外,看到起伏分明的山脊,山上點綴著風力渦輪機,在落日映照下形成剪影。群山構成了背景,眼前則是大片田野與成片高樓交錯的景象。


我帶著極大的謙遜從中國返回。去到一個如此陌生的地方,卻受到如此熱情的歡迎,這是一種非常溫暖、也非常具有人情味的體驗。我有幸見到了許多 AI 生態中的人,他們是我此前只在遠處知道的人;而他們用燦爛的笑容和熱情迎接我,讓我再次意識到,我的工作以及整個 AI 生態本身,都是全球性的。


中國研究者的心態


正在構建語言模型的中國公司,可以說非常適合作為這項技術的「快速跟隨者」。它們建立在中國長期以來的教育與工作文化傳統之上,同時也有著與西方略有不同的技術公司建設方式。


如果只看產出,也就是最新、最大的模型,以及這些模型所支持的智能體式工作流;再看投入要素,比如優秀的科學家、大規模數據和加速計算資源,那麼中國實驗室和美國實驗室看起來大體相似。真正長期存在的差異,出現在這些要素被如何組織、如何塑造之中。


我一直認為,中國實驗室之所以非常擅長追趕並保持在前沿附近,一個原因在於它們在文化上與這項任務非常匹配。但在沒有直接和人交流之前,我覺得自己不適合把這種直覺歸因於某種重要影響。與中國頂尖實驗室中許多優秀、謙遜且開放的科學家交談之後,我的很多想法變得更加清晰了。


今天要構建最好的大語言模型,很大程度上取決於貫穿整個技術棧的細緻工作:從數據,到架構細節,再到強化學習算法的實現。模型的每一個環節都有可能帶來一些提升,而如何把這些提升組合在一起,是一個複雜過程。在這個過程中,一些非常聰明的個人所做的工作,可能必須被擱置,以便讓整體模型在多目標優化中達到最大化。


美國研究者顯然也非常擅長解決單個組件的問題,但美國更有一種「為自己發聲」的文化。作為科學家,當你主動為自己的工作爭取關注時,你往往會更成功;而當代文化也正在推動一種新的成名路徑,也就是成為「頂尖 AI 科學家」。這會帶來直接衝突。


外界廣泛傳聞稱,Llama 組織曾在這些利益訴求嵌入層級化組織之後,因政治壓力而崩潰。我也聽其他實驗室說過,有時可能需要「安撫」一位頂尖研究者,讓他們停止抱怨自己的想法沒有被納入最終模型。無論這是否完全屬實,意思都很清楚:自我意識和職業晉升欲望,確實會妨礙人們構建最好的模型。美國和中國之間,哪怕只是這種文化上的一個小幅方向性差異,也可能對最終產出產生有意義的影響。


其中一部分差異,和中國到底是誰在構建這些模型有關。在所有實驗室裡,一個很直接的現實是:核心貢獻者中有很大比例是仍在讀書的學生。這些實驗室都相當年輕,這讓我想起我們在 Ai2 的組織方式:學生被視為同伴,並被直接整合進大語言模型團隊。


這和美國頂尖實驗室非常不同。在美國,OpenAI、Anthropic、Cursor 等公司根本不提供實習機會。Google 等其他公司名義上會提供和Gemini 相關的實習,但很多人都會擔心,自己的實習會不會被隔離在真正核心工作之外。


總括來說,這種輕微的文化差異,可能通過以下方式提升模型構建能力:為了提升最終模型,人們更願意去做那些不那麼光鮮的工作;剛開始參與 AI 構建的人,可能不受此前幾輪 AI 炒作周期的影響,因此能夠更快適應新的現代技術方法。事實上,我交談過的一位中國科學家非常明確地把這一點視為優勢;較低的自我意識,讓組織架構在一定程度上更容易擴展,因為人們較少嘗試「玩弄系統」;大量人才非常適合解決那些在別處已經有概念驗證的問題,等等。


這種更有利於構建當下語言模型的能力傾向,與一種已知刻板印象形成對照:人們常認為,中國研究者較少產出那種更具創造性、能夠開拓新領域的「從 0 到 1」的學術研究。


在此次行程中幾次更偏學術的實驗室訪問裡,許多負責人都談到,他們正在培養這種更具雄心的研究文化。與此同時,我們交談過的一些技術負責人則懷疑,這種科學研究方式的重塑在短期內是否可能實現,因為它需要重新設計教育體系和激勵體系,而這個改造太大,很難在當前經濟均衡下發生。


這種文化似乎正在訓練出一批非常擅長「大語言模型構建遊戲」的學生和工程師。當然,他們的數量也極其充足。


這些學生告訴我,中國也正在發生與美國類似的人才外流:許多此前考慮走學術道路的人,如今打算留在產業界。其中最有趣的一句話來自一位原本想當教授的研究者,他說自己想當教授,是因為希望接近教育系統;但他隨後又評論說,教育已經被大語言模型解決了——「學生為什麼還要來找我聊天!」


學生們帶著新鮮眼光進入大語言模型領域,這是一個優勢。過去幾年裡,我們看到大語言模型的關鍵範式不斷變化:從擴展 MoE,到擴展強化學習,再到支持智能體。要把這些事情中的任何一件做好,都需要極其快速地吸收大量背景信息,既包括更廣泛的文獻,也包括所在公司內部的技術棧。


學生習慣於做這類事情,也願意帶著謙遜心態放下對「什麼應該有效」的所有預設。他們一頭扎進去,把人生投入其中,只為獲得改進模型的機會。


這些學生也非常神奇地直接,並且沒有一些會讓科學家分心的哲學閒談。當我問他們如何看待模型的經濟影響或長期社會風險時,擁有複雜觀點,並希望在這些議題上施加影響的中國研究者明顯少得多。他們認為自己的角色就是構建最好的模型。


這種差異很微妙,也很容易被否認。但當你和一位優雅、聰明、能夠用英語清晰表達的研究者進行長時間交談時,它最容易被感受到:當你問起一些關於 AI 的更哲學層面的問題,這些基礎問題會懸在空氣中,而對方流露出一種簡單的困惑。對他們來說,這是一種範疇錯誤。


甚至有一位研究者引用了 Dan Wang 的著名判斷:相較於由律師主導的美國,中國是由工程師治理的。在談到這些問題時,他用這個類比強調他們想要建設的願望。在中國,並沒有一種系統性路徑,能夠像 Dwarkesh 或 Lex 這類超級主流播客那樣,培養中國科學家的明星影響力。


我試圖讓中國科學家評論由 AI 引發的未來經濟不確定性、超越簡單 AGI 能力的問題,或者模型應該如何表現的道德爭論;這些問題最終都讓我看到了這些科學家的成長背景和教育背景(已編輯 1)。他們極其專注於自己的工作,但他們成長於一個並不鼓勵討論和表達社會應如何組織、如何改變的體系。


把視角拉遠看,尤其是北京,給我的感覺很像灣區:一個有競爭力的實驗室,可能就在步行或打車幾分鐘之外。我下飛機之後,在去酒店的路上順便去了阿里巴巴北京園區。接下來的 36 小時裡,我們去了智譜 AI、月之暗面、清華大學、美團、小米和 01.ai。


在中國坐滴滴出行很方便。如果你選擇 XL 車型,經常會被分配到帶按摩椅的電動小型面包車。我們向研究者詢問人才爭奪戰,他們說這和我們在美國經歷的非常相似。研究者跳槽很正常,而人們選擇去哪裡,很大程度上取決於當下哪裡的氛圍最好。


在中國,大語言模型社區給人的感覺更像一個生態系統,而不是彼此交戰的部落。在許多非公開對話中,我聽到的幾乎全是對同行的尊重。所有中國實驗室都很戒備字節跳動及其流行的豆包模型,因為它是中國唯一一家前沿閉源實驗室。與此同時,所有實驗室都非常尊重 DeepSeek,認為它是在執行層面最具研究品味的實驗室。在美國,當你和實驗室成員進行非公開交流時,火花往往很快就會四濺。


中國研究者的謙遜中,最讓我印象深刻的一點是,他們在商業層面也經常耸耸肩,說那不是他們的問題。而在美國,似乎每個人都沈迷於各種生態層面的產業趨勢,從數據賣方,到算力,再到融資。


中國 AI 產業與西方實驗室的不同與相似之處


今天構建一個 AI 模型之所以如此有趣,是因為這已經不只是把一群優秀研究者聚在同一棟樓裡、共同打造一個工程奇蹟。過去確實更像這樣,但為了維持 AI 業務,大語言模型正在變成一種混合體:它涉及構建、部署、融資,以及推動這一創造物被採用。


頂級 AI 公司存在於複雜生態系統之中。這些生態系統提供資金、算力、數據以及更多資源,以便持續推動前沿向前發展。


西方生態系統中,圍繞創造和維持大語言模型所需各種投入要素的整合方式,已經被相對充分地概念化和繪製出來。Anthropic 和 OpenAI 就是典型代表。因此,如果我們能發現中國實驗室在這些問題上的思考方式有明顯不同,就能看出不同公司可能在未來押注於哪些有意義的差異。當然,這些未來也會受到融資和/或算力約束的強烈影響。


我把與這些實驗室交流後得到的幾個最大「AI 產業層面」的收穫整理如下:


第一,國內 AI 需求已經出現早期跡象。
有一種被廣泛討論的假設認為,中國 AI 市場會更小,因為中國公司通常不願為軟體付費,因此永遠無法釋放一個足以支撐實驗室的巨大推理市場。


但這個判斷只適用於與 SaaS 生態相對應的軟體支出。而 SaaS 生態在中國歷史上一直很小。另一方面,中國顯然仍然有一個龐大的雲市場。


一個關鍵且尚未回答的問題是:中國企業在 AI 上的支出,到底會更像 SaaS 市場,也就是規模較小;還是更像雲市場,也就是基礎性支出。這個問題連中國實驗室內部也在討論。總體來看,我感覺 AI 正在更接近雲市場,而沒有人真正擔心圍繞新工具形成的市場無法增長。


第二,大多數開發者都深受 Claude 影響。
儘管 Claude 名義上在中國被禁用,但中國大多數 AI 開發者都非常迷戀 Claude,以及它如何改變了他們構建軟體的方式。僅僅因為中國過去不太願意購買軟體,並不意味著我會認為中國不會出現一輪巨大的推理需求增長。


中國技術人員非常務實、謙遜且有動力。這一點給我的感覺,比任何「不花錢買軟體」的歷史習慣都更強。


一些中國研究者會提到他們使用自己的工具進行構建,比如 Kimi 或 GLM 的命令行工具,但所有人都會提到他們使用 Claude。令人意外的是,很少有人提到 Codex,而 Codex 在灣區顯然正在迅速流行。


第三,中國公司有一種技術所有權心態。
中國文化正在與一個轟鳴運轉的經濟引擎結合,產生一些難以預測的結果。我留下的一個深刻感受是,數量眾多的 AI 模型,反映的是這裡許多技術企業在現實中的一種務實均衡。並不存在一個總規劃。


這個產業由一種對字節跳動和阿里巴巴的尊重所定義。它們是被認為會憑藉強大資源贏下許多市場的大型在位者。DeepSeek 是受到尊敬的技術領導者,但遠不是市場領導者。它們設定方向,但並不具備經濟上贏得市場的結構。


這就留下了像美團或螞蟻集團這樣的公司。西方人可能會驚訝於它們為什麼也在構建這些模型。但實際上,它們顯然把大語言模型視為未來技術產品的核心,因此它們需要一個強大的基礎。


當它們對一個強大的通用模型進行微調時,開放社區對模型的反饋會讓它們的技術棧更堅固,同時它們也可以為自己的產品保留內部微調版本。這個行業中的「開放優先」心態,很大程度上由務實主義定義:它能幫助模型獲得強反饋,能回饋開源社區,也能賦能它們自身的使命。


第四,政府支持是真實存在的,但規模尚不清楚。
人們經常斷言,中國政府正在積極幫助開放大語言模型競賽。但這是一個由許多層級構成的、相對去中心化的政府體系,而每一層並沒有一套清晰的操作手冊,規定自己到底應該做什麼。


北京不同街區之間會競爭,爭取讓科技公司把辦公室設在那裡。提供給這些公司的「幫助」,幾乎可以肯定包括移除許可證等官僚流程中的繁文縟節。但這種幫助能走多遠?政府的不同層級能否幫助吸引人才?它們能否幫助走私晶片?


在整個訪問過程中,確實有許多關於政府興趣或幫助的提及,但相關信息遠遠不足以讓我以斷言的方式報告細節,也不足以讓我對政府究竟能如何改變中國 AI 發展軌跡形成一個自信的世界觀。


當然,也完全沒有跡象表明中國政府最高層在影響模型的任何技術決策。


第五,数据產業遠不如西方發達。
我們此前聽說,Anthropic 或 OpenAI 會為單個環境花費超過 1,000 萬美元,每年為了推動強化學習前沿而進行的累計支出達到數億美元量級。因此,我們很想知道,中國實驗室是否也在從性美國公司購買同樣的環境,或者是否有一個鏡像式的國內生態在支持它們。


答案並不是完整意義上的「沒有資料產業」,而是說,根據它們的經驗,資料產業質量相對較差,因此很多時候更好的做法是內部自建環境或資料。研究者自己會花大量時間製作強化學習訓練環境,而字節跳動、阿里巴巴等較大的公司,則可以擁有內部資料標註團隊來支持這件事。這一切都呼應了前面提到的「自建而非購買」的心態。


第六,對更多英偉達芯片的渴求非常強烈。
英偉達算力是訓練的黃金標準,而每個人的進展都受限於沒有更多算力。如果供應充足,顯然它們會購買。包括但不限於華為在內的其他加速器,在推理方面得到了正面評價。無數實驗室都可以使用華為芯片。


這些要點描繪出一個非常不同的 AI 生態系統。如果快速把西方實驗室的運作方式套用到中國同行身上,往往會造成範疇錯誤。關鍵問題在於,這些不同生態系統是否會產出有實質差異的模型類型;還是說,中國模型始終會被解釋為類似於 3 到 9 個月前的美國前沿模型。


結論:全球均衡


在這次旅行之前,我對中國了解得太少;而離開時,我感覺自己才剛剛開始學習。中國不是一個可以用規則或配方來表達的地方,而是一個有著非常不同動力機制和化學反應的地方。它的文化如此古老、如此深厚,並且仍然與國內技術建設的方式完全交織在一起。我還有很多東西需要學習。


美國當前權力結構中的許多部分,都把它們現有的中國觀當作決策中的關鍵心理工具。在我與中國幾乎每一家頭部 AI 實驗室進行過正式或非正式的面對面交流之後,我發現中國有許多品質和本能,是西方決策方式很難建模的。


即便我直接詢問這些實驗室為什麼要開放發布它們最強的模型,我仍然很難把「所有權心態」和「真誠支持生態」之間的交集完全串聯起來。


這裡的實驗室非常務實,並不一定是開源方面的絕對主義者,並不是它們構建的每一個模型都會開放發布。但它們在支持開發者、支持生態,以及把開放作為進一步了解自身模型的方式上,有著很深的意圖。


幾乎每一家中國大型科技公司都在構建自己的通用大語言模型。我們已經看到,美團這樣的平台型服務公司、小米這樣的大型消費科技公司,都發布了開放權重模型。美國的同類公司通常只會購買服務。


這些公司構建大語言模型,並不是為了在熱門新事物中刷存在感,而是出於一種深層且根本的願望:控制自己的技術棧,並發展當下最重要的技術。當我從筆記本電腦上抬頭,總能在地平線上看到一簇簇起重機時,這顯然與中國更廣泛的建設文化和建設能量相契合。


中國研究者身上的人情味、魅力和真誠溫暖,非常令人感到親近。在個人層面上,我們在美國習慣的那種殘酷地緣政治討論,完全沒有滲透到他們身上。這個世界可以擁有更多這種簡單的積極性。作為 AI 社區的一員,我現在更擔心的是,圍繞國籍標籤,成員和群體之間正在出現裂縫。


如果我說自己不希望美國實驗室在 AI 技術棧的每一個部分都成為明確領導者,那是在撒謊。尤其是在我投入大量時間的開放模型領域,我是美國人,這是一個誠實的偏好。


與此同時,我希望開放生態本身能夠在全球範圍內繁榮發展,因為這可以為世界創造更安全、更可訪問、也更有用的 AI。而眼下的問題是,美國實驗室是否會採取行動,佔據這種領導位置。


在我寫完這篇文章時,關於行政命令影響開放模型的更多傳聞正在流傳。這可能會進一步複雜化美國領導力與全球生態之間的協同關係——這並沒有讓我更有信心。


感謝我在月之暗面、智譜、美團、小米、通義千問、螞蟻靈光、01.ai 以及其他機構中有幸交談的所有優秀人士。每個人都如此熱情,也如此慷慨地付出了自己的時間。隨著我的想法逐漸成形,我會繼續分享關於中國的觀察,包括更廣泛的文化層面,也包括 AI 領域本身。


顯然,這些知識將與 AI 前沿發展正在展開的故事直接相關。


[原文链接]



歡迎加入律動 BlockBeats 官方社群:

Telegram 訂閱群:https://t.me/theblockbeats

Telegram 交流群:https://t.me/BlockBeats_App

Twitter 官方帳號:https://twitter.com/BlockBeatsAsia

举报 糾錯/舉報
選擇文庫
新增文庫
取消
完成
新增文庫
僅自己可見
公開
保存
糾錯/舉報
提交