中國大型模型生態實地探索：行業忌憚字節與阿里財力壟斷，僅 DeepSeek 被尊為技術領袖

据動察 Beating 監測，艾倫人工智能研究所（AI2）後訓練團隊負責人，RLHF（基於人類反饋的強化學習）領域權威 Nathan Lambert 發表走訪中國多家領先 AI 實驗室的觀察報告，並揭示中國本土大型模型生態中一種割裂的競爭心態：全行業都在敬畏和忌憚字節跳動與阿里的財力，但同時公認 DeepSeek 才是真正的技術領袖。

Lambert 指出，字節跳動作為中國唯一的閉源前沿實驗室，其資源優勢讓同行感到「恐懼」，被視為最終靠資本贏下大片市場的壟斷巨頭。相比之下，DeepSeek 憑藉極佳的科研品味設定了行業技術方向，贏得了同行的純粹尊重，但各家也認為其現狀「並非為了在商業上贏」。此外在開發鏈條上，中國開發者重度依賴 Claude 輔助編程，且對英偉達算力極度渴求。

在解釋中國模型為何能快速追趕美國時，Lambert 認為護城河是文化而非技術。今天的大型模型訓練是一項極其繁瑣的系統工程。美國科研圈盛行「造星」文化，研究員的個人利益經常與模型整體優化起衝突，矽谷式的科研自負阻礙了協作（Llama 團隊就曾因此動蕩）。

反觀中國，在 OpenAI 和 Anthropic 幾乎不讓實習生碰核心業務時，中國實驗室的絕對主力是大量在校生。這些年輕人沒經歷過早期的 AI 炒作，也不背探討「人類命運」的哲學包袱。他們極度務實，願意接手最枯燥的調優骯髒活。

這篇長文打破了對中國模型「只會抄開源」的刻板印象，也點破了一個殘酷現實：大型模型競爭已不再是拼「天才點子」的科研戰，而是考驗紀律的工程消耗戰，中國正靠著沒有包袱的「學生兵」迅速填平代差。

原文鏈接

糾錯/舉報