据動察 Beating 監測,艾倫人工智能研究所(AI2)後訓練團隊負責人,RLHF(基於人類反饋的強化學習)領域權威 Nathan Lambert 發表走訪中國多家領先 AI 實驗室的觀察報告,並揭示中國本土大型模型生態中一種割裂的競爭心態:全行業都在敬畏和忌憚字節跳動與阿里的財力,但同時公認 DeepSeek 才是真正的技術領袖。
Lambert 指出,字節跳動作為中國唯一的閉源前沿實驗室,其資源優勢讓同行感到「恐懼」,被視為最終靠資本贏下大片市場的壟斷巨頭。相比之下,DeepSeek 憑藉極佳的科研品味設定了行業技術方向,贏得了同行的純粹尊重,但各家也認為其現狀「並非為了在商業上贏」。此外在開發鏈條上,中國開發者重度依賴 Claude 輔助編程,且對英偉達算力極度渴求。
在解釋中國模型為何能快速追趕美國時,Lambert 認為護城河是文化而非技術。今天的大型模型訓練是一項極其繁瑣的系統工程。美國科研圈盛行「造星」文化,研究員的個人利益經常與模型整體優化起衝突,矽谷式的科研自負阻礙了協作(Llama 團隊就曾因此動蕩)。
反觀中國,在 OpenAI 和 Anthropic 幾乎不讓實習生碰核心業務時,中國實驗室的絕對主力是大量在校生。這些年輕人沒經歷過早期的 AI 炒作,也不背探討「人類命運」的哲學包袱。他們極度務實,願意接手最枯燥的調優骯髒活。
這篇長文打破了對中國模型「只會抄開源」的刻板印象,也點破了一個殘酷現實:大型模型競爭已不再是拼「天才點子」的科研戰,而是考驗紀律的工程消耗戰,中國正靠著沒有包袱的「學生兵」迅速填平代差。