header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
掃碼下載APP

中國大型模型生態實地探索:行業忌憚字節與阿里財力壟斷,僅 DeepSeek 被尊為技術領袖

動察 Beating 監測,艾倫人工智能研究所(AI2)後訓練團隊負責人,RLHF(基於人類反饋的強化學習)領域權威 Nathan Lambert 發表走訪中國多家領先 AI 實驗室的觀察報告,並揭示中國本土大型模型生態中一種割裂的競爭心態:全行業都在敬畏和忌憚字節跳動與阿里的財力,但同時公認 DeepSeek 才是真正的技術領袖。

Lambert 指出,字節跳動作為中國唯一的閉源前沿實驗室,其資源優勢讓同行感到「恐懼」,被視為最終靠資本贏下大片市場的壟斷巨頭。相比之下,DeepSeek 憑藉極佳的科研品味設定了行業技術方向,贏得了同行的純粹尊重,但各家也認為其現狀「並非為了在商業上贏」。此外在開發鏈條上,中國開發者重度依賴 Claude 輔助編程,且對英偉達算力極度渴求。

在解釋中國模型為何能快速追趕美國時,Lambert 認為護城河是文化而非技術。今天的大型模型訓練是一項極其繁瑣的系統工程。美國科研圈盛行「造星」文化,研究員的個人利益經常與模型整體優化起衝突,矽谷式的科研自負阻礙了協作(Llama 團隊就曾因此動蕩)。

反觀中國,在 OpenAI 和 Anthropic 幾乎不讓實習生碰核心業務時,中國實驗室的絕對主力是大量在校生。這些年輕人沒經歷過早期的 AI 炒作,也不背探討「人類命運」的哲學包袱。他們極度務實,願意接手最枯燥的調優骯髒活。

這篇長文打破了對中國模型「只會抄開源」的刻板印象,也點破了一個殘酷現實:大型模型競爭已不再是拼「天才點子」的科研戰,而是考驗紀律的工程消耗戰,中國正靠著沒有包袱的「學生兵」迅速填平代差。

举报 糾錯/舉報
糾錯/舉報
提交
新增文庫
僅自己可見
公開
保存
選擇文庫
新增文庫
取消
完成