header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
掃碼下載APP

前位元組Seed工程師:位元組一輪迭代需半年,Google 傳聞只需三個月

動察 Beating 監測,前字節跳動 Seed 團隊工程師、現北京大學助理教授張馳在播客《Into Asia》中透露,字節跳動完成一輪大模型訓練(預訓練加後訓練)需要約半年,而谷歌據傳聞只需三個月。他認為迭代速度是中國公司追趕困難的核心原因之一。張馳在字節約一年,所在的數學團隊偏研究性質,他自述該組的定位「更多是為了宣傳」,與負責模型交付的預訓練和後訓練團隊不同。

張馳描述了 Seed 內部的 benchmaxxing(刷分)文化:團隊領導按負責的 benchmark 評估績效,所有人都在衝分數,「但這不能轉化為實際使用中的好體驗」。他說紙面上中國大公司的模型都能追平美國前沿模型,但實際用起來「不夠好」。Seed 的目標是全球頂尖,「但很遺憾,我不認為我們追上了」,即使是國內第一的目標「也沒有實現」。2024 年底 Seed 自認追平 GPT-4o,隨後 DeepSeek 發布,團隊意識到差距仍在,他加入時全組正緊急轉向強化學習。

举报 糾錯/舉報
糾錯/舉報
提交
新增文庫
僅自己可見
公開
保存
選擇文庫
新增文庫
取消
完成