header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
掃碼下載APP

Token實際成本降至0.99美元,SemiAnalysis披露大型模型消費已占薪酬30%

動察 Beating 監測,在企業端廣泛落地的智能體 AI 正在顛覆專業服務業的單元經濟。研究機構 SemiAnalysis 披露,內部大模型 Token 支出已佔員工總薪資的 30%,人均月消費近 50 億個 Token,核心貢獻者月消耗更超 1000 億個。原本需要分析師耗時數小時的 Excel 模型轉換與財報圖表製作,如今可在幾分鐘內以數美元的代幣成本完成。

實際使用成本的驟降是重塑專業服務業單元經濟的關鍵。儘管 Opus 4.7 官方標價高達每百萬 Token 5 美元輸入與 25 美元輸出,但由於智能體任務高達 300 對 1 的輸入輸出比,以及 90% 以上的提示詞快取命中率,使得實際混合 Token 成本僅為 0.99 美元/百萬。

軟體與硬體的共同加速正在進一步壓縮生成成本。在 B300 運行 DeepSeek R1 時,通過 wideEP、disagg 與 MTP 軟體優化,單 GPU 吞吐量能從 baseline 的 1000 tokens/秒飆升至 14000 tokens/秒,實現 14 倍的純軟體吞吐量提升。而在硬體層面,最優化配置的 GB300 NVL72 吞吐量是 H100 的 17 倍(FP4 下達 32 倍),從而為大模型開發商毛利率的增長提供了結構性保障,並預測 2027 年 Token 價格將遠低於當前水平。

举报 糾錯/舉報
糾錯/舉報
提交
新增文庫
僅自己可見
公開
保存
選擇文庫
新增文庫
取消
完成