· Uber 高管直言,Token 消耗和真實產品改善之間的連結「還不存在」;OpenAI 也承認企業 AI 成本正成為一個越來越現實的問題。
· AI 需求並未消失,但企業開始從試用轉向 ROI 審計,模型供應商開始討論降價,云端、GPU 和數據中心的增長彈性需要重新驗證。
· 相關標的:NVDA、MSFT、AMZN、GOOG、MU、AVGO、AMD、TSM、ARM、ORCL。
連漲兩個月的 AI 美股行情,最近開始走弱回調,市場也開始在明面上尋找原因。
利率、估值擁擠、財報干擾都能解釋這輪回調,但市場正在審計一條更底層的假設:企業消耗更多 Token,是否一定會帶來更多收入、效率和利潤。
過去兩年,AI 交易有一條很順的鏈條。企業大量使用 AI,Token(模型處理文本的計量單位)消耗上升,模型商收入增長,雲端供應商賣出更多算力,GPU、HBM(高頻寬記憶體)、伺服器、數據中心和電力需求繼續擴張。只要 Token 用量繼續增長,市場就可以把它理解為 AI 採用加速,並向上游硬件和資本支出給予更高估值。
但最近出現的一個變化是,連模型供應商自己也開始討論成本問題。
據《華爾街日報》報導,OpenAI 正在研究進一步降低模型調用價格,以應對企業預算壓力以及來自 Anthropic 等競爭對手的挑戰。與此同時,OpenAI CEO Sam Altman 近期公開表示,越來越多企業開始把 AI 成本視為一個重要問題,一些客戶甚至在第一季度就消耗完了原本規劃給全年的 AI 預算。
這件事本身或許還不足以改變行業格局,但它釋放了一個值得關注的信號:市場開始討論的已經不只是模型能力,而是成本、定價和投資回報率。
現在鬆動的不是「企業還用不用 AI」,而是「企業願不願意繼續為高價 Token 無條件買單」。
Uber 總裁兼首席運營官 Andrew Macdonald 在播客中說,Token 消耗增長和「有用的消費者功能」之間的連結「還不存在」。這句話來自買單方,而不是賣方、投行或模型創業公司。
如果此前市场相信「用量就是成功」,現在進入的是第二階段:Token 最後能不能變成收入增長、人工成本下降或利潤率改善。這個問題一旦被財務部門系統性提出,AI 產業鏈的評價語言就會從「需求無限」轉向「回報驗證」。
Uber 的案例值得一看,不是因為它不懂 AI,也不是因為它不願意使用 AI。恰恰相反,Uber 內部對 AI 編碼工具的採用率非常高。據多家媒體報導,公司約 5000 名工程師中,月使用率一度達到 84% 至 95%,單個工程師月度帳單從數百美元到 2000 美元不等。
問題恰恰出在這裡。當使用率足夠高,帳單就不再是創新部門的小額試驗費用,而會變成需要被運營層解釋的真實成本。據公司 CTO 此前披露,Uber 的全年 Claude Code 預算在 4 個月內就被用完。Macdonald 形容,這是一個讓人「頭炸」的時刻。
在企業內部,AI 工具最早往往以「提高效率」的名義進入預算。工程師更快生成代碼,客服更快回答問題,運營團隊更快寫報告,這些都是容易被感知的變化。
但當使用規模擴大後,財務部門看的會變成幾個更硬的問題:有沒有帶來更多收入?有沒有減少真實人力成本?有沒有改善利潤率?
Macdonald 提到的「tokenmaxxing」現象,也說明高用量可能和高價值脫鉤。所謂 tokenmaxxing,指的是團隊或個人為了最大化使用 AI 工具而大量消耗 Token。使用數據看起來很好,但未必對應更好的產品結果。對 AI 服務商來說,這是收入;對企業來說,它可能只是另一種失控的雲帳單。
Uber 的信號比一般的「AI 工具太貴」更值得重視。

它不是在說 AI 沒用,而是在說,當 AI 從試驗預算進入運營預算,企業需要證明每一美元 Token 支出能帶來可衡量的業務結果。高採用率不再自動等於成功,反而會率先暴露成本結構。
企業買方開始算賬,平台也在改變收費方式。
GitHub 已宣布,自 2026 年 6 月 1 日起,Copilot 轉向用量計費模式,並引入每月 AI Credits(AI 使用額度)。對輕度使用者來說,這可能只是帳單結構變化;對頻繁使用智能體功能的開發者來說,部分重度使用者反映,單次會話成本可能達到數十美元,社區討論也隨之升溫。
這件事的含義是,平台不再願意把無限使用的 Token 成本完全包在固定訂閱費裡。

過去,使用者付一個月費,平台承擔背後的模型呼叫成本。現在,隨著智能體呼叫次數、上下文長度和多輪任務增加,成本壓力開始被顯性化。用得越多,付得越多,這是對「無限 AI」敘事的一次修正。
更值得注意的是,這種壓力已經從應用層傳導到模型層。
過去兩年,大模型產業的主流敘事一直是降本增效和規模擴張。但隨著企業採購部門開始審計 ROI,模型供應商也面臨新的問題:如果客戶不願意持續為高價 Token 買單,增長要靠什麼維持?
OpenAI 最近釋放出的信號很典型。一邊是 Sam Altman 承認企業預算正在承受壓力,另一邊是市場傳出 OpenAI 研究進一步降價方案的消息。這意味著行業關注點正在從「模型能力是否領先」轉向「單位智能成本是否足夠低」。
對於企業客戶來說,最重要的問題不再是哪個模型最強,而是哪個模型能在相同預算下創造更多業務結果。
微軟內部削減 Claude Code 授權許可,也在同一個方向上。據 The Verge、Axios、TechRadar 等媒體報導,微軟 Experiences & Devices 部門取消了大部分內部 Claude Code 許可,並轉向自有 Copilot 工具。具體規模和原因仍有待更多披露,不能直接寫成微軟已確認因成本而削減外部工具採購。
但這個動作至少說明,大型科技公司自己也在重新分配外部模型呼叫成本。
這對 AI 產業鏈的影響,不在於某一個工具收入少了多少,而在於買方紀律開始向上傳導。企業可以限制額度、選擇更便宜的模型、把部分任務轉向開源或自建方案,也可以要求供應商折扣。模型商和應用層公司仍然會有需求,但定價權不再只由「模型更強」決定,還要由「客戶能否算得過賬」決定。
雲服務提供商也會受到影響。過去,雲收入中 AI 部分的敘事很強:模型訓練、推理、企業應用都需要算力,Token 用量越多,雲需求越有確定性。但如果企業開始壓低單位 Token 成本,或者把高頻低價值任務轉向更便宜的推理路徑,雲廠商的收入彈性就可能低於市場此前預期。
企業在這個時間點開始審計,一個原因是 AI 使用已經進入足夠大的樣本階段,低效部分不再容易被忽略。
Entelligence.AI 在 2026 年 5 月發布的研究分析了 2444 家組織、超過 100 萬個 Pull Request。按照其測算,在每 1 美元 AI Token 成本中,只有 0.18 美元產生了觸達用戶的實際價值,0.44 美元用於修復 AI 引入的 Bug,0.27 美元用於返工,0.11 美元消耗在審查摩擦中。
這個數據不能寫成全行業結論。它來自供應商自有研究頁面,也主要反映軟件工程場景,不是獨立審計或學術論文。但它足以說明一個問題:企業端確實存在 ROI 審計壓力,尤其是在 AI 生成內容還需要人類復核、修正和集成的場景裡。

AI 工具最容易展示的是生成速度,但企業真正付錢買的是可交付結果。如果 AI 生成的代碼帶來更多 Bug,後續需要更多審查、返工和測試,那麼前端節省的時間會在後端重新出現。對於個人用戶,這可能只是體驗問題;對於大型企業,這會變成財務問題和組織管理問題。
這也解釋了為什麼 Token 用量增長不能再被簡單等同於 AI 成功。
Token 是收入計費單位,也是成本計量單位。對模型商來說,更多 Token 意味著更多收入;對企業來說,更多 Token 只有在帶來更多收入、更低成本或更高利潤率時,才是值得持續擴大的預算項。
如果市場此前把 Token 增長當作硬件需求的領先指標,現在需要補上另一半:Token 的價值轉化率。只有當 Token 消耗能穩定轉化為業務結果,雲廠商的 AI 收入、GPU 訂單、HBM 擴產和數據中心建設,才有更紮實的終端支撐。
宏觀策略師 Andreas Steno Larsen 近期提示,Silicon Data 相關的 LLM Token 支出指數(大型 Token 支出指標)是當前市場值得追蹤的圖表之一。相關報導顯示,該指標追蹤企業為每百萬 Token 支付的支出或價格水平,2026 年初明顯上升後,在 5 月底附近出現回落跡象。
這裡需要保留邊界。Silicon Data 公開頁面更多是產品介紹,指數方法和完整歷史數據並未充分公開。它不能被當作硬結論,但可以作為觀察企業支付意願變化的一個信號。
Token 支出指標回落,也不等於 AI 使用量下降。
事實上,當前市場更像是在見證 AI 行業從「算力競爭」向「單位智能成本競爭」切換。企業仍然需要 AI,但未必願意繼續按照過去的價格體系採購 AI。
如果 OpenAI 最終啟動新一輪價格調整,那麼企業端預算壓力緩解的同時,也意味著模型行業正式進入價格競爭階段。屆時市場需要重新評斷:未來增長來自新增需求,還是來自價格下降後的使用量擴張。
AI 需求仍可能增長,但增長的收入含金量和上游傳導彈性可能發生變化。
這對不同環節的影響並不一樣。應用層和模型層首先面臨價格壓力:企業會要求更清晰的 ROI,減少低價值調用,或者在不同模型之間做成本切換。
雲廠商面臨的是收入彈性問題:同樣的使用量,如果單位價格下降、快取和批處理提高、自建方案增加,雲 AI 收入增速可能不如 Token 總量增長那麼好看。
再往上游,GPU、HBM、先進封裝、伺服器和數據中心建設交易的是未來資本支出。如果企業端支付紀律讓模型商和雲廠商對未來收入更謹慎,硬體訂單和數據中心建設節奏就會被重新評估。
Larsen 的警告不是說硬件需求立即消失,而是說如果 Token 定價持續走弱,市場會開始懷疑這一輪 AI 基礎設施投資周期的斜率。

在 AI 股回调和 Token 账单审计之间,并不存在简单的因果关系。不能简单地说芯片股下跌是因为 Uber 烧光了预算,但它们是相互关联的:当估值已经反映了长期高增长时,任何关于终端支付意愿和投资回报率(ROI)的信号,都会被放大,导致对上游资本支出的重新评估。
目前的证据还不足以支持「AI 泡沫已经破裂」的观点。企业并没有停止使用 AI,开发人员也不会回到没有 Copilot、Claude 或其他智能工具的时代。更合理的评估是,AI 的采用正从早期热情阶段转向预算纪律阶段,市场开始区分哪些用例能够证明回报,哪些只是在制造账单。
接下来最重要的验证,并不是再找一家公司说 AI 太昂贵,而是观察云服务提供商和软件公司的财报语言是否发生变化。微软、亚马逊、谷歌的 AI 云收入增速能否继续保持弹性;Copilot、Claude Code 等企业工具在开始按使用量计费后,续约、降级和投诉情况如何变化;这些方面较单日股价更能说明买方是否正在加强纪律性。
在硬件方面,需要关注 GPU、HBM 和数据中心订单是否出现了下调迹象。只要云服务提供商的资本支出继续增加,先进芯片订单仍然紧俏,Token 支付意愿的下降更像是一次健康的调整。只有当云端 AI 收入弹性减弱,同时上游订单和数据中心建设节奏开始放缓时,市场才可能将其定价为更深层次的周期转折点。
AI 领域的交易并未结束,但其定价语言正在发生变化。过去市场关注的是「使用了多少 Token」,而现在需要关注的是「这些 Token 最终转化为了多少利润」。这种差异将决定接下来 AI 产业链估值分化的方向。
歡迎加入律動 BlockBeats 官方社群:
Telegram 訂閱群:https://t.me/theblockbeats
Telegram 交流群:https://t.me/BlockBeats_App
Twitter 官方帳號:https://twitter.com/BlockBeatsAsia