header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
掃碼下載APP

你交给Claude的訂閱費,光模組公司能拿到多少?

閱讀本文需 14 分鐘
AI 應用收入並不等同於傳統 SaaS,公司估值取決於成本下降與毛利改善。

總結


· Claude 20 美元訂閱成本拆分圖,將一筆人工智慧月費分拆給模型公司、雲算力、GPU、電力和供應鏈。
· 人工智慧訂閱具有持續推理成本,無法直接套用傳統 SaaS 的高毛利假設。
· 關聯標的:OpenAI、Anthropic、Microsoft、Amazon、Google、NVIDIA、台積電、SK 海力士、三星、美光、數據中心和電力供應鏈。


一張將 Claude Pro 美國月付約 20 美元拆分給模型公司、雲算力、GPU 折舊、電力和供應鏈的估算圖,正在讓投資者重新討論人工智慧應用收入到底該怎麼估值。



這張圖並非 Anthropic、Amazon Web Services 或 NVIDIA 的官方分帳數據,也不能當成任何一家公司的真實帳冊。它的價值在於提出了一個更基礎的問題:用戶付給人工智慧應用的訂閱費,有多少能像傳統 SaaS 一樣沉澱成軟體毛利?


傳統 SaaS 的估值想像很清楚。軟體寫好後,多賣一個帳號,新增成本通常不高,成熟純軟體公司毛利率常見在 70% 甚至 80% 以上。投資者願意給高倍數,是因為收入規模擴大後,利潤率有機會繼續抬升。


人工智慧應用的麻煩在於,用戶每一次提問、寫程式碼、分析文件或呼叫 agent,背後都要消耗 GPU 時間、電力、記憶體頻寬和雲資源。表面是固定月費,底層卻是一條隨使用量變化的成本鏈。輕度用戶可能是高毛利,重度用戶在可用額度或相關工具套餐內連續跑任務,成本可能迅速上升。


所以,20 美元拆分圖要挑戰的不是某家公司到底拿走幾美元,而是「人工智慧應用收入是否天然等於 SaaS 收入」。人工智慧公司要證明自己值高倍數,不能只證明用戶願意付費,還要證明使用量加權後的毛利率能持續改善。


訂閱費背後有一條推理成本鏈


人工智慧訂閱和普通軟體訂閱最大的不同,是「使用一次」的邊際成本不再接近於零。


在傳統 SaaS 裡,一個團隊多開一個帳號,服務商也有伺服器、客服和頻寬成本,但這些成本通常不會隨著每一次點擊線性上升。真正昂貴的是前期研發、銷售和獲客。產品規模化後,新增收入中有相當部分可以留下來。


大型模型产品不同。用户輸入問題,模型生成答案,這個過程叫推理,也就是模型被使用者呼叫時的實際計算。Token 是模型讀寫文字的基本計量單位。使用者問得越多、上下文越長、生成內容越複雜,消耗的 token 和算力就越多。


這就形成了固定訂閱和可變成本之間的矛盾。Claude Pro 美國月付口徑約為 20 美元,價格會受地區、稅費和 Anthropic 調整影響。使用者看到的是固定價格,模型公司面對的卻是差異很大的使用行為。有人只是寫郵件和查資料,有人會處理長文件、跑程式碼任務或呼叫更複雜的自動化流程。


市場流傳的拆分圖嘗試把這件事具象化:20 美元裡,一部分留給模型公司,一部分支付給雲和算力提供方。算力成本中包含電力、運維、GPU 折舊。GPU 採購再向上流向英偉達、台積電、HBM(高頻寬內存)供應商、光模組、ODM 和電力相關企業。



這裡的「GPU 折舊」可以理解為,昂貴 GPU 不是一次性算完成本,而是按使用年限、使用強度或會計口徑慢慢攤到 AI 服務裡。真實分配會受到套餐限額、輕重度使用者比例、雲廠商內部結算價、預留算力折扣、GPU 利用率和折舊年限影響。平均成本也不等於邊際成本。


投資者真正需要盯住的是方向:AI 應用公司不能只披露收入增長,還要回答收入增長背後的算力成本是否同步增長。如果使用量擴張快於模型效率提升,訂閱收入越高,毛利壓力可能越明顯。只有效率改善足夠快,模型公司才有機會重新接近軟體公司的利潤結構。


基礎設施先拿到更確定的收入


現階段,AI 使用量增長更直接流向基礎設施,而不是全部沉澱在應用層。


不管使用者是在 Claude、ChatGPT、Gemini,還是企業內部 agent 裡使用模型,推理最終都要落到算力、電力、內存和網路上。應用層可能出現產品更替,底層資源消耗更剛性。只要 AI 使用量繼續上升,雲資本支出、GPU 採購、HBM 需求和資料中心用電就會被拉動。


這也是英偉達、台積電、SK 海力士等基礎設施鏈條持續被市場重估的原因。英偉達近年整體毛利率處於高位,FY2026 年度 GAAP 和非 GAAP 毛利率約為 71.1% 和 71.3%,後續季度指引也保持高位。需要注意,個別季度會受特定費用扰動,公開財報也不總能直接拆出 AI 資料中心的真實毛利結構,但稀缺基礎設施具備定價權這一點已經反映在業績裡。


HBM 是這條鏈上最典型的環節。它不是普通內存,而是 AI 加速器裡支撐高吞吐計算的關鍵部件。模型規模、上下文長度和並發推理需求上升後,AI 晶片對高帶寬內存的依賴更強。供應鏈估算顯示,HBM 在新一代 AI 晶片成本中的佔比提高,這也是 SK 海力士、三星、美光在 AI 週期中被重新定價的重要原因。


電力和數據中心也從背景成本變成投資主線。單次普通文本查詢的能耗未必誇張,但複雜 agent、長上下文、程式碼生成和多輪任務會放大計算量。對雲廠商和數據中心運營商來說,關鍵不是某一次查詢耗電多少,而是海量推理請求持續發生時,集群利用率、電價、冷卻、機房容量和電網接入能力都會變成成本與瓶頸。


基礎設施端的優勢在於業績驗證更快。雲廠商的 AI 資本支出已經發生,英偉達收入和毛利體現在財報裡,HBM 廠商訂單和價格也會較快進入利潤表。模型應用層交易的更多是未來預期:訂閱轉化、企業滲透率、API 收入和未來成本曲線下降後的利潤釋放。



效率改善仍是多頭的核心依據


軟體投資者和 AI 多頭並非沒有反駁。效率派的核心觀點是,今天推理成本偏高只是早期階段現象,模型優化、快取、小模型、自研晶片和更高集群利用率,會持續壓低單位成本。只要成本下降足夠快,AI 應用仍可能回到高毛利軟體邏輯。


這個反駁有現實基礎。部分主流模型在同等或更高能力下,單位價格已經明顯下降。OpenAI 曾披露,GPT-4o mini 相比早期 text-davinci-003 每 token 成本下降 99%。不同公司節奏並不完全一致,Anthropic 近期更多體現為同價升級和模型分層,但行業方向仍是用更低成本提供更強能力。



模型公司也有多種辦法改善單位經濟性。簡單任務交給小模型,常見請求通過快取復用,長上下文和複雜任務交給更強模型。雲廠商則通過自研晶片和集群調度降低單位算力成本。谷歌有 TPU,微軟推出用於推理的 Maia,亞馬遜也在推進 Trainium 和 Inferentia。



如果只看技術進步,AI 應用利潤率確有改善空間。更便宜的推理、更好的模型路由、更強的壓縮能力,都能讓同樣 20 美元訂閱承載更多使用量。輕度用戶、高價企業套餐、API 分層定價和更嚴格的使用限額,也能改善整體單位經濟性。


難點在於,成本下降不是唯一變量。AI 應用正在從簡單聊天走向更重的工作負載。過去用戶可能只是問答和改寫文本,現在越來越多需求來自程式碼 agent、長文檔處理、視頻和多模態生成、企業自動化流程。這些場景價值更高,消耗也更高。模型越有用,用戶越可能把更複雜、更長時間的任務交給它。


分歧由此變得更具體:推理成本下降速度,能否超過使用量和任務複雜度的增長。如果單位成本下降很快,但用戶平均消耗增長更快,模型公司的加權毛利率仍會承壓。反過來,如果模型路由、快取、自研晶片和價格分層足夠有效,AI 訂閱就可能逐步擺脫今天的重成本特徵。


訂閱用戶數並非毛利率


20 美元拆分圖不應被理解為終局。它更像當前階段的估值提醒:當市場還看不到足夠透明的模型公司毛利率數據時,投資者需要給「AI 應用天然等於 SaaS」這個假設打折。


對 OpenAI、Anthropic 這類未上市模型公司來說,外部投資者很難看到完整賬本。融資資料、合作夥伴披露、雲成本結構、企業套餐價格、API 收入佔比和使用限制,都會成為判斷線索。真正有價值的數據不是付費用戶有多少,而是輕度用戶和重度用戶各佔多少、企業客戶是否願意為高強度使用付更高價格、雲結算成本是否下降,以及單位推理成本下降能否進入公司毛利率。


上市公司鏈條的驗證會更快出現在財報裡。英偉達整體毛利率和數據中心收入增速、台積電先進製程和封裝需求、HBM 廠商價格與利潤率、雲廠商資本開支強度,都會繼續反映 AI 使用量是否仍在向基礎設施端傳導。如果這些指標保持強勁,而模型應用層缺少毛利率改善證據,市場會繼續給基礎設施更確定的估值溢價。


最終,模型公司要拿回更高估值錨,需要證明的不只是用戶願意付 20 美元,而是這些訂閱費在重度使用之後,仍能留下足夠多的毛利。下一輪定價分歧,很可能不在 ARR 的 headline 數字,而在推理成本、套餐限制和企業付費價格能否同時跑通。


歡迎加入律動 BlockBeats 官方社群:

Telegram 訂閱群:https://t.me/theblockbeats

Telegram 交流群:https://t.me/BlockBeats_App

Twitter 官方帳號:https://twitter.com/BlockBeatsAsia

举报 糾錯/舉報
選擇文庫
新增文庫
取消
完成
新增文庫
僅自己可見
公開
保存
糾錯/舉報
提交