首頁

快訊深度數據 Skill&API

你交给Claude的訂閱費，光模組公司能拿到多少？

律动BlockBeats

閱讀本文需 14 分鐘

AI 應用收入並不等同於傳統 SaaS，公司估值取決於成本下降與毛利改善。

總結

· Claude 20 美元訂閱成本拆分圖，將一筆人工智慧月費分拆給模型公司、雲算力、GPU、電力和供應鏈。

· 人工智慧訂閱具有持續推理成本，無法直接套用傳統 SaaS 的高毛利假設。

· 關聯標的：OpenAI、Anthropic、Microsoft、Amazon、Google、NVIDIA、台積電、SK 海力士、三星、美光、數據中心和電力供應鏈。

一張將 Claude Pro 美國月付約 20 美元拆分給模型公司、雲算力、GPU 折舊、電力和供應鏈的估算圖，正在讓投資者重新討論人工智慧應用收入到底該怎麼估值。

這張圖並非 Anthropic、Amazon Web Services 或 NVIDIA 的官方分帳數據，也不能當成任何一家公司的真實帳冊。它的價值在於提出了一個更基礎的問題：用戶付給人工智慧應用的訂閱費，有多少能像傳統 SaaS 一樣沉澱成軟體毛利？

傳統 SaaS 的估值想像很清楚。軟體寫好後，多賣一個帳號，新增成本通常不高，成熟純軟體公司毛利率常見在 70% 甚至 80% 以上。投資者願意給高倍數，是因為收入規模擴大後，利潤率有機會繼續抬升。

人工智慧應用的麻煩在於，用戶每一次提問、寫程式碼、分析文件或呼叫 agent，背後都要消耗 GPU 時間、電力、記憶體頻寬和雲資源。表面是固定月費，底層卻是一條隨使用量變化的成本鏈。輕度用戶可能是高毛利，重度用戶在可用額度或相關工具套餐內連續跑任務，成本可能迅速上升。

所以，20 美元拆分圖要挑戰的不是某家公司到底拿走幾美元，而是「人工智慧應用收入是否天然等於 SaaS 收入」。人工智慧公司要證明自己值高倍數，不能只證明用戶願意付費，還要證明使用量加權後的毛利率能持續改善。

訂閱費背後有一條推理成本鏈

人工智慧訂閱和普通軟體訂閱最大的不同，是「使用一次」的邊際成本不再接近於零。

在傳統 SaaS 裡，一個團隊多開一個帳號，服務商也有伺服器、客服和頻寬成本，但這些成本通常不會隨著每一次點擊線性上升。真正昂貴的是前期研發、銷售和獲客。產品規模化後，新增收入中有相當部分可以留下來。

大型模型产品不同。用户輸入問題，模型生成答案，這個過程叫推理，也就是模型被使用者呼叫時的實際計算。Token 是模型讀寫文字的基本計量單位。使用者問得越多、上下文越長、生成內容越複雜，消耗的 token 和算力就越多。

這就形成了固定訂閱和可變成本之間的矛盾。Claude Pro 美國月付口徑約為 20 美元，價格會受地區、稅費和 Anthropic 調整影響。使用者看到的是固定價格，模型公司面對的卻是差異很大的使用行為。有人只是寫郵件和查資料，有人會處理長文件、跑程式碼任務或呼叫更複雜的自動化流程。

市場流傳的拆分圖嘗試把這件事具象化：20 美元裡，一部分留給模型公司，一部分支付給雲和算力提供方。算力成本中包含電力、運維、GPU 折舊。GPU 採購再向上流向英偉達、台積電、HBM（高頻寬內存）供應商、光模組、ODM 和電力相關企業。

這裡的「GPU 折舊」可以理解為，昂貴 GPU 不是一次性算完成本，而是按使用年限、使用強度或會計口徑慢慢攤到 AI 服務裡。真實分配會受到套餐限額、輕重度使用者比例、雲廠商內部結算價、預留算力折扣、GPU 利用率和折舊年限影響。平均成本也不等於邊際成本。

投資者真正需要盯住的是方向：AI 應用公司不能只披露收入增長，還要回答收入增長背後的算力成本是否同步增長。如果使用量擴張快於模型效率提升，訂閱收入越高，毛利壓力可能越明顯。只有效率改善足夠快，模型公司才有機會重新接近軟體公司的利潤結構。

基礎設施先拿到更確定的收入

現階段，AI 使用量增長更直接流向基礎設施，而不是全部沉澱在應用層。

不管使用者是在 Claude、ChatGPT、Gemini，還是企業內部 agent 裡使用模型，推理最終都要落到算力、電力、內存和網路上。應用層可能出現產品更替，底層資源消耗更剛性。只要 AI 使用量繼續上升，雲資本支出、GPU 採購、HBM 需求和資料中心用電就會被拉動。

這也是英偉達、台積電、SK 海力士等基礎設施鏈條持續被市場重估的原因。英偉達近年整體毛利率處於高位，FY2026 年度 GAAP 和非 GAAP 毛利率約為 71.1% 和 71.3%，後續季度指引也保持高位。需要注意，個別季度會受特定費用扰動，公開財報也不總能直接拆出 AI 資料中心的真實毛利結構，但稀缺基礎設施具備定價權這一點已經反映在業績裡。

HBM 是這條鏈上最典型的環節。它不是普通內存，而是 AI 加速器裡支撐高吞吐計算的關鍵部件。模型規模、上下文長度和並發推理需求上升後，AI 晶片對高帶寬內存的依賴更強。供應鏈估算顯示，HBM 在新一代 AI 晶片成本中的佔比提高，這也是 SK 海力士、三星、美光在 AI 週期中被重新定價的重要原因。

電力和數據中心也從背景成本變成投資主線。單次普通文本查詢的能耗未必誇張，但複雜 agent、長上下文、程式碼生成和多輪任務會放大計算量。對雲廠商和數據中心運營商來說，關鍵不是某一次查詢耗電多少，而是海量推理請求持續發生時，集群利用率、電價、冷卻、機房容量和電網接入能力都會變成成本與瓶頸。

基礎設施端的優勢在於業績驗證更快。雲廠商的 AI 資本支出已經發生，英偉達收入和毛利體現在財報裡，HBM 廠商訂單和價格也會較快進入利潤表。模型應用層交易的更多是未來預期：訂閱轉化、企業滲透率、API 收入和未來成本曲線下降後的利潤釋放。

效率改善仍是多頭的核心依據

軟體投資者和 AI 多頭並非沒有反駁。效率派的核心觀點是，今天推理成本偏高只是早期階段現象，模型優化、快取、小模型、自研晶片和更高集群利用率，會持續壓低單位成本。只要成本下降足夠快，AI 應用仍可能回到高毛利軟體邏輯。

這個反駁有現實基礎。部分主流模型在同等或更高能力下，單位價格已經明顯下降。OpenAI 曾披露，GPT-4o mini 相比早期 text-davinci-003 每 token 成本下降 99%。不同公司節奏並不完全一致，Anthropic 近期更多體現為同價升級和模型分層，但行業方向仍是用更低成本提供更強能力。

模型公司也有多種辦法改善單位經濟性。簡單任務交給小模型，常見請求通過快取復用，長上下文和複雜任務交給更強模型。雲廠商則通過自研晶片和集群調度降低單位算力成本。谷歌有 TPU，微軟推出用於推理的 Maia，亞馬遜也在推進 Trainium 和 Inferentia。

如果只看技術進步，AI 應用利潤率確有改善空間。更便宜的推理、更好的模型路由、更強的壓縮能力，都能讓同樣 20 美元訂閱承載更多使用量。輕度用戶、高價企業套餐、API 分層定價和更嚴格的使用限額，也能改善整體單位經濟性。

難點在於，成本下降不是唯一變量。AI 應用正在從簡單聊天走向更重的工作負載。過去用戶可能只是問答和改寫文本，現在越來越多需求來自程式碼 agent、長文檔處理、視頻和多模態生成、企業自動化流程。這些場景價值更高，消耗也更高。模型越有用，用戶越可能把更複雜、更長時間的任務交給它。

分歧由此變得更具體：推理成本下降速度，能否超過使用量和任務複雜度的增長。如果單位成本下降很快，但用戶平均消耗增長更快，模型公司的加權毛利率仍會承壓。反過來，如果模型路由、快取、自研晶片和價格分層足夠有效，AI 訂閱就可能逐步擺脫今天的重成本特徵。

訂閱用戶數並非毛利率

20 美元拆分圖不應被理解為終局。它更像當前階段的估值提醒：當市場還看不到足夠透明的模型公司毛利率數據時，投資者需要給「AI 應用天然等於 SaaS」這個假設打折。

對 OpenAI、Anthropic 這類未上市模型公司來說，外部投資者很難看到完整賬本。融資資料、合作夥伴披露、雲成本結構、企業套餐價格、API 收入佔比和使用限制，都會成為判斷線索。真正有價值的數據不是付費用戶有多少，而是輕度用戶和重度用戶各佔多少、企業客戶是否願意為高強度使用付更高價格、雲結算成本是否下降，以及單位推理成本下降能否進入公司毛利率。

上市公司鏈條的驗證會更快出現在財報裡。英偉達整體毛利率和數據中心收入增速、台積電先進製程和封裝需求、HBM 廠商價格與利潤率、雲廠商資本開支強度，都會繼續反映 AI 使用量是否仍在向基礎設施端傳導。如果這些指標保持強勁，而模型應用層缺少毛利率改善證據，市場會繼續給基礎設施更確定的估值溢價。

最終，模型公司要拿回更高估值錨，需要證明的不只是用戶願意付 20 美元，而是這些訂閱費在重度使用之後，仍能留下足夠多的毛利。下一輪定價分歧，很可能不在 ARR 的 headline 數字，而在推理成本、套餐限制和企業付費價格能否同時跑通。

歡迎加入律動 BlockBeats 官方社群：

Telegram 訂閱群：https://t.me/theblockbeats

Telegram 交流群：https://t.me/BlockBeats_App

Twitter 官方帳號：https://twitter.com/BlockBeatsAsia

#Claude ##英偉達 #臺積電

糾錯/舉報