原文標題:The Great GPU Shortage – Rental Capacity – Launching our H100 1 Year Rental Price Index
原文作者:Daniel Nishball、Jordan Nanos、Cheang Kang Wen 等
編譯:Peggy,BlockBeats
編者按:隨著 AI 從「工具」走向「工作流基礎設施」,GPU 租賃價格進入加速上行區間,供給持續收緊。
從 H100 一年期價格上漲近 40%,到算力被提前鎖定至 2026 年下半年,再到 AI 實驗室通過長期合約與續約機制持續鎖定供給,GPU 市場的運行邏輯已發生明顯變化:價格不再主要由硬件成本決定,而是由 token 消耗、模型能力與生產效率共同塑造。
需求側的變化尤為關鍵。多智能體系統、原生內容生成、AI 編程工具等新範式,正在推動 token 使用進入指數增長區間。報告的核心判斷也逐漸明確:AI 工具的投入產出比已經被驗證,5–10 倍的回報,使得算力價格在相當長一段時間內難以對需求形成有效約束。
由此形成的張力愈發清晰:現實中的算力市場呈現出全面緊缺與定價權上移,而資本市場仍停留在「終將過剩與商品化」的預期之中。這種預期與現實的錯位,正在重塑 AI 基礎設施賽道的估值邏輯。
當算力成為新的生產資料,其價格機制、供給結構與資本回報,正處在一輪深層重構之中。
以下為原文:
Anthropic 的 Claude 4.6 Opus 與 Claude Code 需求大幅飆升。其年度經常性收入(ARR)在短短一個季度內,從去年底的 90 億美元躍升至當前的 250 億美元以上,幾乎實現三倍增長。與此同時,以 GLM、Kimi K2.5 為代表的開源模型,也推動了開源模型相關應用場景的快速擴張。包括 Anthropic、OpenAI 以及多家 Neolabs 在內的企業持續融資,同樣在加劇對 GPU 資源的需求。
這一轉折點意味著,需求在短時間內急劇上升,超大規模雲廠商(hyperscalers)和新興雲服務商(Neoclouds)已出現 GPU 搶購潮。
這一新增需求正在沿著整個供應鏈推高價格,從 DRAM 和 NAND 儲存,到光纖電纜、數據中心託管,再到燃氣輪機等基礎設施,幾乎所有相關產品與服務均出現上漲。
GPU 租賃價格,已成為眾多算力相關產品與服務中,最新一個出現供給緊張、價格躍升的領域。H100 一年期 GPU 租賃合約價格,從 2025 年 10 月的低點每 GPU 每小時 1.70 美元,上漲至 2026 年 3 月的 2.35 美元,漲幅接近 40%。
按需(on-demand)GPU 租賃產能在所有型號上幾乎全部售罄——那些已鎖定按需實例的用戶,即便在價格上漲之後,也不願將算力釋放回市場。2026 年初,尋找 GPU 算力的難度,幾乎就像嘗試搶到「最後一班航班」的機票:價格高企、幾乎無票。若用更貼切的比喻,與其說是搶機票,不如說更像是在「找渠道買藥」。

在 SemiAnalysis,我們長期深度追蹤 Neocloud 與超大规模雲生態中的各類趨勢與關鍵議題,其中就包括 GPU 租賃價格。這一能力,來源於我們在 ClusterMAX、InferenceX 以及 AI 雲總擁有成本(TCO)等項目中的持續研究與實踐。
與此同時,我們也投入大量精力,幫助各類 AI 實驗室對接 Neocloud 服務商,在市場上尋找 GPU 租賃資源,並與生態中的幾乎所有參與方持續交流 GPU 租賃價格的變化趨勢。
自 2023 年起,我們為客戶建立並維護了一套 GPU 租賃價格指數體系,覆蓋主流 GPU 型號(如 H100、H200、B200、B300、GB200、GB300、MI300、MI325、MI355),並橫跨不同租賃期限,從按需(on-demand)、1 個月短租,到最長 5 年的長期合約。該指數基於對多家 Neocloud 服務商與算力買方的調研數據構建,並通過實際交易數據、以及我們參與撮合的談判與成交情況進行交叉驗證。

今天,我們將 H100 一年期 GPU 租賃價格指數向公眾開放,希望為行業提供更多數據與洞察。該指數按月更新,我們也會通過 X 與 LinkedIn 持續發布最新趨勢解讀與市場觀察。至於涵蓋不同租期結構以及其他主流 GPU 型號的完整定價數據,目前僅對訂閱我們 AI 雲 TCO 模型的機構用戶開放。
本報告將圍繞 GPU 租賃市場的最新趨勢、市場一線觀察與關鍵數據展開,解析我們如何理解整體市場結構,並對未來租賃價格的走向進行初步判斷。
僅從 H100 一年期租賃價格曲線來看,尚不足以完整呈現市場的緊張程度——我們在一線獲取算力的實際經歷,以及來自市場參與方的反饋,所反映出的情況更加嚴峻。
當前需求來自多個高度異質的使用場景,幾乎不存在「通用解法」。例如,在推理側,大規模混合專家模型(MoE)更適合運行在如 GB300 NVL72 這類最新的大規模系統上;而在訓練側,H100 在性價比上依然具備優勢,使得即便是相對「舊一代」的 GPU,需求依然維持在高位。
客戶如今甚至在爭相支付每 GPU 每小時 14 美元的 AWS p6-b200 搶佔式實例價格;一些頭部 Neocloud 服務商已經不再出售單節點;部分 H100 的續約價格,竟與兩三年前簽約時完全一致;還有一些 H100 合約已直接續簽到 2028 年,租期長達 4 年。現在想找哪怕 8 個節點(64 張 GPU)的 H100 或 H200 集群,都並不容易——我們詢問的服務商中,有一半已經徹底售罄,而多數服務商的回覆則是:根本沒有任何 Hopper 架構 GPU 會在近期合約到期、釋放出來。
我們甚至聽說,一些算力承租方開始把自己租下來的集群再度拆分轉租,簡直像摩納哥大獎賽期間把公寓拆開短租一樣。接下來會不會出現所謂的「Neocloud 二房東」,恐怕也不再只是玩笑。
Blackwell 的供應同樣極其緊張。我們了解到,由於開源權重模型需求強勁,以及推理需求持續爆發,新一批 Blackwell 集群的部署交付周期如今已延長至 6 月至 7 月。而且,這些即將上線的集群大多也已被提前鎖定。實際上,從整個市場來看,直到 2026 年 8 月至 9 月才會新增上線的產能,幾乎都已經被預訂完畢。
GPU 租賃價格:捲土重來
但市場為何會走到這一步?就在 6 個月前,大多數市場觀察者仍對 GPU 的「終值」持懷疑態度,並普遍認為 GPU 租賃價格會隨著時間推移而不可避免地持續下滑。彼時,若有 Neocloud 或超大規模雲廠商在財務模型中採用 6 年折舊周期來處理 GPU 算力資產,甚至還會遭到金融分析師的批評。在討論未來趨勢之前,我們先快速回顧一下事情是如何演變至此的。
在 2025 年下半年之前,整個生態系統的主流預期一直是:隨著 Blackwell 大規模部署、且其單位算力成本顯著更低,Hopper(即 H100 和 H200)的租賃價格將明顯回落。但實際情況恰恰相反。到了 2025 年下半年,H100 的需求不僅沒有走弱,反而在許多場景中進一步增強。開源權重模型的快速普及,以及當時推理需求的持續加速,是這一輪幾乎無止境算力需求浪潮的最早信號。
到了 2026 年 1 月,算力市場迎來了下一個拐點:DRAM 與 NAND 儲存器價格在經歷數個季度的快速上漲之後,開始進入近乎「抛物線式」的飆升階段。根據我們的儲存模型,2026 年第一季度,LPDDR5 與 DDR5 合約價格同比漲幅分別逼近約 4 倍與 5 倍。
為了應對零組件成本急劇上漲帶來的利潤率風險,OEM 廠商開始上調 AI 伺服器售價,而且提價幅度明顯高於底層零組件本身的漲價幅度。這使得集群資本開支決策變得更加複雜:更高的伺服器採購成本壓縮了專案的預期回報,迫使部分運營商放緩部署節奏,甚至直接放棄上馬專案。結果是,原本可能上線的一部分新增供給被延後或擱置,進一步加劇了租賃市場的緊張局面。

在這場由「AI 伺服器定價失控」引發的採購混亂中,GPU 租賃需求顯著加速增長,市場上原本剩餘的算力幾乎在 1 月和 2 月被完全消化。到了 3 月,無論是 H100、H200 還是 B200,幾乎已無法在任何租期內找到可用產能。一年期租賃價格在 1 月底已突破每 GPU 每小時 2 美元,並在 2 月中下旬較 1 月底再度上漲 15%–20%,預計到 3 月底還將環比再漲 15%–20%。
今年初需求的重要驅動之一,來自原生內容生成(native media generation)。像 Seedance、Nano Banana 這類應用,正在推動用戶以規模化方式生成與迭代圖像和視頻,從而顯著提升 token 吞吐量。但更為關鍵、也更具可見性的需求來源,是多智能體(multi-agent)工作負載的興起——這些系統執行多步驟流程,在高並發環境下持續迭代,帶動 token 消耗與算力需求呈現出「指數式」增長。
這一趨勢,在 Claude Code 的相關數據中體現得尤為明顯,我們此前已在多篇文章中提及。以 SemiAnalysis 為例,僅過去 7 天,公司內部就消耗了數十億 token,平均成本約為每百萬 token 5 美元。但由此帶來的時間節省、工作流擴展與能力提升,遠遠超過了成本本身。如今,SemiAnalysis 已將一整套 AI 工具嵌入多個工作流之中,不再局限於簡單的搜索與摘要,而是延伸至數據看板、自動化抓取、大規模數據處理以及基於智能體的金融建模等場景。
我們也通過諸如 Claude 每日提交量(Claude Commits Daily)等指標,來追踪這一需求的爆發式增長。按照當前趨勢,我們預計到 2026 年底,Claude Code 將佔據全部代碼提交量的 20% 以上。可以說,在你尚未察覺的時間裡,AI 已經開始「吞噬」整個軟體開發流程。對於希望獲取該數據集的機構客戶,可聯繫我們的 API 團隊。提前透露一點:這一提交量,已經明顯高於我們最初發布時的水平。

在我們的圈子裡,幾乎人人都是 Claude Code 的重度用戶。但我們也清楚,這個圈子本身就深度沉浸於 AI 與半導體領域,本質上只是「最前線的一小撮人」。
對於許多《財富》500 強企業,以及更廣泛的公眾而言,Claude Code 與「智能體世界」不過是一個略顯新奇的邊緣話題,偶爾出現在 Facebook 資訊流或 NPR 播客中。他們幾乎尚未意識到,一場由智能體驅動的生產力浪潮與結構性衝擊,正在逼近。

隨著更多來自實體經濟的參與者逐步意識到使用 AI 工具所帶來的驚人投資回報,並加入這場「算力浪潮」,token 消耗將持續出現臺階式上升。關於 AI 投入產出比的爭論,事實上已經塵土落定——使用 AI 工具所創造的價值,往往可以達到其成本的一個數量級以上。在這樣的背景下,token 需求曲線的持續右移,正在形成一股強勁且(在當前階段)相對缺乏彈性的力量,推動 GPU 租賃價格不斷上行。
簡單來說,如果使用 AI 工具的投資回報可以達到 5–10 倍,那麼 GPU 租賃價格仍有相當大的上行空間,才可能真正對需求形成抑制。我們也不排除,租賃價格的進一步上漲,將繼續向上導致,推高伺服器及核心零組件的成本。
SemiAnalysis H100 一年期租賃價格指數發布
今天,我們將 SemiAnalysis 的 H100 一年期租賃合約價格指數免費向公眾開放,旨在提升市場對 GPU 租賃價格趨勢的認知與透明度。
該指數基於對超過 100 家市場參與者(包括 Neocloud 服務商、算力買方與賣方)的月度調查數據構建,用以確定 GPU 租賃價格的代表性區間(第 25 至第 75 百分位)。同時,我們還通過實際交易數據進行交叉驗證,並在自身網路中撮合買賣雙方,直接參與部分交易,以進一步校準價格水平。

自 2023 年以來,我們持續追蹤包括 H100、H200、B200、B300、GB200、GB300 在內的 GPU,在 3 個月至 5 年不同租期下的合約價格;同時也納入了 AMD 系列(MI300、MI325、MI355)的相關數據。
與市場上已有的 GPU 指數相比,SemiAnalysis 的 H100 一年期合約價格指數具有幾個關鍵差異:
首先,許多 GPU 租賃指數基於現貨/按需(spot/on-demand)報價或公開掛牌價格,但實際上,絕大多數 GPU 租賃交易是通過長期合約完成的,通常期限在 6 個月以上。這類價格往往通過雙邊談判形成,並不會出現在任何公開數據庫中。多數大型 Neocloud 服務商更傾向於簽訂至少 1 年的租約,2–3 年更為理想,如果能夠達成 5 年的大額包銷協議則更佳。SemiAnalysis 的 H100 一年期租賃指數,正是聚焦於這一「合約市場」——也就是實際交易量最集中的部分。通過明確指向一個具體租期,該指數也更便於用戶理解其所覆蓋的市場區間,並與自身觀察進行對照驗證。
其次,公開披露的價格,並不代表真實成交價格。超大規模雲廠商與 Neocloud 公布的價格,更多提供的是趨勢方向上的參考,而非實際交易水平。這些價格往往滯後於合約市場的變化,通常是在算力需求已經發生轉變之後,才進行調整。尤其是在按需市場中,價格往往被設定為相對固定的水平,而實際的供需變化,则通過利用率或資源佔用率來體現,只有在必要時才會進行不定期調整。關於這一市場機制,文章後文會進一步展開。
再次,雖然市面上也有不少指數能夠處理大規模的報價、價格與交易數據,並在趨勢分析方面具備優勢,但我們的方式更強調與市場參與者的直接互動。每一筆報價、每一筆交易背後都有其具體語境與決策邏輯,我們希望在呈現量化數據的同時,也補充這些定性信息與一線觀察,從而更全面地還原 GPU 租賃市場的真實結構。
對於機構訂閱用戶,我們還提供覆蓋幾乎所有主流 GPU 租賃市場的完整期限結構數據。

在發布 H100 一年期合約價格指數的同時,我們也為機構級 Tokenomics 模型訂閱用戶推出了 SemiAnalysis Tokenomics Dashboard,用於追蹤並理解前沿 AI 模型格局。該看板支持用戶在程式碼、推理、數學與智能體評估等多個維度進行自定義對比,比較不同模型與服務商的 API 定價,並查看主要 AI 實驗室披露的關鍵數據,包括 token 使用量、收入、估值以及客戶規模等。
在 2025 年下半年之前,GPU 租賃市場的定價環境相對更具競爭性。當時,運營商手中擁有更充足的 GPU 庫存,而終端需求才剛開始加速。因此,各家 Neocloud 服務商之間競爭激烈,普遍通過更具吸引力的價格來爭奪客戶。其核心目標是提高利用率,盡可能在下一輪 GPU 迭代周期到來之前,充分「榨取」現有算力資產的價值。
但此後,市場格局發生了 180 度轉變。如今,Neocloud 與超大規模雲廠商已經完全掌握主動權——他們可以要求更高的預付款、更優的定價、更長的合約期限,甚至可以自主選擇合約的起止時間,以匹配自身的庫存與產能安排。同時,時間也站在了供給側一邊:他們可以按照自身節奏推進部署,並在持續上漲的價格環境中,逐步篩選出最優質的客戶組合。
從結構上看,GPU 租賃市場大致可以劃分為三大板塊,不同板塊對應著不同類型的客戶需求:
短期租賃:按需(on-demand)、搶佔式(spot)以及 3 個月以內的合約
中期合約:3 個月至 3 年以上的合約
長期包銷(offtake):4–5 年期合約,其中 5 年最為常見
短期租賃位於整個租賃期結構的最前端,很多情況下對應的是「剩餘產能」。不過,也有部分服務商(如 Runpod、Lambda)專注於提供規模可觀、靈活的按需或搶佔式算力。
需要注意的是,按需市場的定價機制與其他合約市場存在顯著差異。通常情況下,服務商會為按需資源設定一個相對固定的價格水平,並且僅在極少數情況下進行調整。換句話說,短期市場的價格並不完全由實時供需直接驅動,而更多是通過資源利用率的變化來體現市場緊張程度。

服務商通常會根據資源利用率,對價格進行一次性調整:當利用率偏低時,會通過降價來刺激需求;而當利用率接近滿載時,則會上調價格,因為即便在更高價格水平下,需求仍然能夠維持高位。
這也解釋了為什麼,從時間序列上看,Neocloud 公布的按需價格往往會在較長一段時間內保持不變,然後突然出現「跳變式」的上升或下降。對於按需市場而言,真正能夠高頻反映需求變化的,並不是價格,而是資源利用率。

來源:Lambda Labs、SemiAnalysis
從經濟意義上看,更關鍵的其實是「合約市場」,因為絕大多數 GPU 租賃的交易價值都發生在這一板塊。其中,1 年期合約尤其重要——它既反映了非 AI 實驗室客戶的邊際需求,也體現了來自大客戶的溢出需求,因此是判斷市場收緊程度最敏感的指標。
AI 原生公司(AI Natives)以及中小型 AI 實驗室,主要活躍在 1–3 年期區間。不過,近期一個明顯趨勢是,這些機構也開始嘗試通過更長期的合約來鎖定算力資源——不少已經延伸至 4 年以上,甚至願意支付超過 20% 的預付款,而這在過去的 4 年以上合約中並不常見。
在更長期的 4–5 年期市場中,主導力量則是大型 AI 實驗室,它們會在早期就鎖定大規模算力資源。這類交易通常對應 50MW、100MW 甚至更大規模的集群,大致相當於約 2.4 萬至 4.8 萬張 GB300 NVL72 GPU。整體來看,這類長期包銷協議已佔據 Neocloud GPU 租賃市場相當大的份額。
AI 實驗室青睐此類合約,是因為它們可以一次性鎖定大規模算力,以應對快速增長的終端需求。同時,這些機構通常會深度參與集群設計,包括存儲、網路、CPU 配置等關鍵環節。這類交易往往以 **裸金屬(bare metal)**形式交付,因為 AI 實驗室具備足夠的工程能力,可以在更底層定制技術棧,從而實現最佳的 TCO(總擁有成本)與性能表現。
對於 Neocloud 服務商而言,這類交易同樣具有吸引力。一方面,他們可以將銷售資源集中在少數幾個大額訂單上,而無需處理大量小規模客戶卻獲得相同收入;另一方面,長期合約也便於其以更優條件進行債務融資——通過將融資期限與合約期限匹配,可以有效降低期限錯配與價格波動風險,並在多數情況下鎖定十幾個百分點的項目內部收益率(IRR)。
此外,超大規模雲廠商(Hyperscalers)也常在其中扮演「兜底方」(backstop)的角色——它們作為直接承購方,從 Neocloud 採購算力,再轉售給 AI 實驗室。這種結構對各方而言都是共贏:Neocloud 可以基於 AAA 評級的承購方獲得更優融資條件;而超大規模雲廠商則無需擴張自身資產負債表,便可通過提供信用背書,分得項目收益的一部分。
下表列出了我們正在跟踪的一些大型包銷協議。我們會對這些交易進行深入分析,以反推出其隱含的 GPU 小時價格($/hr/GPU),以及項目 IRR、EBIT 利潤率等關鍵盈利指標。

在當前市場環境下,絕大多數正在擴張的大型 AI 集群,實際上都被 AI 實驗室「內部消化」。不過,這些機構仍會進入 4 年以內的合約市場補充算力,同時通過續簽現有的 H100 和 H200 集群,間接阻止供給重新流入該市場。隨著 GB200 與 GB300 超大規模集群逐步上線,1–3 年期合約市場的供需關係如何演變,將成為接下來一個值得重點觀察的變數。
當前最引人關注的,是底層現實與市場情緒之間的明顯背離。儘管供應收緊、價格上漲這些本應利好 Neocloud(利潤率擴張、資產使用壽命延長)的信號已經非常清晰,但公開市場卻對 CoreWeave、Nebius、Iris Energy 等公司愈發悲觀,其股價目前仍處於過去 6–12 個月區間的低位。
市場依然被「最終供應過剩、算力商品化」的敘事所主導,而上述變化並未真正緩解投資者對 GPU 長期價值的擔憂。但從一線情況來看,供應持續緊張、定價權增強,意味著幾乎所有算力都處於被需求「吸收」的狀態——即便性能存在差異,在當前這種極端短缺環境下,依然供不應求。
要判斷 GPU 租賃價格是否會持續維持高位,可以重點關注三個變量:
1、GB300 集群擴張節奏(2026 年)
關鍵在於新增算力與 token 需求之間的相對速度——是供應緩解緊張,還是需求繼續超越供應。這將直接影響 AI 實驗室是否繼續參與 4 年以內市場,以及該區間的價格走勢。
2、芯片短缺是否進一步惡化
包括台積電 N3 工藝產能、HBM、DRAM、NAND 等關鍵環節,任何製造執行層面的波動,都可能進一步收緊供應。
3、AI 實驗室收入(ARR)與 token 消耗增長速度
AI 商業化與使用規模的擴張,將決定終端需求的強度,這也是驅動算力需求的核心變量。
綜合來看,一個相對明確的結論是:GPU 租賃價格繼續上漲的機率,高於回落的機率。
這一過程具有明顯的自我強化特徵:當 Neocloud 觀察到供應趨緊、價格上漲時,會提前鎖定更多硬件,從而進一步壓縮市場供應,推動價格繼續上行。這與 2023–2024 年的 GPU 短缺周期類似——當時供應緊張推動 OEM 實現了顯著的利潤擴張,並帶動伺服器價格大幅上漲(儘管本輪市場成熟度更高,這一過程未必完全重演)。
與此同時,GPU 租賃價格的再度上行,也在改善 Neocloud 的資本回報率(ROIC):
一方面,提高了已部署資產的利潤率
另一方面,延長了 GPU 的經濟使用周期,使資本能夠更長時間產生現金流
當前最直接受益的,是具備以下特徵的算力提供方:
·短周期合約為主(可快速重定價)
·擁有大量 H100 存量設備
·短期內有新增產能上線
短租結構的 Neocloud,可以更快將舊合約釋放,並以更高價格重新簽約,從而迅速實現利潤擴張。同時,那些提前鎖定下一代算力(多年份合約)的超大規模雲服務商與 Neocloud,也將在未來周期中受益。
那麼問題來了:這一次,會不會真的「不一樣」?
[原文連結]
歡迎加入律動 BlockBeats 官方社群:
Telegram 訂閱群:https://t.me/theblockbeats
Telegram 交流群:https://t.me/BlockBeats_App
Twitter 官方帳號:https://twitter.com/BlockBeatsAsia