首頁

Claude Fable 5 按量收費倒計時，最強模型怎麼用才不燒穿賬單？

律动BlockBeats

閱讀本文需 11 分鐘

Fable 5 強在長任務和代理工作流，也貴在自動循環

摘要
· Claude Fable 5 已於 7 月 1 日恢復存取權，7 月 7 日後更多使用將轉向使用學分。
· 官方定價為每百萬輸入 token 10 美元、輸出 token 50 美元，長會話和自動迴圈將放大消耗。
· 用戶更適合將 Fable 5 放在規劃和複核環節，執行任務交給成本較低的模型。

Claude Fable 5 重新開放後，圍繞高昂 token 成本的節省用法成為用戶討論焦點。這個被 Anthropic 稱為「most capable widely released model」的旗艦模型，面向高強度推理和長期代理任務，支持 100 萬 token 上下文視窗、最高 12.8 萬 token 輸出。能力提升帶來的直接問題是，用戶在 Claude Code、Managed Agents 或長會話中，可能讓模型持續思考、調用工具、反覆檢查，帳單壓力隨之放大。

據 Anthropic 官方網頁，Claude Fable 5 已於 2026 年 7 月 1 日恢復存取權，面向 Pro、Max、Team、Enterprise 用戶，以及 Claude Platform、AWS、Google Cloud、Microsoft Foundry 等渠道。官方定價為每百萬輸入 token 10 美元、每百萬輸出 token 50 美元，prompt caching 讀取價相當於輸入價格最高 90% 折扣。

Anthropic 在「Redeploying Fable 5」公告中稱，Pro、Max、Team 和部分 Enterprise 用戶在 7 月 7 日前，可在最多 50% weekly usage limits 內使用該模型。之後繼續使用，將通過使用學分計費。

Fable 5 因而不適合被當作默認聊天模型隨手打開。它更像一位昂貴的架構師和審稿人，適合在任務開始時定方向，在任務結束前把關，中間大量執行工作則交給成本較低的模型。

最貴的不是一次回答，而是長任務自動跑起來

Fable 5 的成本壓力先來自單價。

每百萬輸入 token 10 美元、每百萬輸出 token 50 美元，讓它本身就是高價模型。短問短答時，用戶可能感受不明顯。但一旦進入程式碼修改、資料整理、產品方案、研究任務、自動化代理等長鏈條場景，輸出 token、上下文、工具呼叫和多輪修正都會疊加。

更容易放大消耗的，是 Fable 5 的強項。

官方文件把它定位為適合 long-horizon agentic work，也就是長期代理式工作。它可以把任務拆成多個階段，主動檢查缺口，必要時繼續呼叫工具或子任務推進。對複雜任務來說，這很有價值，用戶不必每一步都手動提示，模型可以圍繞目標自行迭代。

但如果目標不清、邊界太寬、時間太長，模型可能為了把任務做得更完整而持續運行。原文作者稱，自己在最初幾個小時測試中幾乎耗盡使用限制，儘管並沒有執行特別誇張的任務。這類體驗更像用戶反饋，不是官方成本測算，但提醒了一個現實風險：長會話、自動循環和默認誤用，都會在 7 月 7 日後更直接地變成 credits 消耗。

「10-80-10」：只在關鍵兩端用 Fable

原文提出的核心方法，是把 Fable 5 從「全程執行者」改成「前後把關者」。

所謂「10-80-10」，大致對應一個 AI 項目的三個階段。

前 10% 用 Fable 做規劃。讓它定義任務結構、執行路徑、成功標準、約束條件和交付格式。它最適合的不是機械執行，而是在複雜任務開始前搭出清晰方案。

中間 80% 換成更便宜的模型執行。大量 token 通常消耗在反覆修改、格式調整、程式碼小修、資料整理、普通生成和來回迭代中。這部分工作未必需要 Fable 5 全程參與，可以交給 Opus、Sonnet、Haiku，或其他成本更低的模型。

最後 10% 再把 Fable 拉回來複核。等便宜模型完成主要執行後，讓 Fable 對照最初計劃檢查結果是否偏離目標、有沒有遺漏、哪些地方需要修補、是否達到發布標準。因為此時它是在審查已有產物，而不是從零生成全部內容，token 消耗通常會低得多。

這個方法不等於官方承諾的省錢公式。原文作者提到，部分場景中，把執行層換成便宜模型可將 token 花費降低 50% 以上，但這更應被理解為使用經驗。真正可複製的思路是，高端模型不必承擔所有 token 密集型勞動，它更適合放在判斷、架構和錯誤識別環節。

/goal 和 /loop 讓代理更好用，也讓費用更難查覺

Fable 5 的另一個變化，是它更適合代理式工作流。

在傳統提示方式裡，用戶提出問題，模型回答。用戶檢查後再追問，循環由人推動。每一步是否繼續、是否修正、是否停止，都由用戶決定。

在 Claude Code 環境中，/goal 和 /loop 把這種流程變成更自動化的執行方式。

Anthropic 文檔顯示，/goal 會持續運行直到條件滿足或用戶清除，並可顯示 token spend。官方也建議用戶加入類似「20 輪後停止」的時間或輪次邊界。一個更好的目標不應只是「幫我改代碼」，而是說明要完成什麼、如何驗證結果、哪些限制不能突破、什麼時候停止。

/loop 則用於按間隔重複運行 prompt，例如每 5 分鐘檢查一次部署狀態，也可以由 Claude 動態選擇間隔。官方文檔顯示，循環類任務有 7 天過期規則。這類功能適合監控、迭代、檢查、長期修復和代理任務，模型可以不等用戶反覆提示就繼續推進。

費用風險也在這裡出現。

自動循環把「人類手動確認下一步」改成「模型按計劃繼續跑」。如果目標過寬、結束條件模糊、間隔設定太密、持續時間太長，Fable 5 可能會在用戶離開後繼續消耗 token。模型越擅長發現問題、補充步驟和自我檢查，越需要用戶提前設定硬邊界。

因此，10-80-10 和 loop engineering 更適合一起使用：Fable 5 負責設計循環、設定目標和驗收標準；執行層盡量交給便宜模型；只有在循環關閉、結果需要判斷，或關鍵節點需要質量把關時，再讓 Fable 5 介入。

7 月 7 日後，模型選擇和支出上限都要重新檢查

對普通用戶來說，最直接的風險不是複雜工作流，而是誤用。

原文提醒，開啟 Claude Code 或 Claude 應用時，模型可能預設選中 Fable。這個說法更像使用者經驗，官方資料未將其表述為統一規則。但在新模型重新開放、平台鼓勵使用者測試的階段，一些使用者確實可能在普通聊天、簡單整理或低價值任務中無意使用最貴模型。

按 credits 計費開始後，這種誤用會更敏感。簡單對話、輕量改寫、格式整理、普通總結，並不一定需要 Fable 5。每次開始對話前檢查模型選擇器，可能會成為高頻使用者的基本動作。

另一個現實提醒是設置 spending cap。

Anthropic 支持文件顯示，usage credits 需要在 Settings > Usage 啟用，使用者可設置支付方式並購買或預充值 credits，同時配置 monthly spending cap、auto-reload 和 usage alerts。Claude Code 也適用 usage credits。

如果沒有月度上限，長任務、自動循環和代理式執行可能在短時間內累積明顯費用。對高頻使用者來說，設置月度支出限制、使用提醒，並在 /goal 或 /loop 中寫清停止條件，已經不只是財務設置，而是使用代理模型的一部分。

Fable 5 這類模型帶來的新習慣，是按任務價值和難度分配模型。規劃、複雜判斷、最終複核值得用 Fable；重複執行、普通生成和輕量修改，更適合便宜模型。高端模型正在從「更聰明的聊天機器人」變成「可自動工作的代理」，能力越強，越需要使用者提前設定目標、邊界、時間和預算。否則，帳單失控可能比任務失敗更早出現。

歡迎加入律動 BlockBeats 官方社群：

Telegram 訂閱群：https://t.me/theblockbeats

Telegram 交流群：https://t.me/BlockBeats_App

Twitter 官方帳號：https://twitter.com/BlockBeatsAsia

#Claude

糾錯/舉報