header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
掃碼下載APP

Claude Fable 5 按量收費倒計時,最強模型怎麼用才不燒穿賬單?

閱讀本文需 11 分鐘
Fable 5 強在長任務和代理工作流,也貴在自動循環
摘要
· Claude Fable 5 已於 7 月 1 日恢復存取權,7 月 7 日後更多使用將轉向使用學分。
· 官方定價為每百萬輸入 token 10 美元、輸出 token 50 美元,長會話和自動迴圈將放大消耗。
· 用戶更適合將 Fable 5 放在規劃和複核環節,執行任務交給成本較低的模型。


Claude Fable 5 重新開放後,圍繞高昂 token 成本的節省用法成為用戶討論焦點。這個被 Anthropic 稱為「most capable widely released model」的旗艦模型,面向高強度推理和長期代理任務,支持 100 萬 token 上下文視窗、最高 12.8 萬 token 輸出。能力提升帶來的直接問題是,用戶在 Claude Code、Managed Agents 或長會話中,可能讓模型持續思考、調用工具、反覆檢查,帳單壓力隨之放大。


據 Anthropic 官方網頁,Claude Fable 5 已於 2026 年 7 月 1 日恢復存取權,面向 Pro、Max、Team、Enterprise 用戶,以及 Claude Platform、AWS、Google Cloud、Microsoft Foundry 等渠道。官方定價為每百萬輸入 token 10 美元、每百萬輸出 token 50 美元,prompt caching 讀取價相當於輸入價格最高 90% 折扣。


Anthropic 在「Redeploying Fable 5」公告中稱,Pro、Max、Team 和部分 Enterprise 用戶在 7 月 7 日前,可在最多 50% weekly usage limits 內使用該模型。之後繼續使用,將通過使用學分計費。


Fable 5 因而不適合被當作默認聊天模型隨手打開。它更像一位昂貴的架構師和審稿人,適合在任務開始時定方向,在任務結束前把關,中間大量執行工作則交給成本較低的模型。


最貴的不是一次回答,而是長任務自動跑起來


Fable 5 的成本壓力先來自單價。


每百萬輸入 token 10 美元、每百萬輸出 token 50 美元,讓它本身就是高價模型。短問短答時,用戶可能感受不明顯。但一旦進入程式碼修改、資料整理、產品方案、研究任務、自動化代理等長鏈條場景,輸出 token、上下文、工具呼叫和多輪修正都會疊加。


更容易放大消耗的,是 Fable 5 的強項。


官方文件把它定位為適合 long-horizon agentic work,也就是長期代理式工作。它可以把任務拆成多個階段,主動檢查缺口,必要時繼續呼叫工具或子任務推進。對複雜任務來說,這很有價值,用戶不必每一步都手動提示,模型可以圍繞目標自行迭代。


但如果目標不清、邊界太寬、時間太長,模型可能為了把任務做得更完整而持續運行。原文作者稱,自己在最初幾個小時測試中幾乎耗盡使用限制,儘管並沒有執行特別誇張的任務。這類體驗更像用戶反饋,不是官方成本測算,但提醒了一個現實風險:長會話、自動循環和默認誤用,都會在 7 月 7 日後更直接地變成 credits 消耗。


「10-80-10」:只在關鍵兩端用 Fable


原文提出的核心方法,是把 Fable 5 從「全程執行者」改成「前後把關者」。


所謂「10-80-10」,大致對應一個 AI 項目的三個階段。


前 10% 用 Fable 做規劃。讓它定義任務結構、執行路徑、成功標準、約束條件和交付格式。它最適合的不是機械執行,而是在複雜任務開始前搭出清晰方案。


中間 80% 換成更便宜的模型執行。大量 token 通常消耗在反覆修改、格式調整、程式碼小修、資料整理、普通生成和來回迭代中。這部分工作未必需要 Fable 5 全程參與,可以交給 Opus、Sonnet、Haiku,或其他成本更低的模型。


最後 10% 再把 Fable 拉回來複核。等便宜模型完成主要執行後,讓 Fable 對照最初計劃檢查結果是否偏離目標、有沒有遺漏、哪些地方需要修補、是否達到發布標準。因為此時它是在審查已有產物,而不是從零生成全部內容,token 消耗通常會低得多。


這個方法不等於官方承諾的省錢公式。原文作者提到,部分場景中,把執行層換成便宜模型可將 token 花費降低 50% 以上,但這更應被理解為使用經驗。真正可複製的思路是,高端模型不必承擔所有 token 密集型勞動,它更適合放在判斷、架構和錯誤識別環節。


/goal 和 /loop 讓代理更好用,也讓費用更難查覺


Fable 5 的另一個變化,是它更適合代理式工作流。


在傳統提示方式裡,用戶提出問題,模型回答。用戶檢查後再追問,循環由人推動。每一步是否繼續、是否修正、是否停止,都由用戶決定。


在 Claude Code 環境中,/goal 和 /loop 把這種流程變成更自動化的執行方式。


Anthropic 文檔顯示,/goal 會持續運行直到條件滿足或用戶清除,並可顯示 token spend。官方也建議用戶加入類似「20 輪後停止」的時間或輪次邊界。一個更好的目標不應只是「幫我改代碼」,而是說明要完成什麼、如何驗證結果、哪些限制不能突破、什麼時候停止。


/loop 則用於按間隔重複運行 prompt,例如每 5 分鐘檢查一次部署狀態,也可以由 Claude 動態選擇間隔。官方文檔顯示,循環類任務有 7 天過期規則。這類功能適合監控、迭代、檢查、長期修復和代理任務,模型可以不等用戶反覆提示就繼續推進。


費用風險也在這裡出現。


自動循環把「人類手動確認下一步」改成「模型按計劃繼續跑」。如果目標過寬、結束條件模糊、間隔設定太密、持續時間太長,Fable 5 可能會在用戶離開後繼續消耗 token。模型越擅長發現問題、補充步驟和自我檢查,越需要用戶提前設定硬邊界。


因此,10-80-10 和 loop engineering 更適合一起使用:Fable 5 負責設計循環、設定目標和驗收標準;執行層盡量交給便宜模型;只有在循環關閉、結果需要判斷,或關鍵節點需要質量把關時,再讓 Fable 5 介入。


7 月 7 日後,模型選擇和支出上限都要重新檢查


對普通用戶來說,最直接的風險不是複雜工作流,而是誤用。


原文提醒,開啟 Claude Code 或 Claude 應用時,模型可能預設選中 Fable。這個說法更像使用者經驗,官方資料未將其表述為統一規則。但在新模型重新開放、平台鼓勵使用者測試的階段,一些使用者確實可能在普通聊天、簡單整理或低價值任務中無意使用最貴模型。


按 credits 計費開始後,這種誤用會更敏感。簡單對話、輕量改寫、格式整理、普通總結,並不一定需要 Fable 5。每次開始對話前檢查模型選擇器,可能會成為高頻使用者的基本動作。


另一個現實提醒是設置 spending cap。


Anthropic 支持文件顯示,usage credits 需要在 Settings > Usage 啟用,使用者可設置支付方式並購買或預充值 credits,同時配置 monthly spending cap、auto-reload 和 usage alerts。Claude Code 也適用 usage credits。


如果沒有月度上限,長任務、自動循環和代理式執行可能在短時間內累積明顯費用。對高頻使用者來說,設置月度支出限制、使用提醒,並在 /goal 或 /loop 中寫清停止條件,已經不只是財務設置,而是使用代理模型的一部分。


Fable 5 這類模型帶來的新習慣,是按任務價值和難度分配模型。規劃、複雜判斷、最終複核值得用 Fable;重複執行、普通生成和輕量修改,更適合便宜模型。高端模型正在從「更聰明的聊天機器人」變成「可自動工作的代理」,能力越強,越需要使用者提前設定目標、邊界、時間和預算。否則,帳單失控可能比任務失敗更早出現。



歡迎加入律動 BlockBeats 官方社群:

Telegram 訂閱群:https://t.me/theblockbeats

Telegram 交流群:https://t.me/BlockBeats_App

Twitter 官方帳號:https://twitter.com/BlockBeatsAsia

举报 糾錯/舉報
選擇文庫
新增文庫
取消
完成
新增文庫
僅自己可見
公開
保存
糾錯/舉報
提交