据動察 Beating 監測,Claude 開發者控制台上線 Prompt Caching 儀表板,入口在 platform.claude.com/usage/cache。
儀表板按工作區、模型和時間段篩選,主要展示三項數據:緩存讀取率(cache read ratio),即請求中命中已有緩存的比例;緩存用量構成,把輸入 token 拆成未緩存、5 分鐘緩存寫入、1 小時緩存寫入和緩存讀取四類,以堆疊條形圖呈現;寫入攤銷倍數(write amortization),衡量一次緩存寫入被後續讀取復用了多少次。截圖示例中 Claude Opus 4.6 在 7 天內處理了 27.4 億輸入 token,讀取率 85.4%,寫入攤銷 8.65 倍。底部還有按 1 小時到 24 小時粒度的緩存讀取率時序圖。
Anthropic 的提示緩存機制允許 API 用戶把系統提示、長上下文等固定內容標記為可緩存,首次寫入收取額外費用,後續命中則按標準輸入價的約一折計費。緩存默認保留 5 分鐘,付費可延至 1 小時。此前用戶只能從 API 返回的 token 計數字段間接判斷緩存效果,沒有可視化工具。
