coral-ai/claude-code-token-xray は main · Coral-Bricks-AI/coral-ai

あなた自身のローカルClaudeコードログの1ヶ月分を逆-engineerし、~/.claude/projects/*/*.jsonl実際にトークン、時間、コストが行き先を特定し、それをあなたの環境で実行します。ローカルログのみを参照し、何も送信されません。

発見内容（私自身の1ヶ月分のログ—181セッション、25,564モデル呼び出し）：

生成には料金を払うのではなく、再読み上げには料金を払う. ~29Mユニークトークン→ 4.35B請求 (~150×)、なぜなら各ターンで全ての~173Kトークンコンテキストが再送信されるから.

請求額は84%入力/16%出力 — 同じコンテキストを再読み上げるのは64%である.

最も大きな線は見ることができないものです：隠された論理は出力の84%ですそしてすべての再読の約60%です

~$3,371でOpus 4.7のリストレートで月額です。キャッシングはすでに入力の98%を処理しており—再読はまだ請求の64%です。

完全な記事（すべての表、理由、メインスレッドとサブエージェントの分離）→ coralbricks.ai/blog/claude-code-token-xray

クイックスタート

pip install -r requirements.txt   # just tiktoken
python3 token_time_breakdown.py
python3 cost.py
python3 main_vs_sidecar.py
python3 reread_breakdown.py

tiktokenはOpenAIのトークナイザーであり、Claudeのものではないため、トークン比率は約±15%の信頼性があり、Claudeの正確なものではない。cost.pyの請求トークン数はAPIから直接得られる。usage はブロックされ、正確です。

どの月かコストです。

cost.py から私のログに、Opus 4.7 のリスト価格で設定されています：

行項目	コスト	シェア
入力 — コンテキストの再読み込み（キャッシュ読み取り）	$2,176	64%
入力 — キャッシュ書き込み	$682	20%
入力 — 新鮮（キャッシュ未使用)	$2	0%
出力 — 推論	$429	13%
出力 — ツール呼び出し + 概要	$82	2%
合計	$3,371	100%

キャッシングがそれを正常に保っている唯一のことは——それがなければ同じ作業リストが~22,630 (~7倍)になる。あなたの数値は異なるでしょう；それがポイントです。あなたのもので実行してください.

スクリプト

token_time_breakdown.py — ヘッドラインテーブル：トークン（入力/出力をマーク）とそれぞれの活動（推論、コマンド実行、ツール呼び出しの書き込み、サブエージェント、要約、読み取り/検索、編集）あたりの実行時間と、パッシブコンテキストの行（システムプロンプト＋ツール、添付ファイル、タイプされたプロンプト、注入されたリマインダー）の合計時間。一度のパスで、トークンと時間が一貫性を保たれます。推論は平文で保存されない（暗号化された署名のみ保存されるため）、差し引きによって復元されます：output − tool_calls − summaries。時間はイベントタイムスタンプから再構築されます。
cost.py — トークン総額（キャッシュ読み込み/キャッシュ書き込み（TTL/新鮮な入力/出力））はOpus 4.7のリスト価格で計算され、キャッシュなしの反実仮想も含まれます。
main_vs_sidecar.py — 人間が操作するメインスレッドとスパウンドされたサブエージェント（*/subagents/*.jsonlのネストされたログに記録）を分離します。報告されるトークン数、モデルのミックス、キャッシュヒット率、エージェントあたりのターン数（メインスレッドはセッションあたり、サイドカーメインスレッドはサブエージェントあたり）、それぞれのコストと合計コストを報告します。
reread_breakdown.py — 各アクティビティごとの累積入力: 各セッションのコンテキスト成長を再生し、各種コンテキストが一度再読みされた時にどれだけのコストがかかるかを表示します。unique と re-read のトークン数を各アクティビティごとに報告します（推論が最も大きな再読み行です）。再生は測定された課金入力（正確）にスケーリングされ、各アクティビティの分割はモデルです.

注意点

一つのマシンで一人の月 — 方向性であり、ベンチマークではありません。Claude Codeは動的ですので、あなたの分割は異なります。それがポイントです：あなたのもので実行してください。
世代の間隔には、モデルが書き込む前にコンテキストを読む時間も含まれます；Bash時間は実際の実行（コマンドは自動的に承認されます）ですが、バックグラウンドで実行されるコードや別のターミナルで実行されるコードはカウントされません。
システムプロンプトの行は、各セッションの最初のキャッシュ書き込みから推定されます。

この情報が役に立つと思いましたか？

もしこれがあなたのClaude Codeのトークン、時間、コストが実際にどこに行っているかを理解するのに役立ったなら、⭐リポジトリ— 他が他の人にそれを見つけやすくするのを助ける。あなたの再読シェアがどうなるか気になる。

ライセンス

Apache 2.0 — リポジトリを参照してくださいライセンス

おすすめ購読元

Hacker News: Show HN