慣性聚合 関心のあるブログ、ニュース、テクノロジーを効率的に追跡
原文を読む 慣性聚合で開く

おすすめ購読元

小众软件
小众软件
博客园 - 叶小钗
有赞技术团队
有赞技术团队
大猫的无限游戏
大猫的无限游戏
博客园_首页
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
L
LangChain Blog
Hugging Face - Blog
Hugging Face - Blog
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
aimingoo的专栏
aimingoo的专栏
Blog — PlanetScale
Blog — PlanetScale
爱范儿
爱范儿
T
Tailwind CSS Blog
Jina AI
Jina AI
量子位
Stack Overflow Blog
Stack Overflow Blog
人人都是产品经理
人人都是产品经理
J
Java Code Geeks
V
Visual Studio Blog
月光博客
月光博客

Hacker News: Show HN

PurrrrrFocus: Pomodoro Timer App - App Store Workflow Engine — Multi-Step Orchestration for Bun RapidPhoto: Pro Photo Editor App - App Store GitHub - amitb-quantum/roboapi: The unified API layer for robotics. Connect any robot, any brand, with one SDK. Like Stripe, but for robots. GitHub - manankharwar/fusioncore: ROS 2 sensor fusion SDK: UKF, 3D native, proper GNSS, zero manual tuning. Apache 2.0. Show HN: Wayland Wlroot Hjkl Everywhere Show HN: Codex context bloat? 87% avg reduction on SWE-bench Verified traces GitHub - NoahCristino/llmcat: A simple CLI that transforms your code into clean, structured text for feeding into LLMs. GitHub - actuallyepic/background-computer-use GitHub - h4ckf0r0day/obscura: The headless browser for AI agents and web scraping GitHub - anthonybudd/Express-ts-API-Template: Production-ready minimal REST API boilerplate using Express.js, Sequelize and MySQL. GitHub - molefrog/lilmd: Agent-friendly CLI for reading large Markdown files Show HN: I built a simple site to reduce tool overload and improve focus GitHub - JonathanRosado/claude-anyteam: Native Claude Code teammates, any LLM. Codex today. Gemini, Kimi, GLM, DeepSeek next. GitHub - abi/lilo Show HN: ffmpeg-render-pro – Parallel video rendering with live dashboard GitHub - adam-s/HNswered: Notifies you when someone replies to your Hacker News posts and comments. GitHub - arian-gogani/nobulex: The accountability primitive for AI agents. Cryptographic behavioral commitments with trustless verification. GitHub - Developing-Gamer/roids: Steroids for your AI agents GitHub - nellavio/nellavio: 🚀 Next.js dashboard starter with auth, i18n, 18 pages, 60+ charts and 90+ UI components Spotify – Web Player GitHub - tillahoffmann/cctape: Claude proxy to record all interactions in a local database, allowing you to browse and search sessions, track usage, and let Claude search its own history over MCP. Show HN: Rook, a macOS notes app for developers GitHub - donchuru/mr-links: Chrome extension that shows referenced links above comments on Marginal Revolution assorted links posts GitHub - anubhavgupta/whisper-npu: Speech to text at cursor using NPU. (shortcut -> win+/) SHOW HN: I built a marketplace agency that treats profit as the actual metric GitHub - trycua/cua: Open-source infrastructure for Computer-Use Agents. Sandboxes, SDKs, and benchmarks to train and evaluate AI agents that can control full desktops (macOS, Linux, Windows). GitHub - montanaflynn/headless-terminal: Headless terminal — puppeteer for TUIs (vim/emacs/htop/nethack) with a Go CLI backed by libghostty-vt The Genesis of TurboPentest.com: Bridging the Gap in an AI-Code Explosion Era GitHub - VincenzoManto/Doxa: A YAML-driven multi-agent simulation platform for economic and social systems. It combines LLM-backed agents, market microstructure, relation graphs, and world events behind a FastAPI API and a React client. GitHub - IdreesInc/PokeMesh: Collaborative Pokémon over a decentralized network, no internet required! GitHub - tamnd/python-one: Historical Python source tarballs (1.0.1 through 2.0c1) mirrored from legacy.python.org, extracted and committed at their original release dates. GitHub - dixalex/decision-linter: Decision Linter — like ESLint for your thinking. Claude Code plugin that scores assumptions, runs consider-the-opposite, and outputs judgment memos. GitHub - pitermarx/Virgulas: An Workflowy Inspired Outliner Show HN: A standalone YouTube Music popup for OBS (no plugins required) GitHub - polotno-project/render-tag: Render HTML string into canvas using 2d native API libgoc/bench/README.md at 81798b3dd5e27d7f1e752b6cff0bdf3a95d381b7 · libgoc/libgoc Show HN: Llm.sql – Run a 640MB LLM on SQLite, with 210MB peak RSS and 7.4 tok/s GitHub - RivoLink/leaf: Terminal Markdown previewer — GUI-like experience. [China AI News] Eight Chinese chip families ran DeepSeek V4 on launch day GitHub - michaelaz774/decision-engine: A decision operating system for startup founders, powered by Claude Code. Synthesizes wisdom from 25+ legendary founders and investors into interactive AI-driven decision frameworks. Sheetflow App - Webflow Apps & Integrations Questly — The Third Rail GitHub - crufter/safer: Sleep better while AI agents have shell access. gitrails/README.md at main · maxawzsinger/gitrails Show HN: RustNmap | Hacker News GitHub - 0x0funky/agent-sprite-forge: Agent Skill for generating 2D sprite sheets, transparent PNG frames, and animated GIFs from prompts. Submissions from github.com/darshanfofadiya | Hacker News GitHub - seb3773/ntfs-repair-rfc: A legally defensible, industry-grade blueprint for building an open-source NTFS structural repair engine from scratch. TOSTask - Chrome 应用商店
coral-ai/claude-code-token-xray は main · Coral-Bricks-AI/coral-ai
Hiteshjain11 · 2026-05-28 · via Hacker News: Show HN

Stars License: Apache 2.0 Python

あなた自身のローカルClaudeコードログの1ヶ月分を逆-engineerし、~/.claude/projects/*/*.jsonl実際にトークン、時間、コストが行き先を特定し、それをあなたの環境で実行します。ローカルログのみを参照し、何も送信されません。

Token consumption per task, before vs. after the Opus 4.7 upgrade — ~4× on the same work

発見内容(私自身の1ヶ月分のログ—181セッション、25,564モデル呼び出し):

  • 生成には料金を払うのではなく、再読み上げには料金を払う. ~29Mユニークトークン→ 4.35B請求 (~150×)、なぜなら各ターンで全ての~173Kトークンコンテキストが再送信されるから.
  • 請求額は84%入力/16%出力 — 同じコンテキストを再読み上げるのは64%である.
  • 最も大きな線は見ることができないものです:隠された論理は出力の84%ですそしてすべての再読の約60%です
  • ~$3,371でOpus 4.7のリストレートで月額です。キャッシングはすでに入力の98%を処理しており—再読はまだ請求の64%です。

完全な記事(すべての表、理由、メインスレッドとサブエージェントの分離)→ coralbricks.ai/blog/claude-code-token-xray

クイックスタート

pip install -r requirements.txt   # just tiktoken
python3 token_time_breakdown.py
python3 cost.py
python3 main_vs_sidecar.py
python3 reread_breakdown.py

tiktokenはOpenAIのトークナイザーであり、Claudeのものではないため、トークン比率は約±15%の信頼性があり、Claudeの正確なものではない。cost.pyの請求トークン数はAPIから直接得られる。usage はブロックされ、正確です。

どの月かコストです。

cost.py から私のログに、Opus 4.7 のリスト価格で設定されています:

行項目 コスト シェア
入力 — コンテキストの再読み込み(キャッシュ読み取り) $2,176 64%
入力 — キャッシュ書き込み $682 20%
入力 — 新鮮(キャッシュ未使用) $2 0%
出力 — 推論 $429 13%
出力 — ツール呼び出し + 概要 $82 2%
合計 $3,371 100%

キャッシングがそれを正常に保っている唯一のことは——それがなければ同じ作業リストが~22,630 (~7倍)になる。あなたの数値は異なるでしょう;それがポイントです。あなたのもので実行してください.

スクリプト

  • token_time_breakdown.py — ヘッドラインテーブル:トークン(入力/出力をマーク) それぞれの活動(推論、コマンド実行、ツール呼び出しの書き込み、サブエージェント、要約、読み取り/検索、編集)あたりの実行時間と、パッシブコンテキストの行(システムプロンプト+ツール、添付ファイル、タイプされたプロンプト、注入されたリマインダー)の合計時間。一度のパスで、トークンと時間が一貫性を保たれます。推論は平文で保存されない(暗号化された署名のみ保存されるため)、差し引きによって復元されます:output − tool_calls − summaries。時間はイベントタイムスタンプから再構築されます。
  • cost.py — トークン総額(キャッシュ読み込み/キャッシュ書き込み(TTL/新鮮な入力/出力))はOpus 4.7のリスト価格で計算され、キャッシュなしの反実仮想も含まれます。
  • main_vs_sidecar.py — 人間が操作するメインスレッドとスパウンドされたサブエージェント(*/subagents/*.jsonlのネストされたログに記録)を分離します。報告されるトークン数、モデルのミックス、キャッシュヒット率、エージェントあたりのターン数(メインスレッドはセッションあたり、サイドカーメインスレッドはサブエージェントあたり)、それぞれのコストと合計コストを報告します。
  • reread_breakdown.py — 各アクティビティごとの累積入力: 各セッションのコンテキスト成長を再生し、各種コンテキストが一度再読みされた時にどれだけのコストがかかるかを表示します。uniquere-read のトークン数を各アクティビティごとに報告します(推論が最も大きな再読み行です)。再生は測定された課金入力(正確)にスケーリングされ、各アクティビティの分割はモデルです.

注意点

  • 一つのマシンで一人の月 — 方向性であり、ベンチマークではありません。Claude Codeは動的ですので、あなたの分割は異なります。それがポイントです:あなたのもので実行してください。
  • 世代の間隔には、モデルが書き込む前にコンテキストを読む時間も含まれます;Bash時間は実際の実行(コマンドは自動的に承認されます)ですが、バックグラウンドで実行されるコードや別のターミナルで実行されるコードはカウントされません。
  • システムプロンプトの行は、各セッションの最初のキャッシュ書き込みから推定されます。

この情報が役に立つと思いましたか?

もしこれがあなたのClaude Codeのトークン、時間、コストが実際にどこに行っているかを理解するのに役立ったなら、⭐リポジトリ— 他が他の人にそれを見つけやすくするのを助ける。あなたの再読シェアがどうなるか気になる。

ライセンス

Apache 2.0 — リポジトリを参照してくださいライセンス