coral-ai/claude-code-token-xray at main · Coral-Bricks-AI/coral-ai

당신 자신의 로컬 Claude 코드 로그 한 달 동안을 역공학(~/.claude/projects/*/*.jsonl)하여 토큰, 시간, 비용이 실제로 어디로 갔는지 확인하고 당신의 환경에서 실행하세요. 로컬 로그만 읽습니다; 어디로도 전송되지 않습니다.

그것이 발견한 것 (내 로그 한 달 동안 - 181 세션, 25,564 모델 호출):

생성에 비용을 지불하지 않고, 다시 읽기에 비용을 지불합니다. ~29M 고유 토큰 → 4.35B 청구 (~150×) , 각 턴마다 전체 ~173K 토큰의 컨텍스트를 다시 전송하기 때문입니다.

청구금액은 84% 입력 / 16% 출력 — 그리고 동일한 컨텍스트를 다시 읽는 것은 64% 입니다.

가장 큰 문제는 본인이 볼 수 없는 것입니다: 숨겨진 이유가 84%의 결과를 차지합니다그리고 모든 것의 60%를 다시 읽습니다

~$3,371 Opus 4.7 목록 가격으로 한 달 동안 지출했습니다. 캐싱은 이미 입력의 98%를 처리하고 있으며 — 그리고 다시 읽는 것은 여전히 청구서의 64%를 차지합니다.

전체 기사 작성 (모든 표, 이유, 메인 스레드 대 비동기 에이전트 분리) → coralbricks.ai/blog/claude-code-token-xray

쿼리 시작

pip install -r requirements.txt   # just tiktoken
python3 token_time_breakdown.py
python3 cost.py
python3 main_vs_sidecar.py
python3 reread_breakdown.py

tiktoken은 OpenAI의 토크나이저이지 Claude의 것이 아니므로 토크 비율은 약 ±15%까지 신뢰할 수 있지만 Claude와 정확하지 않습니다. cost.py의 청구 토큰 수는 API에서 직접 제공됩니다.usage을 차단하고 정확합니다.

이 달에 비용이 얼마나 드나요

cost.py부터 로그에 기록되어 있으며, Opus 4.7 목록 가격으로 설정됩니다.

항목	비용	분할
입력 — 재독해 컨텍스트 (캐시 읽기)	$2,176	64%
입력 — 캐시 쓰기	$682	20%
입력 — 최신 (캐시되지 않음)	$2	0%
출력 — 추론	$429	13%
출력 — 도구 호출 + 요약	$82	2%
총합	$3,371	100%

캐싱이 유일하게 정상적으로 작동하게 하는 것입니다 — 그것이 없으면 같은 작업 목록이 ~$22,630 (~7배)로 늘어납니다. 당신의 숫자는 다를 것입니다; 그것이 포인트입니다. 당신의 것으로 실행해 보세요.

스크립트

token_time_breakdown.py — 헤드라인 테이블: 토큰 (입력/출력을 표시한) 그리고 활동당 wall-clock 시간 (추론, 명령 실행, 도구 호출 작성, 하위 에이전트, 요약, 읽기/검색, 편집)에 더해 비활성 컨텍스트 행 (시스템 프롬프트 + 도구, 첨부 파일, 입력된 프롬프트, 주입된 알림). 한 번의 패스로 토큰과 시간이 일관성을 유지. 추론은 평문으로 저장되지 않음 (암호화된 서명만 저장됨), 따라서 차감을 통해 복원됨: output − tool_calls − summaries. 시간은 이벤트 타임스탬프에서 재구성됨.
cost.py — 총 청구 토큰 (캐시 읽기 / 캐시 쓰기 TTL / 신선한 입력 / 출력)은 Opus 4.7 목록 가격으로 책정되며, 캐싱 없는 상황을 반영한 값입니다.
main_vs_sidecar.py — 인간에 의해 운영되는 메인 스레드를 생성된 서브 에이전트(중첩된 */subagents/*.jsonl 하에 로깅됨)로부터 분리합니다. 청구 토큰, 모델별 비율, 캐시 히트율, 에이전트당 턴 수(메인 스레드는 세션당, 사이드카는 서브 에이전트당), 각각의 비용 및 합계 총액을 보고합니다.
reread_breakdown.py — 각 활동별 누적 입력: 각 세션의 맥락 성장을 재생하여 각 종류의 맥락이 매번 다시 읽히는 경우의 비용을 보여줍니다. unique 대비 re-read 토큰을 각 활동당 보고 (이론은 가장 큰 재읽기 줄입니다). 재생은 측정된 청구 입력(정확)으로 비례하여 조정됩니다; 각 활동별 분할은 모델입니다.

주의사항

한 사람의 한 기기에 한 달 동안 — 방향성으로, 벤치마크가 아닙니다. Claude Code는 동적으로 변경되므로 당신의 분할은 다를 것입니다. 그것이 포인트입니다: 당신의 것으로 실행하세요.
세대 간의 차이도 모델이 쓰기 전에 그의 맥락을 읽는 것을 포함합니다; Bash 시간은 실제 실행(명령어 자동 승인), 하지만 배경에서 실행되거나 별도의 터미널에서 실행되는 코드는 계산되지 않습니다.
시스템 프롬프트 행은 각 세션의 첫 캐시 쓰기를 기준으로 추정됩니다.

이것이 유용했나요?

이것이 Claude Code 토큰, 시간, 비용이 실제로 어디로 가는지 알게 해주셨다면, 리포지토리를 ⭐ 하기 바랍니다. — 이를 통해 다른 사람들이 이를 찾을 수 있습니다. 재독독 시간의 비율이 어떻게 나오는지 궁금하신가요.

라이선스

Apache 2.0 — 리포지토리를 참조하세요라이선스

추천 피드

Hacker News: Show HN