인셔셔RSS 관심 있는 블로그, 뉴스, 기술 정보를 효율적으로 추적하고 읽으세요
원문 읽기 InertiaRSS에서 열기

추천 피드

小众软件
小众软件
博客园 - 叶小钗
有赞技术团队
有赞技术团队
大猫的无限游戏
大猫的无限游戏
博客园_首页
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
L
LangChain Blog
Hugging Face - Blog
Hugging Face - Blog
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
aimingoo的专栏
aimingoo的专栏
Blog — PlanetScale
Blog — PlanetScale
爱范儿
爱范儿
T
Tailwind CSS Blog
Jina AI
Jina AI
量子位
Stack Overflow Blog
Stack Overflow Blog
人人都是产品经理
人人都是产品经理
J
Java Code Geeks
V
Visual Studio Blog
月光博客
月光博客

Hacker News: Show HN

PurrrrrFocus: Pomodoro Timer App - App Store Workflow Engine — Multi-Step Orchestration for Bun RapidPhoto: Pro Photo Editor App - App Store GitHub - amitb-quantum/roboapi: The unified API layer for robotics. Connect any robot, any brand, with one SDK. Like Stripe, but for robots. GitHub - manankharwar/fusioncore: ROS 2 sensor fusion SDK: UKF, 3D native, proper GNSS, zero manual tuning. Apache 2.0. Show HN: Wayland Wlroot Hjkl Everywhere Show HN: Codex context bloat? 87% avg reduction on SWE-bench Verified traces GitHub - NoahCristino/llmcat: A simple CLI that transforms your code into clean, structured text for feeding into LLMs. GitHub - actuallyepic/background-computer-use GitHub - h4ckf0r0day/obscura: The headless browser for AI agents and web scraping GitHub - anthonybudd/Express-ts-API-Template: Production-ready minimal REST API boilerplate using Express.js, Sequelize and MySQL. GitHub - molefrog/lilmd: Agent-friendly CLI for reading large Markdown files Show HN: I built a simple site to reduce tool overload and improve focus GitHub - JonathanRosado/claude-anyteam: Native Claude Code teammates, any LLM. Codex today. Gemini, Kimi, GLM, DeepSeek next. GitHub - abi/lilo Show HN: ffmpeg-render-pro – Parallel video rendering with live dashboard GitHub - adam-s/HNswered: Notifies you when someone replies to your Hacker News posts and comments. GitHub - arian-gogani/nobulex: The accountability primitive for AI agents. Cryptographic behavioral commitments with trustless verification. GitHub - Developing-Gamer/roids: Steroids for your AI agents GitHub - nellavio/nellavio: 🚀 Next.js dashboard starter with auth, i18n, 18 pages, 60+ charts and 90+ UI components Spotify – Web Player GitHub - tillahoffmann/cctape: Claude proxy to record all interactions in a local database, allowing you to browse and search sessions, track usage, and let Claude search its own history over MCP. Show HN: Rook, a macOS notes app for developers GitHub - donchuru/mr-links: Chrome extension that shows referenced links above comments on Marginal Revolution assorted links posts GitHub - anubhavgupta/whisper-npu: Speech to text at cursor using NPU. (shortcut -> win+/) SHOW HN: I built a marketplace agency that treats profit as the actual metric GitHub - trycua/cua: Open-source infrastructure for Computer-Use Agents. Sandboxes, SDKs, and benchmarks to train and evaluate AI agents that can control full desktops (macOS, Linux, Windows). GitHub - montanaflynn/headless-terminal: Headless terminal — puppeteer for TUIs (vim/emacs/htop/nethack) with a Go CLI backed by libghostty-vt The Genesis of TurboPentest.com: Bridging the Gap in an AI-Code Explosion Era GitHub - VincenzoManto/Doxa: A YAML-driven multi-agent simulation platform for economic and social systems. It combines LLM-backed agents, market microstructure, relation graphs, and world events behind a FastAPI API and a React client. GitHub - IdreesInc/PokeMesh: Collaborative Pokémon over a decentralized network, no internet required! GitHub - tamnd/python-one: Historical Python source tarballs (1.0.1 through 2.0c1) mirrored from legacy.python.org, extracted and committed at their original release dates. GitHub - dixalex/decision-linter: Decision Linter — like ESLint for your thinking. Claude Code plugin that scores assumptions, runs consider-the-opposite, and outputs judgment memos. GitHub - pitermarx/Virgulas: An Workflowy Inspired Outliner Show HN: A standalone YouTube Music popup for OBS (no plugins required) GitHub - polotno-project/render-tag: Render HTML string into canvas using 2d native API libgoc/bench/README.md at 81798b3dd5e27d7f1e752b6cff0bdf3a95d381b7 · libgoc/libgoc Show HN: Llm.sql – Run a 640MB LLM on SQLite, with 210MB peak RSS and 7.4 tok/s GitHub - RivoLink/leaf: Terminal Markdown previewer — GUI-like experience. [China AI News] Eight Chinese chip families ran DeepSeek V4 on launch day GitHub - michaelaz774/decision-engine: A decision operating system for startup founders, powered by Claude Code. Synthesizes wisdom from 25+ legendary founders and investors into interactive AI-driven decision frameworks. Sheetflow App - Webflow Apps & Integrations Questly — The Third Rail GitHub - crufter/safer: Sleep better while AI agents have shell access. gitrails/README.md at main · maxawzsinger/gitrails Show HN: RustNmap | Hacker News GitHub - 0x0funky/agent-sprite-forge: Agent Skill for generating 2D sprite sheets, transparent PNG frames, and animated GIFs from prompts. Submissions from github.com/darshanfofadiya | Hacker News GitHub - seb3773/ntfs-repair-rfc: A legally defensible, industry-grade blueprint for building an open-source NTFS structural repair engine from scratch. TOSTask - Chrome 应用商店
coral-ai/claude-code-token-xray at main · Coral-Bricks-AI/coral-ai
Hiteshjain11 · 2026-05-28 · via Hacker News: Show HN

Stars License: Apache 2.0 Python

당신 자신의 로컬 Claude 코드 로그 한 달 동안을 역공학(~/.claude/projects/*/*.jsonl)하여 토큰, 시간, 비용이 실제로 어디로 갔는지 확인하고 당신의 환경에서 실행하세요. 로컬 로그만 읽습니다; 어디로도 전송되지 않습니다.

Token consumption per task, before vs. after the Opus 4.7 upgrade — ~4× on the same work

그것이 발견한 것 (내 로그 한 달 동안 - 181 세션, 25,564 모델 호출):

  • 생성에 비용을 지불하지 않고, 다시 읽기에 비용을 지불합니다. ~29M 고유 토큰 → 4.35B 청구 (~150×) , 각 턴마다 전체 ~173K 토큰의 컨텍스트를 다시 전송하기 때문입니다.
  • 청구금액은 84% 입력 / 16% 출력 — 그리고 동일한 컨텍스트를 다시 읽는 것은 64% 입니다.
  • 가장 큰 문제는 본인이 볼 수 없는 것입니다: 숨겨진 이유가 84%의 결과를 차지합니다그리고 모든 것의 60%를 다시 읽습니다
  • ~$3,371 Opus 4.7 목록 가격으로 한 달 동안 지출했습니다. 캐싱은 이미 입력의 98%를 처리하고 있으며 — 그리고 다시 읽는 것은 여전히 청구서의 64%를 차지합니다.

전체 기사 작성 (모든 표, 이유, 메인 스레드 대 비동기 에이전트 분리) → coralbricks.ai/blog/claude-code-token-xray

쿼리 시작

pip install -r requirements.txt   # just tiktoken
python3 token_time_breakdown.py
python3 cost.py
python3 main_vs_sidecar.py
python3 reread_breakdown.py

tiktoken은 OpenAI의 토크나이저이지 Claude의 것이 아니므로 토크 비율은 약 ±15%까지 신뢰할 수 있지만 Claude와 정확하지 않습니다. cost.py의 청구 토큰 수는 API에서 직접 제공됩니다.usage을 차단하고 정확합니다.

이 달에 비용이 얼마나 드나요

cost.py부터 로그에 기록되어 있으며, Opus 4.7 목록 가격으로 설정됩니다.

항목 비용 분할
입력 — 재독해 컨텍스트 (캐시 읽기) $2,176 64%
입력 — 캐시 쓰기 $682 20%
입력 — 최신 (캐시되지 않음) $2 0%
출력 — 추론 $429 13%
출력 — 도구 호출 + 요약 $82 2%
총합 $3,371 100%

캐싱이 유일하게 정상적으로 작동하게 하는 것입니다 — 그것이 없으면 같은 작업 목록이 ~$22,630 (~7배)로 늘어납니다. 당신의 숫자는 다를 것입니다; 그것이 포인트입니다. 당신의 것으로 실행해 보세요.

스크립트

  • token_time_breakdown.py — 헤드라인 테이블: 토큰 (입력/출력을 표시한) 그리고 활동당 wall-clock 시간 (추론, 명령 실행, 도구 호출 작성, 하위 에이전트, 요약, 읽기/검색, 편집)에 더해 비활성 컨텍스트 행 (시스템 프롬프트 + 도구, 첨부 파일, 입력된 프롬프트, 주입된 알림). 한 번의 패스로 토큰과 시간이 일관성을 유지. 추론은 평문으로 저장되지 않음 (암호화된 서명만 저장됨), 따라서 차감을 통해 복원됨: output − tool_calls − summaries. 시간은 이벤트 타임스탬프에서 재구성됨.
  • cost.py — 총 청구 토큰 (캐시 읽기 / 캐시 쓰기 TTL / 신선한 입력 / 출력)은 Opus 4.7 목록 가격으로 책정되며, 캐싱 없는 상황을 반영한 값입니다.
  • main_vs_sidecar.py — 인간에 의해 운영되는 메인 스레드를 생성된 서브 에이전트(중첩된 */subagents/*.jsonl 하에 로깅됨)로부터 분리합니다. 청구 토큰, 모델별 비율, 캐시 히트율, 에이전트당 턴 수(메인 스레드는 세션당, 사이드카는 서브 에이전트당), 각각의 비용 및 합계 총액을 보고합니다.
  • reread_breakdown.py — 각 활동별 누적 입력: 각 세션의 맥락 성장을 재생하여 각 종류의 맥락이 매번 다시 읽히는 경우의 비용을 보여줍니다. unique 대비 re-read 토큰을 각 활동당 보고 (이론은 가장 큰 재읽기 줄입니다). 재생은 측정된 청구 입력(정확)으로 비례하여 조정됩니다; 각 활동별 분할은 모델입니다.

주의사항

  • 한 사람의 한 기기에 한 달 동안 — 방향성으로, 벤치마크가 아닙니다. Claude Code는 동적으로 변경되므로 당신의 분할은 다를 것입니다. 그것이 포인트입니다: 당신의 것으로 실행하세요.
  • 세대 간의 차이도 모델이 쓰기 전에 그의 맥락을 읽는 것을 포함합니다; Bash 시간은 실제 실행(명령어 자동 승인), 하지만 배경에서 실행되거나 별도의 터미널에서 실행되는 코드는 계산되지 않습니다.
  • 시스템 프롬프트 행은 각 세션의 첫 캐시 쓰기를 기준으로 추정됩니다.

이것이 유용했나요?

이것이 Claude Code 토큰, 시간, 비용이 실제로 어디로 가는지 알게 해주셨다면, 리포지토리를 ⭐ 하기 바랍니다. — 이를 통해 다른 사람들이 이를 찾을 수 있습니다. 재독독 시간의 비율이 어떻게 나오는지 궁금하신가요.

라이선스

Apache 2.0 — 리포지토리를 참조하세요라이선스