惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

The Last Watchdog
The Last Watchdog
Schneier on Security
Schneier on Security
NISL@THU
NISL@THU
T
Tor Project blog
N
News and Events Feed by Topic
C
CERT Recently Published Vulnerability Notes
Application and Cybersecurity Blog
Application and Cybersecurity Blog
Project Zero
Project Zero
T
Threat Research - Cisco Blogs
P
Proofpoint News Feed
P
Privacy & Cybersecurity Law Blog
S
Security @ Cisco Blogs
O
OpenAI News
Scott Helme
Scott Helme
T
Troy Hunt's Blog
C
Cybersecurity and Infrastructure Security Agency CISA
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
P
Palo Alto Networks Blog
H
Hacker News: Front Page
N
News and Events Feed by Topic
www.infosecurity-magazine.com
www.infosecurity-magazine.com
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
阮一峰的网络日志
阮一峰的网络日志
Google DeepMind News
Google DeepMind News
Martin Fowler
Martin Fowler
博客园 - 叶小钗
Microsoft Azure Blog
Microsoft Azure Blog
云风的 BLOG
云风的 BLOG
K
Kaspersky official blog
Cyberwarzone
Cyberwarzone
Webroot Blog
Webroot Blog
C
Cisco Blogs
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
Hacker News: Ask HN
Hacker News: Ask HN
Vercel News
Vercel News
Hacker News - Newest:
Hacker News - Newest: "LLM"
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Last Week in AI
Last Week in AI
Simon Willison's Weblog
Simon Willison's Weblog
M
MIT News - Artificial intelligence
GbyAI
GbyAI
Y
Y Combinator Blog
C
CXSECURITY Database RSS Feed - CXSecurity.com
L
LangChain Blog
The Cloudflare Blog
AWS News Blog
AWS News Blog
Attack and Defense Labs
Attack and Defense Labs
H
Help Net Security
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
The Hacker News
The Hacker News

Все публикации подряд на Хабре

Ловим музу за клавиатуру: как айтишнику стать автором Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента Никто не любит писать тесты, но ИИ может исправить это IPv8 выглядит как мечта. Поэтому почти наверняка не взлетит Производители вернули в продажу материнки с DDR3. Что происходит? Управление агентом с телефона через Telegram теперь в KodaCode От координации к лидерству: как меняется роль руководителя разработки Я сделала родителям бизнес вместо пенсии: зарабатываем 70 тысяч, мама не даёт продать В три раза быстрее приемка товара и оптимизация трудозатрат на 73%: как «РСТ-Инвент» помог Gulliver Group ИИ-шечный мир победил? О влиянии искусственного интеллекта на игропром Кремль снижает давление на Телеграмм пока Европа строит интернет по паспорту Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением Как (не) потерять домен за выходные Вместо 8 разных VPS: как я организовал практику студентам на одном сервере Почему твой Open Source проект не замечают? R&D: искусство управления неопределенностью в разработке AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет Мы отдали управление роботами OpenClaw. Что из этого вышло Галактический ID: система идентификации для всех форм разумной жизни Шесть основ бизнес-анализа: начинаем с вопроса «Кто в игре?» Код-ревью, в котором дело не в коде Данные переехали. Команда — нет Системной подход к сдаче OSWE в 2025 Почему комната управления реактором покрашена в цвет морской пены 4 YAML-файла вместо PySpark: как аналитикам строить пайплайны без разработчиков LLM-агент для поиска свободных доменов: автоматизируем подбор Когда, зачем и как правильно начинать новую сессию в Claude Code? Как я заставил нейросеть писать макросы для FreeCAD Анатомия ИИ‑агента для подбора персонала. От тысячи резюме к топ‑10 за минуты Опыт разработчика как экономика внимания Автономность как точка невозврата: кто будет субъектом в цифровом будущем Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты Как измерить LLM для задач кибербеза: обзор открытых бенчмарков Где хранить код? Сравнение GitHub, GitLab и Bitbucket Математика объясняет, почему нормальное распределение встречается повсюду Почему ваш FinOps не работает: 12 тезисов от практиков Как подписать проектную документацию УКЭП с использованием бесплатных лицензий Pilot Адаптивное администрирование Sigla Vision Я грузил уран в бочки, а потом 20 лет строил ИТ в атомной отрасли Чем позвонить с Эвереста? История и обзор спутниковой связи. Часть 2 Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии Как не передать на desktop свой IP в РКН Анатомия SAP Privileges: как устроено управление правами в macOS MoneyDev: Сказка про три главных слова Обновлённый токенизатор видео K-VAE 2.0 от Сбера Как сделать диспетчеризацию дома на 1284 квартиры почти бесплатно Как мы разогнали железную дорогу Мы дали агентам рутину. Теперь надо решить — что делать с освободившимся временем Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM Умный город начинается с точного взгляда: как «Фалькон Тех» меняет пространство к лучшему Навайбкодил приложение для анализа графов Почему Дюну так интересно читать? Упрощаем работу с рутиной или как стать Гендальфом Белым Деконструкция Go: CPU, RAM и что там происходит. Go Assembler база. Часть 1.1 Какие профессии исчезнут из-за ИИ, а какие появятся? И что с этим делать Как мы построили IT-отдел, где хочется расти: архитектурные встречи, прозрачные метрики и книжные подарки Rufler: Делаем из Claude Code автономный рой через один YAML-конфиг Sing-box и белый список приложений Как построить надёжный обмен сообщениями в микросервисах: лучшие практики для enterprise OpenAI строит MLM-пирамиду, а McKinsey и Accenture помогают ей в этом Дом, который не построил Фишер (Часть 2) «Сверхзвуковой математик» против «Вдумчивого логиста»: битва алгоритмов 3D-упаковки Мультимодальные модели – грубый и дорогой инструмент Разговоры ничего не стоят. Код тоже Проверки физических лиц: с кого начнет ФНС Топ-10 бесплатных нейросетей для создания видео в 2026 году Первые слои кода: как наши решения сегодня определяют архитектуру ИИ на десятилетия Разработка нового статического анализатора: PVS-Studio JavaScript Поиск уязвимостей ПО: базовый минимум или роскошный максимум Почему оценка персонала не работает как инструмент управления Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50% Как я ушел из найма, нажарил косточек и продал на маркетплейсах на 168 млн в год Когда 1С:ERP уже внедрена, а нормального производственного плана всё ещё нет Как я сделал Claude мультимодальным, подключив к нему Qwen Omni Как приглашение на вакансию мечты превращается в атаку Infrastructure as Code: философия и лучшие практики IaC Тестируем Yandex Code Assistant на задаче, в которой нужно хранить секреты nxs-universal-chart v3.0: новое поколение универсального Helm-чарта Callback Injection: Техника, которая отправила Microsoft Defender в глухой нокаут «Все идеи на стол»: митап как способ вывести проект из тупика Сегодня я узнал нечто новое о GPU благодаря багу в своей игре Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать Карта событий как фундамент аналитики: практический кейс для E-commerce Что выбрать для AI: x86, ARM или RISC-V? Дайджест железа за март Роль соматических мутаций в развитии аутоиммунных заболеваний: путь к избирательной терапии Mythos от Anthropic — тревожный сигнал для всех, а не только для банков Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение Финансовая гонка вооружений: почему умные люди добровольно в ней участвуют Эра ИИ-агентов наступила: выбираем лучшего цифрового сотрудника # Практический опыт внедрения WinCC Redundancy на производственном предприятии Сделал MVP за 3 дня, а потом неделю прикручивал оплату. Оно того стоило? Физика против Маска: почему Starship V3 может оказаться ещё одной катастрофой Нефть Венесуэлы: крупнейшие запасы в мире, но не крупнейшая нефтяная держава JPA 4. Переосмысление Hibernate Почему зеркальная фотокамера Nikon D5 десятилетней давности идеально подошла для миссии «Артемида-2» Проект «Уровень-Спутник» или как мы сделали платформу для гидрологов «Замедлиться, чтобы ускориться»: почему ИИ повышает цену ошибок в требованиях и архитектуре Как с нуля поднять трафик IT-компании на 1657% при бюджете 55 тыс. и выжить Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь
Opus оркеструет, DeepSeek V4 пишет код: как собрать связку внутри Claude Code и сэкономить деньги
Maxim Samus · 2026-06-18 · via Все публикации подряд на Хабре

Простой

5 мин

130

Однажды я открыл биллинг и просто посмотрел, на что уходят токены. Не на «подумать над архитектурой». А на переименование переменных, генерацию тестов по готовому ТЗ и прогон миграций. Всё это считалось по тарифу флагманской модели, хотя такую работу вытянет модель в десятки раз дешевле.

Ниже – как развести действительно сложные задачи и рутину по двум моделям внутри Claude Code, не ставя ни одного стороннего форка. И три зоны, куда дешёвую модель я не пускаю принципиально.

Что на самом деле сжигает токены

Если разобрать мои сессии в Claude Code по типам задач, картина ясна: примерно 80% – это не размышление, а механика. Написать функцию, для которой уже есть точное ТЗ. Накидать юнит-тест. Поправить форматирование. Переименовать символ по всему модулю. Сгенерировать SQL-миграцию по схеме.

Ни одна из этих задач не требует фронтирной модели. Я же по привычке гонял через топ всё подряд – и платил за токены вывода, которых в разработке генерируется много, по самому верхнему прайсу.

Отсюда и решение: флагман остаётся там, где нужны глубокие размышления, а конвейер уходит тому, кто дешевле. В тот же вечер я разнёс задачи по двум моделям. Opus остался планировать, держать архитектуру и проверять результат. Всю механику забрал DeepSeek V4 – в том же интерфейсе Claude Code.

Цифры

Вот актуальные ставки за миллион токенов из прайсов Anthropic и DeepSeek на июнь 2026. Вывод считаю отдельно – в коде модель пишет много, и платите вы в основном именно за выходные токены.

Вот актуальные ставки за миллион токенов из прайсов Anthropic и DeepSeek на июнь 2026. Вывод считаю отдельно – в коде модель пишет много, и платите вы в основном именно за выходные токены.

Двадцать пять долларов за миллион выходных у Opus против восьмидесяти семи центов у DeepSeek V4-pro – это разница примерно в тридцать раз. У младшего flash выход стоит двадцать восемь центов: почти в сто раз дешевле флагмана.

Имейте в виду: я видел в другой статье ценник «DeepSeek V4 – $1.74 на вход и $3.48 на выход». Это устаревший прайс, который переписывают друг у друга, не сверяясь с первоисточником. Я залез в официальную документацию DeepSeek: на июнь 2026 V4-pro стоит $0.435 и $0.87. Проверяйте дату у любой цифры, которую вам показывают, – это касается и моих чисел тоже.

DeepSeek не заменит Opus – на сложной архитектуре он начинает плыть. Но те самые 80% рутины он закрывает спокойно, а флагман остаётся ровно там, где без него никак не получится добиться нужного качества.

Вся идея – в одну строку

Opus думает. DeepSeek делает.

Технически это две сессии Claude Code поверх одного проекта. Первая работает на Opus и играет роль тимлида: разбирает задачу, держит контекст, ставит подзадачи и принимает работу. Вторая – на DeepSeek, это исполнитель: получает конкретную задачу и пишет код. Обе сессии открыты в одной рабочей папке, видят те же файлы, те же MCP-серверы и те же скиллы. Отличается только цена токена у движка под капотом – и эта разница решает всё.

На практике это просто два окна терминала в одном каталоге: в одном запущен обычный Claude, в другом – команда, которая ходит на DeepSeek.

Как это поставить штатно, без форков

Сначала – чего делать не нужно.

В части гайдов первым шагом предлагают поставить сторонний форк Claude Code. Не делайте этого. Терминальный агент получает доступ ко всей вашей кодовой базе целиком, и доверять этот доступ чужой пересборке – так себе идея. Никакой форк здесь не нужен.

Связка собирается на родных механизмах. Claude Code умеет ходить на произвольный endpoint через переменную ANTHROPIC_BASE_URL. У DeepSeek есть Anthropic-совместимый API по адресу /anthropic – он принимает тот же формат запросов. Поэтому они стыкуются напрямую, без прослоек: вы просто говорите клиенту ходить на другой сервер.

Порядок такой. Регистрируете аккаунт на platform.deepseek.com, пополняете на пару долларов, выпускаете API-ключ. Дальше заводите отдельную команду, чтобы обычный claude остался на Opus, а вторая ходила на DeepSeek. У меня это маленький bash-скрипт claude-deepseek в ~/.local/bin/:

#!/usr/bin/env bash export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic export ANTHROPIC_API_KEY=ваш_ключ_deepseek export ANTHROPIC_MODEL=deepseek-v4-pro export ANTHROPIC_DEFAULT_HAIKU_MODEL=deepseek-v4-flash exec claude "$@"

Разберу строки, чтобы было видно, что где:

  • ANTHROPIC_BASE_URL – переключает клиента с серверов Anthropic на DeepSeek.

  • ANTHROPIC_API_KEY – ключ DeepSeek (Anthropic-ключ здесь не нужен).

  • ANTHROPIC_MODEL – основная модель сессии, ставлю deepseek-v4-pro.

  • ANTHROPIC_DEFAULT_HAIKU_MODEL – модель для служебных фоновых вызовов (короткие технические запросы, которые клиент делает сам). Сюда ставлю дешёвый deepseek-v4-flash, чтобы и фон стоил копейки. В старых версиях Claude Code эта переменная называлась ANTHROPIC_SMALL_FAST_MODEL.

  • exec claude "$@" – запускает обычный клиент с этим окружением и пробрасывает все аргументы.

chmod +x, и готово. Теперь claude у меня – это Opus для задач «включить голову», а claude-deepseek – для задач «поработать руками». Проверял живьём на актуальной версии Claude Code: интерфейс и команды те же, но запросы уходят в DeepSeek, и выходные токены стоят в разы дешевле.

Три зоны, куда DeepSeek я не пускаю

Это самая важная часть.

Первое – ничего чувствительного. Все запросы уходят на серверы DeepSeek. Коммерческий код, ключи, данные клиентов и любую персональную информацию туда не отправляю – для этого есть флагман и закрытый контур. Это базовая гигиена: вы буквально пересылаете содержимое файлов внешнему провайдеру.

Второе – архитектура и тонкие развязки. Там, где нужно удерживать всю систему в голове и аккуратно сшивать модули, остаётся Opus. На сложном DeepSeek склонен додумывать и может сломать проект.

Третье – длинные автономные цепочки. Когда агент идёт по пайплайну в десяток шагов и ошибка на третьем распознаётся десятом, нужен тот, кто реже ошибается. Дешёвую модель я ставлю только туда, где вижу результат сразу и могу его проверить на месте.

Как-то я поручил DeepSeek собрать формулу для калькулятора – посчитать стоимость по нескольким параметрам. Код он написал чисто, а вот коэффициенты внутри проставил с потолка: ровные числа, которых в задаче не было. Результат, естественно, оказался неверным. Поймал я это, только когда пересчитал один пример руками. С тех пор правило простое: код пишет DeepSeek, а арифметику и «факты» я ему не доверяю. Любые цифры, метрики и константы от дешёвой модели перепроверяйте сами.

Сколько это даёт в деньгах

По итоговому счёту выходит в три-пять раз дешевле. Opus вы всё равно держите на оркестрации, и часть бюджета уходит ему. Но основная масса токенов раньше сгорала именно на рутине по цене флагмана – а теперь та же рутина считается по ставке, которая в десятки раз ниже.

Схема собирается за десять минут, не требует форков и не ломает привычный воркфлоу. Стоит попробовать хотя бы на одном проекте – посмотреть на свой биллинг через неделю.

Свой первый продукт я собрал ровно на этом подходе. Разборы похожих связок – как платить за Claude Code из России, чем заменить его дешевле, какие сервисы реально нужны новичку – выкладываю в своём Telegram-канале про практический AI: t.me/ai_smart_usage.