惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

S
Securelist
O
OpenAI News
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
T
Threat Research - Cisco Blogs
D
Darknet – Hacking Tools, Hacker News & Cyber Security
Google Online Security Blog
Google Online Security Blog
C
CXSECURITY Database RSS Feed - CXSecurity.com
N
News and Events Feed by Topic
S
Security Affairs
SecWiki News
SecWiki News
Project Zero
Project Zero
L
Lohrmann on Cybersecurity
P
Proofpoint News Feed
P
Palo Alto Networks Blog
L
LINUX DO - 最新话题
H
Hacker News: Front Page
Recent Commits to openclaw:main
Recent Commits to openclaw:main
I
Intezer
Simon Willison's Weblog
Simon Willison's Weblog
W
WeLiveSecurity
T
The Exploit Database - CXSecurity.com
K
Kaspersky official blog
The GitHub Blog
The GitHub Blog
I
InfoQ
云风的 BLOG
云风的 BLOG
雷峰网
雷峰网
B
Blog
IT之家
IT之家
AWS News Blog
AWS News Blog
Jina AI
Jina AI
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
Google DeepMind News
Google DeepMind News
Spread Privacy
Spread Privacy
N
News and Events Feed by Topic
Security Latest
Security Latest
美团技术团队
C
Check Point Blog
WordPress大学
WordPress大学
T
Tenable Blog
S
Security @ Cisco Blogs
Last Week in AI
Last Week in AI
博客园 - 聂微东
月光博客
月光博客
博客园 - 【当耐特】
S
Schneier on Security
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
S
Secure Thoughts
Schneier on Security
Schneier on Security
C
Cisco Blogs
Cyberwarzone
Cyberwarzone

Все публикации подряд на Хабре

Ловим музу за клавиатуру: как айтишнику стать автором Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента Никто не любит писать тесты, но ИИ может исправить это IPv8 выглядит как мечта. Поэтому почти наверняка не взлетит Производители вернули в продажу материнки с DDR3. Что происходит? Управление агентом с телефона через Telegram теперь в KodaCode От координации к лидерству: как меняется роль руководителя разработки Я сделала родителям бизнес вместо пенсии: зарабатываем 70 тысяч, мама не даёт продать В три раза быстрее приемка товара и оптимизация трудозатрат на 73%: как «РСТ-Инвент» помог Gulliver Group ИИ-шечный мир победил? О влиянии искусственного интеллекта на игропром Кремль снижает давление на Телеграмм пока Европа строит интернет по паспорту Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением Как (не) потерять домен за выходные Вместо 8 разных VPS: как я организовал практику студентам на одном сервере Почему твой Open Source проект не замечают? R&D: искусство управления неопределенностью в разработке AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет Мы отдали управление роботами OpenClaw. Что из этого вышло Галактический ID: система идентификации для всех форм разумной жизни Кто решает судьбу вашего проекта? Разбираем заинтересованные стороны. BABOK #1 Код-ревью, в котором дело не в коде Данные переехали. Команда — нет Системной подход к сдаче OSWE в 2025 Почему комната управления реактором покрашена в цвет морской пены 4 YAML-файла вместо PySpark: как аналитикам строить пайплайны без разработчиков LLM-агент для поиска свободных доменов: автоматизируем подбор Когда, зачем и как правильно начинать новую сессию в Claude Code? Как я заставил нейросеть писать макросы для FreeCAD Анатомия ИИ‑агента для подбора персонала. От тысячи резюме к топ‑10 за минуты Опыт разработчика как экономика внимания Автономность как точка невозврата: кто будет субъектом в цифровом будущем Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты Как измерить LLM для задач кибербеза: обзор открытых бенчмарков Где хранить код? Сравнение GitHub, GitLab и Bitbucket Математика объясняет, почему нормальное распределение встречается повсюду Почему ваш FinOps не работает: 12 тезисов от практиков Как подписать проектную документацию УКЭП с использованием бесплатных лицензий Pilot Адаптивное администрирование Sigla Vision Я грузил уран в бочки, а потом 20 лет строил ИТ в атомной отрасли Чем позвонить с Эвереста? История и обзор спутниковой связи. Часть 2 Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии Как не передать на desktop свой IP в РКН Анатомия SAP Privileges: как устроено управление правами в macOS MoneyDev: Сказка про три главных слова Обновлённый токенизатор видео K-VAE 2.0 от Сбера Как сделать диспетчеризацию дома на 1284 квартиры почти бесплатно Как мы разогнали железную дорогу Мы дали агентам рутину. Теперь надо решить — что делать с освободившимся временем Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM Умный город начинается с точного взгляда: как «Фалькон Тех» меняет пространство к лучшему Навайбкодил приложение для анализа графов Почему Дюну так интересно читать? Упрощаем работу с рутиной или как стать Гендальфом Белым Деконструкция Go: CPU, RAM и что там происходит. Go Assembler база. Часть 1.1 Какие профессии исчезнут из-за ИИ, а какие появятся? И что с этим делать Как мы построили IT-отдел, где хочется расти: архитектурные встречи, прозрачные метрики и книжные подарки Rufler: Делаем из Claude Code автономный рой через один YAML-конфиг Sing-box и белый список приложений Как построить надёжный обмен сообщениями в микросервисах: лучшие практики для enterprise OpenAI строит MLM-пирамиду, а McKinsey и Accenture помогают ей в этом Дом, который не построил Фишер (Часть 2) «Сверхзвуковой математик» против «Вдумчивого логиста»: битва алгоритмов 3D-упаковки Мультимодальные модели – грубый и дорогой инструмент Разговоры ничего не стоят. Код тоже Проверки физических лиц: с кого начнет ФНС Топ-10 бесплатных нейросетей для создания видео в 2026 году Первые слои кода: как наши решения сегодня определяют архитектуру ИИ на десятилетия Разработка нового статического анализатора: PVS-Studio JavaScript Поиск уязвимостей ПО: базовый минимум или роскошный максимум Почему оценка персонала не работает как инструмент управления Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50% Как я ушел из найма, нажарил косточек и продал на маркетплейсах на 168 млн в год Когда 1С:ERP уже внедрена, а нормального производственного плана всё ещё нет Как я сделал Claude мультимодальным, подключив к нему Qwen Omni Как приглашение на вакансию мечты превращается в атаку Infrastructure as Code: философия и лучшие практики IaC Тестируем Yandex Code Assistant на задаче, в которой нужно хранить секреты nxs-universal-chart v3.0: новое поколение универсального Helm-чарта Callback Injection: Техника, которая отправила Microsoft Defender в глухой нокаут «Все идеи на стол»: митап как способ вывести проект из тупика Сегодня я узнал нечто новое о GPU благодаря багу в своей игре Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать Карта событий как фундамент аналитики: практический кейс для E-commerce Что выбрать для AI: x86, ARM или RISC-V? Дайджест железа за март Роль соматических мутаций в развитии аутоиммунных заболеваний: путь к избирательной терапии Mythos от Anthropic — тревожный сигнал для всех, а не только для банков Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение Финансовая гонка вооружений: почему умные люди добровольно в ней участвуют Эра ИИ-агентов наступила: выбираем лучшего цифрового сотрудника # Практический опыт внедрения WinCC Redundancy на производственном предприятии Сделал MVP за 3 дня, а потом неделю прикручивал оплату. Оно того стоило? Физика против Маска: почему Starship V3 может оказаться ещё одной катастрофой Нефть Венесуэлы: крупнейшие запасы в мире, но не крупнейшая нефтяная держава JPA 4. Переосмысление Hibernate Почему зеркальная фотокамера Nikon D5 десятилетней давности идеально подошла для миссии «Артемида-2» Проект «Уровень-Спутник» или как мы сделали платформу для гидрологов «Замедлиться, чтобы ускориться»: почему ИИ повышает цену ошибок в требованиях и архитектуре Как с нуля поднять трафик IT-компании на 1657% при бюджете 55 тыс. и выжить Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь
Anthropic, Fable 5, Claude Code и большой отбор игрушек
Kir Moisha · 2026-06-13 · via Все публикации подряд на Хабре

Средний

11 мин

6.5K

Самая сильная общедоступная модель Anthropic прожила четыре дня. У меня абонемент в кофейню живёт дольше.

9 июня Anthropic выкатила Claude Fable 5, он же Mythos 5 в закрытом контуре. 12 июня доступ к обеим версиям сняли. А между этими датами уместилось столько, сколько иная модель не набирает за год жизни: скрытое ухудшение ответов для ИИ-исследователей, крик "Fable взломали и вытащили системный промпт" (пост Pliny в Xархив на GitHub), спор про обходы защит, внезапное хранение данных 30 дней и в финале - директива правительства США.

Формально названия два: Fable 5 - публичная версия с предохранителями, Mythos 5 - та же базовая модель, но с частью снятых ограничений для доверенных организаций через Project Glasswing.

Fable и Mythos как два контура одной модели

Fable и Mythos как два контура одной модели

Если читать это как новость, получается очередная драма вокруг ИИ.

Если читать как инженер, получается инцидент с внешней зависимостью. Только зависимость не npm-пакет, не Docker-образ и не облачная база. Это закрытая передовая модель, которую вы дёргаете через программный интерфейс или агента прямо в проде.

Два года назад я говорил примерно следующее: такая штука слишком сильная, чтобы её долго раздавали почти даром. Сначала нас используют как бесплатный тестовый стенд. Мы приносим реальные задачи, крайние случаи, обходы защит, рабочие сценарии, баги интерфейсов, корпоративные кейсы. А потом доступ начинают резать, маршрутизировать, логировать, лицензировать и выключать.

Это как двор в детстве. Кто-то приносит самую крутую игрушку, все вокруг неё крутятся до темноты. Потом выходит мама и говорит: всё, наигрались. И игрушку уносят.

Fable 5 меня не удивил. Он просто прокрутил этот сценарий на перемотке: за четыре дня вместо пары лет.

В статье не будет инструкций по обходу защит. Будет другое: как проектировать ИИ-стек, если модель в любой момент могут заменить, урезать, переключить на запасную или снять с доступа.

Что произошло за четыре дня

Короткий таймлайн:

Дата

Событие

Что важно инженеру

9 июня 2026

Anthropic выпускает Claude Fable 5, он же Mythos 5

Базовая модель одна. Fable 5 - публичная версия с предохранителями, Mythos 5 - закрытый режим для доверенных организаций

9 июня 2026

В релизе описаны предохранители

Запросы по кибербезопасности, биологии/химии и дистилляции моделей должны уходить на Opus 4.8. По ранним данным Anthropic, переключение затрагивает меньше 5% сессий

10 июня 2026

WIRED пишет про скрытое ухудшение ответов для разработки передовых ИИ-моделей

Если правило срабатывает невидимо, ломается воспроизводимость рабочего процесса

10-11 июня 2026

Pliny заявляет в X, что Fable взломали, и выкладывает предполагаемый системный промпт на GitHub

Звучит как "хакеры вскрыли модель", но сам архив выглядит скорее как продуктовый промпт Claude.ai, а не "ядро интеллекта"

12 июня 2026

Anthropic публикует заявление о директиве правительства США и снимает доступ

Модель можно потерять не из-за бага в вашем коде, а из-за внешнего решения

Теперь детали.

В релизе Anthropic пишет, что Fable 5 - самая сильная общедоступная модель компании. Цена: $10 за миллион входных токенов и $50 за миллион выходных. Mythos 5 использует ту же базовую модель, но часть предохранителей снята для узкого круга через Project Glasswing.

В том же релизе Anthropic описывает переключение на запасную модель: если классификаторы ловят запросы про кибербезопасность, биологию, химию или дистилляцию моделей, ответ должен обслуживать Claude Opus 4.8, а пользователь должен видеть, что переключение произошло.

Звучит разумно. Сильная модель, отдельные предохранители, запасная модель вместо полного отказа. На бумаге - инженерия взрослых людей.

Проблема началась не там.

WIRED 10 июня написал, что для разработки передовых ИИ-моделей Anthropic сначала выбрала другой режим: невидимо ухудшать ответ, если система решит, что пользователь использует Fable для разработки конкурирующей модели. После критики Anthropic сказала WIRED, что выбрала неправильный компромисс, и пообещала сделать такие ограничения видимыми: отказ или переключение, а не тихая деградация.

Вот это уже инженерная проблема.

Если модель отказывается - можно обработать отказ. Если модель пишет "я переключил вас на Opus 4.8" - можно записать факт переключения. А если модель молча становится хуже, вы дебажите не свой код, не свой промпт и не свою проверку. Вы дебажите чужое правило, которое вам не показали.

Чувство знакомое: код тот же, тесты те же, а вчера почему-то работало лучше. Обычно виноват кэш, кривой деплой или собственная невнимательность в три ночи. Здесь же виноватым может оказаться невидимый классификатор на чужой стороне, к которому у вас нет ни логов, ни доступа, ни даже подтверждения, что он вообще сработал.

Почему "хакеры взломали Fable" звучит громче, чем выглядит файл

Вокруг Fable отдельно разогнали идеальную для ленты историю: хакеры взломали свежую модель Anthropic и вытащили её системный промпт. Источник шума - пост Pliny в X. Архив на GitHub правда есть: файл CLAUDE-FABLE-5.md, 1585 строк, примерно 117 KB.

Медийный шум вокруг взлома и реальный продуктовый слой

Медийный шум вокруг взлома и реальный продуктовый слой

Я его открыл и прочитал целиком.

Впечатление: на секретную формулу интеллекта это не похоже. Это похоже на продуктовый промпт и слой исполнения для конкретной поверхности Claude.ai. Там много инструкций не про "как думать", а про "как работать в приложении":

Блок

Что там по смыслу

Инженерный вывод

product_information

названия моделей, продукты, когда искать свежую документацию

промпт хранит продуктовую маршрутизацию и сообщения пользователю

refusal_handlingtone_and_formatting

стиль ответа и поведение при отказах

часть логики безопасности и интерфейса лежит выше модели

memory_system

правила доступа к памяти

поведение зависит от точки входа и настроек аккаунта

persistent_storage_for_artifacts

хранилище для артефактов

модель работает внутри приложения с дополнительными возможностями

mcp_app_suggestions

логика подключения внешних MCP-приложений

промпт описывает слой оркестрации

computer_usefile_creation_advice

bash, файлы, итоговые артефакты, скриншоты

это ближе к обвязке агента, чем к чистой LLM

search_instructions

когда и как использовать веб-поиск

свежесть фактов и ссылки задаются внешним слоем

Tool Definitions

доступные инструменты

итоговый ответ зависит от набора инструментов

User Contextavailable_skills

контекст пользователя и навыки

одна и та же модель в разных аккаунтах может вести себя по-разному

Это всё важно. Но это не значит, что кто-то "вскрыл Fable".

Слить настройки расширения VS Code - не то же самое, что получить исходники компилятора TypeScript. Вы получили важный слой продукта вокруг компилятора. Иногда именно этот слой и ломает вам работу. Но путать его с весами модели, обучающими данными и процессом дообучения - всё равно что спутать обёртку шоколадки с какао-бобами.

Главный вывод из архива другой: современная передовая модель в продукте - это уже не чистая функция промпт -> ответ.

Это ближе к такому:

answer =
  model(
    prompt,
    account_context,
    entry_point,
    memory_state,
    enabled_tools,
    safety_classifiers,
    web_search,
    file_runtime,
    region,
    plan,
    current_provider_policy
  )

И когда вы говорите "Claude ответил плохо", вопрос уже не один. Какая модель? Какая точка входа: Claude.ai, программный интерфейс, Claude Code, облачный провайдер? Было ли переключение на другую модель? Были ли включены инструменты? Что подмешала память? Какой классификатор сработал? Не поменялась ли обвязка промпта между вчера и сегодня?

Девять аргументов у функции, и половину из них вы не контролируете.

Реальный риск не в конкретном обходе защиты

Я не спорю с тем, что модель уровня Mythos опасна в кибербезопасности и биологии. В Project Glasswing Anthropic приводит серьёзные примеры: Mythos Preview нашёл 27-летнюю уязвимость в OpenBSD, 16-летнюю уязвимость в FFmpeg и цепочку багов в Linux kernel. Баги уже исправлены, но сам уровень понятен: это не игрушечная угроза, это инструмент, который реально умеет находить то, что люди не находили десятилетиями.

Понятно и зачем Anthropic ввела хранение данных 30 дней. В Claude Help Center компания пишет, что промпты и ответы для моделей класса Mythos хранятся 30 дней для безопасности и поиска злоупотреблений. Это касается организаций с режимом нулевого хранения данных в Console, Claude Code Enterprise, AWS Bedrock, Google Cloud Agent Platform и Microsoft Foundry. Для обычных пользовательских тарифов это не новость: там данные и так удерживаются для безопасности.

С точки зрения поставщика логика есть: часть атак видна только на серии запросов. Один промпт выглядит безобидно, а 500 его вариаций подряд - уже планомерная атака на предохранители.

С точки зрения пользователя это тихо меняет договор.

Если ваш корпоративный процесс был построен на режиме нулевого хранения данных, а самая сильная модель внезапно требует хранить данные 30 дней, это не "мелкий нюанс приватности". Это смена модели угроз, переписывание compliance-истории, а иногда и нарушение договора с вашим собственным клиентом. И узнать об этом приятнее заранее, чем от его юристов.

Поэтому реальный риск не в том, что кто-то нашёл красивый обход защиты. Реальный риск в том, что закрытая модель стала управляемой зависимостью с целым рядом внешних рубильников:

  1. Маршрутизация по безопасности - запрос может уйти на запасную модель.

  2. Скрытые правила - модель может стать хуже без явного сигнала.

  3. Хранение данных - сильная модель может нарушить ваш режим нулевого хранения данных.

  4. Доступ по аккаунту - возможности зависят от организации, региона и продукта.

  5. Юридический рубильник - модель могут выключить сверху.

  6. Дрейф версии - имя модели то же, поведение другое.

Это не морализаторство. Это управление зависимостями. Просто зависимость умеет передумать.

Почему "самая сильная модель" не равна "готово к продакшену"

Есть ещё один полезный холодный душ.

Endor Labs прогнали Fable 5 через 200 реальных задач на исправление уязвимостей в Agent Security League. Результат смешанный: 59.8% задач с рабочим исправлением, 19.0% задач с реально закрытой уязвимостью, много таймаутов, 38 подозрений на обход условий теста и при этом 4 задачи, которые раньше не закрывала ни одна комбинация модель+агент.

Это очень похоже на реальность.

Не "бог-модель". Не "провал". Сильный инструмент с острыми краями, который иногда делает то, чего раньше не делал никто, а иногда позорно проигрывает банальному лимиту времени и бюджета.

Для продакшена это значит простую вещь: возможности надо мерить на своём контуре, а не по пресс-релизу. Если у вас агент чинит CVE, мигрирует код, пишет Terraform или разбирает медицинские документы, вам нужен не общий бенчмарк из твиттера. Вам нужен свой набор проверок.

Минимальный журнал для ИИ-процесса:

process: dependency_upgrade_agent
model:
  provider: anthropic
  requested_model: claude-fable-5
  observed_model: claude-fable-5
  fallback_observed: false
entry_point:
  product: claude-code
  version: 2.3.14
  account_type: enterprise
data_policy:
  zdr_expected: true
  retention_days_observed: 30
prompt:
  prompt_sha256: "..."
  system_wrapper_sha256: "..."
input:
  repo_commit: "..."
  task_file_sha256: "..."
output:
  patch_sha256: "..."
verification:
  tests_command: "npm test && npm run lint"
  tests_passed: true
  human_review_required: true
timestamp_utc: "2026-06-13T08:00:00Z"

Половина полей скучные. Именно поэтому они нужны.

Через месяц, когда процесс внезапно просядет, у вас будет не "вчера Claude был умнее", а нормальный diff: изменилась модель, точка входа, политика хранения, обвязка промпта, было переключение на другую модель или просто приехали другие входные данные. "Вчера было лучше" - это не баг-репорт. А вот эти строчки - уже баг-репорт.

Закрытый программный интерфейс против локального запаса

Закрытый программный интерфейс как риск и локальные модели как запас

Закрытый программный интерфейс как риск и локальные модели как запас

Я не предлагаю выбросить Claude, OpenAI или Gemini. Я сам каждый день работаю с ИИ-инструментами для разработки. Сильные закрытые модели дают скорость, которую локальные часто не догоняют, и это честно.

Но закрытый программный интерфейс топовой модели - это ускоритель, а не фундамент.

Фундамент должен переживать отключение поставщика.

Критерий

Закрытый программный интерфейс топовой модели

Модель с открытыми весами как запас

Максимальное качество

Обычно выше

Ниже или нестабильнее

Скорость старта

Мгновенно

Надо поднять инференс

Стоимость владения

Платёж за токены

Железо + эксплуатация

Приватность

Зависит от условий и хранения данных

Контролируете сами

Воспроизводимость

Поставщик может менять маршрутизацию и правила

Можно зафиксировать веса и окружение

Регуляторный риск

Высокий

Ниже, но лицензии тоже важны

Отладка

Ограниченная

Можно смотреть окружение, параметры генерации, логи

Рубильник

Внешний

Ваш

Нормальный ИИ-стек в 2026 для меня выглядит так:

primary:
  closed_model_api:
    providers:
      - anthropic
      - openai
      - google
    routing:
      visible_policy_required: true
      model_switch_logged: true
      refusal_logged: true

fallback:
  local_or_private:
    runtimes:
      - vllm
      - llama.cpp
      - ollama
    model_archive:
      weights: pinned
      tokenizer: pinned
      config: pinned
      license: snapshotted
      model_card: snapshotted
      launch_check: required

Запускать локальную модель каждый день не нужно. Нужно уметь запустить её в тот день, когда придётся. Разница как между огнетушителем и кострищем на даче: пользуетесь редко, а отсутствие замечаете ровно один раз.

Что именно архивировать

Скачать .safetensors и успокоиться - слабая стратегия. Через полгода вы рискуете обнаружить 80 GB файлов и ноль воспроизводимого инференса. Веса есть, а запустить нечем.

Минимальный комплект:

  1. Веса модели.

  2. Файлы токенизатора.

  3. config.jsongeneration_config.json, шаблон чата.

  4. Карточка модели и лицензия на дату скачивания.

  5. Коммит/ревизия из Hugging Face.

  6. Хеши всех крупных файлов.

  7. Версия окружения: vLLM, llama.cpp, Ollama, CUDA/Metal/ROCm.

  8. Быстрая проверка запуска: промпт и ожидаемый тип ответа.

  9. Короткая заметка: зачем модель скачана и для каких задач подходит.

Через Hugging Face это делается нормально. В официальной документации есть вспомогательные функции Python (hf_hub_downloadsnapshot_download) и командная строка. Сейчас команда называется hf download:

uv pip install -U "huggingface_hub[cli]"

MODEL="Qwen/Qwen3-32B"
REVISION="main" # лучше заменить на конкретный хеш коммита
TARGET="./models/qwen3-32b"

hf download "$MODEL" \
  --revision "$REVISION" \
  --local-dir "$TARGET"

find "$TARGET" -maxdepth 2 -type f -print0 \
  | sort -z \
  | xargs -0 shasum -a 256 > "$TARGET/SHA256SUMS"

Если модель закрыта по заявке, добавьте токен через hf auth login и сохраните отдельно сам факт, что доступ требовал подтверждения. Это важно не только юридически, но и операционно: через год другой сотрудник может банально не получить тот же артефакт, а вы будете думать, что он лежит у вас в кармане.

Для GGUF-сборок под llama.cpp логика другая: Hugging Face отдельно документирует GGUF для llama.cpp. Плюс GGUF удобен тем, что квантованный файл уже тащит с собой много нужных метаданных.

Пример для локальной проверки запуска через llama.cpp:

MODEL_GGUF="./models/qwen3-14b-q4_k_m.gguf"

./llama-cli \
  -m "$MODEL_GGUF" \
  -p "Write a Python function that validates an email address. Keep it short." \
  -n 256 \
  --temp 0.2

Для серверного инференса я бы смотрел в сторону vLLM. В документации vLLM есть офлайн-инференс через Python-класс LLM:

from vllm import LLM, SamplingParams

llm = LLM(model="./models/qwen3-32b")
params = SamplingParams(temperature=0.2, max_tokens=256)

outputs = llm.generate(
    ["Write a pytest for a function that parses ISO timestamps."],
    params,
)

print(outputs[0].outputs[0].text)

Для ноутбука и быстрых локальных проверок Ollama проще. Его Modelfile позволяет указать локальный GGUF или модель на safetensors:

FROM ./models/qwen3-14b-q4_k_m.gguf

PARAMETER temperature 0.2
PARAMETER num_ctx 32768

SYSTEM You are a concise coding assistant. Prefer runnable code and tests.
ollama create qwen3-local -f ./Modelfile
ollama run qwen3-local "Explain this stack trace and propose a fix."

Это не заменит Fable один-в-один. И не должно.

Цель запаса не в том, чтобы держать дома такую же магию. Цель в том, чтобы критичный процесс не умер в день, когда поставщик нажал стоп.

Мой практический вывод

Fable не надо хоронить. Anthropic не надо записывать в злодеи недели. Они решают реальную задачу: как дать пользователям модель, которая уже полезна для защиты инфраструктуры, но ровно так же ускоряет и атакующих. Это честно тяжёлый компромисс, и я не уверен, что сам бы разрулил его лучше.

Но для нас, кто строит продукты и внутренние процессы на ИИ, вывод другой.

Программный интерфейс закрытых передовых моделей надо воспринимать как внешнюю зависимость с нестабильным контрактом использования. Модель может быть сильной, дорогой, полезной, незаменимой на отдельных задачах. Но если вы не контролируете веса, маршрутизацию, хранение данных, правила доступа и саму доступность, это не фундамент.

Это арендованный ускоритель. Удобный ровно до того момента, пока за ним не приехали.

Я по-прежнему буду использовать закрытые модели там, где они дают разницу. Но параллельно надо собирать локальный набор моделей с открытыми весами: для кода, рассуждений, эмбеддингов, ранжирования, речи, изображений, для ноутбука, для сервера, для квантованных запусков под конкретное железо.

В следующей статье разберу именно это: какие модели с Hugging Face стоит скачать прямо сейчас, чтобы через полгода-год не остаться с пустыми руками.

Потому что если Fable чему-то и научил, то не тому, что "Anthropic плохие".

Он показал, что игрушки уже начали собирать обратно в коробку. И пока коробку не закрыли, самое время выбрать те, что унесёшь домой и оставишь себе.


Источники: Claude Fable 5, он же Claude Mythos 5 · Заявление Anthropic о директиве правительства США · Хранение данных для моделей класса Mythos · Project Glasswing · WIRED о скрытых ограничениях для ИИ-исследователей · Пост Pliny в X про обход защиты Fable · CL4R1T4S: CLAUDE-FABLE-5.md · Endor Labs: бенчмарк Claude Fable 5 · Hugging Face Hub: скачивание файлов · Hugging Face: командная строка · GGUF для llama.cpp · vLLM: офлайн-инференс · Ollama Modelfile

Об авторе: Кир, CTO и серийный предприниматель. Пишу про ИИ-инструменты, автоматизацию разработки и реальные интеграции в бизнесе без булшита. Канал: @ai_integr.