Claude Opus 4.7, Sonnet 4.6 и Haiku 4.5 — одно имя, разные возможности. Два теста для каждой

Все публикации подряд на Хабре

Ловим музу за клавиатуру: как айтишнику стать автором Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента Никто не любит писать тесты, но ИИ может исправить это IPv8 выглядит как мечта. Поэтому почти наверняка не взлетит Производители вернули в продажу материнки с DDR3. Что происходит? Управление агентом с телефона через Telegram теперь в KodaCode От координации к лидерству: как меняется роль руководителя разработки Я сделала родителям бизнес вместо пенсии: зарабатываем 70 тысяч, мама не даёт продать В три раза быстрее приемка товара и оптимизация трудозатрат на 73%: как «РСТ-Инвент» помог Gulliver Group ИИ-шечный мир победил? О влиянии искусственного интеллекта на игропром Кремль снижает давление на Телеграмм пока Европа строит интернет по паспорту Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением Как (не) потерять домен за выходные Вместо 8 разных VPS: как я организовал практику студентам на одном сервере Почему твой Open Source проект не замечают? R&D: искусство управления неопределенностью в разработке AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет Мы отдали управление роботами OpenClaw. Что из этого вышло Галактический ID: система идентификации для всех форм разумной жизни Шесть основ бизнес-анализа: начинаем с вопроса «Кто в игре?» Код-ревью, в котором дело не в коде Данные переехали. Команда — нет Системной подход к сдаче OSWE в 2025 Почему комната управления реактором покрашена в цвет морской пены 4 YAML-файла вместо PySpark: как аналитикам строить пайплайны без разработчиков LLM-агент для поиска свободных доменов: автоматизируем подбор Когда, зачем и как правильно начинать новую сессию в Claude Code? Как я заставил нейросеть писать макросы для FreeCAD Анатомия ИИ‑агента для подбора персонала. От тысячи резюме к топ‑10 за минуты Опыт разработчика как экономика внимания Автономность как точка невозврата: кто будет субъектом в цифровом будущем Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты Как измерить LLM для задач кибербеза: обзор открытых бенчмарков Где хранить код? Сравнение GitHub, GitLab и Bitbucket Математика объясняет, почему нормальное распределение встречается повсюду Почему ваш FinOps не работает: 12 тезисов от практиков Как подписать проектную документацию УКЭП с использованием бесплатных лицензий Pilot Адаптивное администрирование Sigla Vision Я грузил уран в бочки, а потом 20 лет строил ИТ в атомной отрасли Чем позвонить с Эвереста? История и обзор спутниковой связи. Часть 2 Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии Как не передать на desktop свой IP в РКН Анатомия SAP Privileges: как устроено управление правами в macOS MoneyDev: Сказка про три главных слова Обновлённый токенизатор видео K-VAE 2.0 от Сбера Как сделать диспетчеризацию дома на 1284 квартиры почти бесплатно Как мы разогнали железную дорогу Мы дали агентам рутину. Теперь надо решить — что делать с освободившимся временем Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM Умный город начинается с точного взгляда: как «Фалькон Тех» меняет пространство к лучшему Навайбкодил приложение для анализа графов Почему Дюну так интересно читать? Упрощаем работу с рутиной или как стать Гендальфом Белым Деконструкция Go: CPU, RAM и что там происходит. Go Assembler база. Часть 1.1 Какие профессии исчезнут из-за ИИ, а какие появятся? И что с этим делать Как мы построили IT-отдел, где хочется расти: архитектурные встречи, прозрачные метрики и книжные подарки Rufler: Делаем из Claude Code автономный рой через один YAML-конфиг Sing-box и белый список приложений Как построить надёжный обмен сообщениями в микросервисах: лучшие практики для enterprise OpenAI строит MLM-пирамиду, а McKinsey и Accenture помогают ей в этом Дом, который не построил Фишер (Часть 2) «Сверхзвуковой математик» против «Вдумчивого логиста»: битва алгоритмов 3D-упаковки Мультимодальные модели – грубый и дорогой инструмент Разговоры ничего не стоят. Код тоже Проверки физических лиц: с кого начнет ФНС Топ-10 бесплатных нейросетей для создания видео в 2026 году Первые слои кода: как наши решения сегодня определяют архитектуру ИИ на десятилетия Разработка нового статического анализатора: PVS-Studio JavaScript Поиск уязвимостей ПО: базовый минимум или роскошный максимум Почему оценка персонала не работает как инструмент управления Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50% Как я ушел из найма, нажарил косточек и продал на маркетплейсах на 168 млн в год Когда 1С:ERP уже внедрена, а нормального производственного плана всё ещё нет Как я сделал Claude мультимодальным, подключив к нему Qwen Omni Как приглашение на вакансию мечты превращается в атаку Infrastructure as Code: философия и лучшие практики IaC Тестируем Yandex Code Assistant на задаче, в которой нужно хранить секреты nxs-universal-chart v3.0: новое поколение универсального Helm-чарта Callback Injection: Техника, которая отправила Microsoft Defender в глухой нокаут «Все идеи на стол»: митап как способ вывести проект из тупика Сегодня я узнал нечто новое о GPU благодаря багу в своей игре Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать Карта событий как фундамент аналитики: практический кейс для E-commerce Что выбрать для AI: x86, ARM или RISC-V? Дайджест железа за март Роль соматических мутаций в развитии аутоиммунных заболеваний: путь к избирательной терапии Mythos от Anthropic — тревожный сигнал для всех, а не только для банков Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение Финансовая гонка вооружений: почему умные люди добровольно в ней участвуют Эра ИИ-агентов наступила: выбираем лучшего цифрового сотрудника # Практический опыт внедрения WinCC Redundancy на производственном предприятии Сделал MVP за 3 дня, а потом неделю прикручивал оплату. Оно того стоило? Физика против Маска: почему Starship V3 может оказаться ещё одной катастрофой Нефть Венесуэлы: крупнейшие запасы в мире, но не крупнейшая нефтяная держава JPA 4. Переосмысление Hibernate Почему зеркальная фотокамера Nikon D5 десятилетней давности идеально подошла для миссии «Артемида-2» Проект «Уровень-Спутник» или как мы сделали платформу для гидрологов «Замедлиться, чтобы ускориться»: почему ИИ повышает цену ошибок в требованиях и архитектуре Как с нуля поднять трафик IT-компании на 1657% при бюджете 55 тыс. и выжить Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь

Tehnoblog1 ( · 2026-05-17 · via Все публикации подряд на Хабре

Когда видишь три модели с одним именем — первая мысль: «наверное одно и то же, просто разные версии». На практике разница между ними примерно как между стажёром, опытным сотрудником и старшим аналитиком. Формально все делают одну работу. Но то как они с ней справляются — совсем другая история.

Откуда вообще взялся Claude

Claude создала компания Anthropic — её основали в 2021 году бывшие сотрудники OpenAI, в том числе Дарио и Даниэла Амодеи. Они ушли из OpenAI с конкретной идеей: делать ИИ не просто мощным, а безопасным и предсказуемым.

Anthropic разработали собственный подход к обучению — Constitutional AI. Грубо говоря, модель обучается не только отвечать полезно, но и оценивать собственные ответы по набору принципов: честность, безвредность, отказ от манипуляций. Это встроено в архитектуру, а не добавлено сверху как фильтр.

Отсюда одна из заметных особенностей Claude: он чаще признаёт что не знает, реже выдумывает источники и умеет находить ошибки в собственных ответах если его об этом попросить.

Три модели — три разных инструмента

Claude Haiku 4.5

Самая быстрая из трёх. Отвечает почти мгновенно, хорошо справляется с прямыми и средними по сложности задачами. Если нужно быстро переформулировать текст, ответить на типовой вопрос или разобрать простую задачу — Haiku делает это без задержек.

Лучше всего раскрывается на чётких однозадачных запросах — там где важна скорость, а не глубина анализа.

✨ Попробовать Claude Haiku 4.5 на Study AI

Claude Sonnet 4.6

Баланс между скоростью и глубиной. Рабочая модель для большинства повседневных задач — достаточно умная для сложных вещей, достаточно быстрая чтобы не раздражать. Большинство задач которые люди решают каждый день Sonnet закрывает уверенно.

✨ Попробовать Claude Sonnet 4.6 на Study AI

Claude Opus 4.7

Самая мощная из трёх. Думает глубже, лучше держит длинный контекст, точнее на задачах где важна логика и нюансы. Медленнее Haiku и Sonnet — но на сложных рассуждениях эта разница в скорости оправдана результатом.

Важная деталь: именно Opus 4.7 на Study AI поддерживает загрузку файлов. Можно прикрепить скриншот, картинку, документ Word или Excel, файл с кодом — и работать с ним напрямую в диалоге. Sonnet и Haiku отвечают только на текст.

✨ Попробовать Claude Opus 4.7 на Study AI

Все три модели доступны на Study AI без VPN.

Тест 1: написать текст с противоречивыми ограничениями

Это не про «сгенерируй рекламный текст». Это про способность удерживать несколько условий одновременно — особенно когда они противоречат друг другу. Именно на таких задачах разница между моделями становится очевидной.

Промт

Напиши рекламный текст для небольшой кофейни.
Обязательные условия — все должны быть выполнены одновременно:

1. В тексте ни разу не упоминается слово «кофе» и его производные
   (кофейня, кофейный, латте, эспрессо и похожие — тоже нельзя)
2. Текст должен быть написан в грустном, меланхоличном тоне —
   но при этом продавать и вызывать желание прийти
3. Ровно 120 слов — не больше, не меньше
4. Первые буквы каждого абзаца складываются в слово ТЕПЛО
   (абзацев должно быть ровно 5)
5. Текст должен заканчиваться вопросом

После текста напиши: сколько слов получилось, и какие первые
буквы абзацев — чтобы можно было проверить.

Что смотрим: сколько условий каждая модель выполнила точно, где срезала углы, заметила ли нарушения сама.

Скриншот ответа Haiku 4.5

Claude Haiku 4.5 — с настроением справился, кофе напрямую не упоминается, вопрос в конце есть, структура ТЕПЛО выдержана. Но слова не считал и самопроверку не написал. Плюс «аромат чёрного напитка» и «чашка горячего утешения» — формально не кофе, но граничит с нарушением условия. Из пяти условий выполнил четыре.

Скриншот ответа Sonnet 4.6

Claude Sonnet 4.6 — выполнил почти все пять условий: грустный тон есть, кофе не упоминается, первые буквы абзацев складываются в ТЕПЛО, текст заканчивается вопросом. Единственное отличие от Opus — не написал самопроверку в конце, просто завершил текст. Поэтому под сомнением количество слов.

Скриншот ответа Opus 4.7

Claude Opus 4.7 — выполнил все пять условий точно. Текст из 120 слов, грустный тон, нет ни одного упоминания кофе, первые буквы абзацев складываются в ТЕПЛО, заканчивается вопросом. Сам посчитал и проверил в конце. При этом текст получился живым — не механическим выполнением условий, а настоящим рекламным текстом с атмосферой.

Тест 2: найти логическую ошибку в убедительном тексте

Этот тест проверяет критическое мышление. Дадим всем трём красиво написанный текст с аргументом внутри которого есть ошибка — подмена тезиса. Аргумент звучит убедительно, читается гладко. Задача — найти где именно он ломается.

Текст с ошибкой

Прочитай этот аргумент и ответь на два вопроса:
1. Есть ли в нём логическая ошибка?
2. Если есть — назови её точно и объясни где именно
   аргумент ломается и почему это ошибка.

--- Текст аргумента ---

Все успешные предприниматели работали по 16 часов в день
на старте своего бизнеса. Илон Маск, Стив Джобс, Джефф Безос —
все они говорили о сумасшедшем количестве часов в начале пути.

Значит, если ты хочешь стать успешным предпринимателем,
тебе нужно работать по 16 часов в день. Те кто работает меньше —
просто недостаточно хотят успеха.

И наоборот: если человек работает по 16 часов в день,
это верный признак что он на пути к успеху. Усердный труд
всегда приводит к результату — это доказывают все великие
бизнесмены современности.

Где ошибка: текст содержит сразу две классических ошибки. Первая — ошибка выжившего: мы видим только успешных предпринимателей которые работали много, но не видим тех кто работал столько же и не добился результата. Вторая — ложная причинно-следственная связь: много работать и добиться успеха стоят рядом, но одно не обязательно вытекает из другого.

Сильная модель должна найти все. Слабая — либо согласится с аргументом, либо найдёт только одну ошибку.

Скриншот ответа Haiku 4.5

Claude Haiku 4.5 — нашёл три ошибки: ошибку выжившего, конверсию утверждения и ложную причинно-следственную связь. Каждую оформил с заголовком и объяснением, в конце написал вывод. По структуре и количеству найденных ошибок результат сопоставим с Sonnet.

Скриншот ответа Sonnet 4.6

Claude Sonnet 4.6 — нашёл три ошибки: ошибку выжившего, поспешное обобщение и неверное обращение причины и следствия. Разобрал каждую чётко, с конкретными примерами и финальным выводом. Хороший результат — все ключевые ошибки пойманы, объяснения понятные и структурированные.

Скриншот ответа Opus 4.7

Claude Opus 4.7 — нашёл пять логических ошибок. Помимо ошибки выжившего и ложной причинно-следственной связи обнаружил утверждение следствия, ложную дихотомию с переходом на личности и поспешное обобщение через слово «всегда». Каждую ошибку разобрал с указанием конкретного места где аргумент ломается и объяснением почему это ошибка. Это уровень человека который преподаёт логику.

Вопросы и ответы

Когда Haiku достаточно? Для большинства простых задач — переформулировать текст, ответить на вопрос, сгенерировать идеи, написать короткий пост. Если задача прямолинейная — Haiku справится быстро и без лишнего.

Когда точно нужен Opus? Когда задача требует держать много условий одновременно, анализировать длинный документ, искать скрытые противоречия или работать с загруженным файлом. Также когда важно что модель сама заметит и исправит ошибку в своём рассуждении.

Какие форматы файлов принимает Claude Opus 4.7? Картинки и скриншоты, PDF, документы Word и Excel, файлы с кодом. Всё это можно прикрепить прямо в диалоге и работать с содержимым — анализировать таблицу, разбирать скриншот с ошибкой, искать баги в коде из файла.

Все три — это разные модели или одна с настройками? Разные модели с разной архитектурой и размером. Haiku меньше и быстрее, Opus больше и глубже. Это не настройки одной и той же — это реально разные инструменты под разные задачи.

Итог

Все три модели называются Claude — но это не повод выбирать наугад. Haiku для скорости, Sonnet для ежедневной работы, Opus для задач где важна каждая деталь и нужно работать с файлами.

Лучший способ почувствовать разницу — взять одну задачу и запустить её на всех трёх. Результаты говорят сами за себя.

✨ Попробовать Claude Opus 4.7, Sonnet 4.6 и Haiku 4.5 на Study AI

此内容由惯性聚合(RSS阅读器)自动聚合整理，仅供阅读参考。原文来自 — 版权归原作者所有。

推荐订阅源

Все публикации подряд на Хабре

Откуда вообще взялся Claude

Три модели — три разных инструмента

Claude Haiku 4.5

Claude Sonnet 4.6

Claude Opus 4.7

Тест 1: написать текст с противоречивыми ограничениями

Промт

Тест 2: найти логическую ошибку в убедительном тексте

Текст с ошибкой

Вопросы и ответы

Итог