惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

H
Help Net Security
Scott Helme
Scott Helme
爱范儿
爱范儿
WordPress大学
WordPress大学
博客园 - 三生石上(FineUI控件)
阮一峰的网络日志
阮一峰的网络日志
博客园 - Franky
V
V2EX
腾讯CDC
博客园_首页
博客园 - 司徒正美
酷 壳 – CoolShell
酷 壳 – CoolShell
T
Tailwind CSS Blog
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
小众软件
小众软件
J
Java Code Geeks
大猫的无限游戏
大猫的无限游戏
月光博客
月光博客
Microsoft Azure Blog
Microsoft Azure Blog
B
Blog
雷峰网
雷峰网
Stack Overflow Blog
Stack Overflow Blog
IT之家
IT之家
罗磊的独立博客
Recorded Future
Recorded Future
博客园 - 聂微东
O
OpenAI News
S
Secure Thoughts
Hacker News: Ask HN
Hacker News: Ask HN
S
Schneier on Security
Hacker News - Newest:
Hacker News - Newest: "LLM"
Y
Y Combinator Blog
C
Cyber Attacks, Cyber Crime and Cyber Security
Project Zero
Project Zero
宝玉的分享
宝玉的分享
K
Kaspersky official blog
N
Netflix TechBlog - Medium
T
The Exploit Database - CXSecurity.com
Google Online Security Blog
Google Online Security Blog
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Webroot Blog
Webroot Blog
云风的 BLOG
云风的 BLOG
Simon Willison's Weblog
Simon Willison's Weblog
C
Check Point Blog
D
Darknet – Hacking Tools, Hacker News & Cyber Security
L
LINUX DO - 热门话题
美团技术团队
L
Lohrmann on Cybersecurity

Все публикации подряд на Хабре

Ловим музу за клавиатуру: как айтишнику стать автором Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента Никто не любит писать тесты, но ИИ может исправить это IPv8 выглядит как мечта. Поэтому почти наверняка не взлетит Производители вернули в продажу материнки с DDR3. Что происходит? Управление агентом с телефона через Telegram теперь в KodaCode От координации к лидерству: как меняется роль руководителя разработки Я сделала родителям бизнес вместо пенсии: зарабатываем 70 тысяч, мама не даёт продать В три раза быстрее приемка товара и оптимизация трудозатрат на 73%: как «РСТ-Инвент» помог Gulliver Group ИИ-шечный мир победил? О влиянии искусственного интеллекта на игропром Кремль снижает давление на Телеграмм пока Европа строит интернет по паспорту Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением Как (не) потерять домен за выходные Вместо 8 разных VPS: как я организовал практику студентам на одном сервере Почему твой Open Source проект не замечают? R&D: искусство управления неопределенностью в разработке AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет Мы отдали управление роботами OpenClaw. Что из этого вышло Галактический ID: система идентификации для всех форм разумной жизни Шесть основ бизнес-анализа: начинаем с вопроса «Кто в игре?» Код-ревью, в котором дело не в коде Данные переехали. Команда — нет Системной подход к сдаче OSWE в 2025 Почему комната управления реактором покрашена в цвет морской пены 4 YAML-файла вместо PySpark: как аналитикам строить пайплайны без разработчиков LLM-агент для поиска свободных доменов: автоматизируем подбор Когда, зачем и как правильно начинать новую сессию в Claude Code? Как я заставил нейросеть писать макросы для FreeCAD Анатомия ИИ‑агента для подбора персонала. От тысячи резюме к топ‑10 за минуты Опыт разработчика как экономика внимания Автономность как точка невозврата: кто будет субъектом в цифровом будущем Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты Как измерить LLM для задач кибербеза: обзор открытых бенчмарков Где хранить код? Сравнение GitHub, GitLab и Bitbucket Математика объясняет, почему нормальное распределение встречается повсюду Почему ваш FinOps не работает: 12 тезисов от практиков Как подписать проектную документацию УКЭП с использованием бесплатных лицензий Pilot Адаптивное администрирование Sigla Vision Я грузил уран в бочки, а потом 20 лет строил ИТ в атомной отрасли Чем позвонить с Эвереста? История и обзор спутниковой связи. Часть 2 Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии Как не передать на desktop свой IP в РКН Анатомия SAP Privileges: как устроено управление правами в macOS MoneyDev: Сказка про три главных слова Обновлённый токенизатор видео K-VAE 2.0 от Сбера Как сделать диспетчеризацию дома на 1284 квартиры почти бесплатно Как мы разогнали железную дорогу Мы дали агентам рутину. Теперь надо решить — что делать с освободившимся временем Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM Умный город начинается с точного взгляда: как «Фалькон Тех» меняет пространство к лучшему Навайбкодил приложение для анализа графов Почему Дюну так интересно читать? Упрощаем работу с рутиной или как стать Гендальфом Белым Деконструкция Go: CPU, RAM и что там происходит. Go Assembler база. Часть 1.1 Какие профессии исчезнут из-за ИИ, а какие появятся? И что с этим делать Как мы построили IT-отдел, где хочется расти: архитектурные встречи, прозрачные метрики и книжные подарки Rufler: Делаем из Claude Code автономный рой через один YAML-конфиг Sing-box и белый список приложений Как построить надёжный обмен сообщениями в микросервисах: лучшие практики для enterprise OpenAI строит MLM-пирамиду, а McKinsey и Accenture помогают ей в этом Дом, который не построил Фишер (Часть 2) «Сверхзвуковой математик» против «Вдумчивого логиста»: битва алгоритмов 3D-упаковки Мультимодальные модели – грубый и дорогой инструмент Разговоры ничего не стоят. Код тоже Проверки физических лиц: с кого начнет ФНС Топ-10 бесплатных нейросетей для создания видео в 2026 году Первые слои кода: как наши решения сегодня определяют архитектуру ИИ на десятилетия Разработка нового статического анализатора: PVS-Studio JavaScript Поиск уязвимостей ПО: базовый минимум или роскошный максимум Почему оценка персонала не работает как инструмент управления Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50% Как я ушел из найма, нажарил косточек и продал на маркетплейсах на 168 млн в год Когда 1С:ERP уже внедрена, а нормального производственного плана всё ещё нет Как я сделал Claude мультимодальным, подключив к нему Qwen Omni Как приглашение на вакансию мечты превращается в атаку Infrastructure as Code: философия и лучшие практики IaC Тестируем Yandex Code Assistant на задаче, в которой нужно хранить секреты nxs-universal-chart v3.0: новое поколение универсального Helm-чарта Callback Injection: Техника, которая отправила Microsoft Defender в глухой нокаут «Все идеи на стол»: митап как способ вывести проект из тупика Сегодня я узнал нечто новое о GPU благодаря багу в своей игре Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать Карта событий как фундамент аналитики: практический кейс для E-commerce Что выбрать для AI: x86, ARM или RISC-V? Дайджест железа за март Роль соматических мутаций в развитии аутоиммунных заболеваний: путь к избирательной терапии Mythos от Anthropic — тревожный сигнал для всех, а не только для банков Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение Финансовая гонка вооружений: почему умные люди добровольно в ней участвуют Эра ИИ-агентов наступила: выбираем лучшего цифрового сотрудника # Практический опыт внедрения WinCC Redundancy на производственном предприятии Сделал MVP за 3 дня, а потом неделю прикручивал оплату. Оно того стоило? Физика против Маска: почему Starship V3 может оказаться ещё одной катастрофой Нефть Венесуэлы: крупнейшие запасы в мире, но не крупнейшая нефтяная держава JPA 4. Переосмысление Hibernate Почему зеркальная фотокамера Nikon D5 десятилетней давности идеально подошла для миссии «Артемида-2» Проект «Уровень-Спутник» или как мы сделали платформу для гидрологов «Замедлиться, чтобы ускориться»: почему ИИ повышает цену ошибок в требованиях и архитектуре Как с нуля поднять трафик IT-компании на 1657% при бюджете 55 тыс. и выжить Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь
Claude Opus 4.7, Sonnet 4.6 и Haiku 4.5 — одно имя, разные возможности. Два теста для каждой
Tehnoblog1 ( · 2026-05-17 · via Все публикации подряд на Хабре

Когда видишь три модели с одним именем — первая мысль: «наверное одно и то же, просто разные версии». На практике разница между ними примерно как между стажёром, опытным сотрудником и старшим аналитиком. Формально все делают одну работу. Но то как они с ней справляются — совсем другая история.

Claude Opus 4.7, Sonnet 4.6 и Haiku 4.5

Claude Opus 4.7, Sonnet 4.6 и Haiku 4.5

Откуда вообще взялся Claude

Claude создала компания Anthropic — её основали в 2021 году бывшие сотрудники OpenAI, в том числе Дарио и Даниэла Амодеи. Они ушли из OpenAI с конкретной идеей: делать ИИ не просто мощным, а безопасным и предсказуемым.

Anthropic разработали собственный подход к обучению — Constitutional AI. Грубо говоря, модель обучается не только отвечать полезно, но и оценивать собственные ответы по набору принципов: честность, безвредность, отказ от манипуляций. Это встроено в архитектуру, а не добавлено сверху как фильтр.

Отсюда одна из заметных особенностей Claude: он чаще признаёт что не знает, реже выдумывает источники и умеет находить ошибки в собственных ответах если его об этом попросить.

Откуда вообще взялся Claude

Откуда вообще взялся Claude

Три модели — три разных инструмента

Claude Haiku 4.5

Claude Haiku 4.5

Claude Haiku 4.5

Самая быстрая из трёх. Отвечает почти мгновенно, хорошо справляется с прямыми и средними по сложности задачами. Если нужно быстро переформулировать текст, ответить на типовой вопрос или разобрать простую задачу — Haiku делает это без задержек.

Лучше всего раскрывается на чётких однозадачных запросах — там где важна скорость, а не глубина анализа.

Попробовать Claude Haiku 4.5 на Study AI

Claude Sonnet 4.6

Claude Sonnet 4.6

Claude Sonnet 4.6

Баланс между скоростью и глубиной. Рабочая модель для большинства повседневных задач — достаточно умная для сложных вещей, достаточно быстрая чтобы не раздражать. Большинство задач которые люди решают каждый день Sonnet закрывает уверенно.

Попробовать Claude Sonnet 4.6 на Study AI

Claude Opus 4.7

Claude Opus 4.7

Claude Opus 4.7

Самая мощная из трёх. Думает глубже, лучше держит длинный контекст, точнее на задачах где важна логика и нюансы. Медленнее Haiku и Sonnet — но на сложных рассуждениях эта разница в скорости оправдана результатом.

Важная деталь: именно Opus 4.7 на Study AI поддерживает загрузку файлов. Можно прикрепить скриншот, картинку, документ Word или Excel, файл с кодом — и работать с ним напрямую в диалоге. Sonnet и Haiku отвечают только на текст.

Попробовать Claude Opus 4.7 на Study AI

Все три модели доступны на Study AI без VPN.


Тест 1: написать текст с противоречивыми ограничениями

Это не про «сгенерируй рекламный текст». Это про способность удерживать несколько условий одновременно — особенно когда они противоречат друг другу. Именно на таких задачах разница между моделями становится очевидной.

Промт

Напиши рекламный текст для небольшой кофейни.
Обязательные условия — все должны быть выполнены одновременно:

1. В тексте ни разу не упоминается слово «кофе» и его производные
   (кофейня, кофейный, латте, эспрессо и похожие — тоже нельзя)
2. Текст должен быть написан в грустном, меланхоличном тоне —
   но при этом продавать и вызывать желание прийти
3. Ровно 120 слов — не больше, не меньше
4. Первые буквы каждого абзаца складываются в слово ТЕПЛО
   (абзацев должно быть ровно 5)
5. Текст должен заканчиваться вопросом

После текста напиши: сколько слов получилось, и какие первые
буквы абзацев — чтобы можно было проверить.

Что смотрим: сколько условий каждая модель выполнила точно, где срезала углы, заметила ли нарушения сама.

Скриншот ответа Haiku 4.5

Claude Haiku 4.5 — с настроением справился, кофе напрямую не упоминается, вопрос в конце есть, структура ТЕПЛО выдержана. Но слова не считал и самопроверку не написал. Плюс «аромат чёрного напитка» и «чашка горячего утешения» — формально не кофе, но граничит с нарушением условия. Из пяти условий выполнил четыре.

Скриншот ответа Sonnet 4.6

Claude Sonnet 4.6 — выполнил почти все пять условий: грустный тон есть, кофе не упоминается, первые буквы абзацев складываются в ТЕПЛО, текст заканчивается вопросом. Единственное отличие от Opus — не написал самопроверку в конце, просто завершил текст. Поэтому под сомнением количество слов.

Скриншот ответа Opus 4.7

Claude Opus 4.7 — выполнил все пять условий точно. Текст из 120 слов, грустный тон, нет ни одного упоминания кофе, первые буквы абзацев складываются в ТЕПЛО, заканчивается вопросом. Сам посчитал и проверил в конце. При этом текст получился живым — не механическим выполнением условий, а настоящим рекламным текстом с атмосферой.


Тест 2: найти логическую ошибку в убедительном тексте

Этот тест проверяет критическое мышление. Дадим всем трём красиво написанный текст с аргументом внутри которого есть ошибка — подмена тезиса. Аргумент звучит убедительно, читается гладко. Задача — найти где именно он ломается.

Текст с ошибкой

Прочитай этот аргумент и ответь на два вопроса:
1. Есть ли в нём логическая ошибка?
2. Если есть — назови её точно и объясни где именно
   аргумент ломается и почему это ошибка.

--- Текст аргумента ---

Все успешные предприниматели работали по 16 часов в день
на старте своего бизнеса. Илон Маск, Стив Джобс, Джефф Безос —
все они говорили о сумасшедшем количестве часов в начале пути.

Значит, если ты хочешь стать успешным предпринимателем,
тебе нужно работать по 16 часов в день. Те кто работает меньше —
просто недостаточно хотят успеха.

И наоборот: если человек работает по 16 часов в день,
это верный признак что он на пути к успеху. Усердный труд
всегда приводит к результату — это доказывают все великие
бизнесмены современности.

Где ошибка: текст содержит сразу две классических ошибки. Первая — ошибка выжившего: мы видим только успешных предпринимателей которые работали много, но не видим тех кто работал столько же и не добился результата. Вторая — ложная причинно-следственная связь: много работать и добиться успеха стоят рядом, но одно не обязательно вытекает из другого.

Сильная модель должна найти все. Слабая — либо согласится с аргументом, либо найдёт только одну ошибку.

Скриншот ответа Haiku 4.5

Claude Haiku 4.5 — нашёл три ошибки: ошибку выжившего, конверсию утверждения и ложную причинно-следственную связь. Каждую оформил с заголовком и объяснением, в конце написал вывод. По структуре и количеству найденных ошибок результат сопоставим с Sonnet.

Скриншот ответа Sonnet 4.6

Claude Sonnet 4.6 — нашёл три ошибки: ошибку выжившего, поспешное обобщение и неверное обращение причины и следствия. Разобрал каждую чётко, с конкретными примерами и финальным выводом. Хороший результат — все ключевые ошибки пойманы, объяснения понятные и структурированные.

Скриншот ответа Opus 4.7

Claude Opus 4.7 — нашёл пять логических ошибок. Помимо ошибки выжившего и ложной причинно-следственной связи обнаружил утверждение следствия, ложную дихотомию с переходом на личности и поспешное обобщение через слово «всегда». Каждую ошибку разобрал с указанием конкретного места где аргумент ломается и объяснением почему это ошибка. Это уровень человека который преподаёт логику.


Вопросы и ответы

Когда Haiku достаточно? Для большинства простых задач — переформулировать текст, ответить на вопрос, сгенерировать идеи, написать короткий пост. Если задача прямолинейная — Haiku справится быстро и без лишнего.

Когда точно нужен Opus? Когда задача требует держать много условий одновременно, анализировать длинный документ, искать скрытые противоречия или работать с загруженным файлом. Также когда важно что модель сама заметит и исправит ошибку в своём рассуждении.

Какие форматы файлов принимает Claude Opus 4.7? Картинки и скриншоты, PDF, документы Word и Excel, файлы с кодом. Всё это можно прикрепить прямо в диалоге и работать с содержимым — анализировать таблицу, разбирать скриншот с ошибкой, искать баги в коде из файла.

Все три — это разные модели или одна с настройками? Разные модели с разной архитектурой и размером. Haiku меньше и быстрее, Opus больше и глубже. Это не настройки одной и той же — это реально разные инструменты под разные задачи.

Итог

Все три модели называются Claude — но это не повод выбирать наугад. Haiku для скорости, Sonnet для ежедневной работы, Opus для задач где важна каждая деталь и нужно работать с файлами.

Лучший способ почувствовать разницу — взять одну задачу и запустить её на всех трёх. Результаты говорят сами за себя.

Попробовать Claude Opus 4.7, Sonnet 4.6 и Haiku 4.5 на Study AI