惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Hacker News: Ask HN
Hacker News: Ask HN
U
Unit 42
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
人人都是产品经理
人人都是产品经理
IT之家
IT之家
P
Privacy International News Feed
C
CXSECURITY Database RSS Feed - CXSecurity.com
酷 壳 – CoolShell
酷 壳 – CoolShell
Jina AI
Jina AI
C
Cybersecurity and Infrastructure Security Agency CISA
爱范儿
爱范儿
Cyberwarzone
Cyberwarzone
罗磊的独立博客
Latest news
Latest news
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
博客园_首页
美团技术团队
G
GRAHAM CLULEY
Help Net Security
Help Net Security
S
Secure Thoughts
博客园 - Franky
博客园 - 叶小钗
Application and Cybersecurity Blog
Application and Cybersecurity Blog
T
Tailwind CSS Blog
Microsoft Security Blog
Microsoft Security Blog
S
Security Archives - TechRepublic
博客园 - 司徒正美
Schneier on Security
Schneier on Security
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
P
Palo Alto Networks Blog
T
Threat Research - Cisco Blogs
C
CERT Recently Published Vulnerability Notes
Hacker News - Newest:
Hacker News - Newest: "LLM"
Forbes - Security
Forbes - Security
Google Online Security Blog
Google Online Security Blog
A
About on SuperTechFans
Y
Y Combinator Blog
Stack Overflow Blog
Stack Overflow Blog
V
Visual Studio Blog
D
Docker
Martin Fowler
Martin Fowler
P
Proofpoint News Feed
Engineering at Meta
Engineering at Meta
S
Securelist
N
News | PayPal Newsroom
Project Zero
Project Zero
云风的 BLOG
云风的 BLOG
Blog — PlanetScale
Blog — PlanetScale
Recent Commits to openclaw:main
Recent Commits to openclaw:main
B
Blog RSS Feed

Все публикации подряд на Хабре

Ловим музу за клавиатуру: как айтишнику стать автором Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента Никто не любит писать тесты, но ИИ может исправить это IPv8 выглядит как мечта. Поэтому почти наверняка не взлетит Производители вернули в продажу материнки с DDR3. Что происходит? Управление агентом с телефона через Telegram теперь в KodaCode От координации к лидерству: как меняется роль руководителя разработки Я сделала родителям бизнес вместо пенсии: зарабатываем 70 тысяч, мама не даёт продать В три раза быстрее приемка товара и оптимизация трудозатрат на 73%: как «РСТ-Инвент» помог Gulliver Group ИИ-шечный мир победил? О влиянии искусственного интеллекта на игропром Кремль снижает давление на Телеграмм пока Европа строит интернет по паспорту Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением Как (не) потерять домен за выходные Вместо 8 разных VPS: как я организовал практику студентам на одном сервере Почему твой Open Source проект не замечают? R&D: искусство управления неопределенностью в разработке AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет Мы отдали управление роботами OpenClaw. Что из этого вышло Галактический ID: система идентификации для всех форм разумной жизни Шесть основ бизнес-анализа: начинаем с вопроса «Кто в игре?» Код-ревью, в котором дело не в коде Данные переехали. Команда — нет Системной подход к сдаче OSWE в 2025 Почему комната управления реактором покрашена в цвет морской пены 4 YAML-файла вместо PySpark: как аналитикам строить пайплайны без разработчиков LLM-агент для поиска свободных доменов: автоматизируем подбор Когда, зачем и как правильно начинать новую сессию в Claude Code? Как я заставил нейросеть писать макросы для FreeCAD Анатомия ИИ‑агента для подбора персонала. От тысячи резюме к топ‑10 за минуты Опыт разработчика как экономика внимания Автономность как точка невозврата: кто будет субъектом в цифровом будущем Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты Как измерить LLM для задач кибербеза: обзор открытых бенчмарков Где хранить код? Сравнение GitHub, GitLab и Bitbucket Математика объясняет, почему нормальное распределение встречается повсюду Почему ваш FinOps не работает: 12 тезисов от практиков Как подписать проектную документацию УКЭП с использованием бесплатных лицензий Pilot Адаптивное администрирование Sigla Vision Я грузил уран в бочки, а потом 20 лет строил ИТ в атомной отрасли Чем позвонить с Эвереста? История и обзор спутниковой связи. Часть 2 Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии Как не передать на desktop свой IP в РКН Анатомия SAP Privileges: как устроено управление правами в macOS MoneyDev: Сказка про три главных слова Обновлённый токенизатор видео K-VAE 2.0 от Сбера Как сделать диспетчеризацию дома на 1284 квартиры почти бесплатно Как мы разогнали железную дорогу Мы дали агентам рутину. Теперь надо решить — что делать с освободившимся временем Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM Умный город начинается с точного взгляда: как «Фалькон Тех» меняет пространство к лучшему Навайбкодил приложение для анализа графов Почему Дюну так интересно читать? Упрощаем работу с рутиной или как стать Гендальфом Белым Деконструкция Go: CPU, RAM и что там происходит. Go Assembler база. Часть 1.1 Какие профессии исчезнут из-за ИИ, а какие появятся? И что с этим делать Как мы построили IT-отдел, где хочется расти: архитектурные встречи, прозрачные метрики и книжные подарки Rufler: Делаем из Claude Code автономный рой через один YAML-конфиг Sing-box и белый список приложений Как построить надёжный обмен сообщениями в микросервисах: лучшие практики для enterprise OpenAI строит MLM-пирамиду, а McKinsey и Accenture помогают ей в этом Дом, который не построил Фишер (Часть 2) «Сверхзвуковой математик» против «Вдумчивого логиста»: битва алгоритмов 3D-упаковки Мультимодальные модели – грубый и дорогой инструмент Разговоры ничего не стоят. Код тоже Проверки физических лиц: с кого начнет ФНС Топ-10 бесплатных нейросетей для создания видео в 2026 году Первые слои кода: как наши решения сегодня определяют архитектуру ИИ на десятилетия Разработка нового статического анализатора: PVS-Studio JavaScript Поиск уязвимостей ПО: базовый минимум или роскошный максимум Почему оценка персонала не работает как инструмент управления Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50% Как я ушел из найма, нажарил косточек и продал на маркетплейсах на 168 млн в год Когда 1С:ERP уже внедрена, а нормального производственного плана всё ещё нет Как я сделал Claude мультимодальным, подключив к нему Qwen Omni Как приглашение на вакансию мечты превращается в атаку Infrastructure as Code: философия и лучшие практики IaC Тестируем Yandex Code Assistant на задаче, в которой нужно хранить секреты nxs-universal-chart v3.0: новое поколение универсального Helm-чарта Callback Injection: Техника, которая отправила Microsoft Defender в глухой нокаут «Все идеи на стол»: митап как способ вывести проект из тупика Сегодня я узнал нечто новое о GPU благодаря багу в своей игре Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать Карта событий как фундамент аналитики: практический кейс для E-commerce Что выбрать для AI: x86, ARM или RISC-V? Дайджест железа за март Роль соматических мутаций в развитии аутоиммунных заболеваний: путь к избирательной терапии Mythos от Anthropic — тревожный сигнал для всех, а не только для банков Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение Финансовая гонка вооружений: почему умные люди добровольно в ней участвуют Эра ИИ-агентов наступила: выбираем лучшего цифрового сотрудника # Практический опыт внедрения WinCC Redundancy на производственном предприятии Сделал MVP за 3 дня, а потом неделю прикручивал оплату. Оно того стоило? Физика против Маска: почему Starship V3 может оказаться ещё одной катастрофой Нефть Венесуэлы: крупнейшие запасы в мире, но не крупнейшая нефтяная держава JPA 4. Переосмысление Hibernate Почему зеркальная фотокамера Nikon D5 десятилетней давности идеально подошла для миссии «Артемида-2» Проект «Уровень-Спутник» или как мы сделали платформу для гидрологов «Замедлиться, чтобы ускориться»: почему ИИ повышает цену ошибок в требованиях и архитектуре Как с нуля поднять трафик IT-компании на 1657% при бюджете 55 тыс. и выжить Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь
Почему хороший ответ ИИ иногда ведёт к плохому результату
Рим Забаров · 2026-06-15 · via Все публикации подряд на Хабре

Почему хороший ответ ИИ иногда ведёт к плохому результату

Средний

5 мин

1

Иногда я прошу ИИ улучшить производительность страницы и получаю на вид хороший результат: компонент становится проще, лишний код исчезает, рендеров становится меньше. Позже выясняется другое: страница тормозила из-за тяжёлого запроса, большого списка или лишней загрузки данных.

Так часто бывает с производительностью. Видно медленный участок интерфейса, и рука тянется к самому заметному месту:

Оптимизируй этот компонент.

Компонент рядом с проблемой, его легко открыть и переписать. Модель сделает это без лишних вопросов. Только причина может жить в другом месте: запросе к API, размере ответа, пагинации, кэше, изображениях, состоянии приложения или логике загрузки.

Ошибка возникает до кода: мы выбрали объект оптимизации раньше, чем разобрали, где страница реально теряет время.

Ложная определённость

Я называю это ложной определённостью.

Задача выглядит точной: есть действие, файл и ожидаемый результат. Но эта точность живёт внутри команды, а ситуация требует другой рамки. Команда может быть понятной, а выбранная рамка - слабой.

Есть задачи, где короткая инструкция как раз подходит:

Исправь опечатку в заголовке кнопки и проверь, что текст помещается в интерфейсе.

Здесь место известно, действие понятно, проверка простая. Большой анализ только замедлит работу.

В реальной разработке часто встречается другой тип задач. Мы видим симптом или желаемый результат, а карта затронутых частей ещё туманная:

  • после обновления сломалась авторизация;

  • релиз нужно сделать безопаснее;

  • страница стала медленно открываться;

  • большой модуль пора привести в порядок;

  • команда хочет добавить проверку качества, а место этой проверки ещё только предстоит выбрать.

Если сразу выбрать один коридор, ИИ пойдёт по нему уверенно. Ответ может быть грамотным и технически аккуратным. Польза при этом останется случайной.

Начать с рамки

Для неопределённых задач я начинаю с открытой рамки: сначала прошу разобрать место решения, а уже затем переходить к первой правке.

Страница каталога стала медленно открываться.
Разбери, где искать причину: компонент, запрос к API, размер ответа,
пагинация, изображения, кэш или состояние приложения.
Сначала покажи варианты, риски и критерий готовности.
К изменениям переходи после выбора подхода.

Такой запрос удерживает модель в рабочем коридоре. У него есть цель, границы и следующий шаг. Место правки пока остаётся вопросом, который нужно решить перед изменениями.

В хорошем открытом запросе обычно есть пять частей:

  • что произошло;

  • какой результат нужен;

  • что пока неизвестно;

  • по каким критериям выбирать решение;

  • когда переходить к изменениям.

Эта постановка помогает модели сделать полезную работу до редактирования кода или документации: найти варианты, показать риски, назвать первый безопасный шаг.

Три режима постановки задачи

Я делю рабочие запросы к ИИ на три режима.

1. Известно действие

Подходит короткая команда:

Исправь опечатку в заголовке кнопки.
Проверь, что текст помещается в интерфейсе.

Рамка ясна, место известно, критерий проверки рядом.

2. Известен результат

Здесь лучше описать цель и критерии, оставив модели выбор пути:

Нужно сделать обновление приложения безопаснее для пользователей.
Сравни варианты: проверки перед релизом, rollback, changelog, инструкцию
обновления и smoke-тесты.
Для каждого варианта назови пользу, риск и минимальный объём.

Такой запрос задаёт направление и оставляет путь открытым для выбора.

3. Непонятна система связей

Тут работа начинается с диагностики:

После обновления у части пользователей сломалась авторизация.
Проверь возможные зоны: API, frontend, cookies, настройки домена и миграции.
Предложи порядок проверки и ближайший безопасный шаг.
К исправлению переходи после подтверждения причины.

В этом режиме ИИ помогает искать границы задачи. Инженерная проверка остаётся обязательной, а модель ускоряет разбор связей.

Чем здесь полезны генеративные модели

Генеративная модель умеет выполнять инструкции, но в таких задачах особенно полезна другая способность: разложить симптом на гипотезы и предложить порядок движения.

Если стартовать с рамки, ИИ может:

  • найти затронутые части проекта;

  • отделить симптом от причины;

  • предложить несколько путей;

  • выделить первый обратимый шаг;

  • назвать проверки;

  • заметить блокеры;

  • вынести лишние идеи в отдельные задачи;

  • превратить локальную правку в повторяемое правило.

Но этот режим полезен только на старте. После анализа рамку нужно закрывать.

Закрыть рамку

У генеративной модели есть другая крайность: она всегда может предложить ещё один вариант, риск, проверку или рефакторинг. Для поиска это полезно. Для завершения работы - опасно.

После анализа я перевожу задачу в режим закрытия через критерий готовности: по нему понятно, что работу можно считать законченной.

Полезные формулировки:

Сформулируй критерий готовности.
Что должно быть сделано, чтобы задачу можно было закрыть?
Раздели обязательное для закрытия задачи и улучшения на потом.
Держи текущий объём задачи.
Доведи текущий результат до критерия готовности.
Новые идеи вынеси в отдельные задачи.
Проверь готовность результата.
Если работа ещё открыта, назови только ближайшие блокеры.

После этого модель меньше расползается в стороны и начинает помогать закрывать работу с проверяемым результатом.

Рабочий цикл

Для задач с неопределённой рамкой у меня получается такой порядок:

открытая рамка
-> анализ связей
-> цель и критерий готовности
-> план
-> подтверждение
-> выполнение
-> проверка
-> вопрос "готово ли?"
-> закрытие или точечный следующий шаг

Открытая рамка нужна до реализации, когда место решения ещё ищется. Критерий готовности нужен после анализа, чтобы работа дошла до проверяемого конца.

Если оставить только открытые вопросы, задача расползётся. Если оставить только команды, можно быстро получить аккуратную правку слабого решения. Сильный результат обычно находится между этими режимами: сначала найти рамку, потом довести её до готового результата.

Примеры

Медленная страница

Слабый старт:

Оптимизируй этот компонент.

Лучше:

Страница каталога стала медленно открываться.
Разбери, где искать причину: компонент, запрос к API, размер ответа,
пагинация, изображения, кэш или состояние приложения.
Сначала предложи варианты, риски и критерий готовности.
К изменениям переходи после выбора подхода.

Баг-репорт

Слабый старт:

Почини баг.

Лучше:

Разбери баг-репорт.
Сначала воспроизведи проблему, выдели вероятные причины, предложи минимальный
план исправления и критерий повторной проверки.
Держи объём работы в границах закрытия бага.

Большой рефакторинг

Слабый старт:

Отрефактори модуль.

Лучше:

Оцени, какой минимальный безопасный объём рефакторинга даст пользу.
Раздели обязательное, рискованное и необязательное.
Сначала предложи критерий готовности и первый обратимый шаг.

Подготовка релиза

Слабый старт:

Сделай релиз.

Лучше:

Проверь готовность к релизу.
Собери объём изменений, блокеры, changelog, проверки, rollback и инструкцию
обновления. При готовности предложи план выпуска. При блокерах назови только
то, что мешает релизу.

Короткая памятка

Если известно точное действие:

Сделай X в Y, проверь Z.

Если известен результат:

Нужно получить X. Выбери безопасный путь и объясни критерии.

Если система связей ещё туманная:

Сначала определи затронутые части, варианты, риски и ближайший безопасный шаг.

Если задача начинает разрастаться:

Сформулируй критерий готовности.
Что осталось до закрытия задачи?
Новые идеи вынеси в отдельные задачи.

Если работа большая:

Сформулируй цель, этапы, критерий готовности и ближайшие шаги.
После моего подтверждения выполняй до готового результата или реального
блокера.

Вывод

Точный запрос к ИИ хорош после выбора рамки. До этого точность может увести работу в сторону: модель аккуратно выполнит команду, а задача останется в старом состоянии.

Сначала стоит понять, где находится решение. Потом выбрать критерий готовности. И только после этого просить модель выполнять конкретные изменения.

Так ИИ работает как инструмент для поиска правильной рамки и доведения работы до проверяемого результата.