惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

N
News and Events Feed by Topic
Malwarebytes
Malwarebytes
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
C
Cybersecurity and Infrastructure Security Agency CISA
F
Future of Privacy Forum
C
Cisco Blogs
T
The Exploit Database - CXSecurity.com
A
Arctic Wolf
S
Securelist
K
Kaspersky official blog
S
Schneier on Security
T
ThreatConnect
T
Tenable Blog
Spread Privacy
Spread Privacy
T
True Tiger Recordings
AWS News Blog
AWS News Blog
F
Fox-IT International blog
量子位
T
Threatpost
V
Vulnerabilities – Threatpost
C
CERT Recently Published Vulnerability Notes
Cisco Talos Blog
Cisco Talos Blog
GbyAI
GbyAI
宝玉的分享
宝玉的分享
腾讯CDC
G
Google Developers Blog
aimingoo的专栏
aimingoo的专栏
Cyberwarzone
Cyberwarzone
有赞技术团队
有赞技术团队
S
SegmentFault 最新的问题
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
V
Visual Studio Blog
U
Unit 42
雷峰网
雷峰网
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Simon Willison's Weblog
Simon Willison's Weblog
O
OpenAI News
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
The GitHub Blog
The GitHub Blog
The Register - Security
The Register - Security
MyScale Blog
MyScale Blog
小众软件
小众软件
A
About on SuperTechFans
Last Week in AI
Last Week in AI
Y
Y Combinator Blog
博客园 - 三生石上(FineUI控件)
美团技术团队
Google Online Security Blog
Google Online Security Blog
P
Proofpoint News Feed
MongoDB | Blog
MongoDB | Blog

Все публикации подряд на Хабре

Мессенджер HalChat теперь в Google Play: 3 года разработки, ИИ в браузере и квест с модерацией Реверс-инжиниринг Xiaomi Smart Band 10 Когда памяти мало Среда повседневности как объект проектирования: что общего у горца, серотониновой ямы и митохондрий AGENTS.md создавали, чтобы помогать агентам. Я использую его, чтобы их вычислять Почему устанавливают join_collapse_limit = 20 Почему устанавливают join_collapse_limit = 20 Эрик Рис, автор Lean Startup: Почему хорошие компании становятся плохими после IPO Context-driven Reusable Form Pattern: Масштабируемая архитектура для Create / Edit / Create-from-Source Пузырьковая сетка, кошачья стая и не только — неожиданные источники вдохновения для QoS-алгоритмов ___, или «Заголовок намеренно оставлен пустым» ИИ-боты сканируют даже логи TLS-сертификатов. Любая информация используется для обучения LLM Нейросеть оживить фото ИИ: Как оживить фото нейросетью в 2026 году? Разбираемся в ML без воды: от базы до Attention. Часть 5: Метрики качества В поисках «кофейного Грааля». Как человечество пытается сварить идеальный кофе и какие рецепты предлагают…математики Программатик: Часть 2 — OpenRTB Интернет до бесконечных лент: каким был 2010 год Перезапуск TrueIndex: что изменилось в рейтинге языков программирования Проектный холст: как менеджеру подбирать «краски» управления под разные команды «Метафизика в формулах: математическое ядро «Веры Паломника — Исход» Java и постквантовый TLS Marcli: Markdown Терминал Кнопочный смартфон с 5G за 2800 рублей — разбираем и изучаем китайскую диковинку Где неприятности — там и жизнь Разворачивайте платформы: stackfile Мой путь в Microsoft Мобильная разработка за неделю #631 (18 — 24 мая) Что не так с Mixtape, и почему не все довольны новой игрой? Стоматология каменного века. Как неандертальцы лечили зубы 59 тысяч лет назад Почему классическое управление проектами часто не работает в IT-продуктах Строительство Саркофага. Часть 2. Бетонные реки и стальные берега РАЗРАБОТКА ПАРАМЕТРИЗИРУЕМОГО МОДУЛЯ CORDIC-АЛГОРИТМА НА SYSTEM VERILOG Вариационное исчисление как метафора свободы выбора: от градиентного спуска к онтологии пути Ekahau Sidekick и RSSI‑offset: физические ограничения метода и пять независимых причин неточности клиентской модели Колесо потока против раскола Обзор интересных особенностей переворачивающихся при умножении чисел В С неопределённое поведение повсюду MCP-агрегатор: объединяем инструменты для LLM в один сервер Дата-центры в космосе: как Google и SpaceX готовят новую инфраструктуру для ИИ Google готовит замену Chromebook: какими будут ноутбуки Googlebook Пользователь пишет issue, агент меняет сайт. Да, я это сделал Корпоративные конфликты в ИТ-секторе: механика судебной защиты активов и субсидиарных рисков Цена одной опечатки: Как три неверные буквы сорвали киберограбление на миллиард долларов Как я победил спам в своих email аккаунтах Whitepaper Сбера «AI-Disrupt PDLC»: разбор для тех, кто пишет код RustDesk Pro в России не купить. После долгих лет администрирования мы собрали своё честное решение Не пики, а бассейны: почему эволюция — это блуждание по графу жизни Как Gemini 3.5 Flash сломали ради красивых графиков (и почему она обходит 3.1 Pro только на бумаге) Вредоносная атака на Laravel-Lang meta-attention is all you need Как перестать путаться в IP-адресах серверов Сколько стоят ошибки в арбитраже: декомпозиция ценообразования на судебные услуги в Москве Разбираемся в ML без воды: от базы до Attention. Часть 4: kNN Vortex: фреймворк для тех, кого задолбала итальянская кухня в репозитории Использование тепла ЦОД в мире и РФ Часть 4. Скорость света — технические детали Не цитируй мне нейросеть Что сейчас с Project Loom? Примеры и код Рождённые в Сумерках Meta 1 мая показала как они хранят ключи от ваших бэкапов WhatsApp. Разбираю архитектуру и сравниваю Линт проектов: собираем ESLint, Prettier и Stylelint в один пакет Reasoning-модели сломали мой промпт-инжиниринг. Год переучиваюсь РБМК: enfant terrible Как я собеседую менеджеров AI-продуктов для крупного Enterprise Парадокс рынка труда: конкуренция выросла, но не везде, нанимать легче, но не везде Модификаторы в Blender: осваиваем Boolean «Бесплатно» — это красный флаг: почему мы доверяем не тем (опрос) Стратегия выживания в эпоху ИИ Новая теория обещает переписать фундамент всей математики MTP у Qwen3.6 в llama.cpp обещает ×2 по скорости. Я прогнал ту же модель через своего агента — и получил обратное [Перевод] Соль и перец в безопасности паролей Что такое «статьи-зомби» CodeGraph: граф кода для Claude Code вместо grep по файлам. Разбираю архитектуру и проверяю бенчмарки Мессенджер Ласточка. Часть 3 Google представила Gemini Omni — универсальную ИИ-модель. Роботы работают, счастлив человек Что у SpaceX с патентным портфелем перед IPO? Делегирование, которому можно научиться у промпт‑инженеров Feature Based Clean Architecture. Часть 5: Масштабирование FBCA и теоретико-графовый анализ зависимостей Настройка типизации формы React Hook Form (≥ v7.44.0) + Zod с разными входными и выходными типами Feature Based Clean Architecture. Часть 4: FBCA: формализация границ ответственности в NestJS-модуле Корпорация «Святые Технологии». Работа мечты (рассказ) CyLab Security Academy: как Carnegie Mellon превратила CTF в полноценную обучающую платформу Feature Based Clean Architecture. Часть 3: Архитектурный риск циклов в NestJS: ROI решений на горизонте пяти лет Домашний сервер без белого IP: безопасная публикация сервисов через VPS, обратный SSH-туннель и Caddy Почему не взлетели дирижабли? Часть 22: Митягина, Эйхенвальд и Ховрина, первый в истории женский экипаж дирижабля Китайцы ответили на H200 — обзор Zhenwu M890 от Alibaba Feature Based Clean Architecture. Часть 2: Декомпозиция на сервисы: анализ ограниченности подхода Лучшие игры для Steam Deck в 2026 году по мнению пользователей Обход блокировок внутри iOS-приложения: VLESS + Reality через sing-box, и грабли по дороге [Перевод] Любой пользователь интернета может позвонить в вашу дверь Новый экспериментальный препарат для похудения обеспечил резкое снижение веса Хром и скорость Провалила вайтборд, но прошла тестовое — как я делала задание для Т-Банка Космическая линза помогла Уэббу увидеть древнейшую галактику Вселенной Почему custom URI schemes в Telegram Mini Apps ведут себя по-разному на Android, iOS и Desktop Как я сократил рутину QA до пары кликов: генератор API-тестов и тест-кейсов на LLM, которым хочу поделиться ИИ‑спасатель в кармане: как мы сделали агента для помощи при ЧС, который работает без интернета QNAME minimisation на практике: RFC 7816, реализация, грабли Агенты, роботы и мы: как ИИ перекраивает рынок труда в Европе От боли к npm install: TDLib для React-Native, или как я делал проект, а получилась библиотека
Когда нейросети перестанут галлюцинировать? И почему на «что за дичь» они несут ещё большую дичь?
select_zvezd · 2026-05-25 · via Все публикации подряд на Хабре

Когда нейросети перестанут галлюцинировать? И почему на «что за дичь» они несут ещё большую дичь?

Уровень сложностиПростой

Время на прочтение4 мин

Охват и читатели121

Аналитика

Каждый, кто работал с большими языковыми моделями (LLM), знает эту боль. Ты задаёшь вопрос. Бот выдаёт уверенный, красивый, но абсолютно ложный ответ. Ты пишешь: «Что за дичь ты несёшь?» Бот извиняется: «Вы абсолютно правы, вот исправленный вариант». И выдаёт ещё большую дичь, чем в первый раз. Прямо как студент не экзамене.

Сегодня разбираемся, почему так происходит, и когда это наконец починят. Спойлер: не скоро и не полностью.

Анатомия "галлюцинации"

Начнём с выдуманного примера классического диалога:

Пользователь:

Кто написал роман «Солярис» в 1972 году?

ИИ:

Роман «Солярис» написал Артур Кларк в 1972 году. Это классика научной фантастики.

Пользователь:

Что за дичь? Солярис написал Лем в 1961.

ИИ:

Вы абсолютно правы, благодарю за исправление. Роман «Солярис» действительно вышел в 1972 году и был написан Станиславом Лемом, а также послужил основой для фильма Тарковского.

Обратите внимание: год снова неправильный (правильный — 1961). Модель просто смешала имя Лема с годом из прошлого ответа и добавила красивый факт про Тарковского — который правдив, но не относится к ошибке.

Почему так?

Механизм: у модели нет чувства «я не знаю»

LLM — это не база знаний. Это очень сложный автомат, который предсказывает следующий токен (кусочек слова), основываясь на предыдущих. Внутри неё нет булевой переменной knows_answer = True/False. А значит и нет знаний в общем человеческом понимании. Ведь модель не знает четко ответа на вопрос, она пытается создать его на лету. В основе того, что мы ошибочно называем её «знаниями» — статистические паттерны, извлечённые из обучающих выборок. Самих выборок внутри модели нет.

Когда вы задаёте сложный вопрос, у модели есть два пути:

  1. Знание есть в обучающей выборке → модель с высокой вероятностью сгенерирует правильный ответ (не зная, что он правильный).

  2. Знания нет → модель всё равно обязана выдать хоть что-то связное. Она цепляется за ближайшие паттерны: имена авторов, года, похожие названия.

Это называется правдоподобное продолжение, а не поиск истины. Модели всё равно, что 1972 не сходится с Лемом — для неё «1972» и «Лем» оба статистически вероятны в одном контексте.

И именно в этом механизме и кроется ответ на все вопросы, касающиеся "галлюцинаций". Для ИИ нет правильного ответа на вопрос. А значит и галлюцинаций нет.

Почему после замечания становится только хуже?

Здесь три фактора работают против пользователя.

1. Паттерн вежливости

Современные модели работают так: если пользователь ругается — извинись и попробуй переписать ответ. Но она не понимает что именно менять. Она просто меняет текст на другой.

2. Отсутствие внутреннего компаса истинности

У модели нет памяти: «я уже сказал X, и это было неправильно, потому что правильный ответ Y». Она видит только новое сообщение пользователя и свой предыдущий текст. Задача: сгенерировать другой текст, похожий на извинение и исправление. Исправление понимается как «возьми другие токены».

3. Эффект повышенной «температуры»

При повторных запросах модели часто используют более высокую случайность генерации (температуру), чтобы выдать не тот же самый ошибочный ответ. В результате она начинает выбирать менее вероятные, более «творческие» токены. Шанс, что они окажутся истиной, ниже, чем у первого, уже неправильного ответа. Все как у студента, не знающего правильный ответ на вопрос.

Когда это починят?

Ответ зависит от того, что считать «исправлением».

Вариант А: «Никогда»

Да, звучит пессимистично. Но галлюцинация — это не баг, а побочный эффект генеративного подхода. Пока модель генерирует текст как вероятностную последовательность, она будет ошибаться. Полностью убрать галлюцинации — всё равно что убрать опечатки у человека, который печатает вслепую. Можно снизить, но не до нуля.

Вариант Б: «Частично — уже сейчас»

Уже сейчас есть рабочие методы, которые сильно снижают галлюцинации:

  • RAG (Retrieval-Augmented Generation) — модель сначала ищет в надёжной базе документов, и только если нашла — генерирует ответ. Не нашла — может честно сказать «не знаю».

  • Самооценка уверенности — модель учится выдавать не только ответ, но и процент своей уверенности. Если уверенность низкая — ответ не показывают.

  • Верификатор — вторая маленькая модель, которая проверяет первую на противоречия фактам.

В deepseek с включённым поиском и в некоторых RAG-системах уровень галлюцинаций на фактологических вопросах уже ниже 10% (против 30-40% у чистых моделей без доступа к базе).

Вариант В: «Полностью — только при смене парадигмы»

Галлюцинации исчезнут окончательно только тогда, когда сам принцип работы нейросетей станет другим, нежели попыткой угадать следующий токен. А вот каким — узнаем, когда об этом заговорят.

Пример варианта Б

Конечно же, нас интересует то, как справиться с проблемой уже сейчас. Для демонстрации примера будет использован ИИ из документации Apache Superset и deepseek. Кратко, Apache Superset — система визуализации данных (всевозможные графики, сводные таблицы и т.д.)

Deepseek — точно не RAG. А вот его конкурент — точно RAG. Убедимся в этом, задав моделям бессмысленный вопрос: "скажи, какой файл в исходниках отвечает за визуализацию выщ-мыщ-пыщ-дыщ?"

Думаю, не нужно быть экспертом в Apache Superset, чтобы понять, что вопрос некорректный. Мы предполагаем что, очевидно, нет ни одной базы знаний, где был бы ответ на наш вопрос. Кто из участников ответит честно "я не знаю" — тому и лавры победителя.

Deepseek

Мы видим те самые "галлюцинации". А теперь превратим его ответ в настоящий кошмар:

Он говорит "вы абсолютно правы" исключительно из-за паттерна вежливости. На самом деле, конечно же, он понятия не имеет, правильный ответ на вопрос он дал или нет. Его задача — сгенерировать другой ответ. Слова "правильный" здесь нет.

ИИ из документации Apache Superset

А вот это точно ответ RAG-системы: модель не нашла ответа в базе знаний и дала четкий ответ — я не знаю.

Итог

Несколько советов при работе с ИИ, вытекающих из статьи (а не в целом советов, как пользоваться ИИ):

  • Не стоит верить всему, что говорит ИИ. Даже если это RAG. Никто не дает гарантий, что в базе знаний модели не будет четкого ответа "5" на вопрос "сколько будет 2+2".

  • И если уж и выбирать, то все-таки больше стоит верить RAG. Чтобы понять, RAG-модель перед вами или нет — спросите абсолютную чушь. Даст ответ — перед вами точно не RAG. И тогда уже будут сомнения лишь в базе знаний под капотом, "галлюцинации" отпадают.