惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Stack Overflow Blog
Stack Overflow Blog
P
Privacy International News Feed
U
Unit 42
B
Blog
GbyAI
GbyAI
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
Forbes - Security
Forbes - Security
Engineering at Meta
Engineering at Meta
J
Java Code Geeks
Scott Helme
Scott Helme
MongoDB | Blog
MongoDB | Blog
H
Help Net Security
美团技术团队
T
Threat Research - Cisco Blogs
MyScale Blog
MyScale Blog
爱范儿
爱范儿
Schneier on Security
Schneier on Security
Y
Y Combinator Blog
C
Cisco Blogs
P
Proofpoint News Feed
T
Tenable Blog
TaoSecurity Blog
TaoSecurity Blog
aimingoo的专栏
aimingoo的专栏
Hugging Face - Blog
Hugging Face - Blog
H
Hackread – Cybersecurity News, Data Breaches, AI and More
H
Heimdal Security Blog
N
News and Events Feed by Topic
S
Security @ Cisco Blogs
N
News | PayPal Newsroom
W
WeLiveSecurity
SecWiki News
SecWiki News
小众软件
小众软件
I
InfoQ
Project Zero
Project Zero
Recent Announcements
Recent Announcements
Microsoft Azure Blog
Microsoft Azure Blog
Blog — PlanetScale
Blog — PlanetScale
Attack and Defense Labs
Attack and Defense Labs
Recent Commits to openclaw:main
Recent Commits to openclaw:main
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
Apple Machine Learning Research
Apple Machine Learning Research
S
Secure Thoughts
Martin Fowler
Martin Fowler
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
Cloudbric
Cloudbric
G
Google Developers Blog
Hacker News: Ask HN
Hacker News: Ask HN
Help Net Security
Help Net Security
C
Cybersecurity and Infrastructure Security Agency CISA
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报

Все публикации подряд на Хабре

Ловим музу за клавиатуру: как айтишнику стать автором Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента Никто не любит писать тесты, но ИИ может исправить это IPv8 выглядит как мечта. Поэтому почти наверняка не взлетит Производители вернули в продажу материнки с DDR3. Что происходит? Управление агентом с телефона через Telegram теперь в KodaCode От координации к лидерству: как меняется роль руководителя разработки Я сделала родителям бизнес вместо пенсии: зарабатываем 70 тысяч, мама не даёт продать В три раза быстрее приемка товара и оптимизация трудозатрат на 73%: как «РСТ-Инвент» помог Gulliver Group ИИ-шечный мир победил? О влиянии искусственного интеллекта на игропром Кремль снижает давление на Телеграмм пока Европа строит интернет по паспорту Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением Как (не) потерять домен за выходные Вместо 8 разных VPS: как я организовал практику студентам на одном сервере Почему твой Open Source проект не замечают? R&D: искусство управления неопределенностью в разработке AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет Мы отдали управление роботами OpenClaw. Что из этого вышло Галактический ID: система идентификации для всех форм разумной жизни Шесть основ бизнес-анализа: начинаем с вопроса «Кто в игре?» Код-ревью, в котором дело не в коде Данные переехали. Команда — нет Системной подход к сдаче OSWE в 2025 Почему комната управления реактором покрашена в цвет морской пены 4 YAML-файла вместо PySpark: как аналитикам строить пайплайны без разработчиков LLM-агент для поиска свободных доменов: автоматизируем подбор Когда, зачем и как правильно начинать новую сессию в Claude Code? Как я заставил нейросеть писать макросы для FreeCAD Анатомия ИИ‑агента для подбора персонала. От тысячи резюме к топ‑10 за минуты Опыт разработчика как экономика внимания Автономность как точка невозврата: кто будет субъектом в цифровом будущем Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты Как измерить LLM для задач кибербеза: обзор открытых бенчмарков Где хранить код? Сравнение GitHub, GitLab и Bitbucket Математика объясняет, почему нормальное распределение встречается повсюду Почему ваш FinOps не работает: 12 тезисов от практиков Как подписать проектную документацию УКЭП с использованием бесплатных лицензий Pilot Адаптивное администрирование Sigla Vision Я грузил уран в бочки, а потом 20 лет строил ИТ в атомной отрасли Чем позвонить с Эвереста? История и обзор спутниковой связи. Часть 2 Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии Как не передать на desktop свой IP в РКН Анатомия SAP Privileges: как устроено управление правами в macOS MoneyDev: Сказка про три главных слова Обновлённый токенизатор видео K-VAE 2.0 от Сбера Как сделать диспетчеризацию дома на 1284 квартиры почти бесплатно Как мы разогнали железную дорогу Мы дали агентам рутину. Теперь надо решить — что делать с освободившимся временем Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM Умный город начинается с точного взгляда: как «Фалькон Тех» меняет пространство к лучшему Навайбкодил приложение для анализа графов Почему Дюну так интересно читать? Упрощаем работу с рутиной или как стать Гендальфом Белым Деконструкция Go: CPU, RAM и что там происходит. Go Assembler база. Часть 1.1 Какие профессии исчезнут из-за ИИ, а какие появятся? И что с этим делать Как мы построили IT-отдел, где хочется расти: архитектурные встречи, прозрачные метрики и книжные подарки Rufler: Делаем из Claude Code автономный рой через один YAML-конфиг Sing-box и белый список приложений Как построить надёжный обмен сообщениями в микросервисах: лучшие практики для enterprise OpenAI строит MLM-пирамиду, а McKinsey и Accenture помогают ей в этом Дом, который не построил Фишер (Часть 2) «Сверхзвуковой математик» против «Вдумчивого логиста»: битва алгоритмов 3D-упаковки Мультимодальные модели – грубый и дорогой инструмент Разговоры ничего не стоят. Код тоже Проверки физических лиц: с кого начнет ФНС Топ-10 бесплатных нейросетей для создания видео в 2026 году Первые слои кода: как наши решения сегодня определяют архитектуру ИИ на десятилетия Разработка нового статического анализатора: PVS-Studio JavaScript Поиск уязвимостей ПО: базовый минимум или роскошный максимум Почему оценка персонала не работает как инструмент управления Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50% Как я ушел из найма, нажарил косточек и продал на маркетплейсах на 168 млн в год Когда 1С:ERP уже внедрена, а нормального производственного плана всё ещё нет Как я сделал Claude мультимодальным, подключив к нему Qwen Omni Как приглашение на вакансию мечты превращается в атаку Infrastructure as Code: философия и лучшие практики IaC Тестируем Yandex Code Assistant на задаче, в которой нужно хранить секреты nxs-universal-chart v3.0: новое поколение универсального Helm-чарта Callback Injection: Техника, которая отправила Microsoft Defender в глухой нокаут «Все идеи на стол»: митап как способ вывести проект из тупика Сегодня я узнал нечто новое о GPU благодаря багу в своей игре Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать Карта событий как фундамент аналитики: практический кейс для E-commerce Что выбрать для AI: x86, ARM или RISC-V? Дайджест железа за март Роль соматических мутаций в развитии аутоиммунных заболеваний: путь к избирательной терапии Mythos от Anthropic — тревожный сигнал для всех, а не только для банков Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение Финансовая гонка вооружений: почему умные люди добровольно в ней участвуют Эра ИИ-агентов наступила: выбираем лучшего цифрового сотрудника # Практический опыт внедрения WinCC Redundancy на производственном предприятии Сделал MVP за 3 дня, а потом неделю прикручивал оплату. Оно того стоило? Физика против Маска: почему Starship V3 может оказаться ещё одной катастрофой Нефть Венесуэлы: крупнейшие запасы в мире, но не крупнейшая нефтяная держава JPA 4. Переосмысление Hibernate Почему зеркальная фотокамера Nikon D5 десятилетней давности идеально подошла для миссии «Артемида-2» Проект «Уровень-Спутник» или как мы сделали платформу для гидрологов «Замедлиться, чтобы ускориться»: почему ИИ повышает цену ошибок в требованиях и архитектуре Как с нуля поднять трафик IT-компании на 1657% при бюджете 55 тыс. и выжить Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь
AI-ассистент поддержки: Mindbox навели порядок в базе знаний и генерируют ее с помощью нейросети
Тимофей · 2026-06-18 · via Все публикации подряд на Хабре

Простой

8 мин

31

Два года назад мы запустили бота поддержки, чтобы упростить работу специалистов клиентского сервиса. Поначалу бот закрывал только 18% обращений, и в остальных случаях переводил запрос на оператора. Чтобы увеличить число вопросов, на которые бот может ответить самостоятельно, мы навели порядок в базе знаний и автоматизировали ее обновление. Сейчас бот закрывает 45% обращений в поддержку.

Меня зовут Тимофей Столяров. Я работаю AI‑продакт‑менеджером в Mindbox и отвечаю за то, чтобы рутинные и сложные процессы в компании можно было делегировать нейросетям. Недавно я писал, как мы запустили бота поддержки своими силами. В этой статье расскажу, как нам удалось расширить его кругозор.

Почему решили прокачивать базу знаний для бота поддержки

Первую версию бота мы запустили за три месяца как MVP. Он работал по типовой для AI‑ассистентов схеме: анализировал запрос, обращался к базе знаний и формировал ответ. База состояла из статей help‑центра и Mindbox Журнала, документации для разработчиков и нескольких тысяч сырых диалогов поддержки. И хотя отвечал он качественно — CSAT его ответов составлял 90%, — ему, очевидно, не хватало источников информации и он закрывал лишь 18% обращений. Этот показатель надо было увеличивать.

Чтобы прокачивать базу знаний, мы могли обогащать ее новыми сырыми диалогами из поддержки. От этой идеи пришлось отказаться: за месяц их накапливается больше 5000, зачастую они пересекаются по темам и в каждом может решаться несколько вопросов пользователя. В итоге база переполняется разрозненной неполной информацией и боту все равно негде брать готовые ответы. 

Тогда мы решили поменять структуру базы знаний. Переработали сырые диалоги в ограниченное число статей, которые ежемесячно дополняем информацией из новых диалогов поддержки. Чтобы писать и обновлять статьи вручную, потребовалась бы небольшая редакция из 3–5 авторов, поэтому мы делегировали эту задачу нейросети.

Сырые диалоги поддержки преобразовали в статьи со списками FAQ

Сырые диалоги поддержки преобразовали в статьи со списками FAQ

Как спроектировали новую структуру базы знаний: статьи и FAQ вместо сырых диалогов поддержки

Сейчас в базе хранятся материалы, разбитые на 15 категорий:

— по продуктовым разделам Mindbox: email, SMS, программа лояльности, сценарии;

— по сервисным вопросам.

Для лучшей детализации мы разделили категории на подкатегории, каждая из которых посвящена отдельной теме. Например, продуктовая категория «Мобильные приложения» делится на подкатегории: «Интеграцию мобильного приложения», «Создание пушей», «Доставляемость».

А сервисная категория «Поломки и доступность» делится на подкатегории «Доступность интерфейса», «Производительность админки», «Доступность API», «Фоновые операции».

Фрагмент FAQ, который относится к подкатегории «Фоновые операции»

Фрагмент FAQ, который относится к подкатегории «Фоновые операции»

Список подкатегорий составили вручную: сгруппировали завершенные диалоги по темам обращения, а затем распределили их по продуктовым разделам. В итоге получили 120 подкатегорий. 

Каждая подкатегория объединяет в себе набор данных:

  1. FAQ — набор нескольких пар «вопрос–ответ», извлеченных из диалогов. Например, в подкатегории про программу лояльности может быть больше 30 пар. Каждая из них закрывает один конкретный вопрос клиента.

  2. Статью, которая содержит базовую информацию по теме, принципам работы и типичные сценарии. Генерируется автоматически на основе FAQ.

  3. Указание, в каких еще источниках базы знаний искать ответ или не искать вообще. Например, если клиент спрашивает про маркетинг, бессмысленно лезть в техническую документацию для разработчиков, но можно поискать ответ в соответствующей статье help-центра.

Пара «вопрос–ответ»

«Можно ли изменить категорию у уже созданного статуса заказа или статуса позиции заказа в Mindbox?»

Нет. В Mindbox категорию у уже созданного статуса нельзя менять через редактирование, даже если удалить действия с этим статусом. Блокировка поля категории после создания статуса не снимается удалением истории.

Как исправить категорию

Нужно пересоздать статус:

  1. Остановите передачу новых заказов или действий с этим статусом, иначе зависимые сущности будут появляться снова.

  2. Удалите действия, в которых использовался этот статус.

  3. Уберите использование статуса из сущностей, которые блокируют удаление статуса.

  4. Удалите сам статус.

  5. Создайте статус заново с нужной категорией.

Что может блокировать удаление статуса

Статус может не удаляться не только из-за действий, но и из-за других зависимостей в Mindbox. В диалоге подтвердилось, что удаление блокируют, в частности:

  • активные сценарии;

  • сценарии в черновике;

  • рассылки в процессе.

Если статус не удаляется

Если после остановки передачи и удаления действий статус всё равно не удаляется, проверьте, не используется ли он в сценариях и текущих рассылках. Пока такая зависимость существует, пересоздать статус с тем же внешним идентификатором не получится.

Важно

Если внешний идентификатор статуса жёстко зашит во внешней системе, рабочий путь — именно удалить старый статус и создать его заново с тем же внешним идентификатором и правильной категорией. Создание второго статуса с новым идентификатором в таком случае не решает задачу интеграции.

Когда клиент обращается в бот, AI анализирует вопрос и определяет его подкатегорию. Затем инструменты векторного и семантического поиска находят близкие по смыслу материалы. Темы подкатегорий пересекаются, и на этом этапе поиск может вернуть лишнее. Например, вместе со статьей про маркетинг выдать статью про интеграцию. Чтобы выбрать более подходящие для ответа статьи, на следующем шаге AI ранжирует найденный материал и отсекает все, что не связано с вопросом напрямую. В агент попадают только материалы с оценкой «подходит».

В результате бот формирует ответ на основе:

— релевантных пар из FAQ нужной подкатегории;

— статьи по теме;

— информации из help‑центра, материалов из Mindbox Журнала и технической документации.

Как генерируем и обновляем базу знаний: метод «снежного кома»

Новую базу знаний собираем автоматически: AI-модель читает новые диалоги поддержки и на их основе создает или дополняет FAQ и статьи. Таким образом, база обогащается за счет новых обращений в поддержку.

Мы называем этот процесс «снежным комом». Он состоит из четырех этапов.

Этап 1: классифицируем обращения в поддержку. Все новые диалоги автоматически загружаются в нейросеть. AI распределяет их по подкатегориям и отсеивает те обращения, где непонятно, какой был вопрос и как он решился.

Этап 2: фильтруем диалоги. Для обогащения базы знаний отбираем только те диалоги, в которые подключался оператор‑человек: в них может быть информация, которой еще нет в базе знаний, раз бот не справился сам.

Этап 3: решаем, нужно ли менять базу знаний. Для нового диалога и вычисленной подкатегории находим текущую статью и FAQ в базе, если они есть. Нейросеть решает, нужно ли обновить материал на основе обрабатываемого диалога. Возможные решения AI:

skip

Пропустить. Диалог не содержит новой информации, не относится к теме или предполагает косметические правки

update

Добавить в FAQ новый пункт или дополнить существующий

delete

Удалить пункт из FAQ: он дублирует другой по смыслу или описывает временный баг

check

Пометить диалог для ручной валидации, если в нем есть данные, которые противоречат тому, что уже содержится в базе

Этап 4: дополняем базу знаний. После того как нейросеть приняла решение, она вносит изменения в FAQ и статью.

Чтобы заставить AI‑модель корректно обновлять материалы, мы прошли типичный путь от общения с ней как с обычным человеком до подробной развернутой инструкции. Перечислю наши ключевые требования, которые должна выполнять модель: 

— сразу же завершить работу, если диалог не относится к заданной теме;

— решить, стоит ли обновлять текущий перечень FAQ: добавить новые пары «вопрос‑ответ», переписать или удалить существующие;

— формулировать текст в мире клиента, а не писать в духе «ошибка 403 в webhook»;

— избегать дублирования пунктов в FAQ;

— сохранять существующие факты при обновлении пункта.

Как следим за качеством базы знаний, чтобы «снежный ком» не вышел из-под контроля

Метод «снежный ком» предполагает, что нейросеть каждый раз дополняет существующие версии статей. Если на предыдущей итерации модель допустила неточность в тексте или внесла избыточную информацию, то при обновлении она будет считать материал эталонным и наращивать его новыми ошибками и лишними деталями.

Для нас это болезненно проявляется в сложных продуктовых темах, где один и тот же вопрос клиента может иметь десятки разных объяснений. Например, когда клиент спрашивает «Почему не сработала акция?», специалисты поддержки выясняют подробности и находят причину проблемы конкретно у этого клиента. У одного могли быть некорректно настроены фильтры сегментации, у другого — неверно задан период акции, у третьего не выполнялось условие по минимальной сумме заказа. Модель документирует все эти обращения в FAQ о программе лояльности, посчитав, что в материалах на эту тему должно быть много деталей.

В итоге статья разрастается до 200+ пунктов и превращается в хаотичный набор частных случаев. А поскольку огромный текст каждый раз целиком попадает в контекст модели, стоимость обновления растет.

Чтобы остановить избыточное разрастание материалов, контролируем объем статей вручную и ограничиваем число диалогов из соответствующей подкатегории, которые попадают в обработку к AI.

А чтобы клиенты получали от бота полезные и корректные ответы, следим за качеством базы знаний и раз в месяц оцениваем его по случайной выборке материалов: 

  1. Модерируем FAQ, в которых обнаружились фактические ошибки. Например, нейросеть может дописать «костыльные» рекомендации, которые специалист поддержки дает клиенту в момент временного сбоя сервиса. В штатном режиме такие советы теряют актуальность и не работают, поэтому записи о них нужно выявлять и удалять из материалов.

  2. Проверяем, чтобы каждый пункт в FAQ описывал только одну задачу клиента. Например, вопрос «Как настроить RFM‑отчет и запустить автоматический сценарий на сегмент клиентов оттока?» касается сразу трех тем. Такие вопросы дробим и уносим каждый в свою подкатегорию.

В дальнейшем планируем тщательнее контролировать качество материалов:

— все новые и дополненные статьи будут проверять внутренние эксперты. Ожидаем, что это потребует меньших затрат времени, чем создание статей с нуля;

— статьи, к которым редко обращается бот, будем удалять или переписывать вручную. Если материал не используется, значит, он бесполезен и зря занимает место в хранилище данных.

Дашборд, с помощью которого следим за состоянием базы знаний

Дашборд, с помощью которого следим за состоянием базы знаний

Чего добились: прокачали бота и снизили нагрузку техподдержки

Когда мы приводили в порядок базу знаний и настраивали ее автоматическое обновление, то стремились повысить число закрытых ботом обращений. Нам это удалось, и теперь бот закрывает 45% вопросов из первой линии поддержки. 

Недавно бота подключили и ко второй линии — это внутренняя поддержка для самих сотрудников. Там он помогает специалистам первой линии и менеджерам по успеху клиентов находить информацию о продукте. Скоро планируем подключить бота к третьей линии — это поддержка для специалистов из второй. Там отвечают разработчики и помогают разобраться, как работает сервис. Рассчитываем, что на третьей линии бот снимет часть нагрузки с разработчиков: до них будут доходить только самые сложные вопросы.

Диалог на второй линии поддержки

Диалог на второй линии поддержки

А еще по MCP-протоколу мы открыли доступ к базе для корпоративных AI-инструментов. Теперь, прежде чем задавать вопрос техподдержке, сотрудники могут поискать ответ самостоятельно в чатах с AI.