惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

F
Full Disclosure
Recorded Future
Recorded Future
T
Tenable Blog
S
Securelist
C
CERT Recently Published Vulnerability Notes
T
Threatpost
S
Schneier on Security
A
Arctic Wolf
The Hacker News
The Hacker News
C
CXSECURITY Database RSS Feed - CXSecurity.com
Know Your Adversary
Know Your Adversary
P
Privacy International News Feed
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
The Register - Security
The Register - Security
Cisco Talos Blog
Cisco Talos Blog
AWS News Blog
AWS News Blog
K
Kaspersky official blog
T
True Tiger Recordings
T
Threat Research - Cisco Blogs
V
Vulnerabilities – Threatpost
P
Palo Alto Networks Blog
T
The Exploit Database - CXSecurity.com
小众软件
小众软件
B
Blog
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
Microsoft Azure Blog
Microsoft Azure Blog
Cyberwarzone
Cyberwarzone
C
Cybersecurity and Infrastructure Security Agency CISA
T
Tor Project blog
Spread Privacy
Spread Privacy
Malwarebytes
Malwarebytes
P
Proofpoint News Feed
F
Fox-IT International blog
F
Fortinet All Blogs
P
Privacy & Cybersecurity Law Blog
G
GRAHAM CLULEY
量子位
Latest news
Latest news
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
博客园 - 叶小钗
Project Zero
Project Zero
T
Tailwind CSS Blog
N
Netflix TechBlog - Medium
Martin Fowler
Martin Fowler
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
I
Intezer
博客园_首页
腾讯CDC
H
Hackread – Cybersecurity News, Data Breaches, AI and More
D
Darknet – Hacking Tools, Hacker News & Cyber Security

Все публикации подряд на Хабре

Я держал кафе 16 лет и кормил полгорода. Потом пришли зумеры и всё посыпалось Есть ли жизнь на фазе: откуда берёт энергию умный выключатель без подключённой нейтрали Go Computer. История удивительного планшета из 1992 года с графическим интерфейсом Экономия GPU-часов в 2,5 раза, уход ИИ в бэкенд и новые стандарты агентских систем: ML-дайджест Что скрывается за AI-стратегией SAP, Oracle и Palantir: зачем корпоративному ИИ семантическое ядро Персонализация как баг Одна на 9 команд: как я внедряла квартальное планирование в трайбе, который сопротивлялся переменам После ИИ писать код руками ощущается уже не как норма Языковые модели без машинного обучения Обмен через интернет между мобильными приложениями ТСД и 1С От плановых ремонтов к предиктивному обслуживанию: дорожная карта для главного инженера Параллельный импорт техники закрыли или нет? Юридический разбор Резервное электрообеспечение для ЦОДов: патенты в мире и в России 256 зелёных тестов на нерабочем коде. Так выглядит «услужливый клерк» внутри нейросети Бизнес-аналитика для сети из 300 аптек: прогноз продаж и другие показатели Impact Analysis в дизайн-системе: как мы сделали CI осмысленнее, а review понятнее Топ-5 лучших нейросетей 2026 года: полный список на любой случай в SpeShu.AI Что делает сотрудников по-настоящему эффективными: процессы, знания или технологии Как за один вечер я написал сервис инвентаризации оргтехники для филиальной сети из 16 локаций Склад нанимает — и не может остановиться. Дефицит складских работников в 2026 году: причины и решения Шёл за утечкой памяти, нашёл утечку диска: SXSSFWorkbook без dispose() в Apache POI Штраф в размере 155 000 рублей получил владелец сайта по заявлению Роскомнадзора Индивидуальный план развития: от формальной процедуры к инструменту управления экспертизой команды Как понять, что вы не управляете финансами, а просто смотрите на цифры Водоросли и микропластик Масштабирование LLM: от одного чипа до ЦОДа. Глава 3. Траснформеры Бомба замедленного действия взорвалась: эпоха ИИ «бери сколько унесёшь» закончилась Стимпанк как часть жизни. История паровых двигателей и место, которое они занимали в мире в XIX-XX веках. Часть 2 288-ядерный Xeon 6+ и другие серверные CPU От OCR к смыслу: как мы научили модель понимать, кто кому отец, мать, жених и свидетель Насколько плох был Intel iAPX 432 — проверяем на практике Приручаем железо: внедряем DevOps в промышленной разработке Когда Reality не хватает: добавляем Hysteria2 + Salamander в iOS-мессенджер, и как всегда грабли по дороге (ч.2) Разработчики не экстрасенсы: как мы перестали приносить туман вместо ТЗ Дайджест C++: новости, полезные материалы и “свой язык” на десерт Ещё один репозиторий моделей для Archi 10 простых шагов, чтобы создать позиционирование для продукта Загадочная поэма древнего Китая, работающая как компьютер CLOUD Act, GDPR и ваш DNS: что на самом деле может ваш провайдер Ускоряем и оптимизируем numpy, pandas, scipy и sklearn Idempotency keys: 5 граблей, которые мы поймали на проде Gamedev. Парсинг данных из Google Sheets и Excel в json без привлечения программистов Nano Banana Google AI: как использовать Нано Банана для генерации и редактирования изображений Два игрока на весь российский рынок ИИ: что показал ЦИПР-2026 Менеджер ресурсов ЯНДЕКС 360 (YANDEX 360) промокоды июнь 2026: промокод Yandex 360 скидка 40% на годовые тарифы Open-Source инструмент для автоматического перевода книг Ищу ранних тестировщиков для Android-версии agent harnesses Не используйте LLM для текста Увеличиваем продажи без слез аналитика Оптимизация запросов к PostgreSQL: 5 неочевидных настроек для продакшена 45 лет тюрьмы за DROP TABLE и переход Карпатого в Anthropic Планирование движения для ровера на ходовой Ackerman'а Революция в изучении языков Java — быстрая. Ваш код может таким не быть Как я опоздал на конкурс OpenAi с новой архитектурой нейросети Быстрые интеграции в 1С: прощайте, бесконечные переделки Как получить субсидию 300 миллионов от Минпромторга? preIPO Anthropic, OpenAI, SpaceX. Разбираемся — стоит ли участвовать? Entaxy ION + OPC UA: два способа получить данные с промышленного оборудования Память на миллион, а толку ноль: как мы спасали ИИ-агента от «тупости» РСЯ, AdSense или myTarget: что на самом деле в 2026 приносит больше денег сайту и причем тут монетизаторы Практическое построение сервисов на Go под реальный трафик PostgreSQL и аналитика: что меняется, когда хранилище становится общим Codex за 5 месяцев 2026: мой топ-5 релизов, что не зашло и где OpenAI обогнал Anthropic Как создать короткое видео с помощью нейросетей: Полный гайд по Veo 3.1, Kling 3.0 и Happy Horse 1.0 Алгоритм проверок физлиц от экс сотрудника ФНС Как ИИ портит резюме студентам Системные вызовы в сфере ИТ в 2026: стратегический взгляд для ИТ-руководителей Вайбкодинг заканчивается на localhost: как я строю SaaS для цифровизации коттеджных поселков с Codex Производственные риски в небольшом кастомном производстве. С чем я сталкивалась и как научилась это учитывать Подключаем ИИ органы чувств: bash-демон, пайка и самосознание на Raspberry Pi Я хотел повторить Growing Neural CA за вечер. Ушёл месяц Промт для генерации текста без ИИ следа — как писать уникальные тексты через нейросеть От capabilities к AppArmor: что реально остановит атакующего в контейнере CactOS Вектора интересов: как находить настоящую мотивацию и усиливать команды Цена безопасности [Перевод] Цена безопасности “Рубик” от пет-проекта до прода или ITIL 4 для строительно-торговых центров Чего ждать (и не ждать) от ремейка AC4 Black Flag Архитектурный тупик корпоративного хранения: почему смена модели не снимает ограничений и что с этим делать Атаки через подрядчиков, дефицит кадров и квест с импортозамещением: главные вызовы ИБ в 2026 году Я не оставлю детям наследства Почему порты стали «дверями» в сервер, и кто решил, что SSH будет 22 Почему зарубежные разработчики чипов возвращаются на китайские фабрики Как у меня НЕ получился торговый бот на Polymarket Проектирование архитектуры в нотации ArchiMate с использованием ИИ. Часть 2 Как превратить домашнюю файлопомойку в умную AI-галерею на основе сборки из x99+Xeon и видеокарты за 2 тыс рублей Перспективы заселения нашей галактики Кризис менеджмент в ИТ Reactive Programming не спасёт вас. Если вы не решили эти 5 проблем — у вас просто медленный монолит с Flux Как я делаю DIY-контроллер для ПК: громкость, приложения, MIDI, OBS Миграция микросервисов на Python с помощью LLM: экономим месяцы для разработчиков Программирование микросхем GAL и им подобных Почему таск-трекер не заменяет ИСУП: из чего состоит полноценный контур управления проектами Всё об информационной безопасности. Кибербезопасность. DevOps, CI/CD. Хакеры. Алексей Федулаев Как импортировать базу клиентов в amoCRM и навести порядок в контактах Как мы четыре раза переписали Outbox Google предлагает единый «водяной знак» для изображений, видео и текста, созданных ИИ
Почему RAG — фундамент любой AI-трансформации
it-calm · 2026-05-27 · via Все публикации подряд на Хабре

Время на прочтение5 мин

Охват и читатели1.7K

За последние годы большинство AI-проектов в компаниях стартуют одинаково: сначала делают чат-бота, затем добавляют агентов, автоматизируют отдельные процессы и ожидают роста эффективности.

На практике такие проекты часто не дают устойчивого результата. Модель может корректно генерировать текст, демонстрации выглядят убедительно, но в реальной работе ответы оказываются нестабильными, противоречивыми и не связанными с внутренними стандартами компании.

Основная причина — отсутствие единого слоя знаний.

В проекте для ресторанной группы с 10+ заведениями и историей более 15 лет мы сознательно начали не с агентов и не с интерфейсов, а с построения корпоративной RAG-инфраструктуры. Этот слой стал основой всей последующей AI-архитектуры.

Почему AI без корпоративной памяти не работает

В большинстве компаний проблема не в отсутствии данных, а в их фрагментации.

Меню, технологические карты, стандарты, регламенты, обучение персонала, винные карты, внутренние инструкции и гайды накапливаются годами, но хранятся в разных форматах и системах. Эти данные не связаны между собой и не образуют единого источника знаний.

Если подключить LLM к таким данным напрямую, возникают типовые эффекты:

  • модель даёт разные ответы на одинаковые вопросы;

  • информация противоречит сама себе;

  • часть ответов устаревает;

  • контекст бизнеса игнорируется;

  • появляются «галлюцинации».

В результате AI становится нестабильным инструментом, который генерирует тексты, но не опирается на реальные стандарты компании.

Поэтому первым этапом была не автоматизация, а создание единого интеллектуального слоя.

Мы собрали более 1000 страниц документов, накопленных за 15 лет: меню, регламенты, техкарты, внутренние инструкции, обучающие материалы и гайды. После этого данные были очищены, структурированы, размечены и объединены в единую RAG-инфраструктуру.

Этот слой стал единым источником фактов для всех последующих AI-сервисов.

Что такое RAG в прикладной архитектуре

RAG (Retrieval-Augmented Generation) — это подход, при котором модель не генерирует ответ «из памяти», а сначала получает релевантные данные из корпоративной базы знаний и только затем формирует ответ.

В упрощённой схеме:

  • модель отвечает за генерацию текста;

  • RAG отвечает за достоверность.

Технически это реализуется через векторизацию документов и семантический поиск. Данные из корпоративных источников преобразуются в векторное представление и сохраняются в специализированном хранилище (например, Qdrant), а структурированные данные и служебная логика — в PostgreSQL.

При запросе система:

  1. ищет релевантные фрагменты в базе знаний;

  2. передаёт их модели;

  3. формирует ответ на основе найденных данных.

Такой подход ограничивает произвольную генерацию и делает ответы привязанными к реальным документам компании.

Это критично для корпоративной среды, где важно контролировать, какие данные использует AI и как они обновляются.

Интеграция с Notion как источником знаний

В проекте корпоративная память была связана с Notion.

Это позволило оставить для заказчика привычную среду работы с документами. Менеджеры продолжают редактировать материалы в Notion, а система автоматически синхронизирует изменения с RAG-слоем.

После обновления документа:

  • данные переобрабатываются;

  • обновляются векторные представления;

  • становятся доступны всем AI-сервисам без участия разработчиков.

Таким образом, база знаний остаётся актуальной без ручных релизов и дополнительных интеграций.

Архитектура: от контента к AI-продуктам

RAG-инфраструктура в проекте построена как многоуровневая система.

Нижний слой — корпоративный контент: документы, регламенты, меню, инструкции (Notion).

Следующий слой — обработка и синхронизация: очистка, разметка, обновления.

Далее — слой хранения:

  • Qdrant — векторное хранилище;

  • PostgreSQL — структурированные данные и служебная логика.

Верхний слой — AI-продукты:

  • Telegram-интерфейсы;

  • CRM;

  • веб-интерфейсы;

  • внутренние сервисы;

  • потенциальные интеграции с кассовыми системами.

Ключевой принцип — все продукты работают с одной и той же памятью, а не с отдельными копиями данных.

Что можно построить на единой RAG-базе

После появления корпоративной памяти AI перестаёт быть точечным инструментом и становится платформой.

В рамках проекта на этом слое можно запускать:

  • AI-ассистента управляющего (ответы по стандартам и регламентам);

  • AI-метрдотеля (меню, рекомендации, бронирования);

  • AI-онбординг сотрудников (обучение на базе внутренних данных);

  • автоматизацию создания документов, чек-листов и инструкций.

Также появляется возможность запускать агентов в разных интерфейсах — Telegram, web, CRM, внутренние системы — без дублирования логики и данных.

Подготовка данных без нагрузки на бизнес

Одна из задач проекта — не вовлекать заказчика в длительную подготовку данных.

Мы не требовали писать технические задания и не просили пересобирать документацию. Вместо этого:

  • собрали и оцифровали 1000+ страниц документов;

  • очистили и структурировали данные;

  • выделили сущности, связи, версии и теги;

  • загрузили данные в Qdrant и PostgreSQL;

  • настроили автоматическое обновление;

  • реализовали архитектуру с ролевым доступом.

В результате заказчик получил рабочую корпоративную память без многомесячной подготовки.

Ролевая сегментация и контроль доступа

В системе реализована ролевая модель:

  • гость;

  • официант;

  • менеджер;

  • шеф-повар;

  • управляющий;

  • другие роли.

Для каждой роли формируется изолированный слой данных. Доступ к информации определяется через фильтрацию по параметрам:

  • restaurant_id;

  • object_type;

  • tags.

Пользователь получает только те данные, которые соответствуют его роли и контексту.

Конфиденциальная информация дополнительно маркируется, а все запросы логируются.

Администрирование и аудит

Система включает административный интерфейс, который позволяет:

  • управлять доступами;

  • назначать роли;

  • приглашать пользователей;

  • отслеживать запросы;

  • анализировать использование данных.

Все обращения к RAG-слою фиксируются, что даёт прозрачность и возможность аудита.

Безопасность как часть архитектуры

Безопасность была встроена на уровне инфраструктуры:

  • изолированные базы данных по ролям;

  • отдельные ключи доступа;

  • запрет межролевого доступа;

  • фильтрация на уровне запросов;

  • логирование всех операций;

  • ротация ключей.

Это исключает ситуацию, при которой пользователь может получить данные, не предназначенные для его уровня доступа.

Вывод

Большинство AI-проектов теряют устойчивость не из-за качества модели, а из-за отсутствия единой базы знаний.

Без корпоративной памяти AI начинает противоречить сам себе, использовать устаревшие данные и требовать постоянных исправлений.

RAG-инфраструктура решает эту проблему, превращая AI из демонстрационного инструмента в управляемую систему, которая опирается на реальные данные компании и масштабируется вместе с бизнесом.

Поэтому в проектах с реальной нагрузкой правильная последовательность выглядит так:

  1. формирование корпоративной памяти;

  2. построение RAG-слоя;

  3. запуск AI-продуктов и автоматизации.

Попытка поменять порядок обычно приводит к обратному эффекту: росту затрат, усложнению архитектуры и снижению качества результата.