惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

N
News and Events Feed by Topic
Malwarebytes
Malwarebytes
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
C
Cybersecurity and Infrastructure Security Agency CISA
F
Future of Privacy Forum
C
Cisco Blogs
T
The Exploit Database - CXSecurity.com
A
Arctic Wolf
S
Securelist
K
Kaspersky official blog
S
Schneier on Security
T
ThreatConnect
T
Tenable Blog
Spread Privacy
Spread Privacy
T
True Tiger Recordings
AWS News Blog
AWS News Blog
F
Fox-IT International blog
量子位
T
Threatpost
V
Vulnerabilities – Threatpost
C
CERT Recently Published Vulnerability Notes
Cisco Talos Blog
Cisco Talos Blog
GbyAI
GbyAI
宝玉的分享
宝玉的分享
腾讯CDC
G
Google Developers Blog
aimingoo的专栏
aimingoo的专栏
Cyberwarzone
Cyberwarzone
有赞技术团队
有赞技术团队
S
SegmentFault 最新的问题
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
V
Visual Studio Blog
U
Unit 42
雷峰网
雷峰网
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Simon Willison's Weblog
Simon Willison's Weblog
O
OpenAI News
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
The GitHub Blog
The GitHub Blog
The Register - Security
The Register - Security
MyScale Blog
MyScale Blog
小众软件
小众软件
A
About on SuperTechFans
Last Week in AI
Last Week in AI
Y
Y Combinator Blog
博客园 - 三生石上(FineUI控件)
美团技术团队
Google Online Security Blog
Google Online Security Blog
P
Proofpoint News Feed
MongoDB | Blog
MongoDB | Blog

Все публикации подряд на Хабре

Шахматные программы V. Оценочная функция Восстание масс в обществе спектакля и отчуждение труда в царстве количества: что делать во времена всеобщего упадка? Не умеешь работать с ИИ? Тебя заменит тот, кто умеет Как интеллект становится уязвимостью под давлением Не надо так: три типичные ошибки, которые приводят ко взлому Заметки про код-стайл в C++ Забытый мультиколор (часть 1) Культура ест стратегию на завтрак: почему не работает долгосрочное планирование Советское ИИ: Забытые гении Как оплатить iCloud в России в 2026 году без смены региона Apple ID Глубокая интеграция месседжинга с бизнес процессами в фреймворке NodaLogic Контекстные менеджеры в Python за пределами with open(): пишем свои и упрощаем код Пароль против уборщицы Выяснились детали мега-IPO SpaceX, а также первый прибыльный квартал Anthropic Люди с психическими расстройствами – новая нефть? Когда нейросети перестанут галлюцинировать? И почему на «что за дичь» они несут ещё большую дичь? Мессенджер HalChat теперь в Google Play: 3 года разработки, ИИ в браузере и квест с модерацией Реверс-инжиниринг Xiaomi Smart Band 10 Когда памяти мало Среда повседневности как объект проектирования: что общего у горца, серотониновой ямы и митохондрий AGENTS.md создавали, чтобы помогать агентам. Я использую его, чтобы их вычислять Почему устанавливают join_collapse_limit = 20 Почему устанавливают join_collapse_limit = 20 Эрик Рис, автор Lean Startup: Почему хорошие компании становятся плохими после IPO Context-driven Reusable Form Pattern: Масштабируемая архитектура для Create / Edit / Create-from-Source Пузырьковая сетка, кошачья стая и не только — неожиданные источники вдохновения для QoS-алгоритмов ___, или «Заголовок намеренно оставлен пустым» ИИ-боты сканируют даже логи TLS-сертификатов. Любая информация используется для обучения LLM Нейросеть оживить фото ИИ: Как оживить фото нейросетью в 2026 году? Разбираемся в ML без воды: от базы до Attention. Часть 5: Метрики качества В поисках «кофейного Грааля». Как человечество пытается сварить идеальный кофе и какие рецепты предлагают…математики Программатик: Часть 2 — OpenRTB Интернет до бесконечных лент: каким был 2010 год Перезапуск TrueIndex: что изменилось в рейтинге языков программирования Проектный холст: как менеджеру подбирать «краски» управления под разные команды «Метафизика в формулах: математическое ядро «Веры Паломника — Исход» Java и постквантовый TLS Marcli: Markdown Терминал Кнопочный смартфон с 5G за 2800 рублей — разбираем и изучаем китайскую диковинку Где неприятности — там и жизнь Разворачивайте платформы: stackfile Мой путь в Microsoft Мобильная разработка за неделю #631 (18 — 24 мая) Что не так с Mixtape, и почему не все довольны новой игрой? Стоматология каменного века. Как неандертальцы лечили зубы 59 тысяч лет назад Почему классическое управление проектами часто не работает в IT-продуктах Строительство Саркофага. Часть 2. Бетонные реки и стальные берега РАЗРАБОТКА ПАРАМЕТРИЗИРУЕМОГО МОДУЛЯ CORDIC-АЛГОРИТМА НА SYSTEM VERILOG Вариационное исчисление как метафора свободы выбора: от градиентного спуска к онтологии пути Ekahau Sidekick и RSSI‑offset: физические ограничения метода и пять независимых причин неточности клиентской модели Колесо потока против раскола Обзор интересных особенностей переворачивающихся при умножении чисел В С неопределённое поведение повсюду MCP-агрегатор: объединяем инструменты для LLM в один сервер Дата-центры в космосе: как Google и SpaceX готовят новую инфраструктуру для ИИ Google готовит замену Chromebook: какими будут ноутбуки Googlebook Пользователь пишет issue, агент меняет сайт. Да, я это сделал Корпоративные конфликты в ИТ-секторе: механика судебной защиты активов и субсидиарных рисков Цена одной опечатки: Как три неверные буквы сорвали киберограбление на миллиард долларов Как я победил спам в своих email аккаунтах Whitepaper Сбера «AI-Disrupt PDLC»: разбор для тех, кто пишет код RustDesk Pro в России не купить. После долгих лет администрирования мы собрали своё честное решение Не пики, а бассейны: почему эволюция — это блуждание по графу жизни Как Gemini 3.5 Flash сломали ради красивых графиков (и почему она обходит 3.1 Pro только на бумаге) Вредоносная атака на Laravel-Lang meta-attention is all you need Как перестать путаться в IP-адресах серверов Сколько стоят ошибки в арбитраже: декомпозиция ценообразования на судебные услуги в Москве Разбираемся в ML без воды: от базы до Attention. Часть 4: kNN Vortex: фреймворк для тех, кого задолбала итальянская кухня в репозитории Использование тепла ЦОД в мире и РФ Часть 4. Скорость света — технические детали Не цитируй мне нейросеть Что сейчас с Project Loom? Примеры и код Рождённые в Сумерках Meta 1 мая показала как они хранят ключи от ваших бэкапов WhatsApp. Разбираю архитектуру и сравниваю Линт проектов: собираем ESLint, Prettier и Stylelint в один пакет Reasoning-модели сломали мой промпт-инжиниринг. Год переучиваюсь РБМК: enfant terrible Как я собеседую менеджеров AI-продуктов для крупного Enterprise Парадокс рынка труда: конкуренция выросла, но не везде, нанимать легче, но не везде Модификаторы в Blender: осваиваем Boolean «Бесплатно» — это красный флаг: почему мы доверяем не тем (опрос) Стратегия выживания в эпоху ИИ Новая теория обещает переписать фундамент всей математики MTP у Qwen3.6 в llama.cpp обещает ×2 по скорости. Я прогнал ту же модель через своего агента — и получил обратное [Перевод] Соль и перец в безопасности паролей Что такое «статьи-зомби» CodeGraph: граф кода для Claude Code вместо grep по файлам. Разбираю архитектуру и проверяю бенчмарки Мессенджер Ласточка. Часть 3 Google представила Gemini Omni — универсальную ИИ-модель. Роботы работают, счастлив человек Что у SpaceX с патентным портфелем перед IPO? Делегирование, которому можно научиться у промпт‑инженеров Feature Based Clean Architecture. Часть 5: Масштабирование FBCA и теоретико-графовый анализ зависимостей Настройка типизации формы React Hook Form (≥ v7.44.0) + Zod с разными входными и выходными типами Feature Based Clean Architecture. Часть 4: FBCA: формализация границ ответственности в NestJS-модуле Корпорация «Святые Технологии». Работа мечты (рассказ) CyLab Security Academy: как Carnegie Mellon превратила CTF в полноценную обучающую платформу Feature Based Clean Architecture. Часть 3: Архитектурный риск циклов в NestJS: ROI решений на горизонте пяти лет Домашний сервер без белого IP: безопасная публикация сервисов через VPS, обратный SSH-туннель и Caddy
qrrot — база данных со встроенным ИИ
piterovxyz · 2026-05-25 · via Все публикации подряд на Хабре
Так выглядит работа с AI

Так выглядит работа с AI

Написать свою in-memory базу данных — это своеобразный способ изучить Go под капотом и сделать значимый пет-проект. Создавать обычную обертку над map скучно. Поэтому я задался вопросом: а что если написать по настоящему быстрый движок с бинарным хранением, а сверху прикрутить интерактивного ИИ-ассистента, с которым можно общаться на естественном языке, заставляя его самостоятельно выполнять цепочки запросов?

Так на свет появился qrrot — in-memory хранилище на Go с TCP-интерфейсом, бинарными снапшотами и встроенным агентом на базе Gemini.

В этой статье я проведу максимально подробный обзор своего проекта: мы разберем архитектуру, посмотрим на бенчмарки, изучим, как тут работает ИИ, а в конце я пройдусь по всем архитектурным болячкам и недочетам.

1. Под капотом: Типы данных и движок

В ядре qrrot лежит потокобезопасная структура Store, защищенная sync.RWMutex:

type Store struct {
	mu   sync.RWMutex
	data map[string]value.Value
}

В отличие от примитивных хранилищ типа string-string, движок строго типизирован и поддерживает три классических типа данных:

  • string — классические строки;

  • int — 64-битные целые числа;

  • json — JSON-объекты.

Все значения хранятся в памяти в структуре Value, которая содержит байтовый слайс и тег типа:

type Type uint8

const (
	TypeEmpty Type = iota
	TypeString
	TypeInt
	TypeJson
)

type Value struct {
	valueType Type
	data      []byte
}

Это позволяет легко сериализовать данные и избегать расходов на рефлексию при отдаче клиенту. Команды максимально привычные: put, get, del, exists, incr, decr, all.

2. Борьба за наносекунды: Парсер и сетевой слой

Когда вы пишете базу данных, самое «горячее» место — это разбор входящих команд. Обычный strings.Split здесь не подойдет: он аллоцирует память на каждый токен, что убьет производительность сборщика мусора при десятках тысяч запросов в секунду.

Zero-alloc (почти) парсер

Я написал парсер, который бежит по массиву байт, игнорируя лишние пробелы и табуляции. Особая магия начинается при обработке строк с пробелами (например, JSON-объектов). Парсер умеет понимать двойные кавычки " и экранированные символы \", аккуратно собирая токены в предвыделенный буфер [8][]byte.

Результаты бенчмарков (Apple M4, Darwin ARM64) говорят сами за себя:

  • Сырые операции в памяти:

    • BenchmarkStore_Get - 6.29 ns/op, 0 B/op, 0 allocs/op

    • BenchmarkStore_Put -13.30 ns/op, 0 B/op, 0 allocs/op

  • Парсинг команд:

    • BenchmarkParser_ParseGet - 25.70 ns/op, 32 B/op, 1 allocs/op

    • BenchmarkParser_ParsePut -51.19 ns/op, 32 B/op, 2 allocs/op

Аллокации в парсере сведены к минимуму (1-2 на команду) — они уходят лишь на приведение байтов к string при создании объекта команды.

TCP-сервер

Сетевое взаимодействие построено на базе стандартного пакета net. Каждое соединение обслуживается в своей горутине. Полный цикл (получение пакета -> парсинг -> блокировка мьютекса -> чтение/запись -> ответ клиенту) работает крайне быстро:

  • BenchmarkTCPServer_Get - 11 970 ns/op (~83 000 RPS)

  • BenchmarkTCPServer_Put - 12 157 ns/op (~82 000 RPS)

3. Киллер-фича: Интерактивный ИИ-ассистент

Для активации достаточно запустить базу с флагом -ai и передать API_KEY. В REPL становится доступна команда ai.

Поддерживается выполнение нескольких шагов

Простая генерация одной команды не работает для сложных задач. Например, по запросу “если юзер ivan существует, инкрементируй его возраст” ИИ не может сразу выдать команду записи, так как не знает состояние базы.

Для этого под капотом реализован цикл (до 5 итераций), где ИИ общается с движком БД специальными тегами:

  1. QUERY READ: <command> — ИИ просит базу выполнить чтение (например, get ivan).

  2. QUERY WRITE: <command> — промежуточная запись данных.

  3. RESULT READ: / RESULT WRITE: — финальный результат.

Как это выглядит на практике:

  1. Вы пишете: ai удали профиль ivan, если у него возраст меньше 30

  2. LLM отвечает движку: QUERY READ: all

  3. Движок прозрачно для вас выполняет all, ищет среди данных Ивана, видит у него возраст {"age": 25} [json] и отправляет обратно LLM.

  4. LLM понимает, что юзер найден по ключу (допустим, ivan), и выдает финальное действие: RESULT WRITE: del ivan.

Human-in-the-loop (Защита от восстания машин)

База данных никогда не выполняет деструктивные команды ИИ вслепую. Если LLM генерирует write-команды (put, del, incr, decr), qrrot останавливает выполнение, рисует красивую ASCII-рамку с планом выполнения и ждет подтверждения:

ai wants to execute the following write command(s):
┌─────────────────────────────────┐
     1. del ivan                                                                       
└─────────────────────────────────┘
execute final commands? (y/n): 

Это гарантирует, что галлюцинации нейросети не уничтожат ваш прод.

4. Данные на диске: Бинарные снапшоты

In-memory — это круто, но данные нужно сохранять. Вместо использования тяжеловесных форматов (JSON/XML), qrrot сохраняет дамп в собственный бинарный формат с сигнатурой QRRT.

Структура файла максимально плотная:

  • 4 байта сигнатура (QRRT) + 1 байт версии.

  • Далее подряд идут записи: [1 байт тип] [2 байта длина ключа] [ключ] [4 байта длина значения] [значение].

Атомарность сохранения: При вызове exit или перехвате системных сигналов (SIGINT/SIGTERM) срабатывает механизм Graceful Shutdown:

  1. Дамп пишется во временный файл dump.qrr-*.tmp.

  2. Вызывается f.Sync() для принудительного сброса буферов ОС на физический диск (защита от отключения питания).

  3. Выполняется os.Rename(), который в POSIX-системах гарантированно атомарно подменяет старый файл новым.

Бенчмарки I/O (10 миллионов ключей с длинными значениями и JSON):

  • Сохранение на диск: 2.41 секунды.

  • Чтение, парсинг и загрузка 10М ключей в RAM: 3.14 секунды. Дополнительно реализована защита от OOM при чтении битых файлов: если в дампе указана длина значения больше 16 МБ, база откажется загружать этот ключ, предотвращая краш системы.

5. О проблемах и архитектурных недочетах

Идеального кода не существует, особенно, если проект написан за две недели одним человеком. qrrot создавался как пет-проект, и он уж точно не способен хотя бы как то конкурировать с каким нибудь Redis. В нем заложены компромиссы, которые при росте нагрузки могут выстрелить в ногу. Давайте их разберем:

1. Глобальная блокировка

Ядро базы — это Store под единым sync.RWMutex. Для 80k RPS на localhost этого хватает, но на машинах с десятками ядер потоки начнут выстраиваться в очередь. Как чинить: Переписать на шардирование. Разбить хранилище на массив из 256 сегментов (каждый со своей мапой и своим мьютексом). Сегмент выбирается по хэшу от ключа. Это радикально снизит конкуренцию блокировок.

2. OOM при снятии снапшотов

В текущей реализации метод Snapshot сначала вызывает loadDataToRam(), который делает maps.Copy(res, s.data). Это катастрофа для больших баз. Если у вас в памяти лежит 10 ГБ данных, в момент создания снапшота база выделит еще 10 ГБ оперативки просто для создания безопасной копии мапы. Как чинить: Либо блокировать мапу на время записи на диск (убьет доступность БД), либо реализовывать MVCC (Multi-Version Concurrency Control) или механизм наподобие RCU (Read-Copy-Update).

3. Отсутствие WAL (Write-Ahead Log)

Снапшоты сохраняются только при выходе. Если сервер проработает месяц, накопит данные, и процесс убьет SIGKILL (или пропадет питание) — все данные с момента старта исчезнут. Как чинить: Писать append-only лог каждой транзакции на диск в реальном времени. При старте база должна загружать последний дамп, а затем “накатывать” операции из WAL.

4. ИИ-ассистент работает только локально (в REPL)

Архитектура ИИ-агента с интерактивным запросом y/n завязана на os.Stdin и os.Stdout. Если вы запустите БД в режиме TCP-сервера и пошлете по сети команду ai, движок честно ответит: ai is only available in interactive console (i'll fix it). Для работы по сети потребуется реализовать интерактивный протокол поверх TCP.

5. Оверхед по памяти для простых чисел

Значения типа int (int64) занимают 8 байт, но qrrot упаковывает их в структуру Value с тегом типа и байтовым слайсом []byte. Это порождает лишние аллокации и оверхед в памяти. Для мелких данных это неэффективно по сравнению с interface{} или unsafe-трюками.

Итог

qrrot — это отличный полигон для экспериментов. Проект доказывает, что на чистом Go, используя лишь стандартную библиотеку (за исключением ИИ-клиента), можно за короткое время собрать производительный движок, выдерживающий огромный RPS.

Опыт с LLM в качестве самостоятельного агента мне оказался особенно интересным: модель отлично справляется с многошаговыми задачами и парсингом JSON внутри базы, выступая мостом между человеческим языком и строгой логикой БД.

Вы можете потыкать демо онлайн через TCP (увы, пока для TCP AI я не прикрутил):

nc qrrot.xyz 23

Буду рад вашей критике, архитектурным советам и пулл-реквестам: GitHub

Спасибо!