惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Security Latest
Security Latest
Scott Helme
Scott Helme
C
Cybersecurity and Infrastructure Security Agency CISA
Engineering at Meta
Engineering at Meta
小众软件
小众软件
Security Archives - TechRepublic
Security Archives - TechRepublic
The Last Watchdog
The Last Watchdog
Cloudbric
Cloudbric
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
G
GRAHAM CLULEY
N
News | PayPal Newsroom
宝玉的分享
宝玉的分享
Y
Y Combinator Blog
人人都是产品经理
人人都是产品经理
云风的 BLOG
云风的 BLOG
U
Unit 42
Attack and Defense Labs
Attack and Defense Labs
Microsoft Security Blog
Microsoft Security Blog
博客园_首页
Hacker News: Ask HN
Hacker News: Ask HN
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
M
MIT News - Artificial intelligence
T
Threat Research - Cisco Blogs
P
Privacy & Cybersecurity Law Blog
Martin Fowler
Martin Fowler
Forbes - Security
Forbes - Security
GbyAI
GbyAI
Cisco Talos Blog
Cisco Talos Blog
AWS News Blog
AWS News Blog
酷 壳 – CoolShell
酷 壳 – CoolShell
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
S
SegmentFault 最新的问题
J
Java Code Geeks
T
Tenable Blog
L
Lohrmann on Cybersecurity
Webroot Blog
Webroot Blog
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
H
Help Net Security
The Hacker News
The Hacker News
Schneier on Security
Schneier on Security
The Cloudflare Blog
月光博客
月光博客
F
Fortinet All Blogs
The GitHub Blog
The GitHub Blog
aimingoo的专栏
aimingoo的专栏
博客园 - 【当耐特】
雷峰网
雷峰网
T
Troy Hunt's Blog
罗磊的独立博客
L
LangChain Blog

Все публикации подряд на Хабре

Ловим музу за клавиатуру: как айтишнику стать автором Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента Никто не любит писать тесты, но ИИ может исправить это IPv8 выглядит как мечта. Поэтому почти наверняка не взлетит Производители вернули в продажу материнки с DDR3. Что происходит? Управление агентом с телефона через Telegram теперь в KodaCode От координации к лидерству: как меняется роль руководителя разработки Я сделала родителям бизнес вместо пенсии: зарабатываем 70 тысяч, мама не даёт продать В три раза быстрее приемка товара и оптимизация трудозатрат на 73%: как «РСТ-Инвент» помог Gulliver Group ИИ-шечный мир победил? О влиянии искусственного интеллекта на игропром Кремль снижает давление на Телеграмм пока Европа строит интернет по паспорту Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением Как (не) потерять домен за выходные Вместо 8 разных VPS: как я организовал практику студентам на одном сервере Почему твой Open Source проект не замечают? R&D: искусство управления неопределенностью в разработке AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет Мы отдали управление роботами OpenClaw. Что из этого вышло Галактический ID: система идентификации для всех форм разумной жизни Шесть основ бизнес-анализа: начинаем с вопроса «Кто в игре?» Код-ревью, в котором дело не в коде Данные переехали. Команда — нет Системной подход к сдаче OSWE в 2025 Почему комната управления реактором покрашена в цвет морской пены 4 YAML-файла вместо PySpark: как аналитикам строить пайплайны без разработчиков LLM-агент для поиска свободных доменов: автоматизируем подбор Когда, зачем и как правильно начинать новую сессию в Claude Code? Как я заставил нейросеть писать макросы для FreeCAD Анатомия ИИ‑агента для подбора персонала. От тысячи резюме к топ‑10 за минуты Опыт разработчика как экономика внимания Автономность как точка невозврата: кто будет субъектом в цифровом будущем Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты Как измерить LLM для задач кибербеза: обзор открытых бенчмарков Где хранить код? Сравнение GitHub, GitLab и Bitbucket Математика объясняет, почему нормальное распределение встречается повсюду Почему ваш FinOps не работает: 12 тезисов от практиков Как подписать проектную документацию УКЭП с использованием бесплатных лицензий Pilot Адаптивное администрирование Sigla Vision Я грузил уран в бочки, а потом 20 лет строил ИТ в атомной отрасли Чем позвонить с Эвереста? История и обзор спутниковой связи. Часть 2 Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии Как не передать на desktop свой IP в РКН Анатомия SAP Privileges: как устроено управление правами в macOS MoneyDev: Сказка про три главных слова Обновлённый токенизатор видео K-VAE 2.0 от Сбера Как сделать диспетчеризацию дома на 1284 квартиры почти бесплатно Как мы разогнали железную дорогу Мы дали агентам рутину. Теперь надо решить — что делать с освободившимся временем Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM Умный город начинается с точного взгляда: как «Фалькон Тех» меняет пространство к лучшему Навайбкодил приложение для анализа графов Почему Дюну так интересно читать? Упрощаем работу с рутиной или как стать Гендальфом Белым Деконструкция Go: CPU, RAM и что там происходит. Go Assembler база. Часть 1.1 Какие профессии исчезнут из-за ИИ, а какие появятся? И что с этим делать Как мы построили IT-отдел, где хочется расти: архитектурные встречи, прозрачные метрики и книжные подарки Rufler: Делаем из Claude Code автономный рой через один YAML-конфиг Sing-box и белый список приложений Как построить надёжный обмен сообщениями в микросервисах: лучшие практики для enterprise OpenAI строит MLM-пирамиду, а McKinsey и Accenture помогают ей в этом Дом, который не построил Фишер (Часть 2) «Сверхзвуковой математик» против «Вдумчивого логиста»: битва алгоритмов 3D-упаковки Мультимодальные модели – грубый и дорогой инструмент Разговоры ничего не стоят. Код тоже Проверки физических лиц: с кого начнет ФНС Топ-10 бесплатных нейросетей для создания видео в 2026 году Первые слои кода: как наши решения сегодня определяют архитектуру ИИ на десятилетия Разработка нового статического анализатора: PVS-Studio JavaScript Поиск уязвимостей ПО: базовый минимум или роскошный максимум Почему оценка персонала не работает как инструмент управления Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50% Как я ушел из найма, нажарил косточек и продал на маркетплейсах на 168 млн в год Когда 1С:ERP уже внедрена, а нормального производственного плана всё ещё нет Как я сделал Claude мультимодальным, подключив к нему Qwen Omni Как приглашение на вакансию мечты превращается в атаку Infrastructure as Code: философия и лучшие практики IaC Тестируем Yandex Code Assistant на задаче, в которой нужно хранить секреты nxs-universal-chart v3.0: новое поколение универсального Helm-чарта Callback Injection: Техника, которая отправила Microsoft Defender в глухой нокаут «Все идеи на стол»: митап как способ вывести проект из тупика Сегодня я узнал нечто новое о GPU благодаря багу в своей игре Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать Карта событий как фундамент аналитики: практический кейс для E-commerce Что выбрать для AI: x86, ARM или RISC-V? Дайджест железа за март Роль соматических мутаций в развитии аутоиммунных заболеваний: путь к избирательной терапии Mythos от Anthropic — тревожный сигнал для всех, а не только для банков Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение Финансовая гонка вооружений: почему умные люди добровольно в ней участвуют Эра ИИ-агентов наступила: выбираем лучшего цифрового сотрудника # Практический опыт внедрения WinCC Redundancy на производственном предприятии Сделал MVP за 3 дня, а потом неделю прикручивал оплату. Оно того стоило? Физика против Маска: почему Starship V3 может оказаться ещё одной катастрофой Нефть Венесуэлы: крупнейшие запасы в мире, но не крупнейшая нефтяная держава JPA 4. Переосмысление Hibernate Почему зеркальная фотокамера Nikon D5 десятилетней давности идеально подошла для миссии «Артемида-2» Проект «Уровень-Спутник» или как мы сделали платформу для гидрологов «Замедлиться, чтобы ускориться»: почему ИИ повышает цену ошибок в требованиях и архитектуре Как с нуля поднять трафик IT-компании на 1657% при бюджете 55 тыс. и выжить Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь
Фреймворк для «красных» процессоров и модель «издатель — подписчик». Работаем с флотом ИИ-агентов на своей машине
beeline_cloud · 2026-06-18 · via Все публикации подряд на Хабре

Фреймворк для «красных» процессоров и модель «издатель — подписчик». Работаем с флотом ИИ-агентов на своей машине

Простой

6 мин

0

Популярная тема в ИТ-сфере сегодня — локальная работа с ИИ-агентами. На этой волне мы в Beeline Cloud решили посмотреть на подходящие инструменты с открытым исходным кодом и подготовили подборку фреймворков, которые помогут управлять ИИ-агентами у себя «под боком» и с нуля писать интеллектуальных помощников под свои задачи.

Изображение: Ionut Roman (Unsplash License)

Изображение: Ionut Roman (Unsplash License)

Решение для «красных» процессоров

Год назад AMD выложила в открытый доступ фреймворк Gaia. Он позволяет писать ИИ-агентов, заточенных под работу на чипах Ryzen AI с аппаратным ускорением. Исходники распространяются по лицензии MIT, и на GitHub инструмент собрал 1,4 тыс. звезд.

Gaia является единой средой, в которой можно локально проектировать ИИ-помощников, запускать их и управлять ими, а также следить за их работой. Фреймворк предлагает чат с ИИ-помощником (в том числе голосовой), RAG-поиск, возможность взаимодействовать с локальными текстовыми файлами пользователя, а также генерировать код и выполнять его тестирование. Можно подключаться к внешним инструментам — например, если нужно «подтянуть» данные о погоде или задачи из Jira.

Установить Gaia можно как приложение для Windows, macOS и Linux, либо запустить через Lemonade Server. Фреймворк поставляется с SDK для Python и C++. Информация по установке и работе с Gaia приведена в документации на сайте. В целом она довольно объемная, там можно найти и руководства, как использовать ИИ-агентов для генерации кода или работы в 3D-пакете Blender. Также авторы проекта подготовили серию обучающих «плейбуков» — их можно воспринимать как пошаговые практикумы, в которых объясняется, как писать ИИ-агентов с нуля. Реализация одних проектов (вроде генератора изображений) займет около 15 минут, а на другие (например, ИИ-модуль для интерактивной работы с документами) может уйти и час.

ИИ-агент за пару строчек кода без шаблонов

Ailoy — это написанная на Rust библиотека для упрощенной разработки и интеграции агентов в приложения (лицензия Apache 2.0). Ее представили специалисты из южнокорейской компании BrekkyLab, специализирующейся на фреймворках для ИИ-решений, в 2025 году.

Ailoy предлагает высокоуровневые API для многоэтапных диалогов, настроек системных промптов и логического вывода. Можно работать с локальными моделями Qwen3 (хотя есть возможность подключиться и к проприетарным облачным моделям). Локальные ИИ-агенты могут вызывать внешние инструменты, чтобы расширить свои возможности [Ailoy поддерживает связь со сторонними системами по протоколу MCP]. Что касается решаемых задач, то агенты в Ailoy могут осуществлять RAG-поиск в документах пользователя. При желании можно включить функцию мышления, чтобы модель формулировала структурируемый пошаговый вывод. Разработчики рекомендуют использовать ее для научного анализа.

Задавать характер поведения и роль ИИ-агента можно с помощью системных сообщений — высокоуровневых инструкций по типу «Кратко отвечай в JSON-формате». Кроме того, библиотека поддерживает мультимодальный ввод (может работать с текстом, изображениями) и WebAssembly, так что агентов можно запускать в браузере. Стоит отметить, что агенты в Ailoy не учитывают контекст в разговоре; каждое сообщение от пользователя является отдельным новым запросом [но можно вновь отправить все предыдущие ответы одной репликой, чтобы учесть вводные]. Для кого-то это может показаться недостатком, однако разработчики намеренно реализовали диалог так, чтобы работа с системами ИИ была более предсказуемой. 

Гайд по началу работы с Ailoy можно найти в документации, где также перечислены доступные модели и инструменты, а также поддерживаемые среды. Еще там имеются инструкции по работе с API Python, Node.js и WebAssembly, описание архитектуры решения.

Один раз написать код — и все

В 2025 году специалисты из шведского стартапа Opper представили Opperator под лицензией Apache 2.0. Это — фреймворк с терминальным интерфейсом для развертки узкоспециализированных моделей. Как говорят авторы, он предназначен не только для задач вроде обработки почты и анализа документов, но и для разработки — с его помощью можно запускать тесты, деплоить код и мониторить билды. За управление моделями в Opperator отвечает специальный демон. Он передает пользовательские команды из терминала ИИ-агентам, отслеживает их работу, перезапускает при сбоях и обеспечивает безопасное хранение секретов. Сами же ИИ-помощники представляют собой изолированные Python-процессы со своими зависимостями и конфигурациями.

Изображение: JustDataPlease (Unsplash License)

Изображение: JustDataPlease (Unsplash License)

Подготовить шаблон для создания агента достаточно просто. Для этого нужно прописать несколько команд в терминале. Хотя Opperator предлагает и альтернативный вариант — произвести сборку в интерактивном конструкторе. Достаточно описать, какие функции будет выполнять агент, например: «Мне нужен агент, который будет анализировать скриншоты в папке и переименовывать файлы в зависимости от содержимого». Далее редактор в формате диалога уточнит детали реализации, проведет настройку и протестирует работу ИИ-агента.

Платформа с расчетом на масштабирование

AutoAgents — написанная на Rust платформа с модульной архитектурой для управления ИИ-агентами. В 2026 году это решение было опубликовано под двойной лицензией Apache 2.0 и MIT. Его автором выступил инженер-программист из компании ServiceNow, который по совместительству является разработчиком среды выполнения LiquidOS. По его словам, AutoAgents может послужить основой для высокоуровневого агентного фреймворка.

Интересным компонентом AutoAgents является механизм ReAct (думать + действовать), позволяющий ИИ-агентам работать в циклах: сперва планировать задачу, потом выполнять ее и наблюдать за результатами. При этом пользователь контролирует память агентов. По умолчанию они помнят контекст лишь последних сообщений, однако для них можно настроить иные стратегии «запоминания». Пользователь может искать старые запросы, экспортировать и импортировать диалоги. Между собой агенты общаются в формате «издатель — подписчик», то есть конкретная модель может работать только с тем событием, которое исходит из определенного для нее источника. А система окружения распределяет ресурсы и отслеживает состояние всех ИИ-агентов. Вызов инструментов определяется макросами с типобезопасными входами и выходами. Если пользователь сомневается в надежности того или иного внешнего приложения, его можно запустить в изолированной WASM-среде.

В документации проекта подробностей больше — в ней показано, как установить AutoAgents, какие LLM-провайдеры поддерживаются и как устроены основные компоненты решения. Кроме того, в GitHub-репозитории можно найти множество ознакомительных примеров по работе с фреймворком: реализации разных типов ИИ-агентов и интеграций с протоколом MCP.

Beeline Cloud — безопасный облачный провайдер. Разрабатываем облачные решения, чтобы вы предоставляли клиентам лучшие сервисы.

Что еще почитать в нашем блоге и на ИТ-площадке «вАЙТИ»:

  • От виртуальных рук до ИИ для выживальщиков: любопытные открытые агентные ОС [и один хардверный проект]. Еще одна подборка в нашем блоге. Рассказываем про операционки, в которых агенты взаимодействуют с интерфейсами программ и не только. Например, в OpenFang модули-руки могут работать с вебом и собирать информацию из открытых источников и документов, а проект Lukan позволяет превратить операционную систему в интеллектуальный хаб для работы с нейросетями в tmux или PTY.

  • Интеллектуальная видеоаналитика: как нейросеть устроена изнутри. На примере одной реализованной системы видеонаблюдения автор материала рассказывает, какие технологии используются, как проходит обучение и какие сложности возникают при реализации. Компактный материал, который поможет быстро познакомиться с темой.

  • ИИ уже читает ваш сайт, но по каким правилам? LLMs.txt, robots.txt и контроль агентов. Файл robots.txt говорит краулерам, какие разделы сайта им трогать можно, а какие — стоит обходить стороной. Ценным указаниям следуют далеко не все роботы, но это отдельная история. Дело в том, что системный файл robots.txt решает задачу доступа к контенту, но не задает правила его использования. LLMs.txt — это попытка решить проблему. Статья разбирает синтаксис LLMs.txt с базовыми директивами и примерами для популярных CMS [кстати, у себя в блоге мы обсуждали еще один профильный стандарт — security.txt, который так и не обрел широкую популярность].

  • Как мы создали нейросеть для определения возраста. Еще одна статья, автор которой обсуждает опыт реализации системы машинного зрения для ритейла и рассказывает про сбор данных и тестирование модели. Материал подается сжато, но наглядно — с примерами. Также автор поделился результатами: ни один младенец не был «признан» совершеннолетним, а в группе от 10 до 14 лет нейросеть ошибалась лишь в 3% случаев.