惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
F
Full Disclosure
罗磊的独立博客
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
G
Google Developers Blog
The Register - Security
The Register - Security
雷峰网
雷峰网
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
H
Help Net Security
博客园 - 司徒正美
B
Blog
宝玉的分享
宝玉的分享
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
U
Unit 42
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
T
Tenable Blog
腾讯CDC
Simon Willison's Weblog
Simon Willison's Weblog
P
Proofpoint News Feed
Cisco Talos Blog
Cisco Talos Blog
博客园 - 【当耐特】
V
Vulnerabilities – Threatpost
C
Cyber Attacks, Cyber Crime and Cyber Security
Cyberwarzone
Cyberwarzone
F
Fortinet All Blogs
NISL@THU
NISL@THU
C
Cisco Blogs
K
Kaspersky official blog
WordPress大学
WordPress大学
L
Lohrmann on Cybersecurity
The GitHub Blog
The GitHub Blog
C
Check Point Blog
M
MIT News - Artificial intelligence
大猫的无限游戏
大猫的无限游戏
阮一峰的网络日志
阮一峰的网络日志
Google DeepMind News
Google DeepMind News
aimingoo的专栏
aimingoo的专栏
T
Threatpost
Application and Cybersecurity Blog
Application and Cybersecurity Blog
量子位
L
LINUX DO - 最新话题
I
Intezer
H
Hackread – Cybersecurity News, Data Breaches, AI and More
V
V2EX
Attack and Defense Labs
Attack and Defense Labs
Y
Y Combinator Blog
A
Arctic Wolf
S
Schneier on Security
Engineering at Meta
Engineering at Meta
有赞技术团队
有赞技术团队

Все публикации подряд на Хабре

Ловим музу за клавиатуру: как айтишнику стать автором Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента Никто не любит писать тесты, но ИИ может исправить это IPv8 выглядит как мечта. Поэтому почти наверняка не взлетит Производители вернули в продажу материнки с DDR3. Что происходит? Управление агентом с телефона через Telegram теперь в KodaCode От координации к лидерству: как меняется роль руководителя разработки Я сделала родителям бизнес вместо пенсии: зарабатываем 70 тысяч, мама не даёт продать В три раза быстрее приемка товара и оптимизация трудозатрат на 73%: как «РСТ-Инвент» помог Gulliver Group ИИ-шечный мир победил? О влиянии искусственного интеллекта на игропром Кремль снижает давление на Телеграмм пока Европа строит интернет по паспорту Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением Как (не) потерять домен за выходные Вместо 8 разных VPS: как я организовал практику студентам на одном сервере Почему твой Open Source проект не замечают? R&D: искусство управления неопределенностью в разработке AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет Мы отдали управление роботами OpenClaw. Что из этого вышло Галактический ID: система идентификации для всех форм разумной жизни Шесть основ бизнес-анализа: начинаем с вопроса «Кто в игре?» Код-ревью, в котором дело не в коде Данные переехали. Команда — нет Системной подход к сдаче OSWE в 2025 Почему комната управления реактором покрашена в цвет морской пены 4 YAML-файла вместо PySpark: как аналитикам строить пайплайны без разработчиков LLM-агент для поиска свободных доменов: автоматизируем подбор Когда, зачем и как правильно начинать новую сессию в Claude Code? Как я заставил нейросеть писать макросы для FreeCAD Анатомия ИИ‑агента для подбора персонала. От тысячи резюме к топ‑10 за минуты Опыт разработчика как экономика внимания Автономность как точка невозврата: кто будет субъектом в цифровом будущем Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты Как измерить LLM для задач кибербеза: обзор открытых бенчмарков Где хранить код? Сравнение GitHub, GitLab и Bitbucket Математика объясняет, почему нормальное распределение встречается повсюду Почему ваш FinOps не работает: 12 тезисов от практиков Как подписать проектную документацию УКЭП с использованием бесплатных лицензий Pilot Адаптивное администрирование Sigla Vision Я грузил уран в бочки, а потом 20 лет строил ИТ в атомной отрасли Чем позвонить с Эвереста? История и обзор спутниковой связи. Часть 2 Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии Как не передать на desktop свой IP в РКН Анатомия SAP Privileges: как устроено управление правами в macOS MoneyDev: Сказка про три главных слова Обновлённый токенизатор видео K-VAE 2.0 от Сбера Как сделать диспетчеризацию дома на 1284 квартиры почти бесплатно Как мы разогнали железную дорогу Мы дали агентам рутину. Теперь надо решить — что делать с освободившимся временем Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM Умный город начинается с точного взгляда: как «Фалькон Тех» меняет пространство к лучшему Навайбкодил приложение для анализа графов Почему Дюну так интересно читать? Упрощаем работу с рутиной или как стать Гендальфом Белым Деконструкция Go: CPU, RAM и что там происходит. Go Assembler база. Часть 1.1 Какие профессии исчезнут из-за ИИ, а какие появятся? И что с этим делать Как мы построили IT-отдел, где хочется расти: архитектурные встречи, прозрачные метрики и книжные подарки Rufler: Делаем из Claude Code автономный рой через один YAML-конфиг Sing-box и белый список приложений Как построить надёжный обмен сообщениями в микросервисах: лучшие практики для enterprise OpenAI строит MLM-пирамиду, а McKinsey и Accenture помогают ей в этом Дом, который не построил Фишер (Часть 2) «Сверхзвуковой математик» против «Вдумчивого логиста»: битва алгоритмов 3D-упаковки Мультимодальные модели – грубый и дорогой инструмент Разговоры ничего не стоят. Код тоже Проверки физических лиц: с кого начнет ФНС Топ-10 бесплатных нейросетей для создания видео в 2026 году Первые слои кода: как наши решения сегодня определяют архитектуру ИИ на десятилетия Разработка нового статического анализатора: PVS-Studio JavaScript Поиск уязвимостей ПО: базовый минимум или роскошный максимум Почему оценка персонала не работает как инструмент управления Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50% Как я ушел из найма, нажарил косточек и продал на маркетплейсах на 168 млн в год Когда 1С:ERP уже внедрена, а нормального производственного плана всё ещё нет Как я сделал Claude мультимодальным, подключив к нему Qwen Omni Как приглашение на вакансию мечты превращается в атаку Infrastructure as Code: философия и лучшие практики IaC Тестируем Yandex Code Assistant на задаче, в которой нужно хранить секреты nxs-universal-chart v3.0: новое поколение универсального Helm-чарта Callback Injection: Техника, которая отправила Microsoft Defender в глухой нокаут «Все идеи на стол»: митап как способ вывести проект из тупика Сегодня я узнал нечто новое о GPU благодаря багу в своей игре Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать Карта событий как фундамент аналитики: практический кейс для E-commerce Что выбрать для AI: x86, ARM или RISC-V? Дайджест железа за март Роль соматических мутаций в развитии аутоиммунных заболеваний: путь к избирательной терапии Mythos от Anthropic — тревожный сигнал для всех, а не только для банков Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение Финансовая гонка вооружений: почему умные люди добровольно в ней участвуют Эра ИИ-агентов наступила: выбираем лучшего цифрового сотрудника # Практический опыт внедрения WinCC Redundancy на производственном предприятии Сделал MVP за 3 дня, а потом неделю прикручивал оплату. Оно того стоило? Физика против Маска: почему Starship V3 может оказаться ещё одной катастрофой Нефть Венесуэлы: крупнейшие запасы в мире, но не крупнейшая нефтяная держава JPA 4. Переосмысление Hibernate Почему зеркальная фотокамера Nikon D5 десятилетней давности идеально подошла для миссии «Артемида-2» Проект «Уровень-Спутник» или как мы сделали платформу для гидрологов «Замедлиться, чтобы ускориться»: почему ИИ повышает цену ошибок в требованиях и архитектуре Как с нуля поднять трафик IT-компании на 1657% при бюджете 55 тыс. и выжить Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь
Федеративное обучение в условиях дефицита памяти на Edge-устройствах. Часть 1
aloshkarev ( · 2026-04-27 · via Все публикации подряд на Хабре

Время на прочтение7 мин

Охват и читатели26

Кейс

Если ваше устройство думает, что 1 ГБ — это ругательное слово, то этот доклад в двух частях для вас.

Меня зовут Александр Лошкарев, я инженер-программист в компании Eltex. Этот материал основан на моем докладе для AiConf и посвящен федеративному обучению (FL). Мы разберем, как внедрять ML-модели на краевых устройствах, которые жестко ограничены в ресурсах и имеют меньше 256 МБ оперативной памяти. 

В компании Eltex мы проектируем сетевое оборудование с нуля. Обычно беспроводные устройства работают в статическом режиме: их один раз конфигурируют, и дальше они годами не меняют параметры, если только администратор не вмешается вручную. Но в современных сетях Wi-Fi такой подход неэффективен из-за постоянной интерференции и изменения радиообстановки.

Обычно решение о реконфигурировании принимается централизованно на контроллерах беспроводных сетей. Мы решили провести эксперимент и попробовать внедрить механизмы самообучения прямо в точки доступа.

Предметная область: зачем устройствам интеллект

Краевые устройства собирают телеметрию напрямую от клиентов (смартфонов, планшетов). Перенос вычислений на эти узлы создает технические сложности: требуется квантование моделей, динамическая загрузка слоев, работа с нестандартно распределенными данными (non-IID) и сжатие градиентов для передачи. На практике это нужно, чтобы уйти от статической конфигурации. Сейчас, если рядом появляется источник сильных помех, качество связи деградирует и остается низким вплоть до ручной перенастройки сети администратором. Локальная аналитика позволит узлу перестраивать параметры на лету.

В корпоративной сети от 50 точек доступа мы ставим цель снизить влияние интерференции на 40% и увеличить общую пропускную способность примерно на треть:

Контекст Wi-Fi оптимизации

Архитектурно система состоит из контроллера и самих точек доступа. Управлять радиоэфиром мы можем через три параметра: ширину полосы, канал и мощность передатчика. Сама точка постоянно собирает статистику подключенных клиентов: уровень сигнала, зашумленность, процент потерянных пакетов и количество попыток переподключения.

Перед тем, как перейдем к следующей составляющей, предлагаю следующую задачку. Попробуем выразить возможные улучшения на устройстве через целевую функцию.

Поиск идеальных настроек — это задача многокритериальной оптимизации. Мы используем алгоритмы машинного обучения с подкреплением, где целевая функция работает как функция награды. На вход подаются доступные каналы, значения ширины полосы, выбранная модель прогнозирования и горизонт планирования (от 1 минуты до суток). Алгоритм стремится максимизировать пропускную способность и точность прогнозов. Одновременно он должен минимизировать помехи от соседних точек, задержки передачи, расход оперативной памяти и нагрузку на процессор.

Чтобы сеть не была нестабильной, настройки меняются с учетом гистерезиса (защитного интервала в 10-15%). Логика простая: если утилизация эфира высока, полосу сужают; если есть свободные ресурсы — расширяют. Главное правило системы — ни один клиент не должен остаться без связи.

В статье рассматриваются два направления: оптимизация радиоэфира и оптимизация ML-моделей. 

Управление каналами, шириной полосы и балансировка клиентов могут теоретически существенно улучшить работу сети. На практике полезная скорость ограничена накладными расходами протокола CSMA/CA. Главная польза от AI-оптимизации радиоресурсов (RRM) — стабильность среды. Алгоритмы снижают коканальную интерференцию (CCI) примерно на 40% и улучшают SNR в среднем на 7 дБ. У динамического изменения настроек есть и минусы. Смена канала требует отправки кадра CSA, из-за чего клиенты кратковременно теряют связь и получают скачки задержек. 

Если взять за базу 100 Мбит/с, выбор канала дает прибавку в 15% к стабильности работы, настройка полосы — 25%, контроль утилизации — 10%, а корректировка покрытия — 8%.

Федеративное обучение: основы

Федеративное обучение (FL) хорошо решает задачи беспроводных сетей. Точки доступа получают модели, которые соответствуют их локальным ресурсам. Архитектуру сети менять не нужно, систему можно развернуть поверх существующей инфраструктуры. Если точка доступа отключается и не присылает данные, результаты вычисляются по остальным узлам того же класса. По сети передаются только весовые коэффициенты, сырой трафик остается на местах. Это экономит ресурсы каналов и использует аппаратные мощности точек доступа во время простоев без дополнительных вложений.

Архитектурные подходы FL

FL делится на горизонтальное и вертикальное. В первом случае узлы имеют однотипные признаки, во втором — разные, поэтому загружается только часть модели. Вертикальный подход напоминает Split Learning. 

Также выделяют схемы Cross-Silo и Cross-Device. Cross-Silo часто применяют банки для обновления моделей безопасности без прямой передачи клиентских баз друг другу.  

Вызовы FL в Wi-Fi сетях

В Wi-Fi сетях внедрение FL сталкивается с тремя проблемами. Первая — данные распределены неравномерно (Non-IID). Трафик в офисе отличается от производства, есть сезонность и влияние локальных событий. Вторая — зоопарк оборудования. В одной сети работают устройства с процессорами ARM и MIPS, а объем оперативной памяти составляет от 64 до 512 МБ. Третья — сетевые ограничения. Связь с контроллером может прерываться, требуя повторной авторизации узла. Пользовательский трафик имеет приоритет. Основная задача точки доступа по передаче данных должна выполняться на 100%, пересылка весов не может забирать эти ресурсы.

Федеративные алгоритмы

Алгоритмы FL собирают веса с агентов и вычисляют единые коэффициенты для рассылки обратно на устройства. 

Для корпоративной среды оптимальным оказался метод с батч-нормализацией — FedBN. Каждая точка доступа работает в уникальной радиосреде с собственным фоновым шумом и интерференцией (проблема Feature Shift). FedBN оставляет параметры слоев нормализации на самом устройстве. Это предотвращает усреднение локального шума при глобальной агрегации. Для компенсации разницы в железе мы добавили HeteroFL. Этот алгоритм динамически сужает скрытые каналы и формирует локальные модели разной сложности. Слабые устройства обучают только небольшую подсеть, не блокируя работу остальных узлов с полными моделями. 

На наших тестах эта связка показала точность 94% на однородных данных и 80% на неоднородных при небольшом числе раундов.

Технические решения

Архитектура решения состоит из двух основных элементов: контроллера и точек доступа. 

Контроллер отвечает за агрегацию весовых коэффициентов и расчет средних значений. Точка доступа совмещает две функции. Во-первых, она работает как региональный агент федеративного обучения, выполняя кэширование моделей и квантование. Во-вторых, она отвечает за инференс: собирает данные и выдает локальные прогнозы.  

Потоки данных разделены на четыре этапа: 

Первый — сбор данных и Feature Engineering через подсистему eBPF. В Linux эта технология представляет собой виртуальную машину внутри ядра, которая позволяет выполнять код с минимальными накладными расходами. 

Второй этап — локальное обучение со сжатием градиентов до 75%. 

Третий — обновление моделей. За счет динамической подгрузки слоев мы экономим около 60% оперативной памяти на каждом шаге. 

Четвертый этап — агрегирование с адаптивным квантованием (INT8/INT4). 

Адаптивное квантование

Само адаптивное квантование — это решение задачи минимизации эффекта.

Алгоритм выбирает 8- или 4-битное значение в зависимости от требуемого коэффициента сжатия, балансируя между точностью модели и потреблением памяти. 

Динамическая подгрузка слоев

Механизм динамической подгрузки слоев состоит из предиктивной фазы и политики вытеснения (замещения). 

Расчет вероятности обращения к кэшу и истории использования позволяет понять, какие слои нужно загрузить в память заранее. На практике это радикально снижает потребление пиковой памяти, но увеличивает задержки из-за необходимости предзагрузки данных. Этот недостаток компенсируется асинхронной загрузкой слоев. На целевой модели мы достигли Cache Hit Rate на уровне 85-95%.

Что такое eBPF

Если вы в первый раз сталкиваетесь с этим определением — это из системной части, из Linux. Это виртуальная машина, код в ядре, который выполняется без перезагрузки. Он дает программируемый инструмент анализа и управления практически всем, чем сейчас можно в системе заниматься на уровне ядра, и обеспечивает полную безопасность. Подсистема eBPF обеспечивает безопасное выполнение кода: ошибка в модуле не приведет к панике ядра (kernel panic) и перезагрузке устройства. 

Мы используем eBPF для фильтрации, агрегации и валидации сетевых данных. Главная оптимизация здесь — прямой маппинг памяти между ядром и пространством пользователя (user space). Стандартные кольцевые буферы (perf buffers) требуют ресурсоемкого копирования данных. 

Архитектура eBPF интеграции выглядит следующим образом: 

Чтобы организовать настоящий zero-copy обмен тензорами, мы применили механизм BPF Arena. Он выделяет разделяемую память с прямым доступом через вызов mmap(). Программа в фоновом режиме формирует готовый тензор прямо в ядре и передает его в ML-модель по C-указателю. Системные вызовы для копирования блоков исключаются полностью. В итоге латентность падает, а нагрузка на CPU при подготовке данных снижается на 35-50%. 

Во второй части этого материала я расскажу об экспериментальной платформе, реализации и архитектуре, выборе моделей, результатах эксперимента и поделюсь практическими рекомендациями. Подпишитесь, чтобы не пропустить!

А пока что рекомендую ознакомиться с материалами прикладной технической конференции по Data Science AiConf 2026. В 2026 году мы собрали программу вокруг ключевых вызовов AI-команд. Под каждую тему были организованы не только доклады, но и интерактивные форматы, чтобы каждый получил на выходе конкретные идеи и список «что делать завтра».

Среди основных тем — аргументация технологических решений бизнесу, датасеты (от legacy-свалки до работающей модели), мультиагентные системы, как заставить LLM отвечать точно и по правилам, как правильно ставить задачи для ML и AI, будущее поиска и рекомендаций, RAG от архитектуры до production и экономика AI: как считать и сокращать стоимость железа. Присоединяйтесь!