惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

F
Full Disclosure
Recorded Future
Recorded Future
T
Tenable Blog
S
Securelist
C
CERT Recently Published Vulnerability Notes
T
Threatpost
S
Schneier on Security
A
Arctic Wolf
The Hacker News
The Hacker News
C
CXSECURITY Database RSS Feed - CXSecurity.com
Know Your Adversary
Know Your Adversary
P
Privacy International News Feed
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
The Register - Security
The Register - Security
Cisco Talos Blog
Cisco Talos Blog
AWS News Blog
AWS News Blog
K
Kaspersky official blog
T
True Tiger Recordings
T
Threat Research - Cisco Blogs
V
Vulnerabilities – Threatpost
P
Palo Alto Networks Blog
T
The Exploit Database - CXSecurity.com
小众软件
小众软件
B
Blog
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
Microsoft Azure Blog
Microsoft Azure Blog
Cyberwarzone
Cyberwarzone
C
Cybersecurity and Infrastructure Security Agency CISA
T
Tor Project blog
Spread Privacy
Spread Privacy
Malwarebytes
Malwarebytes
P
Proofpoint News Feed
F
Fox-IT International blog
F
Fortinet All Blogs
P
Privacy & Cybersecurity Law Blog
G
GRAHAM CLULEY
量子位
Latest news
Latest news
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
博客园 - 叶小钗
Project Zero
Project Zero
T
Tailwind CSS Blog
N
Netflix TechBlog - Medium
Martin Fowler
Martin Fowler
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
I
Intezer
博客园_首页
腾讯CDC
H
Hackread – Cybersecurity News, Data Breaches, AI and More
D
Darknet – Hacking Tools, Hacker News & Cyber Security

Все публикации подряд на Хабре

Gamedev. Парсинг данных из Google Sheets и Excel в json без привлечения программистов Nano Banana Google AI: как использовать Нано Банана для генерации и редактирования изображений Менеджер ресурсов ЯНДЕКС 360 (YANDEX 360) промокоды июнь 2026: промокод Yandex 360 скидка 40% на годовые тарифы Open-Source инструмент для автоматического перевода книг Ищу ранних тестировщиков для Android-версии agent harnesses Не используйте LLM для текста Увеличиваем продажи без слез аналитика Оптимизация запросов к PostgreSQL: 5 неочевидных настроек для продакшена 45 лет тюрьмы за DROP TABLE и переход Карпатого в Anthropic Планирование движения для ровера на ходовой Ackerman'а Революция в изучении языков Java — быстрая. Ваш код может таким не быть Как я опоздал на конкурс OpenAi с новой архитектурой нейросети Быстрые интеграции в 1С: прощайте, бесконечные переделки Как получить субсидию 300 миллионов от Минпромторга? preIPO Anthropic, OpenAI, SpaceX. Разбираемся — стоит ли участвовать? Entaxy ION + OPC UA: два способа получить данные с промышленного оборудования Память на миллион, а толку ноль: как мы спасали ИИ-агента от «тупости» РСЯ, AdSense или myTarget: что на самом деле в 2026 приносит больше денег сайту и причем тут монетизаторы Практическое построение сервисов на Go под реальный трафик PostgreSQL и аналитика: что меняется, когда хранилище становится общим Codex за 5 месяцев 2026: мой топ-5 релизов, что не зашло и где OpenAI обогнал Anthropic Как создать короткое видео с помощью нейросетей: Полный гайд по Veo 3.1, Kling 3.0 и Happy Horse 1.0 Алгоритм проверок физлиц от экс сотрудника ФНС Как ИИ портит резюме студентам Системные вызовы в сфере ИТ в 2026: стратегический взгляд для ИТ-руководителей Вайбкодинг заканчивается на localhost: как я строю SaaS для цифровизации коттеджных поселков с Codex Производственные риски в небольшом кастомном производстве. С чем я сталкивалась и как научилась это учитывать Подключаем ИИ органы чувств: bash-демон, пайка и самосознание на Raspberry Pi Я хотел повторить Growing Neural CA за вечер. Ушёл месяц Промт для генерации текста без ИИ следа — как писать уникальные тексты через нейросеть От capabilities к AppArmor: что реально остановит атакующего в контейнере CactOS Вектора интересов: как находить настоящую мотивацию и усиливать команды Цена безопасности [Перевод] Цена безопасности “Рубик” от пет-проекта до прода или ITIL 4 для строительно-торговых центров Чего ждать (и не ждать) от ремейка AC4 Black Flag Архитектурный тупик корпоративного хранения: почему смена модели не снимает ограничений и что с этим делать Атаки через подрядчиков, дефицит кадров и квест с импортозамещением: главные вызовы ИБ в 2026 году Я не оставлю детям наследства Почему порты стали «дверями» в сервер, и кто решил, что SSH будет 22 Почему зарубежные разработчики чипов возвращаются на китайские фабрики Как у меня НЕ получился торговый бот на Polymarket Проектирование архитектуры в нотации ArchiMate с использованием ИИ. Часть 2 Как превратить домашнюю файлопомойку в умную AI-галерею на основе сборки из x99+Xeon и видеокарты за 2 тыс рублей Перспективы заселения нашей галактики Кризис менеджмент в ИТ Reactive Programming не спасёт вас. Если вы не решили эти 5 проблем — у вас просто медленный монолит с Flux Как я делаю DIY-контроллер для ПК: громкость, приложения, MIDI, OBS Миграция микросервисов на Python с помощью LLM: экономим месяцы для разработчиков Программирование микросхем GAL и им подобных Почему таск-трекер не заменяет ИСУП: из чего состоит полноценный контур управления проектами Всё об информационной безопасности. Кибербезопасность. DevOps, CI/CD. Хакеры. Алексей Федулаев Как импортировать базу клиентов в amoCRM и навести порядок в контактах Как мы четыре раза переписали Outbox Google предлагает единый «водяной знак» для изображений, видео и текста, созданных ИИ Сексизм в IT: данные вместо домыслов Один фронтенд, чтоб править всеми, один фронтенд, чтоб всех найти: 1 точка входа, разные BI ИИ в тестировании: зачем мы пошли в пилот и почему начали с чата, а не с агентов Как я научила Telegram-бота наводить порядок в чате с мемами: пересылка по хештегам в соответствующую тему Как мы сделали внутреннюю CRM для управления студией – опыт Doubletapp Десятипальцевый метод — как печатать цифру " Шесть "? Партнерская программа по нейросетям: зарабатывай на ИИ, приводя клиентов в AI-сервис Как я сделал «клик по элементу → открыть в VS Code» за один вечер Эволюция Telegram‑бота на C++: от «лапши» в main() до ООП, in‑memory кэша и мутов по Фибоначчи Как я (внезапно) стал адвокатом вайб‑кодинга в корпорации Дизайн за 5 минут. Дайджест мая 2026 Только 17% всех 64-битных целых чисел можно разложить на два 32-битных 0,000000001% × ∞ = 100%. Вы осознаёте что любое событие неизбежно? «Вы либо трусы наденьте, либо крестик снимите». Как мы выиграли еще один суд против PR-агентства PRslon Почему вы тратите время не на переговоры, а на чужую внутреннюю драму. Как проходят переговоры с крупными компаниями Как приоритизировать регрессионные проверки, когда сжаты сроки релиза Электронные транспортные накладные: технический разбор нововведений 2026 года для логистов, разработчиков и бизнеса Как определить LLM под капотом чат-бота: учебный эксперимент по black-box fingerprinting Хабру 20 лет — зовём вас отметить это к нам Домой iPad как инструмент разработчика в эпоху агентного программирования Inspector v3: как я сделал свой центр управления Kubernetes на старом ноутбуке Как мы осваивали производство гибко-жёстких печатных плат: от проб и ошибок к рабочей технологии 30 лет мы внедряли в России Ansys. А потом он ушёл — и пришлось садиться писать собственный CAE для аддитивной печати Цифровой рубль и цифровой чек Облако под защитой от DDoS: чем On-Demand отличается от Always-On Распродажа в издательстве «Питер» Почему современный стадион больше похож на ЦОД, чем на арену Машина, которая учится думать Запихнули игровую приставку в короб и в первый же месяц продали на 3 млн Игровой ноутбук vs игровой ПК за те же деньги: что изменилось в 2026 году ГИС для Minecraft. Часть 1 Смена старого оборудования на новое убирает огромные затраты на его эксплуатацию — но куда девать всё это старое? Project Manager 2026: как AI-инструменты меняют профессию SLA как инструмент, а не отчёт. Часть 1. Как подружить бизнес и инженеров через общие цифры Послания от ангелов и первый шаг к компьютерам: стеганография Средневековья и Ренессанса Что новенького есть в CSS в 2026 году? Хватит мучить ChatGPT. Почему ваш промпт не сработает Как и зачем мы писали семантический слой для ИИ аналитики – SLayer Маленькая EVPN/VXLAN-фабрика без тупика: как мы запускали площадку в Амстердаме Репликация по DDIA: что я понял, только когда сам сломал прод RAG без downtime: настраиваем инкрементальное обновление документов на Qdrant и LangChain Тени истории: война машин. Как «Энигма» и «Фиалка» определили исход Второй мировой войны
Два игрока на весь российский рынок ИИ: что показал ЦИПР-2026
kliment_ceo · 2026-05-27 · via Все публикации подряд на Хабре

Уровень сложностиПростой

Время на прочтение12 мин

Охват и читатели2K

Репортаж

ЦИПР — «Цифровая индустрия промышленной России» — это одна из главных в стране конференций про промышленную цифровизацию, проходит уже одиннадцатый год. И это, вопреки названию, не выставка станков и не парад чиновников. Это место, где разработка встречается с промышленностью: Яндекс, Сбер, «Газпром нефть», «Росатом», «Северсталь», операторы связи привозят сюда не пресс-релизы, а свои инженерные команды и то, что эти команды собрали: ИИ-агентов, компьютерное зрение, языковые модели, MLOps-платформы. По стендам ходят не только министры и губернаторы, но и те, кто эти системы реально пишет: CTO, тимлиды, руководители ИИ-направлений. На пленарке — премьер-министр; на сессиях рядом — доклады про инференс, дообучение и архитектуру агентов. В этом году форум собрал больше 13 тысяч человек из 46 стран, около 185 стендов и за 350 подписанных соглашений. Если коротко — это место, где видно не моду, а то, что промышленность и госкорпорации реально готовы внедрять и за что готовы платить.

Первый день сессий

Первый день сессий

Я только что оттуда вернулся — и первым делом полез на Хабр посмотреть, что пишут с форума. Почти ничего. Профильная же тема, ну? Ладно, напишу сам. Только это будет не обзор стендов: три дня я ходил по сессиям, слушал, говорил с людьми — и дальше попробую разобрать, как рынок ИИ в России устроен на самом деле, без презентационного глянца.

На всякий случай напомню, меня зовут Климент Викулов, я сооснователь GPTunneL. Это платформа, через которую 2 миллиона человек и 4500 компаний работают с ИИ: единый доступ к двум сотням типовым ИИ-моделей с оплатой в рублях, а поверх — RAG, агенты, оркестрация, и, собственная модель GROM. Среди наших корпоративных клиентов Северсталь, Евраз, ряд дочерних компаний Сбера, и ещё с полсотни компаний такого же калибра; с самим Сбером работаем по GigaChat. Энтерпрайз такого уровня не приходит на сервис, который не прошёл ряд его корпоративных проверок, а это долгая и муторная процедура, и в сфере ИИ её проходят единицы.

Говорю это не ради хвастовства, а чтобы было понятно, откуда я смотрю на рынок: не из зала, а изнутри — вижу, что реально внедряется у крупных заказчиков, а что остаётся красивым слайдом. На ЦИПР мы стояли на стенде МТС, с которым делаем совместное решение, к нему я ещё вернусь позже, отдельным разделом.

И сразу обозначу: всё, что дальше — это моё личное мнение, взгляд из нашей практики, а не истина в последней инстанции. Что-то я говорю как факт, а что-то — это просто моя оценка, и я буду честно показывать, где одно, а где другое. С какими-то выводами вы не согласитесь — и это нормально.

Вывод, к которому я пришёл, простой. Весь промышленный ИИ в России сегодня держится на двух компаниях — на Сбере и Яндексе. Дальше — о том, почему так вышло, к чему это ведёт и где в этой картине все остальные.

Форум двух компаний

Я походил по стендам и сессиям, послушал, кто что внедряет и поймал ощущение, которое потом подтверждалось в каждом втором разговоре. С кем из корпоратов ни заговоришь про ИИ, за спиной у него либо Сбер, либо Яндекс.

Это не фигура речи. Объединённая авиастроительная корпорация (ОАК) тестирует GigaChat для проектирования авиадеталей. Объединённая двигателестроительная корпорация (ОДК) делает со Сбером компьютерное зрение для контроля качества двигателей. «Газпром нефть» и «Норникель» строят промышленных агентов с Яндексом. «Северсталь» принципиально идёт своим путём на открытых моделях, но это лишь исключение, подтверждающее правило. Слушаешь сессии по промышленному ИИ, и складывается устойчивая картинка: по одну сторону стола заказчик, по другую — один из двух.

Дальше можно было бы съехать в публицистику про монополизацию. Но мне интереснее разобрать, почему так вышло. Потому что это не лень рынка и не заговор — это его физика.

Три дефицита: вычисления, данные, деньги

Чтобы построить и содержать сильную модель, нужны три вещи: вычисления, данные и деньги. Деньги — это ещё и люди, и время. Не хватает хотя бы одного — и ты уже не игрок в лиге моделей. В России в дефиците все три сразу. И всё, что по этим трём пунктам в стране вообще набралось, собрано ровно у двух компаний.

Разберу по очереди — от самого обсуждаемого дефицита к самому, на мой взгляд, недооценённому.

Дефицит первый: вычисления

Про дефицит железа на форуме говорил каждый, кто внедряет ИИ. Цифры, которые звучали: в 2024-м в России запустили около 14 тысяч серверных стоек, в 2025-м — примерно впятеро меньше. Срок окупаемости одного ЦОДа из-за ключевой ставки вырос с 6–8 до 10–12 лет — замораживать деньги на такой срок мало кто готов. Все дата-центры страны потребляют порядка 1,5 ГВт; в Китае для сравнения — около 30 ГВт. Новейших чипов Blackwell в товарных количествах нет почти ни у кого.

Это уровень, на котором ресурс конечен даже у гигантов. Сбер в своё время просил у государства 450 млрд рублей на дата-центр и получил отказ — предложили строить за свой счёт. Если уж Сберу говорят «стройте сами», то у остальных вопрос «где взять вычисления для своей модели» закрыт по умолчанию.

И здесь — оговорка, без которой вся картина выйдет кривой. «Держится на двух» не значит, что эти двое сильны по мировым меркам. По оценкам отраслевых источников, у Сбера и Яндекса вместе — порядка пары десятков тысяч ускорителей NVIDIA. Для России это много. Но один крупный западный гиперскейлер ворочает сотнями тысяч, а у мировых лидеров счёт идёт уже на миллионы. Так что два игрока держат рынок не потому, что они огромные, а потому что все остальные отстали ещё сильнее.

Дефицит в России вообще не точечный, а сплошной. Не хватает, по сути, всего сразу: мощных дата-центров под обучение, размеченных датасетов, денег и — отдельная боль — собственных чипов. Россия не производит ИИ-ускорители; всё, на чём работают и Сбер, и Яндекс, и мы, — это NVIDIA, приехавшая по параллельному импорту. Именно поэтому Сбер лезет в микроэлектронику: в начале 2026-го он выкупил долю в группе «Элемент», крупнейшем российском производителе чипов, по сути, заявка на роль «русского Huawei». История долгая, не на один год, но сам факт показателен: лидер рынка вынужден закрывать дефицит на уровне физического кремния.

А теперь — то, в чём я с рынком расхожусь.

Смотрел инфраструктуру у крупных российских игроков и обратил внимание: инференс крутится на тяжёлых датацентровых картах NVIDIA — A100, H100, где-то и H200. Это отличное железо — для обучения моделей это топ, без вариантов. Но гонять на такой карте продакшн-инференс средних моделей — это как возить пиццу на КамАЗе. Доедет, просто посмотрите на расход.

Логика простая. Большая часть реальных корпоративных задач — это модели на 7–32 миллиарда параметров: агенты, ассистенты, классификаторы, разбор документов. Фронтир на 200B+ нужен далеко не везде. А модель уровня 30B в квантизации спокойно живёт на потребительском Blackwell — RTX 5090 с 32 ГБ и даёт цену за миллион токенов ниже, чем H100 на сопоставимой нагрузке. Это не маркетинг, это публичные бенчмарки. Китайцы, которых зажали экспортными ограничениями, давно считают экономику инференса именно так — дешёвое железо плюс агрессивная квантизация плюс грамотный батчинг.

Честный нюанс: 70B+ и фронтир на потребительской карте не закрыть — не хватит памяти, нет NVLink, нет ECC. Для этого по-прежнему нужен датацентровый Blackwell или связка A100/H100. Так что нехватка вычислений никуда не девается: фронтир требует масштаба, который есть у двоих.

Но часть дефицита — рукотворная. Дорогое железо занято тем, что прекрасно уехало бы на железо в разы дешевле. И это не теория: я и сам на ЦИПР искал, у кого взять серверы под инференс нашей модели GROM, предварительно нашёл поставщиков. Потребительский Blackwell, привезённый через Китай и сертифицированный для ввоза в РФ, задачу закрывает. Российская модель на видеокартах, приехавших по параллельному импорту — над словом «суверенитет» тут можно иронизировать сколько угодно, но экономически это работает.

Дефицит второй: данные

А вот это, на мой взгляд, самый недооценённый из трёх дефицитов, и я бы хотел, чтобы на форуме про него говорили больше, чем про видеокарты.

Современная модель учится на триллионах токенов текста. И тут неудобная арифметика: качественного русскоязычного текста в мире кратно меньше, чем англоязычного. Для общих моделей Сбер и Яндекс выгребли русскоязычный веб настолько, насколько он вообще выгребается. Лёгкие данные закончились.

Но ЦИПР — форум не про общие модели, а про промышленный ИИ. А самые ценные промышленные данные — чертежи, телеметрия станков, базы дефектов, логи ремонтов, технологические карты лежат запертыми внутри корпораций. Это их интеллектуальная собственность, и просто так наружу её никто не отдаст. На пленарке это, кстати, прямо признали: данных для обучения индустриальных моделей у разработчиков, по сути, нет, а как корпоративную ИС «допускать» к обучению — Минцифры ещё только предстоит придумать.

И вот тут ключевая мысль всего текста.

Промышленный ИИ в России сегодня нельзя купить как готовый продукт. Потому что это пока и не продукт — это серия партнёрств вокруг доступа к данным. ОАК пускает партнёра к своим данным по нервюрам — и тот обучает модель. ОДК пускает к данным с производства двигателей — и появляется компьютерное зрение. Каждый промышленный кейс — это отдельная сделка про данные, а не покупка лицензии.

А чтобы такие сделки заключались, нужна не технология. Нужен вес: масштаб, репутация, возможность сесть за стол с ОАК или «Норникелем» на равных. Такой вес в стране есть у двух компаний. Поэтому Сбер и Яндекс в каждом проекте — не потому, что у них "лучшая российская модель", а потому что промышленный ИИ устроен как переговоры о данных, а вести их по плечу единицам.

Это и есть ответ на вопрос «почему два имени». Не модель — данные.

Здесь добавлю и свой опыт. У нас есть собственная модель, GROM, и работа над ней показывает то же самое. Видеокарты — вопрос решаемый: ищем варианты, и в ближайшее время закроем. А данные — нет. Самое ценное здесь, отраслевые наборы, заперто у тех, кто сам модели не строит. И в этот потолок упирается каждый — лидеры тоже, просто у них он выше.

Дефицит третий: деньги

И последнее. Обучение конкурентоспособной фронтир-модели - это, по оценкам, которые звучали на форуме, расходы порядка триллиона рублей, и дальше будет только дороже. Один только Сбер вкладывает в ИИ около 600 млрд рублей за 2024–2026 годы, из них 350 млрд — в одном лишь 2026-м. Это не венчурные деньги и не раунд — это бюджет корпорации или государства, который надо жечь годами без гарантии возврата.

Любопытно, что отставания в кадрах и фундаментальной науке эксперты на форуме как раз не фиксируют — российские специалисты сильны и востребованы, в том числе в западных командах. То есть деньги тут не про то, чтобы нанять умных. Они про то, кто может позволить себе не останавливаться.

Сложите три дефицита вместе — и список тех, кто закрыл все три, закономерно сходится к двум.

Что показал сам Сбер и Яндекс

Раз уж речь о них — коротко, что Сбер и Яндекс привезли на форум.

Сбер показывал ГигаКоворк — платформу управления автономными агентами для всей компании. На стенде нам сказали, что решение уже в проде. Я честно попробовал это пощупать: потыкал демо, нажал «назад» — и поймал моргающий курсор, будто страница всё ещё считает себя полем ввода. Мелочь, не спорю, и вполне может быть частностью конкретного стенда. Но ощущения готового боевого продукта у меня лично не возникло. Сразу оговорюсь: это субъективное впечатление от 30 минут у чужого стенда, а не вердикт.

Андрей Белевцев, старший вице-президент Сбера рассказывает про достижения и планы банка в части ИИ

Андрей Белевцев, старший вице-президент Сбера рассказывает про достижения и планы банка в части ИИ

Зацепило меня другое, посерьёзнее. Под капотом у платформы — только GigaChat. На мой взгляд, агентскому решению такого масштаба логично уметь работать и с открытыми моделями: под разные задачи — разные модели, так и дешевле, и гибче. Но тут признаю честно — не мне решать: у Сбера своя модель и свои причины её продвигать.

Яндекс зашёл с другой стороны — со стороны продукта для людей: Алиса, агенты, которые выполняют задачи за пользователя, агентная коммерция, носимые устройства со встроенным ИИ. Если совсем коротко, разница в акцентах такая: Сбер заходит в ИИ как инфраструктура, Яндекс — как продукт. Обе ставки выглядят рабочими.

«Промт-инженер» — это не профессия

Отдельно зацепила одна реплика. Андрей Белевцев, старший вице-президент Сбера и руководитель блока «Технологическое развитие», высказался про модную профессию «промт-инженер». Смысл был такой: отдельной должности «промт-инженер» не существует, и если кто-то предлагает вас на неё выучить — это инфоцыганство. Писать промты сегодня должен уметь каждый. Это как 30 лет назад искали «человека, который умеет работать с компьютером», а потом навык стал базовым для всех, и отдельная вакансия отпала сама собой.

Согласен полностью. Уметь писать промты обязан каждый — от бухгалтера до разработчика. Это не отдельная каста, это новая базовая грамотность. И если видите курс «выучись на промт-инженера за два месяца» — сэкономьте деньги: навык набивается ежедневной практикой, а не сертификатом в рамочке от новомодного коуча из инстаграмма.

Где в этой картине все остальные

Если фронтир-модели — удел двоих, значит ли это, что остальным на рынке ИИ делать нечего? Наоборот. Ценность для бизнеса создаётся не на уровне модели, а поверх неё — в продуктах, которые решают конкретную задачу. И этот слой открыт для всех: тут не нужны ни свой дата-центр, ни триллион рублей, ни доступ к данным «Норникеля» — нужно понимать боль заказчика и быстро собирать работающее.

И тут пора разобраться с термином, который на нас вешают регулярно. GPTunneL почти в каждом обзоре записывают в «агрегаторы нейросетей» — и я знаю эту категорию изнутри, поэтому скажу прямо: как самостоятельный бизнес чистый агрегатор сегодня мёртв. Собрать в одном окне доступ к чужим моделям было хорошей идеей для 2023–2024 годов, когда дефицитом был сам доступ. Сейчас это просто арбитраж — обернул чужой API, добавил оплату рублём, взял маржу, — и эту маржу схлопнули с двух сторон.

Снизу давит серый рынок: масса продавцов, в том числе китайских, льёт доступ через API кратно дешевле себестоимости — фермы аккаунтов, серые ключи, промокредиты. Часто это даже не настоящий API: продавцы проксируют доступ через подписочные продукты вроде Codex и выдают его за API — снаружи похоже, но функционал урезан, ни стабильных лимитов, ни гарантий. И главное — это ненадёжно: такие сервисы появляются десятками в месяц и так же тихо закрываются через пару месяцев (нам в компанию только за неделю прилетает два-три подобных предложения). В моменте выигрываешь на цене, а потом остаёшься без доступа посреди рабочего процесса.

Сверху маржу давят крупные игроки с собственной инфраструктурой. Когда у тебя свои дата-центры, доступ к моделям перестаёт быть отдельным бизнесом и становится копеечной услугой поверх того, что и так есть. Чистому перепродавцу против этого играть нечем: ни серых схем, ни своего железа. Токен стал биржевым товаром, а бизнесом — то, что строится поверх него.

Поэтому всерьёз закрепляются те, кто пошёл глубже: снаружи всё то же окно с моделями, а внутри — пайплайны и целые продукты на нейросетях, RAG, агенты, оркестрация, контроль данных. В этот слой зашли и сами крупные компании. У Ростелекома есть Нейрошлюз. Билайн пошёл к малому бизнесу и ИП: доступ к топовым моделям — Claude, Seedance 2.0, Veo, NanоBanana и тд — можно подключить прямо в личном кабинете оператора; ход, на мой взгляд, разумный. Свои сборки есть у MWS GPT и ещё у нескольких крупных компаний.

Интерфейс Билайна для доступа к нейросетям

Интерфейс Билайна для доступа к нейросетям

Интерфейс Ростелекома по доступу к нейросетям

Интерфейс Ростелекома по доступу к нейросетям

ИИ-Фабрика: продуктовый слой встречает инфраструктуру

Вот на этом, продуктовом слое, работаем и мы. GPTunneL даёт бизнесу доступ ко всем актуальным моделям в одном интерфейсе — да, это в том числе и есть тот самый «доступ», и это нормальная, живая часть продукта. Но только им мы не ограничиваемся: поверх — пайплайны, RAG, агенты, оркестрация, своя модель GROM. Доступ — это вход; ценность создаёт то, что на нём построено.

ИИ Фабрика на стенде МТС за моей спиной (извиняюсь за не самое удачное фото, но другого не имею :) )

ИИ Фабрика на стенде МТС за моей спиной (извиняюсь за не самое удачное фото, но другого не имею :) )

На стенде МТС мы показывали ИИ-Фабрику — совместный продукт GPTunneL и МТС. Он хорошо объясняет, что я имею в виду под «продуктом поверх инфраструктуры», поэтому разберу его как пример, а не как витрину.

Для заказчика это выглядит как наш типовой интерфейс - т.е. одно окно ко всем топовым нейросетям: 200+ моделей, доступных без VPN и с оплатой российской картой, причём не только текстовых — модели для фото, видео и музыки тоже здесь. Одна из моделей под капотом — наша GROM. Всё это либо работает в дата-центрах МТС, либо разворачивается on-premise, в контуре заказчика — и тогда данные не покидают периметр компании вообще.

Зачем это бизнесу — видно на простом примере. Маркетингу нужно снять киношную рекламу на современных видеомоделях, разработчикам — подключить Claude для написания кода. Обычный путь сегодня — идти на сторону, и тут два варианта, оба так себе. Первый — сомнительный посредник: непонятно, как закрывать оплату документами, лишние вопросы от бухгалтерии, и тот самый риск, о котором шла речь выше, — сегодня сервис есть, завтра нет. Второй — личная иностранная карта: корпоративный контент уходит через чужой периметр, а аккаунт, который сегодня работает, завтра может быть заблокирован. ИИ-Фабрика делает ту же задачу внутри собственного контура компании. Ценность здесь — не в моделях, модели у всех одни и те же. Ценность в том, что вокруг них собрано.

Губернатор Нижегородской области Глеб Никитин, вице-премьер и руководитель Аппарата Правительства России Дмитрий Григоренко знакомятся с совместным продуктом GPTunneL и МТС - ИИ-Фабрикой на стенде МТС. Я - на фоне слева

Губернатор Нижегородской области Глеб Никитин, вице-премьер и руководитель Аппарата Правительства России Дмитрий Григоренко знакомятся с совместным продуктом GPTunneL и МТС - ИИ-Фабрикой на стенде МТС. Я - на фоне слева

Лоукод, который всё никак не кончится

Ещё одно наблюдение, и оно тревожит меня сильнее моргающего курсора.

На ЦИПР очень много лоукода и ноукода: конструкторы, визуальные сборщики пайплайнов, «перетащи блок, соедини стрелочкой». Само по себе это не плохо — лоукод закрывает реальную боль. Проблема в другом: когда лоукодом меряют передовой край.

Мир разработки за последний год уехал в другую сторону — в vibe coding. Ты формулируешь, что хочешь, а агент пишет код, чинит баги, гоняет тесты, патчит репозиторий. Это не «блоки мышкой» — это работа с кодовой базой на естественном языке. На ЦИПР вайбкод как мейнстрим почти не звучал. И тут Россия выглядит на полтакта позади: мы обстоятельно осваиваем конструкторы ровно тогда, когда передовой край уже сместился к агентам, которые пишут сами. Ощущение, будто все увлечённо учатся водить машину с автоматом, а по соседней полосе уже едут вообще без водителя.

Телеком: своя железка наконец поехала

Физически чуть ли не половину форума занимали операторы связи — повестка у них своя, отдельная от ИИ-трека. Коротко: МегаФон с YADRO впервые запустил отечественную базовую станцию в городе-миллионнике, она работает прямо в Нижнем. Билайн тестирует 5G в 11 городах, но коммерчески запуститься пока не может — нет разрешения регулятора. МТС показала аэромобильный комплекс связи — по сути, дрон с базовой станцией, разворачивающий покрытие там, где его нет.

Что показательно: для ИИ-трека новость дня — «агент заменил рабочую роль», для телекома — «наконец-то своя железка вместо импортной». Один форум, а скорости — будто из разных десятилетий.

Что в итоге

Дуополия, с которой я начал — это палка о двух концах.

С одной стороны, концентрация сейчас эффективна. Кто-то должен тащить инфраструктуру и заключать тяжёлые сделки про данные, и хорошо, что в стране есть кому. С другой — это хрупко. Когда хребет всего промышленного ИИ страны — это один банк и одна интернет-компания, любой их сбой или разворот становится сбоем целой отрасли. И главный дефицит в этой картине — даже не видеокарты и не данные, а тонкий продуктовый слой поверх двух гигантов. Лидеры дают инфраструктуру. А тепло по домам должен развозить кто-то ещё, и вот этого «кого-то ещё» в стране пока мало.

Отставание есть, отрицать его глупо. Но закрывается оно не лозунгами с пленарок, а скучной работой: считать экономику инференса, доводить продукты до боевого состояния, придумать наконец рамку, по которой корпорации смогут отдавать данные в обучение, не теряя на этом интеллектуальную собственность. Вот это — повестка. А «у нас тоже есть своя модель» — давно уже почти не новость.

И последнее, чтобы по-честному. Всё выше — мой личный разбор: один форум, одна точка зрения, взгляд практика, а не объективный отчёт. В деталях я вполне могу ошибаться. Если вы видите рынок иначе — спорьте в комментариях, ради такого разговора я это и пишу.

ЦИПР для меня не последняя точка в ближайший месяц. Дальше — ПМЭФ: если там будет что-то стоящее по части ИТ, напишу отдельно. А в середине июня едем в Китай — искать решения для наших моделей и заключать официальные партнёрства с рядом китайских поставщиков. По сути, едем напрямую к лидерам — и в моделях, и в железе. Про эту поездку расскажу отдельным постом, как вернёмся. Так что продолжение следует.

Если хотите следить за этим вживую, не дожидаясь статей на Хабре, то у меня есть телеграм-канал https://t.me/kliment_vikulov , там пишу о таких вещах намного чаще и подробнее и показываю изнанку (которая не под NDA): поездки, переговоры, тесты моделей, иногда — неожиданных пользователей нашего сервиса.