惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

V
Vulnerabilities – Threatpost
P
Proofpoint News Feed
The Hacker News
The Hacker News
Know Your Adversary
Know Your Adversary
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
T
Tenable Blog
AWS News Blog
AWS News Blog
S
Securelist
T
Threatpost
C
Cybersecurity and Infrastructure Security Agency CISA
IT之家
IT之家
腾讯CDC
WordPress大学
WordPress大学
Spread Privacy
Spread Privacy
C
Check Point Blog
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
Engineering at Meta
Engineering at Meta
Latest news
Latest news
A
About on SuperTechFans
The Register - Security
The Register - Security
L
LINUX DO - 热门话题
T
The Exploit Database - CXSecurity.com
C
Cisco Blogs
T
Tailwind CSS Blog
Simon Willison's Weblog
Simon Willison's Weblog
阮一峰的网络日志
阮一峰的网络日志
MyScale Blog
MyScale Blog
大猫的无限游戏
大猫的无限游戏
T
Tor Project blog
L
Lohrmann on Cybersecurity
G
GRAHAM CLULEY
B
Blog RSS Feed
Scott Helme
Scott Helme
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
NISL@THU
NISL@THU
P
Privacy International News Feed
Security Latest
Security Latest
Recorded Future
Recorded Future
L
LangChain Blog
Cyberwarzone
Cyberwarzone
C
Cyber Attacks, Cyber Crime and Cyber Security
C
CXSECURITY Database RSS Feed - CXSecurity.com
博客园 - 聂微东
Google DeepMind News
Google DeepMind News
Last Week in AI
Last Week in AI
Apple Machine Learning Research
Apple Machine Learning Research
F
Fortinet All Blogs
O
OpenAI News
T
Threat Research - Cisco Blogs
Blog — PlanetScale
Blog — PlanetScale

Все публикации подряд на Хабре

Ловим музу за клавиатуру: как айтишнику стать автором Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента Никто не любит писать тесты, но ИИ может исправить это IPv8 выглядит как мечта. Поэтому почти наверняка не взлетит Производители вернули в продажу материнки с DDR3. Что происходит? Управление агентом с телефона через Telegram теперь в KodaCode От координации к лидерству: как меняется роль руководителя разработки Я сделала родителям бизнес вместо пенсии: зарабатываем 70 тысяч, мама не даёт продать В три раза быстрее приемка товара и оптимизация трудозатрат на 73%: как «РСТ-Инвент» помог Gulliver Group ИИ-шечный мир победил? О влиянии искусственного интеллекта на игропром Кремль снижает давление на Телеграмм пока Европа строит интернет по паспорту Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением Как (не) потерять домен за выходные Вместо 8 разных VPS: как я организовал практику студентам на одном сервере Почему твой Open Source проект не замечают? R&D: искусство управления неопределенностью в разработке AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет Мы отдали управление роботами OpenClaw. Что из этого вышло Галактический ID: система идентификации для всех форм разумной жизни Шесть основ бизнес-анализа: начинаем с вопроса «Кто в игре?» Код-ревью, в котором дело не в коде Данные переехали. Команда — нет Системной подход к сдаче OSWE в 2025 Почему комната управления реактором покрашена в цвет морской пены 4 YAML-файла вместо PySpark: как аналитикам строить пайплайны без разработчиков LLM-агент для поиска свободных доменов: автоматизируем подбор Когда, зачем и как правильно начинать новую сессию в Claude Code? Как я заставил нейросеть писать макросы для FreeCAD Анатомия ИИ‑агента для подбора персонала. От тысячи резюме к топ‑10 за минуты Опыт разработчика как экономика внимания Автономность как точка невозврата: кто будет субъектом в цифровом будущем Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты Как измерить LLM для задач кибербеза: обзор открытых бенчмарков Где хранить код? Сравнение GitHub, GitLab и Bitbucket Математика объясняет, почему нормальное распределение встречается повсюду Почему ваш FinOps не работает: 12 тезисов от практиков Как подписать проектную документацию УКЭП с использованием бесплатных лицензий Pilot Адаптивное администрирование Sigla Vision Я грузил уран в бочки, а потом 20 лет строил ИТ в атомной отрасли Чем позвонить с Эвереста? История и обзор спутниковой связи. Часть 2 Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии Как не передать на desktop свой IP в РКН Анатомия SAP Privileges: как устроено управление правами в macOS MoneyDev: Сказка про три главных слова Обновлённый токенизатор видео K-VAE 2.0 от Сбера Как сделать диспетчеризацию дома на 1284 квартиры почти бесплатно Как мы разогнали железную дорогу Мы дали агентам рутину. Теперь надо решить — что делать с освободившимся временем Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM Умный город начинается с точного взгляда: как «Фалькон Тех» меняет пространство к лучшему Навайбкодил приложение для анализа графов Почему Дюну так интересно читать? Упрощаем работу с рутиной или как стать Гендальфом Белым Деконструкция Go: CPU, RAM и что там происходит. Go Assembler база. Часть 1.1 Какие профессии исчезнут из-за ИИ, а какие появятся? И что с этим делать Как мы построили IT-отдел, где хочется расти: архитектурные встречи, прозрачные метрики и книжные подарки Rufler: Делаем из Claude Code автономный рой через один YAML-конфиг Sing-box и белый список приложений Как построить надёжный обмен сообщениями в микросервисах: лучшие практики для enterprise OpenAI строит MLM-пирамиду, а McKinsey и Accenture помогают ей в этом Дом, который не построил Фишер (Часть 2) «Сверхзвуковой математик» против «Вдумчивого логиста»: битва алгоритмов 3D-упаковки Мультимодальные модели – грубый и дорогой инструмент Разговоры ничего не стоят. Код тоже Проверки физических лиц: с кого начнет ФНС Топ-10 бесплатных нейросетей для создания видео в 2026 году Первые слои кода: как наши решения сегодня определяют архитектуру ИИ на десятилетия Разработка нового статического анализатора: PVS-Studio JavaScript Поиск уязвимостей ПО: базовый минимум или роскошный максимум Почему оценка персонала не работает как инструмент управления Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50% Как я ушел из найма, нажарил косточек и продал на маркетплейсах на 168 млн в год Когда 1С:ERP уже внедрена, а нормального производственного плана всё ещё нет Как я сделал Claude мультимодальным, подключив к нему Qwen Omni Как приглашение на вакансию мечты превращается в атаку Infrastructure as Code: философия и лучшие практики IaC Тестируем Yandex Code Assistant на задаче, в которой нужно хранить секреты nxs-universal-chart v3.0: новое поколение универсального Helm-чарта Callback Injection: Техника, которая отправила Microsoft Defender в глухой нокаут «Все идеи на стол»: митап как способ вывести проект из тупика Сегодня я узнал нечто новое о GPU благодаря багу в своей игре Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать Карта событий как фундамент аналитики: практический кейс для E-commerce Что выбрать для AI: x86, ARM или RISC-V? Дайджест железа за март Роль соматических мутаций в развитии аутоиммунных заболеваний: путь к избирательной терапии Mythos от Anthropic — тревожный сигнал для всех, а не только для банков Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение Финансовая гонка вооружений: почему умные люди добровольно в ней участвуют Эра ИИ-агентов наступила: выбираем лучшего цифрового сотрудника # Практический опыт внедрения WinCC Redundancy на производственном предприятии Сделал MVP за 3 дня, а потом неделю прикручивал оплату. Оно того стоило? Физика против Маска: почему Starship V3 может оказаться ещё одной катастрофой Нефть Венесуэлы: крупнейшие запасы в мире, но не крупнейшая нефтяная держава JPA 4. Переосмысление Hibernate Почему зеркальная фотокамера Nikon D5 десятилетней давности идеально подошла для миссии «Артемида-2» Проект «Уровень-Спутник» или как мы сделали платформу для гидрологов «Замедлиться, чтобы ускориться»: почему ИИ повышает цену ошибок в требованиях и архитектуре Как с нуля поднять трафик IT-компании на 1657% при бюджете 55 тыс. и выжить Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь
Жизнь сквозь призму LLM. Часть 1 — почему мы будем платить не за сервис, а за доступ к мышлению
firnind (SEN · 2026-04-29 · via Все публикации подряд на Хабре

Уровень сложностиПростой

Время на прочтение6 мин

Охват и читатели402

Мнение

Разговор про большие языковые модели до сих пор слишком часто ведётся по одной из двух схем. Либо восторг: «смотрите, нейросеть уже пишет код и тексты», либо скепсис: «она всё равно галлюцинирует». Ни то, ни другое уже не отражает масштаб происходящего.

Всем привет! Меня зовут Дмитрий Фырнин, я управляющий партнёр и технический директор в SENSE, и собрал серию материалов-рассуждений о том, как LLM меняют нашу жизнь — а где-то уже изменили — на уровне среды, в которой мы работаем и принимаем решения.

В первой части разберём, как массовый спрос меняет природу LLM: почему они выходят из категории сервиса и начинают вести себя как инфраструктура или коммунальная услуга — со своей экономикой, токенами как единицей доступа и давлением рынка на стоимость «машинного мышления».

А во второй части посмотрим на последствия: что происходит, когда между людьми появляется новая прослойка мышления, и как это начинает менять поведение, конфликты и сам способ принимать решения.

LLM как новая коммунальная услуга

Если смотреть на рынок без маркетинговой обвязки, LLM больше похожи не на SaaS-сервисы, а на энергетику. Компании продают инференс — токены вычислительной мощности.

За каждым ответом стоят дата-центры, GPU, электричество, архитектурные ограничения и конкуренция за железо.

Аналогия с энергосистемой здесь неслучайна. Электричество — базовая инфраструктура: она распределяется, тарифицируется, приоритизируется и регулируется. В обычный день это незаметно. Но вспомните ощущение беспомощности, когда свет отключают. С LLM происходит то же самое. Пока это выглядит как подписка или API-тариф. Но по мере того, как на модель завязывается всё больше процессов, она превращается в коммунальную услугу: с уровнями сервиса, SLA, приоритетами и чувствительностью к цене.

В этом смысле LLM — новая энергия для интеллектуальной деятельности. Как электричество вынесло часть физической работы в инфраструктуру, LLM выносят часть когнитивной. А у любой «энергии» неизбежно появляются цена, правила доступа и борьба за контроль.

Экономика токенов

По сути, все игроки рынка продают один базовый продукт. Продуктовые оболочки — корпоративные тарифы, API, «про»-режимы, агентные сценарии — сводятся к одному: сколько токенов, какого качества и при каких ограничениях доступно пользователю.

Но у этой экономики есть жёсткие границы. Снизу стоимость токена ограничивает себестоимость вычислений и альтернативные издержки железа. На одной и той же мощности можно продавать токены, а можно зарабатывать иначе — майнить, сдавать мощность, использовать для других задач.

Если второе выгоднее, цена на токены не будет падать бесконечно. 

Сверху давит рынок. Конкуренция, демпинг и — что важно — государственные субсидии не дают цене свободно расти. Механизм прямой: когда государство покрывает часть издержек на инфраструктуру, энергетику или сами компании, отдельные игроки могут продавать токены ниже реальной себестоимости. 

Например, Китай субсидирует дата-центры, энергетику и производителей GPU, что позволило DeepSeek выйти на рынок с агрессивно низкой ценой. США через CHIPS Act и военные контракты косвенно финансируют инфраструктуру Microsoft, Google и Amazon — и это перетекает в коммерческое ценообразование. ЕС поддерживает таких игроков, как Mistral, через государственные фонды, рассматривая их как стратегический актив. 

Остальные вынуждены подстраиваться, даже если у них другая структура затрат. В итоге стоимость токена оказывается зажатой не только между инфраструктурой и рынком, но и между геополитическими интересами разных государств. С высокой вероятностью экономика токенов станет зоной постоянного конфликта трёх сил: себестоимости вычислений, инвестиционного давления и геополитического демпинга.

Почему рынок LLM неизбежно упрётся в прибыль

Пока вокруг ИИ держится риторика «гонки за будущее», легко забыть, что крупнейшие компании в этом сегменте инвестиционные. Это означает, что рынок LLM быстро повзрослеет. Как только инвесторы начнут сильнее давить, главным вопросом станет не впечатляющий бенчмарк, а выгода от продажи её интеллекта в массовом режиме.

Проще говоря, рынку нужно будет не «лучшее мышление», а «достаточно хорошее мышление с предсказуемой экономикой».

В ближайшие годы будут не только про улучшение качества моделей, но и про борьбу за цену единицы машинного мышления. Кто сумеет давать достаточно хороший результат при более низкой себестоимости, тот и начнёт определять правила игры. Рынок ИИ становится похож на любой другой инфраструктурный рынок, где решают не только технология, но и тариф, ресурсная база, эффективность и способность выдерживать ценовое давление.

Отсюда становится понятным, почему разговоры про «цифровых сотрудников» набирают вес: это попытка предложить рынку понятную единицу потребления. Но на практике это пока не автономный субъект, а сборка из модели, инструментов, памяти и ограничений. Поэтому ближайшее будущее не универсальный AGI, а коммерциализация узких сценариев: поддержка, суммаризация, генерация, аналитика, кодогенерация, работа с внутренними данными.

У мышления появляется цена

Впервые в истории мы начинаем считать стоимость мышления не как философской категории, а как процесса, который можно частично делегировать вычислительной системе и измерить в токенах, задержке и деньгах.

Почему это важно? Умственный труд всегда стоил денег, но его цена учитывалась через часы специалистов без явной, пооперационной тарификации мыслительного усилия. LLM впервые позволяют грубо, но практически оценить, сколько стоит анализ, генерация, перебор вариантов, работа агента.

Это меняет поведение компаний. Они начинают оптимизировать не просто процессы, а глубину и стоимость размышления: 

  • где хватит дешёвой модели;

  • где нужен большая глубина погружения;

  • где допустим черновик;

  • где требуется человеческая верификация. 

Постепенно возникает разделение: где использование ИИ нормально и даже обязательно, а где, напротив, ценность в гарантированно человеческом участии из-за цены ошибки или репутационных рисков.

Будут ли модели сильнее улучшаться, или начнётся эпоха «новых айфонов»

Часто обсуждают, насколько ещё LLM будут умнеть. Думаю, правильнее ставить вопрос иначе: как долго улучшения будут оставаться общественно значимыми, а не только инженерно заметными? Уже сейчас каждый новый скачок обходится дороже, даётся сложнее и меньше ощущается массовым пользователем.

Это напоминает рынок потребительских технологий: сначала революция, затем серия улучшений, которые объективно есть, но субъективно воспринимаются как второстепенные. Инженерный прогресс и рыночный эффект начинают расходиться. Модели лучше справляются со сложными задачами, но если это не масштабируется в массовый спрос, бизнес-эффект ограничен.

Наиболее реалистичный сценарий выглядит так: модели будут становиться лучше, но далеко не каждый раз это будет менять повседневный опыт большинства. Вероятно, рынок сместится: часть улучшений станет критичной для профессионалов, часть будет работать на поддержание лидерства и оправдание цены.

Это признак взросления технологии, а не её стагнации.

В какой-то момент массовому пользователю окажется важнее не то, что модель стала чуть умнее, а то, что она стала надёжнее, дешевле, безопаснее и лучше встроилась в реальные процессы.

Безопасность данных — главный тормоз для реальной агентности

Пока модель помогает писать или искать, цена ошибки невысока. Но как только LLM получает доступ к действиям — ситуация меняется. Почта, документы, CRM, платежи, внутренние сервисы: в этих сценариях модель влияет на реальные действия. А значит, становится точкой потенциальной атаки, утечки или сбоя.

Исследования prompt injection показывают: агентные системы уязвимы к атакам, которые могут приводить к утечке данных и выполнению несанкционированных действий. Модель не на 100% различает данные и инструкции. Вредоносный контент может интерпретироваться как команда — и влиять не только на ответ, но и на поведение всей системы, вплоть до вызова инструментов и изменения логики выполнения.

Безопасность LLM — это не просто защита модели от «плохих запросов», а защита всей цепочки делегированного мышления. Если человек думает через LLM, а LLM действует через инструменты, то компрометация этой прослойки равнозначна компрометации части человеческого решения.

Безопасность данных станет одним из главных факторов, определяющих, где LLM станут инфраструктурой, а где останутся удобной игрушкой. Во внутренних контурах компаний это уже видно: чем чувствительнее данные и чем ближе модель к действию, тем выше спрос не на «самую умную», а на «самую контролируемую» систему.

Вместо вывода: куда мы движемся

Как я уже говорил, эта статья — попытка поразмышлять о будущем LLM, опираясь на то, что уже происходит сейчас. LLM перестают быть инструментом и становятся инфраструктурой. А значит, мы начинаем жить в мире, где мышление — это не только внутренняя способность человека, но и внешний ресурс с ценой, ограничениями и правилами доступа.

Фокус смещается с возможностей моделей на их безопасность и управляемость. И это пока только технический уровень изменений.

Как только часть мышления выносится наружу, неизбежно меняется и поведение людей: как они принимают решения, спорят и взаимодействуют друг с другом. Но это уже тема для второй части, которая выйдет в ближайшем будущем. 

А пока интересно услышать ваше мнение: движемся ли мы к тому, что LLM станут новой базовой инфраструктурой или это всё-таки временный технологический пик? Делитесь в комментариях, обсудим.