惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

aimingoo的专栏
aimingoo的专栏
量子位
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
S
Schneier on Security
Cisco Talos Blog
Cisco Talos Blog
T
ThreatConnect
J
Java Code Geeks
博客园 - 司徒正美
A
Arctic Wolf
T
True Tiger Recordings
C
Cybersecurity and Infrastructure Security Agency CISA
Cyberwarzone
Cyberwarzone
Know Your Adversary
Know Your Adversary
T
Threat Research - Cisco Blogs
V
Vulnerabilities – Threatpost
Recorded Future
Recorded Future
P
Palo Alto Networks Blog
The Hacker News
The Hacker News
The Register - Security
The Register - Security
S
Securelist
www.infosecurity-magazine.com
www.infosecurity-magazine.com
C
CXSECURITY Database RSS Feed - CXSecurity.com
Application and Cybersecurity Blog
Application and Cybersecurity Blog
I
Intezer
P
Privacy & Cybersecurity Law Blog
Scott Helme
Scott Helme
K
Kaspersky official blog
博客园 - 聂微东
Last Week in AI
Last Week in AI
V
V2EX
小众软件
小众软件
F
Fox-IT International blog
Martin Fowler
Martin Fowler
Apple Machine Learning Research
Apple Machine Learning Research
T
Tenable Blog
F
Future of Privacy Forum
Microsoft Security Blog
Microsoft Security Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
腾讯CDC
Stack Overflow Blog
Stack Overflow Blog
C
Check Point Blog
阮一峰的网络日志
阮一峰的网络日志
GbyAI
GbyAI
T
Threatpost
I
InfoQ
P
Proofpoint News Feed
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
T
Tor Project blog
G
GRAHAM CLULEY
D
DataBreaches.Net

Все публикации подряд на Хабре

Свой AI-агент из почты, systemd и LLM MemForge2: загрузочная флешка, которая за минуту говорит — какую планку памяти менять Лицензии важны. Разбор ошибок авторов и пользователей программ От RAG-прототипа к агенту в продакшн: путь по метрикам, а не по моде Serial Terminal: кастомный веб-терминал для последовательного порта на Web Serial API Китайский стартап GigaAI обещает робота-домработника за 1 млн рублей уже в 2027 году — правда или PR? Open-source VPN клиент Tunguska Роман за 6 недель без идеи на старте: миф или реальность? ИИ построит ваш план действий за 10 секунд Security Week 2622: эффективность Claude Mythos по версии Cloudflare Reactive Forms vs Signal Forms: Эволюция сложных форм в Angular TorFlash — приложение для Linux: поиск торрентов, скачивание и копирование на флешку в одно нажатие Как я решил проблему русской диктовки для ИИ Оверинжиниринг, потопивший немецкую подлодку или некоторые «баги» не чинятся десятилетиями Как ставить цели и не забывать о них: пошаговая система с примерами в таск-менеджере Как настроить observability в Spring Boot 3 HackTheBox. Прохождение Mini Pro Lab Puppet Обзор серверного ускорителя NVIDIA Tesla V100 16 Gb в корпусе от RTX 4090: Часть 3 — Запуск локальных моделей ИИ Редактирование текста нейросетью: как сделать диплом и курсовую более человечными Самодельный ARM ноутбук, реально ли? Как 100+ авторов пишут 100+ процессов в 3 версиях и не путаются. Или как мы переехали с Wiki на Git Прошла AnalystDays – хорошие выступления и нетворкинг VSCode как IDE для embedded разработки Моделирование широкополосной антенны с двойной круговой поляризацией и высокой изоляцией Ваше прошлое физически существует прямо сейчас. И вы заморожены там навсегда От списка инструментов к technical output: как security engineer’у описывать hands-on опыт в CV и на интервью I just want an agent. Часть 1. Как я научил ИИ собирать ИИ-агентов за пользователей и выиграл конкурс I just want an agent. Часть 1. Как я научил ИИ собирать ИИ-агентов за пользователей и выиграл конкурс Вайбкодинг спас меня от подрядчиков. А потом я поняла, что сама стала подрядчиком для своих агентов Святой Августин и GAN: почему борьба добра и зла — это генеративная состязательная сеть В каждом QR-коде зашита половина лишней информации. Намеренно Я открываю автомат ключом, меняю рулон бумаги и зарабатываю 180 тысяч в месяц с точки Мастер восстановления. Культура достиженства и выгорание Недельный геймдев: #279 — 24 мая, 2026 Защита от дублирования кода агентами: семантические концепции Frontend Status: свежий дайджест фронтенда и AI — 25.05.2026 Где искать IT-работу кроме HH: подборка платформ 2026 Почему простые числа собираются в спирали? OCR для Data Lakehouse: от Apache Tika к собственному решению на базе Docling Jira — Тьюринг-полная Kubernetes-аудит после Wiz и Prisma: как живут без CNAPP в 2026 «Тестируем MVP в 4 раза быстрее»: как нейросети изменили жизнь предпринимателей На каком стеке и железе работает умное наблюдение в вашем городе: обзор технологий от разработчиков видеоаналитики Как мы ускорили согласования на двух заводах в 24 раза Heartbeat-мониторинг cron-job'ов: dead-man-switch на FastAPI [Перевод] Сегодня нет джуниоров, а в 2031 году не станет и синьоров Профайлер для PostgreSQL: от идеи до работающего MVP за сутки [Перевод] Ограничения размера cookie в ASP.NET Core в продакшене: причины и способы решения Проблема «божественного» Obsidian: почему я отказался от централизованного подхода в работе Лицензии GNU GPL: как пройти проверку Минцифры и заказчика для госзакупок и КИИ Хакатон Samsung IT Academy Hack 2026: как студенты оптимизировали поиск в корпоративном мессенджере Хакатон Samsung IT Academy Hack 2026: как студенты оптимизировали поиск в корпоративном мессенджере MTProxy jumper — делаем автоматическое переключение прокси-серверов Telegram Ты уже используешь агента. Просто не заметил Книжный салон. Послевкусие и благодарности Как отлаживать мини‑приложения в MAX и почему без DevTools это боль Cбор биометрических данных. Как защищается наша биометрия на практике Как запустить учет активов без цифровой свалки: первые 90 дней CGE: визуализация кравлера и скрытых связей между поддоменами Зачем банки тратят миллиарды на науку (спойлер: не благотворительности ради) Книга: «Современный Java Concurrency. Глубокое погружение в Virtual Threads, Structured Concurrency и Scoped Values» Как использовать подписку ChatGPT и Claude в Cursor без оплаты за API токены Специализированная ИСУП или модуль в универсальной платформе: вот в чем вопрос Обход белых списков через WebRTC на стероидах (с поддержкой iOS и десктопа) Регата INFOSTART CIO CAMP: когда команда проверяется не в переговорной, а на воде Пет-проект, который не умер: система бронирования устройств как полигон для AI-разработки Не надо встраивать ИИ в каждую корпоративную систему, это архитектурная ошибка Нейросети для дизайна интерьера: Выбираем лучший ИИ для генерации концептов и планировок квартиры Что там с Ил-114-300 Что такое DAS: как и зачем продукт-менеджеры саботируют запуск новых продуктов 8% компаний измеряют критическое мышление руководителей. Что делают остальные 92% CVE, Shell и побег из контейнера: испытываем возможности PT Cloud Application Firewall Как я научил Алису петь: генерация музыки по голосовой команде Восстановление данных с помощью бесплатной утилиты Easy Disk Checker Как мы построили сквозную аналитику в Power BI Год разработки iOS-игры, 266 тысяч показов и $33: как я делал Vault и почти ничего не заработал Ты прокрастинируешь потому, что избегаешь напрасных усилий, а не чрезмерных нагрузок Я построила диагностику «стоит ли это автоматизировать» — и она трижды говорила глупости. Разбор ошибок Как устроены world models, что показал Google на прошлой неделе и где это меняет gamedev и робототехнику Двухдневная рабочая неделя — будущий стандарт CPU не умер, он просто ждал. Китай строит двухэксафлопсный суперкомпьютер без единого GPU — прорыв, необходимость, фейк? 3Sound: поиск бесплатных звуков для игр больше не боль? 3 Тбит/с по-русски: почему DDoS в 2026 году стал угрозой для любого бизнеса 10 Гбит/с — зачем вам такая скорость передачи данных в облаке Ремонтируем аналоговый XY-самописец Endim 622 [Перевод] IPO компании SpaceX: хорошая попытка, но нет «Ща будет шрифт»: история одного русского embedded‑шрифта Как аквариум на подоконнике превратился в full-stack платформу с AI GiftsHub — из чат-бота в полноценный backend-продукт Пиратство, копирайт и DMCA: как Napster, The Pirate Bay и YouTube изменили закон. Часть II Как найти внутренние резервы для развития предприятия Как один французский чиновник от безысходности начал платил зарплаты картами и практически изобрёл банкноты RAG в энтерпрайзе: почему демо работает, а прод нет AI-агент для финансовых процессов: как мы научили ИИ считать числа из базе данных без галлюцинаций Автопостинг на 8 платформах: архитектура waterfall, custom publisher'ы и API-ловушки Кинетика против бронзы: Почему Голиаф был обречен в дуэли с Давидом [Перевод] Масштабирование LLM: от одного чипа до ЦОДа. Глава 2. Шардинг LLM не работает за вас. Она работает с вами Чем лучше защищает минеральный SPF, тем страшнее он выглядит Стимпанк как часть жизни. История паровых двигателей и место, которое они занимали в мире в XIX-XX веках. Часть 1
Конец бесплатного кремния: как Google AI Studio превратилась из рая для инженеров в симулятор смены аккаунтов
YH7H22 · 2026-05-26 · via Все публикации подряд на Хабре

Уровень сложностиПростой

Время на прочтение3 мин

Охват и читатели248

У каждого из нас в закладках браузера есть Google AI Studio. Еще год назад это было место силы.

Давайте вспомним лето 2025-го. Релиз Gemini 2.5 Pro. Google выкатывает модель с невероятным контекстным окном и делает немыслимое: дает разработчикам практически безлимитную квоту через API и веб интерфейс. Ты мог загрузить туда библиотеку кода, пару книг, логи сервера за месяц и весь день задавать модели вопросы. Лимиты казались бесконечными. Сообщество ликовало: "Наконец-то корпорация повернулась лицом к энтузиастам! OpenAI повержен!"

А потом наступил 2026 год. Вышли Gemini 3.0, а за ней и 3.1 Pro. И карета превратилась в тыкву.

Сегодня попытка вести долгую сессию с 3.1 Pro в AI Studio напоминает изощренную пытку. Десять сообщений с плотным контекстом и вы ловите Quota Exceeded. Чтобы закончить архитектурный ресерч или дописать сложный модуль, люди вынуждены регистрировать по 5-6 альт аккаунтов, перебрасывая контекст из одного окна в другое, пока Google не забанит их по IP.

Почему AI Studio так стремительно скатилась ? Многие думают, что Google просто стал жадным. Но мы с вами знаем: корпорации не бывают жадными или щедрыми. Корпорации умеют считать деньги и тепловыделение.

1. Бесплатный сыр и жажда данных (RLHF-ферма)

Лето 2025 года было не благотворительностью. Это была самая масштабная в истории операция по сбору высококачественных пользовательских данных для Long Context RLHF.

Google отчаянно нуждался в понимании того, как именно разработчики используют окна в 1 миллионов токенов. Им нужны были ваши репозитории, ваши архитектурные споры, ваши паттерны поиска багов в мегабайтах логов. Давая нам безлимитный Gemini 2.5 Pro, Google превратил нас в бесплатных разметчиков данных. Мы сами показали им, где модель теряет фокус, а где галлюцинирует.

К выходу Gemini 3.0 они собрали необходимый датасет. Выучили паттерны. Улучшили метрики маршрутизации внутри слоев. Ферма выполнила свою задачу. Надобность оплачивать ваши круглосуточные эксперименты отпала.

2. Физика KV кэша и термодинамика

Вторая причина аппаратная. Gemini 3.1 Pro это не просто 2.5 Pro с новыми весами. Это фундаментально более тяжелая модель (вероятно, массивный MoE с огромной размерностью скрытого состояния).

Каждый раз, когда вы держите в AI Studio контекст на 500к токенов, сервер Google должен хранить ключи и значения для каждого из этих токенов в сверхдорогой видеопамяти.

Давайте посчитаем: для тяжелой модели 500k токенов контекста на одного пользователя могут занимать от 10 до 40 ГБ видеопамяти просто для поддержания сессии. А теперь представьте, что таких любителей бесплатного сыра миллион.
Google не стал жадным. Инженеры Google просто посмотрели на счета за электричество от своих TPU кластеров. Поддерживать сессии 3.1 Pro с длинным контекстом это буквально сжигать миллионы долларов в час в виде тепла.

В 2.5 Pro они компенсировали эту стоимость ради захвата рынка. В 3.1 Pro законы термодинамики и ограничения пропускной способности памяти взяли свое.

3. Смерть иллюзии бесконечности

Мы разбаловались. Мы поверили, что вычислительные мощности это нечто бесконечное, льющееся из розетки как вода. Google AI Studio летом 25 го поддерживала эту иллюзию.

Но сейчас индустрия ИИ уперлась в жесткий compute wall. Масштабирование интеллекта моделей 3 го поколения требует экспоненциально больше вычислений на инференсе.

Лимиты AI Studio сегодня это честное отражение реальной стоимости интеллекта. Если вам нужен гениальный программист-ассистент, способный удержать в голове 100к строк кода, вы не можете получать его бесплатно 24/7. Ни одна инфраструктура в мире этого не выдержит.

Время взрослеть

Нам больно и обидно переключаться между пятью Google аккаунтами, чтобы доделать задачу. Мы с ностальгией вспоминаем времена, когда можно было закинуть в Gemini целую кодовую базу и болтать об этом часами.

Но AI Studio не скатилась. Она просто столкнулась с реальностью. Экспериментальный полигон закрыт, началась коммерческая эксплуатация. Халява кончилась.

Что делать нам? Возвращаться к корням.
Перестать кидать моделям мусорные мегабайты текста на всякий случай. Учиться писать лаконичные, структурные промпты. Внедрять RAG на своей стороне, подавая в контекст только нужное. И, конечно же, поддерживать open source и локальные модели. Потому что пока вы зависите от чужого кластера, ваш интеллект ограничен чужой квотой.