Многие смотрят на это спустя рукава, но Google создавал AIStudio не для того, чтобы вы ежедневного пользовались им в качестве основного интерфейса для общения с LLM. Студия была создана с целью дать возможность разработчикам настраивать параметры инференса, тестировать, баловаться. И не нужно быть главным‑по‑aistudio, чтоб это понять — там есть тулинг, граундинг поиска, можно изменить системный промпт. Диалоги сохраняются в виде файлов на гугл диске, чтоб было можно их клонировать, бекапить, итд. Есть отдельная страница с рейт лимитами, с выпуском апи токенов. Это — ворота к программному интерфейсу для разработчиков, а не удобный chatgpt‑like веб‑интерфейс.
Однако, за годы полировки студия постоянно улучшалась, — что ж тут сказать, Логан Килпатрик и ко — молодцы. Есть отдельный нехилый слой пользователей, которые предпочитают основному приложению Gemini именно что Студию. Почему — да всё просто, лимиты с подписками в интерфейсе chatgpt‑like оставляют желать лучшего, когда у самой студии лимиты вообще отдельные, а в ней же ещё и можно выпустить free tier апи ключик.
В общем, как мне кажется — это был немаловажный фактор полировки качества студии. Ещё какой‑то год назад она и ощущалась и работала совсем по другому. Парсер разметки заедал, и выводил часть размышлений в виде простого текста. До сих пор, хоть и стоит отдать должное — гораааздо реже, иногда бек присылает два ответа и перемешивает их в самом страшном виде — присылая 2–3 блока размышлений, вставляя их посреди уже итогового ответа, и в общем вычистить эту большую кашу занимает добрых 3–4 минуты на один такой косячок. Почему вообще присылается несколько — A/B тестирование. Та самая штука, когда «выберите, какой ответ по вашему подходит больше». Было много таких мелочей, к которым хоть и можно было привыкнуть, но нервов они выели условно на 3–5% в пересчёте в кол‑во токенов, которые я там за всё это время истратил.
И что?
Я занимаюсь много чем с LLM — и генерирую код, и общаюсь в быту, и использую в нескольких проектах, и делаю разного рода эксперименты. Попробовать за годы (да, я начинал примерно с chatgpt-3.5, в числе первых оплачивал подписку, и очень рад что перестал) я успел все ключевые интерфейсы, да разрешите мне во имя всего святого их не перечислять плз =)
Так и какого тогда фига спустя всё это время я до сих пор иногда пользуюсь студией? Всё просто — предсказуемость, удобство, сильная команда которая её делает. Это всё помимо того, что мне просто нравится Gemini, и по множеству моих разных небольших и средних исследований больше подходит под большинство моих проектов — в общем, я отчасти адепт, хотя и стараюсь быть объективным, каждой задаче — свой инструмент.
Безусловно, я пробовал так же немало self‑hosted интерфейсов для LLM. И они все как на подбор чем‑то лично меня да раздражают. Чего только стоит один Open WebUI? Огромная махина на питоне, которая дома заведётся исключительно через docker compose, будет нещадно при каждом F5 крутить свой спиннер загрузки диалогов из SQLite, или где она их там хранит. Абсолютно сомнительный тулинг на python‑функциях, каша в настройках — есть как локальные, так и глобальные промпты и прочие настройки что делает пользование абсолютно интуитивно непонятным. Замечу — каждому своё. Если вы обожаете Open WebUI — ради бога, я сам им до сих пор иногда пользуюсь, потому что там осталась часть важных старых диалогов. Но использовать это как быстрый ежедневный инструмент для работы в том числе с кодом? Нет, спасибо.
И да, с кодом. Я посмотрел за это время на сотни изобретений, среди которых десятки IDE, десятки расширений для VS Code, десятки отдельных кодинг‑агентов итд. Потыкал буквально всё — от Cursor до самоделок. И речь, если что, тут не за удобство вайбкодинга, это дело пятое. Я писал код много лет до Attention is all your need, так пишу и после. Сменилась эпоха и мы просто обросли инструментами, тут демагогий предлагаю не начинать — итак вся лента Хабра ими пухнет с каждым днём. Я здесь именно за удобный мне самому инструмент под конкретно мои задачи. Возможно, кому‑то он тоже станет удобным и обретёт место в инструментарии. И один из основных и по сей день юз кейсов подобного интерфейса — обсуждение с LLM кода и его непосредственно генерация. Сколько бы ни было удобных и не очень удобных инструментов заточенных именно под кодинг — мало кто, из тех у кого веб‑интерфейс и по сей день один из основных инструментов, не генерирует там код.
Далее — Lost in the Middle и размытие внимания. Как бы там ни было — примерно на 100к токенах контекстного окна — любая LLM начинает нещадно тупить. Проблема решена на бумаге в лабораториях, но не на деле. Приходится лезть в самый верх диалога, и по одному кликать «удалить — подтвердить» для каждого сообщения. в AI Studio отдельно приходится удалять блоки рассуждений, а в open webui чуть получше — автоматически с удалением одного твоего сообщения — удаляется ответ на него от ассистента, но на масштабах целой работы это всё равно ручной костыль. Если я присылаю модельке 3–4 важных полных и больших листинга кода, где прошу к примеру проверить их на взаимодействие друг с другом — я осознаю, что рано или поздно мне опять придётся что‑то удалять, либо в начале, либо в конце, либо в середине.
Чего мне не хватает в интерфейсах для общения с LLM?
скорости, реактивности, простоты. Отсутствия тучи зависимостей. Сам инференс стек сейчас чуть ли не легче поднять, чем интерфейсы к нему! смешно!
методов автоматической и ручной очистки контекста по разным правилам.
централизованного и понятного тулинга. но об этом сегодня я расскажу лишь частично, ибо тема для отдельного материала, хотя и в предлагаемом решении всё уже полностью реализовано.
подсчёт токенов на клиентской стороне. ни у кого не видел из серьёзных интерфейсов кроме самого AI Studio — это прекрасная вещь! когда ты печатаешь, и сразу видишь сколько твои копипасты добавят тысяч токенов в текущее контекстное окно.
Для личного решения всех этих пунктов — осмеливаюсь представить вам 🧪lab!
🧪lab — это полностью бесплатная, с открытым исходным кодом, serverless, компактная, минималистичная и лёгкая альтернатива AI Studio и в целом интерфейс для повседневного общения с LLM.
https://github.com/Talos‑popcorn/lab

Общее:
Хостится на Cloudflare Pages, нет никакого бекенда — только статика.
Поддерживает Ollama и OpenAI‑compatible провайдеров (а значит и gemini, и openrouter, и как я понимаю — всё что угодно)
Хранит все диалоги и настройки исключительно в браузере — в IndexedDB (с помощью Dexie.js).
Фичи:
Real time подсчёт всех токенов. На выбор даю общий js‑tiktoken и нативный токенайзер от Gemini, который на 99% точно считает по гуглу. Расхождение замечено порядка десятков токенов, не более. Сидеть и подбирать точные мета‑токены (мета‑информацию о самом диалоге, куски жсона которые так же учитывает сам Gemini при подсчёте) я посчитал бессмысленным по правилу Парето.
Автоочистка чата по скользящему окну. Опционально, конечно. Можно выставить 100к токенов, и спокойно общаться — после переваливания за порог интерфейс автоматически удалит самые старые сообщения, чтоб вернуться в диапазон. Удалит не более чем нужно.
Ручные инструменты очистки — «Оставить только последние N сообщений», «Удалить первые N», «Удалить N самых тяжёлых», «Сжать весь код в чате». Мне больше не нужно бегать и удалять по одному сообщению сверху!
Резервное копирование — можно выгрузить всё в жсоне и точно так же загрузить с другого устройства.
Изменение системного промпта — одно, глобальное!
Monaco Editor для просмотра генерируемого кода.
Интеграция с ToolHub — об этом мы поговорим в следующий раз, отдельная штуковина, она позволяет мне централизовать все MCP тулы и свои собственные в одно удобное пространство, которое я могу использовать везде. Т.к. конечно же, общаться с моделью без возможности хотя бы поиска в 2026 году уже не совсем интересно.
Не получится просто так взять и подключить labstudio.tech к локальной олламе. Нужно самой олламе объяснить, что она должна быть рада любому ориджину:
sudo systemctl edit ollama.service
И там дописываем:
[Service]
Environment=“OLLAMA_ORIGINS=*”
Если оллама крутится на локалхосте — этого должно быть достаточно. Если же где‑то в локальной подсети — ещё нужно будет разрешать браузеру insecure с https на http. Но проще, наверное, просто скачать репо себе и сделать bun run dev.
Конечно же — сразу говорю — я разработал это для себя и своих целей. У меня не стояло задачи удовлетворить хотелки всех пользователей подобных интерфейсов. Здесь нет каких‑либо категоричных инженерных изысков, невероятных алгоритмов, которые следовало бы запатентовать. Просто попробуй — я не прошу ни копейки, ничего не продаю, не рекламирую (кроме себя любимого, но любой материал с философской точки зрения и есть самореклама автора), не прикладываю никаких ссылок на тг каналы (только один небольшой баннер на сайте, но можно скачать проект себе и вырезать его — ваше право), если понравится — кому‑то в этом мире станет удобнее работать и жить, если не понравится — буду рад услышать почему именно.




















