惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

S
Securelist
O
OpenAI News
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
T
Threat Research - Cisco Blogs
D
Darknet – Hacking Tools, Hacker News & Cyber Security
Google Online Security Blog
Google Online Security Blog
C
CXSECURITY Database RSS Feed - CXSecurity.com
N
News and Events Feed by Topic
S
Security Affairs
SecWiki News
SecWiki News
Project Zero
Project Zero
L
Lohrmann on Cybersecurity
P
Proofpoint News Feed
P
Palo Alto Networks Blog
L
LINUX DO - 最新话题
H
Hacker News: Front Page
Recent Commits to openclaw:main
Recent Commits to openclaw:main
I
Intezer
Simon Willison's Weblog
Simon Willison's Weblog
W
WeLiveSecurity
T
The Exploit Database - CXSecurity.com
K
Kaspersky official blog
The GitHub Blog
The GitHub Blog
I
InfoQ
云风的 BLOG
云风的 BLOG
雷峰网
雷峰网
B
Blog
IT之家
IT之家
AWS News Blog
AWS News Blog
Jina AI
Jina AI
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
Google DeepMind News
Google DeepMind News
Spread Privacy
Spread Privacy
N
News and Events Feed by Topic
Security Latest
Security Latest
美团技术团队
C
Check Point Blog
WordPress大学
WordPress大学
T
Tenable Blog
S
Security @ Cisco Blogs
Last Week in AI
Last Week in AI
博客园 - 聂微东
月光博客
月光博客
博客园 - 【当耐特】
S
Schneier on Security
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
S
Secure Thoughts
Schneier on Security
Schneier on Security
C
Cisco Blogs
Cyberwarzone
Cyberwarzone

Все публикации подряд на Хабре

Ловим музу за клавиатуру: как айтишнику стать автором Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента Никто не любит писать тесты, но ИИ может исправить это IPv8 выглядит как мечта. Поэтому почти наверняка не взлетит Производители вернули в продажу материнки с DDR3. Что происходит? Управление агентом с телефона через Telegram теперь в KodaCode От координации к лидерству: как меняется роль руководителя разработки Я сделала родителям бизнес вместо пенсии: зарабатываем 70 тысяч, мама не даёт продать В три раза быстрее приемка товара и оптимизация трудозатрат на 73%: как «РСТ-Инвент» помог Gulliver Group ИИ-шечный мир победил? О влиянии искусственного интеллекта на игропром Кремль снижает давление на Телеграмм пока Европа строит интернет по паспорту Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением Как (не) потерять домен за выходные Вместо 8 разных VPS: как я организовал практику студентам на одном сервере Почему твой Open Source проект не замечают? R&D: искусство управления неопределенностью в разработке AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет Мы отдали управление роботами OpenClaw. Что из этого вышло Галактический ID: система идентификации для всех форм разумной жизни Кто решает судьбу вашего проекта? Разбираем заинтересованные стороны. BABOK #1 Код-ревью, в котором дело не в коде Данные переехали. Команда — нет Системной подход к сдаче OSWE в 2025 Почему комната управления реактором покрашена в цвет морской пены 4 YAML-файла вместо PySpark: как аналитикам строить пайплайны без разработчиков LLM-агент для поиска свободных доменов: автоматизируем подбор Когда, зачем и как правильно начинать новую сессию в Claude Code? Как я заставил нейросеть писать макросы для FreeCAD Анатомия ИИ‑агента для подбора персонала. От тысячи резюме к топ‑10 за минуты Опыт разработчика как экономика внимания Автономность как точка невозврата: кто будет субъектом в цифровом будущем Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты Как измерить LLM для задач кибербеза: обзор открытых бенчмарков Где хранить код? Сравнение GitHub, GitLab и Bitbucket Математика объясняет, почему нормальное распределение встречается повсюду Почему ваш FinOps не работает: 12 тезисов от практиков Как подписать проектную документацию УКЭП с использованием бесплатных лицензий Pilot Адаптивное администрирование Sigla Vision Я грузил уран в бочки, а потом 20 лет строил ИТ в атомной отрасли Чем позвонить с Эвереста? История и обзор спутниковой связи. Часть 2 Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии Как не передать на desktop свой IP в РКН Анатомия SAP Privileges: как устроено управление правами в macOS MoneyDev: Сказка про три главных слова Обновлённый токенизатор видео K-VAE 2.0 от Сбера Как сделать диспетчеризацию дома на 1284 квартиры почти бесплатно Как мы разогнали железную дорогу Мы дали агентам рутину. Теперь надо решить — что делать с освободившимся временем Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM Умный город начинается с точного взгляда: как «Фалькон Тех» меняет пространство к лучшему Навайбкодил приложение для анализа графов Почему Дюну так интересно читать? Упрощаем работу с рутиной или как стать Гендальфом Белым Деконструкция Go: CPU, RAM и что там происходит. Go Assembler база. Часть 1.1 Какие профессии исчезнут из-за ИИ, а какие появятся? И что с этим делать Как мы построили IT-отдел, где хочется расти: архитектурные встречи, прозрачные метрики и книжные подарки Rufler: Делаем из Claude Code автономный рой через один YAML-конфиг Sing-box и белый список приложений Как построить надёжный обмен сообщениями в микросервисах: лучшие практики для enterprise OpenAI строит MLM-пирамиду, а McKinsey и Accenture помогают ей в этом Дом, который не построил Фишер (Часть 2) «Сверхзвуковой математик» против «Вдумчивого логиста»: битва алгоритмов 3D-упаковки Мультимодальные модели – грубый и дорогой инструмент Разговоры ничего не стоят. Код тоже Проверки физических лиц: с кого начнет ФНС Топ-10 бесплатных нейросетей для создания видео в 2026 году Первые слои кода: как наши решения сегодня определяют архитектуру ИИ на десятилетия Разработка нового статического анализатора: PVS-Studio JavaScript Поиск уязвимостей ПО: базовый минимум или роскошный максимум Почему оценка персонала не работает как инструмент управления Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50% Как я ушел из найма, нажарил косточек и продал на маркетплейсах на 168 млн в год Когда 1С:ERP уже внедрена, а нормального производственного плана всё ещё нет Как я сделал Claude мультимодальным, подключив к нему Qwen Omni Как приглашение на вакансию мечты превращается в атаку Infrastructure as Code: философия и лучшие практики IaC Тестируем Yandex Code Assistant на задаче, в которой нужно хранить секреты nxs-universal-chart v3.0: новое поколение универсального Helm-чарта Callback Injection: Техника, которая отправила Microsoft Defender в глухой нокаут «Все идеи на стол»: митап как способ вывести проект из тупика Сегодня я узнал нечто новое о GPU благодаря багу в своей игре Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать Карта событий как фундамент аналитики: практический кейс для E-commerce Что выбрать для AI: x86, ARM или RISC-V? Дайджест железа за март Роль соматических мутаций в развитии аутоиммунных заболеваний: путь к избирательной терапии Mythos от Anthropic — тревожный сигнал для всех, а не только для банков Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение Финансовая гонка вооружений: почему умные люди добровольно в ней участвуют Эра ИИ-агентов наступила: выбираем лучшего цифрового сотрудника # Практический опыт внедрения WinCC Redundancy на производственном предприятии Сделал MVP за 3 дня, а потом неделю прикручивал оплату. Оно того стоило? Физика против Маска: почему Starship V3 может оказаться ещё одной катастрофой Нефть Венесуэлы: крупнейшие запасы в мире, но не крупнейшая нефтяная держава JPA 4. Переосмысление Hibernate Почему зеркальная фотокамера Nikon D5 десятилетней давности идеально подошла для миссии «Артемида-2» Проект «Уровень-Спутник» или как мы сделали платформу для гидрологов «Замедлиться, чтобы ускориться»: почему ИИ повышает цену ошибок в требованиях и архитектуре Как с нуля поднять трафик IT-компании на 1657% при бюджете 55 тыс. и выжить Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь
В интернете нет нормальной альтернативы Google AI Studio. Пришлось написать свою
Безымян Бесфамильнов · 2026-06-13 · via Все публикации подряд на Хабре

Простой

7 мин

7.1K

Многие смотрят на это спустя рукава, но Google создавал AIStudio не для того, чтобы вы ежедневного пользовались им в качестве основного интерфейса для общения с LLM. Студия была создана с целью дать возможность разработчикам настраивать параметры инференса, тестировать, баловаться. И не нужно быть главным‑по‑aistudio, чтоб это понять — там есть тулинг, граундинг поиска, можно изменить системный промпт. Диалоги сохраняются в виде файлов на гугл диске, чтоб было можно их клонировать, бекапить, итд. Есть отдельная страница с рейт лимитами, с выпуском апи токенов. Это — ворота к программному интерфейсу для разработчиков, а не удобный chatgpt‑like веб‑интерфейс.

Однако, за годы полировки студия постоянно улучшалась, — что ж тут сказать, Логан Килпатрик и ко — молодцы. Есть отдельный нехилый слой пользователей, которые предпочитают основному приложению Gemini именно что Студию. Почему — да всё просто, лимиты с подписками в интерфейсе chatgpt‑like оставляют желать лучшего, когда у самой студии лимиты вообще отдельные, а в ней же ещё и можно выпустить free tier апи ключик.

В общем, как мне кажется — это был немаловажный фактор полировки качества студии. Ещё какой‑то год назад она и ощущалась и работала совсем по другому. Парсер разметки заедал, и выводил часть размышлений в виде простого текста. До сих пор, хоть и стоит отдать должное — гораааздо реже, иногда бек присылает два ответа и перемешивает их в самом страшном виде — присылая 2–3 блока размышлений, вставляя их посреди уже итогового ответа, и в общем вычистить эту большую кашу занимает добрых 3–4 минуты на один такой косячок. Почему вообще присылается несколько — A/B тестирование. Та самая штука, когда «выберите, какой ответ по вашему подходит больше». Было много таких мелочей, к которым хоть и можно было привыкнуть, но нервов они выели условно на 3–5% в пересчёте в кол‑во токенов, которые я там за всё это время истратил.

И что?

Я занимаюсь много чем с LLM — и генерирую код, и общаюсь в быту, и использую в нескольких проектах, и делаю разного рода эксперименты. Попробовать за годы (да, я начинал примерно с chatgpt-3.5, в числе первых оплачивал подписку, и очень рад что перестал) я успел все ключевые интерфейсы, да разрешите мне во имя всего святого их не перечислять плз =)

Так и какого тогда фига спустя всё это время я до сих пор иногда пользуюсь студией? Всё просто — предсказуемость, удобство, сильная команда которая её делает. Это всё помимо того, что мне просто нравится Gemini, и по множеству моих разных небольших и средних исследований больше подходит под большинство моих проектов — в общем, я отчасти адепт, хотя и стараюсь быть объективным, каждой задаче — свой инструмент.

Безусловно, я пробовал так же немало self‑hosted интерфейсов для LLM. И они все как на подбор чем‑то лично меня да раздражают. Чего только стоит один Open WebUI? Огромная махина на питоне, которая дома заведётся исключительно через docker compose, будет нещадно при каждом F5 крутить свой спиннер загрузки диалогов из SQLite, или где она их там хранит. Абсолютно сомнительный тулинг на python‑функциях, каша в настройках — есть как локальные, так и глобальные промпты и прочие настройки что делает пользование абсолютно интуитивно непонятным. Замечу — каждому своё. Если вы обожаете Open WebUI — ради бога, я сам им до сих пор иногда пользуюсь, потому что там осталась часть важных старых диалогов. Но использовать это как быстрый ежедневный инструмент для работы в том числе с кодом? Нет, спасибо.

И да, с кодом. Я посмотрел за это время на сотни изобретений, среди которых десятки IDE, десятки расширений для VS Code, десятки отдельных кодинг‑агентов итд. Потыкал буквально всё — от Cursor до самоделок. И речь, если что, тут не за удобство вайбкодинга, это дело пятое. Я писал код много лет до Attention is all your need, так пишу и после. Сменилась эпоха и мы просто обросли инструментами, тут демагогий предлагаю не начинать — итак вся лента Хабра ими пухнет с каждым днём. Я здесь именно за удобный мне самому инструмент под конкретно мои задачи. Возможно, кому‑то он тоже станет удобным и обретёт место в инструментарии. И один из основных и по сей день юз кейсов подобного интерфейса — обсуждение с LLM кода и его непосредственно генерация. Сколько бы ни было удобных и не очень удобных инструментов заточенных именно под кодинг — мало кто, из тех у кого веб‑интерфейс и по сей день один из основных инструментов, не генерирует там код.

Далее — Lost in the Middle и размытие внимания. Как бы там ни было — примерно на 100к токенах контекстного окна — любая LLM начинает нещадно тупить. Проблема решена на бумаге в лабораториях, но не на деле. Приходится лезть в самый верх диалога, и по одному кликать «удалить — подтвердить» для каждого сообщения. в AI Studio отдельно приходится удалять блоки рассуждений, а в open webui чуть получше — автоматически с удалением одного твоего сообщения — удаляется ответ на него от ассистента, но на масштабах целой работы это всё равно ручной костыль. Если я присылаю модельке 3–4 важных полных и больших листинга кода, где прошу к примеру проверить их на взаимодействие друг с другом — я осознаю, что рано или поздно мне опять придётся что‑то удалять, либо в начале, либо в конце, либо в середине.

Чего мне не хватает в интерфейсах для общения с LLM?

  1. скорости, реактивности, простоты. Отсутствия тучи зависимостей. Сам инференс стек сейчас чуть ли не легче поднять, чем интерфейсы к нему! смешно!

  2. методов автоматической и ручной очистки контекста по разным правилам.

  3. централизованного и понятного тулинга. но об этом сегодня я расскажу лишь частично, ибо тема для отдельного материала, хотя и в предлагаемом решении всё уже полностью реализовано.

  4. подсчёт токенов на клиентской стороне. ни у кого не видел из серьёзных интерфейсов кроме самого AI Studio — это прекрасная вещь! когда ты печатаешь, и сразу видишь сколько твои копипасты добавят тысяч токенов в текущее контекстное окно.

Для личного решения всех этих пунктов — осмеливаюсь представить вам 🧪lab!

🧪lab — это полностью бесплатная, с открытым исходным кодом, serverless, компактная, минималистичная и лёгкая альтернатива AI Studio и в целом интерфейс для повседневного общения с LLM.

https://labstudio.tech/

https://github.com/Talos‑popcorn/lab

Язык меняется в настройках

Язык меняется в настройках

Общее:

  • Хостится на Cloudflare Pages, нет никакого бекенда — только статика.

  • Поддерживает Ollama и OpenAI‑compatible провайдеров (а значит и gemini, и openrouter, и как я понимаю — всё что угодно)

  • Хранит все диалоги и настройки исключительно в браузере — в IndexedDB (с помощью Dexie.js).

Фичи:

  • Real time подсчёт всех токенов. На выбор даю общий js‑tiktoken и нативный токенайзер от Gemini, который на 99% точно считает по гуглу. Расхождение замечено порядка десятков токенов, не более. Сидеть и подбирать точные мета‑токены (мета‑информацию о самом диалоге, куски жсона которые так же учитывает сам Gemini при подсчёте) я посчитал бессмысленным по правилу Парето.

  • Автоочистка чата по скользящему окну. Опционально, конечно. Можно выставить 100к токенов, и спокойно общаться — после переваливания за порог интерфейс автоматически удалит самые старые сообщения, чтоб вернуться в диапазон. Удалит не более чем нужно.

  • Ручные инструменты очистки — «Оставить только последние N сообщений», «Удалить первые N», «Удалить N самых тяжёлых», «Сжать весь код в чате». Мне больше не нужно бегать и удалять по одному сообщению сверху!

  • Резервное копирование — можно выгрузить всё в жсоне и точно так же загрузить с другого устройства.

  • Изменение системного промпта — одно, глобальное!

  • Monaco Editor для просмотра генерируемого кода.

  • Интеграция с ToolHub — об этом мы поговорим в следующий раз, отдельная штуковина, она позволяет мне централизовать все MCP тулы и свои собственные в одно удобное пространство, которое я могу использовать везде. Т.к. конечно же, общаться с моделью без возможности хотя бы поиска в 2026 году уже не совсем интересно.

Не получится просто так взять и подключить labstudio.tech к локальной олламе. Нужно самой олламе объяснить, что она должна быть рада любому ориджину:

sudo systemctl edit ollama.service

И там дописываем:

[Service]

Environment=“OLLAMA_ORIGINS=*”

Если оллама крутится на локалхосте — этого должно быть достаточно. Если же где‑то в локальной подсети — ещё нужно будет разрешать браузеру insecure с https на http. Но проще, наверное, просто скачать репо себе и сделать bun run dev.

Конечно же — сразу говорю — я разработал это для себя и своих целей. У меня не стояло задачи удовлетворить хотелки всех пользователей подобных интерфейсов. Здесь нет каких‑либо категоричных инженерных изысков, невероятных алгоритмов, которые следовало бы запатентовать. Просто попробуй — я не прошу ни копейки, ничего не продаю, не рекламирую (кроме себя любимого, но любой материал с философской точки зрения и есть самореклама автора), не прикладываю никаких ссылок на тг каналы (только один небольшой баннер на сайте, но можно скачать проект себе и вырезать его — ваше право), если понравится — кому‑то в этом мире станет удобнее работать и жить, если не понравится — буду рад услышать почему именно.