惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

TaoSecurity Blog
TaoSecurity Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
S
SegmentFault 最新的问题
B
Blog
博客园_首页
博客园 - 聂微东
GbyAI
GbyAI
U
Unit 42
L
LangChain Blog
Y
Y Combinator Blog
美团技术团队
IT之家
IT之家
H
Help Net Security
大猫的无限游戏
大猫的无限游戏
J
Java Code Geeks
V
V2EX
爱范儿
爱范儿
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
Microsoft Security Blog
Microsoft Security Blog
A
About on SuperTechFans
雷峰网
雷峰网
P
Palo Alto Networks Blog
Google DeepMind News
Google DeepMind News
The Hacker News
The Hacker News
宝玉的分享
宝玉的分享
Stack Overflow Blog
Stack Overflow Blog
T
Tenable Blog
Martin Fowler
Martin Fowler
酷 壳 – CoolShell
酷 壳 – CoolShell
Apple Machine Learning Research
Apple Machine Learning Research
A
Arctic Wolf
V
Vulnerabilities – Threatpost
罗磊的独立博客
The GitHub Blog
The GitHub Blog
C
Cisco Blogs
Simon Willison's Weblog
Simon Willison's Weblog
Microsoft Azure Blog
Microsoft Azure Blog
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
Recorded Future
Recorded Future
AWS News Blog
AWS News Blog
S
Schneier on Security
P
Privacy International News Feed
Engineering at Meta
Engineering at Meta
N
Netflix TechBlog - Medium
MongoDB | Blog
MongoDB | Blog
L
Lohrmann on Cybersecurity
D
DataBreaches.Net
阮一峰的网络日志
阮一峰的网络日志
G
GRAHAM CLULEY

Все публикации подряд на Хабре

Ловим музу за клавиатуру: как айтишнику стать автором Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента Никто не любит писать тесты, но ИИ может исправить это IPv8 выглядит как мечта. Поэтому почти наверняка не взлетит Производители вернули в продажу материнки с DDR3. Что происходит? Управление агентом с телефона через Telegram теперь в KodaCode От координации к лидерству: как меняется роль руководителя разработки Я сделала родителям бизнес вместо пенсии: зарабатываем 70 тысяч, мама не даёт продать В три раза быстрее приемка товара и оптимизация трудозатрат на 73%: как «РСТ-Инвент» помог Gulliver Group ИИ-шечный мир победил? О влиянии искусственного интеллекта на игропром Кремль снижает давление на Телеграмм пока Европа строит интернет по паспорту Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением Как (не) потерять домен за выходные Вместо 8 разных VPS: как я организовал практику студентам на одном сервере Почему твой Open Source проект не замечают? R&D: искусство управления неопределенностью в разработке AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет Мы отдали управление роботами OpenClaw. Что из этого вышло Галактический ID: система идентификации для всех форм разумной жизни Кто решает судьбу вашего проекта? Разбираем заинтересованные стороны. BABOK #1 Код-ревью, в котором дело не в коде Данные переехали. Команда — нет Системной подход к сдаче OSWE в 2025 Почему комната управления реактором покрашена в цвет морской пены 4 YAML-файла вместо PySpark: как аналитикам строить пайплайны без разработчиков LLM-агент для поиска свободных доменов: автоматизируем подбор Когда, зачем и как правильно начинать новую сессию в Claude Code? Как я заставил нейросеть писать макросы для FreeCAD Анатомия ИИ‑агента для подбора персонала. От тысячи резюме к топ‑10 за минуты Опыт разработчика как экономика внимания Автономность как точка невозврата: кто будет субъектом в цифровом будущем Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты Как измерить LLM для задач кибербеза: обзор открытых бенчмарков Где хранить код? Сравнение GitHub, GitLab и Bitbucket Математика объясняет, почему нормальное распределение встречается повсюду Почему ваш FinOps не работает: 12 тезисов от практиков Как подписать проектную документацию УКЭП с использованием бесплатных лицензий Pilot Адаптивное администрирование Sigla Vision Я грузил уран в бочки, а потом 20 лет строил ИТ в атомной отрасли Чем позвонить с Эвереста? История и обзор спутниковой связи. Часть 2 Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии Как не передать на desktop свой IP в РКН Анатомия SAP Privileges: как устроено управление правами в macOS MoneyDev: Сказка про три главных слова Обновлённый токенизатор видео K-VAE 2.0 от Сбера Как сделать диспетчеризацию дома на 1284 квартиры почти бесплатно Как мы разогнали железную дорогу Мы дали агентам рутину. Теперь надо решить — что делать с освободившимся временем Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM Умный город начинается с точного взгляда: как «Фалькон Тех» меняет пространство к лучшему Навайбкодил приложение для анализа графов Почему Дюну так интересно читать? Упрощаем работу с рутиной или как стать Гендальфом Белым Деконструкция Go: CPU, RAM и что там происходит. Go Assembler база. Часть 1.1 Какие профессии исчезнут из-за ИИ, а какие появятся? И что с этим делать Как мы построили IT-отдел, где хочется расти: архитектурные встречи, прозрачные метрики и книжные подарки Rufler: Делаем из Claude Code автономный рой через один YAML-конфиг Sing-box и белый список приложений Как построить надёжный обмен сообщениями в микросервисах: лучшие практики для enterprise OpenAI строит MLM-пирамиду, а McKinsey и Accenture помогают ей в этом Дом, который не построил Фишер (Часть 2) «Сверхзвуковой математик» против «Вдумчивого логиста»: битва алгоритмов 3D-упаковки Мультимодальные модели – грубый и дорогой инструмент Разговоры ничего не стоят. Код тоже Проверки физических лиц: с кого начнет ФНС Топ-10 бесплатных нейросетей для создания видео в 2026 году Первые слои кода: как наши решения сегодня определяют архитектуру ИИ на десятилетия Разработка нового статического анализатора: PVS-Studio JavaScript Поиск уязвимостей ПО: базовый минимум или роскошный максимум Почему оценка персонала не работает как инструмент управления Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50% Как я ушел из найма, нажарил косточек и продал на маркетплейсах на 168 млн в год Когда 1С:ERP уже внедрена, а нормального производственного плана всё ещё нет Как я сделал Claude мультимодальным, подключив к нему Qwen Omni Как приглашение на вакансию мечты превращается в атаку Infrastructure as Code: философия и лучшие практики IaC Тестируем Yandex Code Assistant на задаче, в которой нужно хранить секреты nxs-universal-chart v3.0: новое поколение универсального Helm-чарта Callback Injection: Техника, которая отправила Microsoft Defender в глухой нокаут «Все идеи на стол»: митап как способ вывести проект из тупика Сегодня я узнал нечто новое о GPU благодаря багу в своей игре Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать Карта событий как фундамент аналитики: практический кейс для E-commerce Что выбрать для AI: x86, ARM или RISC-V? Дайджест железа за март Роль соматических мутаций в развитии аутоиммунных заболеваний: путь к избирательной терапии Mythos от Anthropic — тревожный сигнал для всех, а не только для банков Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение Финансовая гонка вооружений: почему умные люди добровольно в ней участвуют Эра ИИ-агентов наступила: выбираем лучшего цифрового сотрудника # Практический опыт внедрения WinCC Redundancy на производственном предприятии Сделал MVP за 3 дня, а потом неделю прикручивал оплату. Оно того стоило? Физика против Маска: почему Starship V3 может оказаться ещё одной катастрофой Нефть Венесуэлы: крупнейшие запасы в мире, но не крупнейшая нефтяная держава JPA 4. Переосмысление Hibernate Почему зеркальная фотокамера Nikon D5 десятилетней давности идеально подошла для миссии «Артемида-2» Проект «Уровень-Спутник» или как мы сделали платформу для гидрологов «Замедлиться, чтобы ускориться»: почему ИИ повышает цену ошибок в требованиях и архитектуре Как с нуля поднять трафик IT-компании на 1657% при бюджете 55 тыс. и выжить Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь
Я четыре месяца диктовал дневник AI-агенту. Вот почему память оказалась важнее модели
Алексей Синяев · 2026-06-13 · via Все публикации подряд на Хабре

Средний

11 мин

1.5K

Это личный инженерный эксперимент, а не медицинский инструмент. Система помогает фиксировать наблюдения и готовить вопросы специалисту, но не ставит диагнозы и не заменяет врача или психолога.

Личные примеры в статье основаны на моих наблюдениях, но отдельные формулировки и детали я обобщил, чтобы не публиковать дневник дословно.

Через четыре месяца ежедневных записей я попросил агента проанализировать прошедший месяц. Ответ выглядел убедительно: связный текст, аккуратные формулировки, похожие на настоящие выводы.

Проблема была в том, что агент не прочитал большую часть моих записей. Файлы лежали рядом, на том же диске, но в анализ попали лишь случайные фрагменты. Остальное модель достроила сама, и сделала это так гладко, что я почти ничего не заметил.

Именно тогда я понял главное: в персональном дневнике память и доступ к данным важнее самой модели. Можно взять самую сильную LLM, но если она не прочитала источник, её выводам нельзя доверять.

А до этого вечера система работала так. В 21:00 телефон коротко вибрирует. Бот спрашивает, как я спал, сколько было энергии, что происходило на работе, была ли тренировка и что сильнее всего повлияло на день.

Я не открываю отдельное приложение и не двигаю слайдеры. Зажимаю кнопку записи в Telegram и секунд сорок говорю как есть:

Спал около семи часов. Утром была силовая, но после обеда энергия резко упала. На работе два релиза, поесть нормально не успел. Настроение в целом нормальное, раздражительность выше обычного.

На полке в другой комнате старый ноутбук распознаёт речь и передаёт текст агенту. Тот сохраняет исходник, заполняет служебные поля, делает коммит и присылает короткую сводку. Если не хватает важного, задаёт один вопрос.

Так я впервые продержался с дневником не три дня и не три недели, а несколько месяцев.

Сначала мне казалось, что я строю ещё одного AI-ассистента. В итоге оказалось, что я решаю две более прозаичные задачи:

  1. Сделать ежедневную запись настолько простой, чтобы её было легче сделать, чем отложить;

  2. Хранить историю так, чтобы любой вывод можно было проверить по исходным записям.

Дальше расскажу, как старый Xiaomi Mi Gaming Laptop стал домашним AI-сервером, что в итоге заработало и почему даже сильная модель начинает додумывать факты, если не дать ей нужные записи.

Если коротко, вот цифры за четыре месяца:

Срок использования

4 месяца, ~120 дневных записей

Непрерывный uptime

35 дней без перезапуска

Стоимость мая

$1.91 (период экспериментов с моделями)

Первые 13 дней июня

$0.44 на flash-модели

Скорость распознавания

22 секунды аудио → 2,17 секунды транскрипции

Железо

GTX 1060 6 GB, 16 GB RAM, Ubuntu 24.04

Но самым неожиданным результатом оказались не стоимость и не железо. Самой сложной задачей оказалось заставить модель читать нужные записи.

Почему все мои предыдущие дневники умирали

Я пробовал бумажные блокноты, заметки в телефоне, Notion и приложения-трекеры. Сценарий всегда был одинаковым.

Первые дни интересно. Потом однажды нет сил заполнять форму. На следующий день возникает долг уже за два дня. Через неделю дневник начинает напоминать не об осознанности, а о невыполненной обязанности.

Проблема была не в отсутствии нужных полей. Наоборот, полей всегда было слишком много. Между мыслью «сегодня я почему-то выжат» и сохранённым наблюдением стояли приложение, форма, категории, шкалы и необходимость писать связный текст.

Telegram уже открыт у меня десятки раз в день. Голосовое не требует формулировать идеальную запись. Поэтому главный интерфейс моей системы — не дашборд и не чат с красивым аватаром, а обычная кнопка записи.

Через месяц интерес к новой игрушке прошёл. Остался короткий ритуал: напоминание, сорок секунд речи, подтверждение. Именно тогда я понял, что дневник прижился.

Старый игровой ноутбук получил вторую работу

В 2019 году я купил Xiaomi Mi Gaming Laptop. Внутри:

Компонент

Конфигурация

CPU

Intel Core i7-8750H, 6 ядер / 12 потоков

GPU

GTX 1060 Mobile, 6 GB VRAM

RAM

16 GB

OS

Ubuntu 24.04 LTS

С 2021 года я почти перестал играть, и несколько лет ноутбук стоял без дела. В начале 2026 года я решил не покупать отдельный сервер под очередной AI-эксперимент, а использовать то, что уже есть.

Забавно, что самая дорогая часть этой системы несколько лет пылилась на полке. Я ожидал, что главным ограничением окажется GTX 1060. В итоге самым сложным оказался не GPU, а доступ модели к нужным данным.

Для домашнего сервера игровой ноутбук оказался неожиданно удобным: работает достаточно тихо для домашнего офиса, батарея переживает короткие отключения питания, а старая видеокарта всё ещё хорошо ускоряет распознавание речи. Полноценным ИБП это не считается: батарея не защищает роутер и не заменяет контролируемое завершение работы.

Первую версию я строил на OpenClaw, но платформа оказалась шире, чем мне нужно: я использовал небольшую её часть, а настраивать приходилось систему целиком. Следующую версию собрал на Hermes Agent от Nous Research — открытом фреймворке, который принимает сообщения, вызывает модели и запускает инструменты. Не путайте его с семейством моделей Hermes-3 той же компании.

Оказалось, что одной модели недостаточно

В системе нет одной модели, которая делает всё. Задачи разделены:

Telegram (доступ только по allowlist)
        |
        v
Hermes Gateway на Ubuntu
  |-- faster-whisper: локальное распознавание речи
  |-- DeepSeek: приводит текст к единому формату
  |-- vision-модель: разбирает скриншоты
  |-- journal skill: создаёт и обновляет записи
  |-- reflection skill: готовит сводки
  `-- расписание: напоминает в 21:00
        |
        v
Markdown vault
  |-- Obsidian для чтения и графиков
  `-- Git -> приватный репозиторий

Hermes связывает все части между собой. Голос распознаёт Whisper, текст приводит к единому формату недорогая модель DeepSeek через API, картинки разбирает отдельная vision-модель, а окончательная версия истории хранится в файлах. Отдельного HTTP-сервиса между Hermes и Whisper нет: faster-whisper установлен как voice-зависимость в Python-окружение Hermes и вызывается самим gateway. Голосовое проходит через Telegram, но распознаётся уже на ноутбуке и не уходит ещё одному облачному сервису.

Проверенная на 7 июня 2026 года конфигурация распознавания:

  • faster-whisper 1.2.1;

  • модель medium (multilingual);

  • CUDA 12.2;

  • compute_type: int8_float32;

  • GTX 1060 с 6 GB VRAM.

Одно тестовое голосовое длительностью 22 секунды распозналось за 2,17 секунды, то есть примерно в десять раз быстрее реального времени. Это не полноценный тест производительности: результат зависит от аудио, языка и нагрузки на ноутбук. Для дневника мне было важнее другое: ждать приходится несколько секунд, а не минуту.

GPU при этом не обязателен. Faster Whisper работает и на CPU, только медленнее. Смысл моей конфигурации не в том, что всем нужна GTX 1060, а в том, что старое железо может закрыть конкретную локальную задачу. Пытаться разместить на 6 GB VRAM качественную большую LLM я не стал.

На ту же дату процесс Hermes работал без перезапуска 35 дней, занимал около 5,7 ГБ памяти и накопил 6 часов 27 минут процессорного времени. Это просто замер на конкретную дату, но его достаточно, чтобы понять: для такой нагрузки старого ноутбука хватает.

Запись должна пережить модель

Каждый день хранится в обычном файле:

wellbeing-journal/
  daily/
    2026/
      06/
        2026-06-07.md
  weekly/
  reflections/
  attachments/
  _system/
    scales.md
    schema.md

Пример служебных полей в начале файла, или YAML frontmatter:

---
date: 2026-06-07
sleep_hours: 7
energy: 4
mood: 4
stress: 2
tags: [work, strength-training, poor-sleep]
needs_review: false
---

Ниже находятся аккуратная сводка и отдельный раздел Raw с исходным текстом. Исходник нельзя заменять пересказом модели: анализ можно сделать заново, а потерянный текст уже не восстановить.

Повторное сообщение за тот же день обновляет файл с этой датой, а не создаёт 2026-06-07-final-2.md. Перед коммитом программа проверяет структуру записи. Данные из скриншотов получают пометки source: ocr и needs_review: true: их нужно подтвердить вручную.

Шкалы настроения, энергии и стресса описаны в _system/scales.md. Без якорей моя сегодняшняя «энергия 4» и «энергия 4» через месяц могут означать разные состояния. Система не должна угадывать значение по тону, если я назвал его сам.

Git здесь хранит историю исправлений и служит резервной копией. Если Whisper неправильно распознал упражнение, я могу открыть исходную расшифровку и увидеть, когда появилась правка.

Если завтра я заменю Hermes или DeepSeek, сами записи останутся обычными Markdown-файлами. Для меня в этом и состоит их долговечность: данные не зависят от памяти одной модели или формата одного сервиса.

Где проходят границы приватности

Приватный репозиторий GitHub — это ограничение доступа, а не сквозное шифрование. Telegram видит сообщения, DeepSeek получает отправленный ему текст, модель для изображений видит картинки, а GitHub хранит копию дневника. Поэтому называть систему полностью локальной или полностью приватной было бы неправильно.

Агент не помнит ваш архив

Вернусь к тому вечеру, с которого начал. Записей накопилось много, я попросил агента проанализировать месяц и получил связный, уверенный ответ. Модель не читала архив, но отвечала так, будто читала.

Ответ выглядел правдоподобно по понятной причине: он опирался на настоящую структуру дневника. Знакомые теги, привычные формулировки, та же интонация, что и в моих записях. Внешне это не отличалось от честного разбора. Поэтому принять его за правду было очень легко: ничто в тексте не сигнализировало, что под выводами почти нет данных.

Конкретный пример. Среди прочего агент написал: «падение энергии во второй половине месяца связано с нагрузкой на работе — спады приходятся на дни релизов». Звучало логично и совпадало с моим ощущением, поэтому я почти кивнул. Но решил проверить и открыл записи за те даты вручную. Выяснилось, что в дни с самой низкой энергией я писал про сон по пять-шесть часов, а половина этих записей вообще не попала в анализ: модель прочитала несколько файлов из начала месяца и достроила остальное. Поле sleep_hours в выводе не фигурировало ни разу. Вывод про работу был не ложным, он был построен на неполных данных: реальный сигнал про сон просто не дошёл до модели, потому что нужные файлы не были прочитаны.

Это не баг конкретной модели, а инженерная проблема. Память разговоров, история сессий и Markdown-файлы на диске — три разные вещи. Файлы лежали рядом с агентом, но это не значит, что он их прочитал. На вопрос «что происходило со мной в июне?» модель берёт случайно доступные фрагменты и достраивает пробелы — так она и устроена. Для личной истории это особенно опасно: правдоподобную генерацию легко принять за воспоминание системы.

Поэтому правило теперь жёсткое:

Любой вывод по истории должен ссылаться на конкретные прочитанные записи. Нет источника — нет вывода.

Поэтому перед месячным разбором я отдельно собираю данные:

  1. скрипт выбирает дневные записи за нужные даты;

  2. парсит YAML и считает покрытие метрик;

  3. добавляет недельные сводки;

  4. складывает всё нужное в один компактный файл;

  5. только после этого модель ищет повторения и формулирует гипотезы.

В начале анализа я указываю период, количество прочитанных файлов и полноту данных. Например:

Период: 2026-05-01 — 2026-05-31
Прочитано daily-файлов: 27/31
Сон: данные за 24/31 дней
Энергия: данные за 27/31 дней
Тренировки: 11 записей

Фраза «средний сон — 7,2 часа» бесполезна без количества заполненных дней. Если среднее рассчитано по двум дням из тридцати, делать по нему выводы нельзя.

Пока архив небольшой, мне хватает дат, тегов, полнотекстового поиска и недельных сводок. Векторная база сама по себе не сделает ответы надёжными: всё равно придётся показывать, из каких записей взялся вывод. Семантический поиск понадобится, когда обычный перестанет находить одно и то же событие, описанное разными словами.

Что дневник действительно помог заметить

Самые полезные находки оказались не сенсационными. Я многое из этого и так «знал», но не видел повторяемость.

Первая связка: поздний сериал, короткий сон, тяжёлое утро и слабая тренировка. Один такой день ничего не доказывает. Когда одинаковая последовательность повторяется несколько раз и рядом лежат датированные записи, торговаться с собой становится сложнее.

Вторая связка оказалась неожиданнее. После приёма мелатонина мне было трудно просыпаться, и первая половина дня проходила в заторможенном состоянии. По памяти это выглядело как несколько случайных плохих утр. В журнале повторение стало заметно.

Это не медицинский вывод и не рекомендация другим. Это личная корреляция, которую можно обсудить со специалистом.

Ещё один полезный эпизод начался с фразы: «стресса не чувствую, но всё бесит». Раньше я бы записал просто «плохой день». В истории было видно другое: несколько ночей с прерывистым сном, низкая энергия, нормальная оценка стресса и высокая раздражительность.

В сводке появилась формулировка: «после недосыпа у тебя меньше терпения». Ничего нового модель не открыла. Она просто помогла разделить два состояния, которые я раньше смешивал.

Иногда месячная сводка делает обратное: не подтверждает драматичное ощущение. Плохая пятница может запомниться как «вся неделя была ужасной», хотя три предыдущих дня в записях были нормальными. Для меня это не менее ценно, чем поиск негативных паттернов.

Что ломалось и чему это научило

1. Большая платформа не обязательно лучше

Первая система на OpenClaw поддерживала гораздо больше интеграций, чем мне требовалось: в реальности нужны были один Telegram-канал, одна модель и один ежедневный сценарий. Для моего узкого сценария её возможности оказались избыточными, а чинить всё равно приходилось систему целиком. После перехода на Hermes схема стала меньше и понятнее лично мне.

2. Более крупная модель Whisper не решила мою проблему

Повторяющиеся ошибки в именах упражнений и сервисов лучше исправил небольшой словарь подтверждённых замен, чем попытка везде использовать более тяжёлую модель.

Услышано

Каноничный термин

Контекст

“хэви”

Hevy(приложение для учета тренировок)

тренировка

“язио”

YAZIO(приложение для учета ккал)

питание

Замены применяются только в подходящем контексте, а исходная расшифровка сохраняется.

3. OCR нельзя считать фактом

Модель может перепутать на скриншоте 60 и 80 килограммов или потерять десятичную точку. Поэтому оригинал хранится рядом, распознанные цифры помечаются для проверки, а подтверждаю их я.

4. Пустое значение лучше выдуманного

Если я не назвал вес или длительность сна, поле остаётся пустым. Ноль испортил бы график, а догадка модели — доверие к архиву.

5. Один вопрос лучше анкеты

Если данных не хватает, бот задаёт одно компактное уточнение. Цель системы — сохранить привычку, а не добиться идеального заполнения любой ценой.

6. Автоматический коммит нужно проверять

Перед коммитом программа проверяет структуру записи и ищет случайно попавшие в неё ключи доступа. Если отправить изменения на GitHub не удалось, файл всё равно остаётся на ноутбуке.

Сколько это стоит

Вот реальные расходы на текстовую модель за два месяца. Это стоимость работы всего агента, а не только вечерних записей: сюда входят эксперименты, периодические проверки, задачи по расписанию, работа с инструментами, уточнения и месячные разборы. Поэтому дневник сам по себе стоил бы дешевле.

Май 2026: я ещё экспериментировал с моделями, поэтому основная часть запросов шла через deepseek-v4-pro. Итого за месяц — $1.91: 880 запросов к pro и 159 к flash, 30,5 миллиона учтённых токенов у pro и ещё 8,6 миллиона у flash.

Май 2026 года: период экспериментов с двумя моделями обошёлся в $1.91.

За первые 13 дней июня 2026 года я полностью перешёл на deepseek-v4-flash: 508 запросов, 26,3 миллиона токенов и $0.44 расходов. Если нагрузка останется похожей, полный месяц будет стоить примерно доллар. Понятно, что это грубый расчёт по первым 13 дням, но порядок цифр уже виден.

Первые 13 дней июня 2026 года после перехода на flash: $0.44.

Слой

Реальная стоимость

faster-whisper локально

без API-платы; электричество отдельно

Текстовый API

около $1–2/мес для всего агента при моей текущей нагрузке

Обработка изображений

отдельный бюджет, использую несколько раз в месяц

Git / Obsidian

$0 (приватный репозиторий на GitHub Free и локальный Obsidian)

У другого пользователя сумма будет иной: она зависит от объёма переданного текста, выбранной модели, количества обращений к инструментам и частоты запросов.

Ежедневные записи обрабатывает недорогая модель. Более сильную можно подключать только для редкого месячного разбора. Но качество разбора всё равно зависит прежде всего от того, какие записи ему передали.

Почему я не отдал всё готовому ассистенту с памятью

Память готового ассистента и личный архив решают разные задачи. Ассистент может запоминать полезный контекст между разговорами, но мне нужны конкретные датированные записи, которые можно прочитать, проверить и перенести в другую систему.

Я не хочу зависеть от того, можно ли выгрузить внутреннюю память сервиса целиком и увидеть, что именно там сохранено. Для дневника мне важнее иметь возможность открыть записи за март и проверить ответ по исходным файлам.

Markdown-файл открывается любым редактором без учётной записи. Git-репозиторий клонируется одной командой. Схему можно изменить скриптом. Модель можно заменить, не теряя ни одной записи.

Вот что меня удивило больше всего. Я строил систему вокруг локальной LLM, GPU-ускорения и автономного агента, а самым надёжным её элементом оказалась обычная папка с текстовыми файлами по датам. Whisper можно поменять, DeepSeek заменить, Hermes переписать, ноутбук выбросить — переживёт всё это именно папка. Модели приходят и устаревают каждые несколько месяцев, а текстовый файл с датой в имени переживёт их все.

Самая надёжная технология во всей системе оказалась самой старой: обычный текстовый файл.

Что осталось после четырёх месяцев

Дневник не сделал меня автоматически здоровее и дисциплинированнее. Я всё ещё могу лечь поздно, пропустить запись или проигнорировать очевидную связь между недосыпом и тяжёлым днём.

Он сделал другое: последствия решений стали видимыми.

Из проекта я вынес несколько правил:

  • постоянство важнее полноты: тридцать неидеальных записей полезнее семи идеальных;

  • простые правила важнее умной модели: один файл на день, единая структура, пустое значение вместо догадок и ссылки на исходные записи;

  • сырой ввод нужно хранить отдельно от интерпретации;

  • корреляция в дневнике — повод наблюдать и задать вопрос, а не ставить себе диагноз;

  • история должна храниться в понятных файлах, которые можно проверить и перенести в другую систему.

Старый ноутбук не стал Джарвисом. Он стал внимательным интерфейсом к моим собственным записям.

Это оказалось полезнее обещаний, что AI однажды поймёт меня лучше меня самого. Пока он просто возвращает мне мои же записи и показывает, где они начинают повторяться.


Мне интересно, на каком объёме личного Markdown-архива вы бы перестали полагаться на даты, теги и обычный поиск и добавили семантический. И как при этом показывали бы, из каких записей модель сделала каждый вывод?

Дополнительные материалы

Подробную установку, месячный разбор и расчёт стоимости я вынес в серию из трёх статей, чтобы не превращать этот текст в длинный мануал.