惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

F
Full Disclosure
Recorded Future
Recorded Future
T
Tenable Blog
S
Securelist
C
CERT Recently Published Vulnerability Notes
T
Threatpost
S
Schneier on Security
A
Arctic Wolf
The Hacker News
The Hacker News
C
CXSECURITY Database RSS Feed - CXSecurity.com
Know Your Adversary
Know Your Adversary
P
Privacy International News Feed
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
The Register - Security
The Register - Security
Cisco Talos Blog
Cisco Talos Blog
AWS News Blog
AWS News Blog
K
Kaspersky official blog
T
True Tiger Recordings
T
Threat Research - Cisco Blogs
V
Vulnerabilities – Threatpost
P
Palo Alto Networks Blog
T
The Exploit Database - CXSecurity.com
小众软件
小众软件
B
Blog
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
Microsoft Azure Blog
Microsoft Azure Blog
Cyberwarzone
Cyberwarzone
C
Cybersecurity and Infrastructure Security Agency CISA
T
Tor Project blog
Spread Privacy
Spread Privacy
Malwarebytes
Malwarebytes
P
Proofpoint News Feed
F
Fox-IT International blog
F
Fortinet All Blogs
P
Privacy & Cybersecurity Law Blog
G
GRAHAM CLULEY
量子位
Latest news
Latest news
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
博客园 - 叶小钗
Project Zero
Project Zero
T
Tailwind CSS Blog
N
Netflix TechBlog - Medium
Martin Fowler
Martin Fowler
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
I
Intezer
博客园_首页
腾讯CDC
H
Hackread – Cybersecurity News, Data Breaches, AI and More
D
Darknet – Hacking Tools, Hacker News & Cyber Security

Все публикации подряд на Хабре

Nano Banana Google AI: как использовать Нано Банана для генерации и редактирования изображений Два игрока на весь российский рынок ИИ: что показал ЦИПР-2026 Менеджер ресурсов ЯНДЕКС 360 (YANDEX 360) промокоды июнь 2026: промокод Yandex 360 скидка 40% на годовые тарифы Ищу ранних тестировщиков для Android-версии agent harnesses Не используйте LLM для текста Увеличиваем продажи без слез аналитика Оптимизация запросов к PostgreSQL: 5 неочевидных настроек для продакшена 45 лет тюрьмы за DROP TABLE и переход Карпатого в Anthropic Планирование движения для ровера на ходовой Ackerman'а Революция в изучении языков Java — быстрая. Ваш код может таким не быть Как я опоздал на конкурс OpenAi с новой архитектурой нейросети Быстрые интеграции в 1С: прощайте, бесконечные переделки Как получить субсидию 300 миллионов от Минпромторга? preIPO Anthropic, OpenAI, SpaceX. Разбираемся — стоит ли участвовать? Entaxy ION + OPC UA: два способа получить данные с промышленного оборудования Память на миллион, а толку ноль: как мы спасали ИИ-агента от «тупости» РСЯ, AdSense или myTarget: что на самом деле в 2026 приносит больше денег сайту и причем тут монетизаторы Практическое построение сервисов на Go под реальный трафик PostgreSQL и аналитика: что меняется, когда хранилище становится общим Codex за 5 месяцев 2026: мой топ-5 релизов, что не зашло и где OpenAI обогнал Anthropic Как создать короткое видео с помощью нейросетей: Полный гайд по Veo 3.1, Kling 3.0 и Happy Horse 1.0 Алгоритм проверок физлиц от экс сотрудника ФНС Как ИИ портит резюме студентам Системные вызовы в сфере ИТ в 2026: стратегический взгляд для ИТ-руководителей Вайбкодинг заканчивается на localhost: как я строю SaaS для цифровизации коттеджных поселков с Codex Производственные риски в небольшом кастомном производстве. С чем я сталкивалась и как научилась это учитывать Подключаем ИИ органы чувств: bash-демон, пайка и самосознание на Raspberry Pi Я хотел повторить Growing Neural CA за вечер. Ушёл месяц Промт для генерации текста без ИИ следа — как писать уникальные тексты через нейросеть От capabilities к AppArmor: что реально остановит атакующего в контейнере CactOS Вектора интересов: как находить настоящую мотивацию и усиливать команды Цена безопасности [Перевод] Цена безопасности “Рубик” от пет-проекта до прода или ITIL 4 для строительно-торговых центров Чего ждать (и не ждать) от ремейка AC4 Black Flag Архитектурный тупик корпоративного хранения: почему смена модели не снимает ограничений и что с этим делать Атаки через подрядчиков, дефицит кадров и квест с импортозамещением: главные вызовы ИБ в 2026 году Я не оставлю детям наследства Почему порты стали «дверями» в сервер, и кто решил, что SSH будет 22 Почему зарубежные разработчики чипов возвращаются на китайские фабрики Как у меня НЕ получился торговый бот на Polymarket Проектирование архитектуры в нотации ArchiMate с использованием ИИ. Часть 2 Как превратить домашнюю файлопомойку в умную AI-галерею на основе сборки из x99+Xeon и видеокарты за 2 тыс рублей Перспективы заселения нашей галактики Кризис менеджмент в ИТ Reactive Programming не спасёт вас. Если вы не решили эти 5 проблем — у вас просто медленный монолит с Flux Как я делаю DIY-контроллер для ПК: громкость, приложения, MIDI, OBS Миграция микросервисов на Python с помощью LLM: экономим месяцы для разработчиков Программирование микросхем GAL и им подобных Почему таск-трекер не заменяет ИСУП: из чего состоит полноценный контур управления проектами Всё об информационной безопасности. Кибербезопасность. DevOps, CI/CD. Хакеры. Алексей Федулаев Как импортировать базу клиентов в amoCRM и навести порядок в контактах Как мы четыре раза переписали Outbox Google предлагает единый «водяной знак» для изображений, видео и текста, созданных ИИ Сексизм в IT: данные вместо домыслов Один фронтенд, чтоб править всеми, один фронтенд, чтоб всех найти: 1 точка входа, разные BI ИИ в тестировании: зачем мы пошли в пилот и почему начали с чата, а не с агентов Как я научила Telegram-бота наводить порядок в чате с мемами: пересылка по хештегам в соответствующую тему Как мы сделали внутреннюю CRM для управления студией – опыт Doubletapp Десятипальцевый метод — как печатать цифру " Шесть "? Партнерская программа по нейросетям: зарабатывай на ИИ, приводя клиентов в AI-сервис Как я сделал «клик по элементу → открыть в VS Code» за один вечер Эволюция Telegram‑бота на C++: от «лапши» в main() до ООП, in‑memory кэша и мутов по Фибоначчи Как я (внезапно) стал адвокатом вайб‑кодинга в корпорации Дизайн за 5 минут. Дайджест мая 2026 Только 17% всех 64-битных целых чисел можно разложить на два 32-битных 0,000000001% × ∞ = 100%. Вы осознаёте что любое событие неизбежно? «Вы либо трусы наденьте, либо крестик снимите». Как мы выиграли еще один суд против PR-агентства PRslon Почему вы тратите время не на переговоры, а на чужую внутреннюю драму. Как проходят переговоры с крупными компаниями Как приоритизировать регрессионные проверки, когда сжаты сроки релиза Электронные транспортные накладные: технический разбор нововведений 2026 года для логистов, разработчиков и бизнеса Как определить LLM под капотом чат-бота: учебный эксперимент по black-box fingerprinting Хабру 20 лет — зовём вас отметить это к нам Домой iPad как инструмент разработчика в эпоху агентного программирования Inspector v3: как я сделал свой центр управления Kubernetes на старом ноутбуке Как мы осваивали производство гибко-жёстких печатных плат: от проб и ошибок к рабочей технологии 30 лет мы внедряли в России Ansys. А потом он ушёл — и пришлось садиться писать собственный CAE для аддитивной печати Цифровой рубль и цифровой чек Облако под защитой от DDoS: чем On-Demand отличается от Always-On Распродажа в издательстве «Питер» Почему современный стадион больше похож на ЦОД, чем на арену Машина, которая учится думать Запихнули игровую приставку в короб и в первый же месяц продали на 3 млн Игровой ноутбук vs игровой ПК за те же деньги: что изменилось в 2026 году ГИС для Minecraft. Часть 1 Смена старого оборудования на новое убирает огромные затраты на его эксплуатацию — но куда девать всё это старое? Project Manager 2026: как AI-инструменты меняют профессию SLA как инструмент, а не отчёт. Часть 1. Как подружить бизнес и инженеров через общие цифры Послания от ангелов и первый шаг к компьютерам: стеганография Средневековья и Ренессанса Что новенького есть в CSS в 2026 году? Хватит мучить ChatGPT. Почему ваш промпт не сработает Как и зачем мы писали семантический слой для ИИ аналитики – SLayer Маленькая EVPN/VXLAN-фабрика без тупика: как мы запускали площадку в Амстердаме Репликация по DDIA: что я понял, только когда сам сломал прод RAG без downtime: настраиваем инкрементальное обновление документов на Qdrant и LangChain Тени истории: война машин. Как «Энигма» и «Фиалка» определили исход Второй мировой войны Как ускорить распознавание объектов нейросетями среди множества классов, не жертвуя памятью и точностью
Open-Source инструмент для автоматического перевода книг
sys_admin_sy · 2026-05-27 · via Все публикации подряд на Хабре

Уровень сложностиПростой

Время на прочтение5 мин

Охват и читатели2.3K

Кейс

Я перевел учебник по химии - OpenStax «Chemistry: Atoms First 2e», состоящий из 1200+ страниц: https://viacheslavsysoev.github.io/chemistry-atoms-first-russian/

Знание, к которому есть лицензия, но нет языка — это знание, к которому нет доступа.

У меня было две проблемы.

  1. Подписка на Claude с увеличенными лимитами, которые я не успевал использовать.

  2. Языковой барьер, который мешал мне читать книги, которые меня интересуют.

Знание лучших университетов мира формально доступно любому. Однако, между знанием и человеком стоит языковой барьер, и для огромной части мира он непреодолим. Школьник из посёлка с английским на тройку не сядет читать 1200-страничный учебник на чужом языке. Не потому, что глупый — а потому что когнитивная нагрузка двойного перевода делает обучение крайне сложным.

Логично предположить, что в эпоху, когда нейросеть сдаёт экзамены по медицине, задача «перевести книгу» решена. Я пошёл искать готовые сервисы.

Нашёл десяток. Все платные. Ладно, за платное обычно дают качество.

Меня в тот момент интересовала одна книжка. На русском её не было, а читать в оригинале не хотелось. Я решил заплатил неприличные деньги за автоперевод и получил PDF, в котором:

  • Терминология плавала: «активация» в третьей главе становилась «возбуждением» в седьмой.

  • Формулы стали бессмысленными надписями (сравнил с оригиналом)

  • Подписи к рисункам оказались посреди текста. Ссылки «см. рис. 4.2» вели в никуда.

  • Логики между разделами не было: ощущение, что каждый абзац переводился изолированно гугл переводчиком.

По этой книге было невозможно учиться. Я заплатил за машинный мусор в красивой обложке. И за это просят от 30 до 300 долларов.

И тут две мои проблемы сложились в одну. У меня есть простаивающие лимиты на сильной модели. И есть боль от того, что задача, которую эта модель обязана решать на современном уровне, рынком решается отвратительно — потому что у платных сервисов нет стимулов делать хорошо. Их главное достоинство - перевод от 2ух минут до 2ух часов.

Эта картина мне что-то напомнила. В 1983 году Ричард Столман увидел мир, в котором всё ПО становилось проприетарным, и сел писать GNU.

Я не Столман. Но логика та же: если рынок предлагает только плохие проприетарные решения задачи — нужно сделать открытое решение.

Я хочу построить open-source инфраструктуру автоматического перевода книг, удовлетворяющую трём условиям:

  1. Бесплатна. Клонируешь репозиторий, запускаешь локально или в подписке на LLM, которая у тебя уже есть. Без посредников.

  2. Качество, по которому можно учиться. С формулами, терминологией, ссылками, иллюстрациями.

  3. Обновляемая. Выходит второе издание — перегоняем. Книга — живой документ.

Я обкатал пайплайн на OpenStax «Chemistry: Atoms First 2e» — 1200 страниц, 21 глава, ~200 разделов с формулами и иллюстрациями. Лицензия CC BY-NC-SA 4.0.

Технические учебники — худший случай для перевода, и именно поэтому правильный полигон. Чтобы правильно перевести такую книгу, человек должен быть экспертом (1) в области знаний этой книги, (2) в области языка, на котором эта книга написана, и (3) в области языка, на который переводит. Автоперевод в таких книгах сложен, потому что:

  • Терминология должна быть единой на 1000+ страниц.

  • Формулы нельзя пересказать своими словами.

  • Структура линейна: косяк в 4.2 поедет в 7.3 и дальше.

Проблемы, которые встретились:

  1. Чтение формул ненадёжно. Копируя текст из PDF документа формулы наверняка потеряют смысл.

  2. Привязка иллюстраций к тексту. pdfimages извлекает картинки без подписей. Сопоставить «img-432 = Figure 7.5» — отдельная задача, иногда привязка съезжает.

  3. Стилистический дрейф. Даже с гайдом тон чуть гуляет между разделами.

  4. Стоимость. Мне пришлось потратить 6 пятичасовых лимитов Claude Opus 4.7 (по подписке с x5 лимитами). Если бы это решалось API запросами, то вышло бы, наверное, больше денег.

  5. Я не химик. Текст читается, терминология единообразна, формулы валидны, структура совпадает с оригиналом. Но смысловую точность в нюансах без живого химика не гарантирую.

Итоговый алгоритм:

Алгоритм работы автопереводчика

Алгоритм работы автопереводчика

Шаг 1. Три экстракции из PDF.

pdftotext не умеет в химию: H₂SO₄ превращается в H 2 SO 4. Поэтому из одного PDF делается три источника утилитами poppler-utils:

# Текст, который будет использован для перевода
pdftotext -layout chemistry-atoms-first-2e.pdf original_text.txt

# Исходные страницы, превращённые в PNG картинки, чтобы понять, как разместить таблицу или картинку
pdftoppm -png -r 200 chemistry-atoms-first-2e.pdf pages/page

# Исходные картинки, использованные в книге, чтобы не вырезать их ножницами
pdfimages -all chemistry-atoms-first-2e.pdf images/img

Текст — для прозы. PNG страниц — то, на что модель смотрит глазами через multimodal, когда в расшифровке мусор. Изображения — для привязки к рисункам.

Шаг 2. Декомпозиция. Одна большая LLM-сессия не работает: контекст переполняется, тон плывёт, терминология расходится. Поэтому много маленьких независимых сессий, координируемых через файловую систему.

Один раздел учебника (5–15 страниц) = один запуск агента. Контекст: гайд, глоссарий, диапазон страниц, PNG.

Шаг 3. Когерентность через глоссарий. Главное ноу-хау против разнобоя — растущий GLOSSARY.md. Перед использованием нового термина агент смотрит туда. Если термина нет — добавляет. Следующий агент уже видит решение. Терминология сходится сама собой.

Шаг 4. State machine. Каждый раздел проходит pending → draft → review → done. Агенты независимо друг от друга что-то решили или ошиблись? Это обнаружится на ревью. Которое тоже сделает нейросеть. Человеку только в конце дадим уже максимально логичный вариант на проверку.

Шаг 5. Рендер. Статический сайт на MkDocs Material + MathJax/mhchem. Деплой — GitHub Pages. На каждой странице кнопка «Редактировать» открывает Markdown в GitHub-редакторе: правка через PR.

Уточнение:

Разговор шел про Open-Source, но используется Claude. Почему?

Локальные LLM наверняка способны проделать тот же самый труд, однако у меня нет топовых видеокарт, точно так же, как и сотен тысяч рублей на их покупку.

Подписка выглядит более дешевым вариантом. Покупая Claude, наравне с их моделями мы получаем и их вычислительные мощности. А эти мощности не получится вынести в "open-source".

Заключение

Если вы химик, преподаватель, аспирант, толковый старшекурсник или просто интересующийся — зайдите и потыкайте. Особенно полезен взгляд на терминологию, формулировки законов и сравнение с оригиналом. На каждой странице сайта — кнопка «Редактировать»: правка через pull request за три клика.

Если бы у вас в руках появился такой инструмент — работающий, бесплатный, открытый — какую книгу вы бы прогнали первой? Что из непереведённого вам больно не иметь под рукой? Для следующего перевод я могу выбрать именно вашу книгу.

## Ссылки

- 📘 Оригинал книги: [Chemistry: Atoms First 2e](https://openstax.org/details/books/chemistry-atoms-first-2e)

- ⚖️ Лицензия: [CC BY-NC-SA 4.0](https://creativecommons.org/licenses/by-nc-sa/4.0/)

- 🌐 Сайт перевода: https://viacheslavsysoev.github.io/chemistry-atoms-first-russian/

- 📦 Репозиторий: https://github.com/ViacheslavSysoev/chemistry-atoms-first-russian

- 🪄 Проект автоперевода: (https://github.com/ViacheslavSysoev/perevodnik)