惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

A
About on SuperTechFans
C
Cyber Attacks, Cyber Crime and Cyber Security
Google DeepMind News
Google DeepMind News
C
Check Point Blog
H
Hackread – Cybersecurity News, Data Breaches, AI and More
Stack Overflow Blog
Stack Overflow Blog
云风的 BLOG
云风的 BLOG
Microsoft Azure Blog
Microsoft Azure Blog
P
Proofpoint News Feed
爱范儿
爱范儿
F
Fortinet All Blogs
博客园_首页
博客园 - Franky
博客园 - 聂微东
腾讯CDC
博客园 - 三生石上(FineUI控件)
MongoDB | Blog
MongoDB | Blog
Schneier on Security
Schneier on Security
N
News and Events Feed by Topic
Help Net Security
Help Net Security
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
B
Blog
O
OpenAI News
The Last Watchdog
The Last Watchdog
N
News | PayPal Newsroom
Recent Announcements
Recent Announcements
V
Visual Studio Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
S
SegmentFault 最新的问题
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
Cloudbric
Cloudbric
Forbes - Security
Forbes - Security
Webroot Blog
Webroot Blog
阮一峰的网络日志
阮一峰的网络日志
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
PCI Perspectives
PCI Perspectives
Y
Y Combinator Blog
Blog — PlanetScale
Blog — PlanetScale
Security Archives - TechRepublic
Security Archives - TechRepublic
月光博客
月光博客
SecWiki News
SecWiki News
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
美团技术团队
S
Security @ Cisco Blogs
IT之家
IT之家
人人都是产品经理
人人都是产品经理
H
Hacker News: Front Page
H
Heimdal Security Blog
V
Vulnerabilities – Threatpost
The Hacker News
The Hacker News

Все публикации подряд на Хабре

Ловим музу за клавиатуру: как айтишнику стать автором Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента Никто не любит писать тесты, но ИИ может исправить это IPv8 выглядит как мечта. Поэтому почти наверняка не взлетит Производители вернули в продажу материнки с DDR3. Что происходит? Управление агентом с телефона через Telegram теперь в KodaCode От координации к лидерству: как меняется роль руководителя разработки Я сделала родителям бизнес вместо пенсии: зарабатываем 70 тысяч, мама не даёт продать В три раза быстрее приемка товара и оптимизация трудозатрат на 73%: как «РСТ-Инвент» помог Gulliver Group ИИ-шечный мир победил? О влиянии искусственного интеллекта на игропром Кремль снижает давление на Телеграмм пока Европа строит интернет по паспорту Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением Как (не) потерять домен за выходные Вместо 8 разных VPS: как я организовал практику студентам на одном сервере Почему твой Open Source проект не замечают? R&D: искусство управления неопределенностью в разработке AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет Мы отдали управление роботами OpenClaw. Что из этого вышло Галактический ID: система идентификации для всех форм разумной жизни Шесть основ бизнес-анализа: начинаем с вопроса «Кто в игре?» Код-ревью, в котором дело не в коде Данные переехали. Команда — нет Системной подход к сдаче OSWE в 2025 Почему комната управления реактором покрашена в цвет морской пены 4 YAML-файла вместо PySpark: как аналитикам строить пайплайны без разработчиков LLM-агент для поиска свободных доменов: автоматизируем подбор Когда, зачем и как правильно начинать новую сессию в Claude Code? Как я заставил нейросеть писать макросы для FreeCAD Анатомия ИИ‑агента для подбора персонала. От тысячи резюме к топ‑10 за минуты Опыт разработчика как экономика внимания Автономность как точка невозврата: кто будет субъектом в цифровом будущем Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты Как измерить LLM для задач кибербеза: обзор открытых бенчмарков Где хранить код? Сравнение GitHub, GitLab и Bitbucket Математика объясняет, почему нормальное распределение встречается повсюду Почему ваш FinOps не работает: 12 тезисов от практиков Как подписать проектную документацию УКЭП с использованием бесплатных лицензий Pilot Адаптивное администрирование Sigla Vision Я грузил уран в бочки, а потом 20 лет строил ИТ в атомной отрасли Чем позвонить с Эвереста? История и обзор спутниковой связи. Часть 2 Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии Как не передать на desktop свой IP в РКН Анатомия SAP Privileges: как устроено управление правами в macOS MoneyDev: Сказка про три главных слова Обновлённый токенизатор видео K-VAE 2.0 от Сбера Как сделать диспетчеризацию дома на 1284 квартиры почти бесплатно Как мы разогнали железную дорогу Мы дали агентам рутину. Теперь надо решить — что делать с освободившимся временем Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM Умный город начинается с точного взгляда: как «Фалькон Тех» меняет пространство к лучшему Навайбкодил приложение для анализа графов Почему Дюну так интересно читать? Упрощаем работу с рутиной или как стать Гендальфом Белым Деконструкция Go: CPU, RAM и что там происходит. Go Assembler база. Часть 1.1 Какие профессии исчезнут из-за ИИ, а какие появятся? И что с этим делать Как мы построили IT-отдел, где хочется расти: архитектурные встречи, прозрачные метрики и книжные подарки Rufler: Делаем из Claude Code автономный рой через один YAML-конфиг Sing-box и белый список приложений Как построить надёжный обмен сообщениями в микросервисах: лучшие практики для enterprise OpenAI строит MLM-пирамиду, а McKinsey и Accenture помогают ей в этом Дом, который не построил Фишер (Часть 2) «Сверхзвуковой математик» против «Вдумчивого логиста»: битва алгоритмов 3D-упаковки Мультимодальные модели – грубый и дорогой инструмент Разговоры ничего не стоят. Код тоже Проверки физических лиц: с кого начнет ФНС Топ-10 бесплатных нейросетей для создания видео в 2026 году Первые слои кода: как наши решения сегодня определяют архитектуру ИИ на десятилетия Разработка нового статического анализатора: PVS-Studio JavaScript Поиск уязвимостей ПО: базовый минимум или роскошный максимум Почему оценка персонала не работает как инструмент управления Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50% Как я ушел из найма, нажарил косточек и продал на маркетплейсах на 168 млн в год Когда 1С:ERP уже внедрена, а нормального производственного плана всё ещё нет Как я сделал Claude мультимодальным, подключив к нему Qwen Omni Как приглашение на вакансию мечты превращается в атаку Infrastructure as Code: философия и лучшие практики IaC Тестируем Yandex Code Assistant на задаче, в которой нужно хранить секреты nxs-universal-chart v3.0: новое поколение универсального Helm-чарта Callback Injection: Техника, которая отправила Microsoft Defender в глухой нокаут «Все идеи на стол»: митап как способ вывести проект из тупика Сегодня я узнал нечто новое о GPU благодаря багу в своей игре Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать Карта событий как фундамент аналитики: практический кейс для E-commerce Что выбрать для AI: x86, ARM или RISC-V? Дайджест железа за март Роль соматических мутаций в развитии аутоиммунных заболеваний: путь к избирательной терапии Mythos от Anthropic — тревожный сигнал для всех, а не только для банков Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение Финансовая гонка вооружений: почему умные люди добровольно в ней участвуют Эра ИИ-агентов наступила: выбираем лучшего цифрового сотрудника # Практический опыт внедрения WinCC Redundancy на производственном предприятии Сделал MVP за 3 дня, а потом неделю прикручивал оплату. Оно того стоило? Физика против Маска: почему Starship V3 может оказаться ещё одной катастрофой Нефть Венесуэлы: крупнейшие запасы в мире, но не крупнейшая нефтяная держава JPA 4. Переосмысление Hibernate Почему зеркальная фотокамера Nikon D5 десятилетней давности идеально подошла для миссии «Артемида-2» Проект «Уровень-Спутник» или как мы сделали платформу для гидрологов «Замедлиться, чтобы ускориться»: почему ИИ повышает цену ошибок в требованиях и архитектуре Как с нуля поднять трафик IT-компании на 1657% при бюджете 55 тыс. и выжить Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь
Автотесты: опыт построения системы качества для Kubernetes-платформы
dBrain · 2026-06-18 · via Все публикации подряд на Хабре

Средний

6 мин

16

На старте проекта у нас не было ни одного автотеста. При этом продукт уже представлял собой полноценную платформу контейнеризации на базе Kubernetes с большим количеством управляемых сервисов и единой консолью управления. Любое изменение могло затронуть базы данных, брокеры сообщений, системы хранения данных или внутренние управляющие компоненты платформы.

Ручные проверки постепенно переставали справляться с объемом изменений. Поэтому мы начали строить систему автоматизированного тестирования.

Оглядываясь назад, можно сказать, что написание тестов оказалось самой простой частью работы. Гораздо больше времени заняли создание собственного фреймворка, организация тестовых окружений, интеграция с CI/CD, построение отчетности и настройка процессов внутри команды.

Без готового решения

Когда мы начали работу над автоматизацией, готового решения внутри проекта не существовало. Не было ни инфраструктуры для запуска тестов, ни единых подходов к написанию проверок.

Поскольку платформа построена вокруг Kubernetes и объединяет множество сервисов под единым интерфейсом управления, нам требовался инструмент, который позволял бы одинаково удобно работать как с backend-компонентами, так и с пользовательскими сценариями.

В качестве основы мы выбрали Python и PyTest. Причина проста: Python хорошо знаком как разработчикам, так и DevOps-инженерам. Кроме того, экосистема PyTest уже содержит огромное количество готовых решений для организации тестирования, управления окружениями, генерации отчетности и интеграции с CI/CD.

В результате появился единый фреймворк, который сегодня используется для запуска тестов, подготовки окружений, формирования отчетности и уведомления команды о результатах прогонов.

При этом изначально мы не ставили перед собой задачу создать универсальный инструмент. Нам нужен был фреймворк, который решает проблемы конкретного продукта. Именно поэтому многие решения принимались исходя из особенностей платформы, а не абстрактных лучших практик.

То, что действительно ломается

Первый серьезный пласт автоматизации появился на уровне API. Это было продиктовано архитектурой продукта. Большая часть логики платформы находится на стороне backend-компонентов, а пользовательские действия в интерфейсе в конечном итоге сводятся к вызовам управляющих сервисов.

Мы начали автоматизировать проверки основных менеджеров платформы, отвечающих за создание ресурсов, изменение конфигураций, получение статусов и выполнение операций управления.

При этом старались тестировать не отдельные методы, а законченные сценарии работы с системой. Если пользователь создает ресурс через консоль управления, то именно такой сценарий и должен проверяться автоматизированно.

Такой подход позволил достаточно быстро получить реальную пользу от автоматизации. Тесты начали ловить регрессии, ошибки и недочеты в бизнес-логике, а не просто проверять корректность отдельных API-вызовов. Со временем именно API-покрытие стало фундаментом всей системы тестирования.

Немного UI-тестов

Когда речь заходит об автоматизации интерфейсов, часто возникает желание покрыть тестами буквально каждый экран, каждую страницу и кнопку, каждый элемент UI. На практике это редко работает.

UI-тесты значительно сложнее в сопровождении, медленнее выполняются и сильнее зависят от изменений продукта. Любая переработка интерфейса может привести к тому, что десятки сценариев придется актуализировать заново.

Поэтому мы сделали ставку на наиболее важные пользовательские кейсы. Для автоматизации интерфейса был выбран Playwright. Сейчас это один из наиболее популярных и гибких инструментов для тестирования современных веб-приложений. С его помощью мы моделируем реальные действия пользователя через консоль управления платформой и проверяем критически важные сценарии работы.

В результате UI-тестов у нас значительно меньше, чем API-проверок. Но каждый из них воспроизводит реальный путь пользователя и позволяет находить проблемы, которые невозможно обнаружить через API.

Такой баланс оказался гораздо эффективнее, чем попытка добиться стопроцентного покрытия интерфейса.

Проблема в окружении

Один из самых полезных уроков мы получили уже после появления первых стабильных наборов тестов. Поначалу проверки запускались на обычных средах разработки. Казалось, что этого достаточно. Однако очень быстро стало понятно, что результаты таких прогонов сложно считать надежными.

Разработчики постоянно вносили изменения, обновляли сервисы, меняли конфигурации. В результате при падении теста было сложно понять, действительно ли проблема связана с новым кодом или причина находится где-то в самом окружении.

Поэтому мы пошли по пути создания отдельного тестового контура. Появилось выделенное staging-окружение, максимально приближенное к среде препрода. В отличие от обычных сред разработки, оно остается стабильным и не используется для ежедневных экспериментов. Фактически это стало нашей моделью будущего production. Именно здесь теперь проходят основные автоматизированные проверки перед дальнейшим продвижением изменений.

После появления отдельного контура количество ложных срабатываний заметно сократилось, а доверие команды к результатам тестирования существенно выросло.

Проверять изменения до релиза, а не после

Следующим шагом стала интеграция автоматизированных проверок в CI/CD.

Сегодня процесс выглядит достаточно просто. После внесения изменений в основную ветку запускается пайплайн проверки. Сначала тестируется текущая версия системы, чтобы убедиться в корректном состоянии окружения. Затем на staging устанавливается новый билд и выполняется полный набор автоматизированных проверок.

Если тесты проходят успешно, сборка продолжает движение по релизному процессу. Если возникают ошибки, команда получает уведомления и может оперативно приступить к анализу проблемы.

Подобный подход позволил значительно сократить количество ситуаций, когда проблемы обнаруживаются уже после развертывания новой версии продукта. Автоматизация перестала существовать отдельно от процесса разработки и стала его неотъемлемой частью.

Запустить тесты недостаточно

Достаточно быстро стало понятно, что ценность тестирования определяется не только качеством самих проверок. Не менее важно быстро разобраться в причинах падения. Если инженеру приходится тратить часы на поиск информации о том, что произошло во время прогона, эффективность всей системы начинает снижаться.

Поэтому отдельное внимание было уделено отчетности.

Для каждого запуска формируется отчет Pytest, который позволяет быстро получить необходимые данные для воспроизведения ошибки, и полный развернутый отчет Allure Report, где доступна история запусков, информация о нестабильных сценариях и подробная диагностика ошибок.

Уведомления о проблемах сейчас отправляются по электронной почте, также используется интеграция с мессенджерами.

В результате информация о проблеме появляется практически сразу после неудачного запуска, а инженеры получают все необходимые данные для анализа.

Проверять не только функциональность, но и устойчивость

Сегодня основной фокус команды направлен на расширение покрытия существующего функционала. Каждый новый автоматизированный сценарий позволяет сократить объем ручных проверок перед релизом и ускорить получение обратной связи по изменениям. Однако со временем становится очевидно, что функциональное тестирование решает далеко не все задачи.

Для инфраструктурной платформы не менее важны производительность и отказоустойчивость. Поэтому следующим этапом развития стали нагрузочное тестирование и chaos engineering.

Сейчас идет работа над отдельным фреймворком, который позволит моделировать различные профили нагрузки и оценивать поведение системы в условиях повышенного потребления ресурсов. В качестве основного инструмента для нагрузочного тестирования рассматривается K6.

Параллельно ведутся эксперименты с chaos engineering. На начальном этапе планируется использовать Chaos Mesh для моделирования контролируемых отказов отдельных компонентов платформы. Нас интересует не только вопрос корректности работы системы в штатном режиме. Не менее важно понимать, как она будет вести себя при деградации сервисов, отказах инфраструктурных компонентов или других нештатных ситуациях. Именно в таких сценариях обычно проявляются реальные сильные и слабые стороны архитектуры.

ИИ в контуре тестирования

Еще одно направление, над которым мы начали работать, связано с использованием ИИ-агентов для управления тестовыми сценариями и анализа результатов запусков.

Первый вопрос, который обычно возникает в подобных обсуждениях, касается безопасности. В нашем случае работа ведется в рамках корпоративного контура с ограничениями на передачу данных во внешние системы. Используемые решения могут работать внутри контролируемой среды и не требуют передачи внутренней информации за пределы инфраструктуры компании.

Безусловно, такой подход накладывает определенные ограничения и не позволяет использовать весь спектр возможностей публичных сервисов. Однако для задач автоматизации тестирования существующих возможностей вполне достаточно.

При этом речь не идет о замене инженеров. Мы рассматриваем ИИ как дополнительный инструмент автоматизации, который способен взять на себя часть рутинных операций, помочь с анализом результатов и в перспективе упростить управление всей системой тестирования.

Сейчас мы продолжаем расширять покрытие автотестами, развиваем нагрузочное тестирование и экспериментируем с подходами к chaos engineering. Будет интересно узнать, как похожие задачи решаются в других командах. Если вы строили систему автотестирования для сложных платформ, работаете с Kubernetes-продуктами или уже внедряли нагрузочное тестирование и chaos engineering в свои процессы, поделитесь опытом в комментариях. Интересно обсудить как удачные решения, так и ошибки, на которых удалось чему-то научиться.