惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
C
CXSECURITY Database RSS Feed - CXSecurity.com
博客园_首页
H
Hackread – Cybersecurity News, Data Breaches, AI and More
T
ThreatConnect
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
博客园 - 聂微东
H
Help Net Security
T
Threat Research - Cisco Blogs
Blog — PlanetScale
Blog — PlanetScale
A
Arctic Wolf
G
Google Developers Blog
量子位
U
Unit 42
I
InfoQ
V
V2EX
F
Fox-IT International blog
P
Privacy & Cybersecurity Law Blog
V
Visual Studio Blog
J
Java Code Geeks
大猫的无限游戏
大猫的无限游戏
C
CERT Recently Published Vulnerability Notes
博客园 - 三生石上(FineUI控件)
T
The Exploit Database - CXSecurity.com
T
Tailwind CSS Blog
SecWiki News
SecWiki News
Know Your Adversary
Know Your Adversary
MyScale Blog
MyScale Blog
宝玉的分享
宝玉的分享
The Hacker News
The Hacker News
Project Zero
Project Zero
Application and Cybersecurity Blog
Application and Cybersecurity Blog
月光博客
月光博客
Recent Commits to openclaw:main
Recent Commits to openclaw:main
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
G
GRAHAM CLULEY
C
Cisco Blogs
I
Intezer
Simon Willison's Weblog
Simon Willison's Weblog
O
OpenAI News
Recorded Future
Recorded Future
T
Tenable Blog
W
WeLiveSecurity
腾讯CDC
Stack Overflow Blog
Stack Overflow Blog
T
The Blog of Author Tim Ferriss
www.infosecurity-magazine.com
www.infosecurity-magazine.com
D
Docker
C
Cybersecurity and Infrastructure Security Agency CISA
PCI Perspectives
PCI Perspectives

Все публикации подряд на Хабре

Зарядка для джависта Щука на весло: почему случайная выручка опасна для молодого продукта Как я делал VPN-сервис в 2026 году Из разработчика в системные аналитики: практический путь в профессию Почему ваш сайт не продаёт, хотя SEO-шник клянётся, что всё хорошо Сейчас никому не нужны технологии, все обсуждают только ИИ От папки с созвонами до 5K+ юзеров: как pet-проект «для себя» встретился с реальными пользователями Отстаём своим путём Лучшие приложения для изучения иностранных языков: что выбрать в 2026 году Что не нужно знать топ менеджеру, что бы провалить внедрение AI | ИИ Одна строчка .Result роняет ваш ASP.NET Core при CPU 8 %: разбор hill-climbing в .NET 9 Миграции в Go-проекте: PostgreSQL в Docker и goose на практике Что такое OpSec, если углубится Российская компания на 50 человек платит 350 000 ₽ в год за софт, который дублирует сам себя Локализовать нельзя ошибиться. Как работает локализация в автономном транспорте и почему это — самая сложная задача. 1/2 Inside AI Meetup — как это было? Делимся записями докладов, фото и атмосферой Делаем сайт из картинки в нейронке Один простой механизм управляет практически всем в игре Cities: Skylines Встраиваемая векторная БД для RAG на .NET 8: когда внешние сервисы избыточны Gemini-3.5-flash догнал GPT-5.5 на 97/S и в 2.5× дешевле. Но главное — китайцы выигрывают по цене и качеству JavaScript. Работа с большими файлами в браузере. Часть 2/2: Создание 5Gb файлов в браузере Как визуализировать задачи и зависимости в проекте: обзор трекеров, Gantt, графов и whiteboard-инструментов Как команда становится AI Native: методология из 4 этапов Как дебажить distroless-контейнер в Kubernetes без shell: ephemeral containers на практике ИИ не автоматизировал разработчиков. Он сделал кое-что хуже Как оплатить обучение за границей из России в 2026 году: способы, цены, рейтинги Сложный поиск альтернативных частиц Хиггса Тест батареек Camelion Plus Почему компании строят свои конструкторы баннеров: разбор паттерна, который никто не называет Структурированное логирование и трейсинг в Node.js: @cleverbrush/log и @cleverbrush/otel Странные образования на поверхности Венеры ставят в тупик планетологов Шифрование на уровне протокола Пять самых крупных ошибок, которые допускают компании при внедрении SRE Приложения для Битрикс24, которые реально экономят время Анатомия Claude Code. Первичный анализ и наполнение контекста Как изменились требования к разработчикам в эпоху AI: опыт техлида Распродажа «Большой Пятерки» в PlayStation – Days Of Play GIT: Как ломать и чинить историю правильно Разбираемся в ML без воды: от базы до Attention. Часть 6: Логистическая регрессия Решето как гипотетический контейнер для жидких субстанций Лучшие нейросети для генерации изображений — как создать картинку с помощью ИИ в 2026 году Волны гасят ветер: во что упирается развитие ИИ в теории длинных волн Кондратьева Почему на самом деле нельзя делить на ноль? Физический и аксиоматический подходы Zero Trust для подрядного доступа: четыре слоя Identity, Device, Access и Monitoring Zero Trust для подрядного доступа: четыре слоя Identity, Device, Access и Monitoring Базовый командный runtime для терминальных AI-агентов Спектр. Контекст создания, трудности, боли и победы Задолбал нейрослоп: честный разбор, почему мы не можем без него C3D Converter: Plug and Play Почему технические директора не проходят в CIO: портфель проектов против навыка «докрутить» SaaS умирает? Я сравнил 8 публикаций Q1 2026 с тем, что вижу внутри Kaiten Взрослый BIM для детского сада на 230 мест: крупнейший застройщик Черноземья ОДСК – сделал комплексный проект в nanoCAD Privacy-by-design: что наш edge не пишет на диск и почему это сложнее, чем кажется Civilization VII: что изменилось в механике смены эпох после патча 1.4.0 Готовые решения для интернет-магазина на 1С-Битрикс: разбираю рынок изнутри На РОИ появились инициативы с требованием ограничения полномочий РКН и блокировок Фаундер написал 15 страниц про рынок и поднял на этом $10M Формула интегрирования по частям с точки зрения дифференциальной геометрии Plan-tango: как я перестал гонять план между Claude Code и Codex руками Динозавры в проде: сколько лет языкам программирования и кто до сих пор зарабатывает на «мёртвых» Как стать postgres в чужом облаке: краш-тест безопасности управляемых БД Погружение в новый проект: как не потерять месяц жизни Простой гайд по Kling Motion Control от А до Я Семантический слой: архитектура, подходы и роль в эпоху AI-аналитики Гоняться за оптовиками и чуть не закрыться, придумать «стартовый набор новичка» и удвоить выручку НЕкурс про разработку безопасного программного обеспечения (РБПО) Теология возможных миров. Есть ли боги в мультивселенной, или мультивселенная и есть Бог? Что делать, если не прошли переаккредитацию ИТ-компании в 2026 году: пошаговый план действий Нейросеть для работы с текстом — как генерировать чистый и уникальный текст для студентов Прокачать SQLite и сократить векторы в видеоформате — открытые инструменты для работы с эмбеддингами Киберзадачи в сеттинге Minecraft. Школьники в финале ВсоШ по инфобезу Windows 11 будет работать быстрее на всех компьютерах. Теперь официально Кэширование в Symfony: как мы сломали авторизацию и починили ее через Lock Стажеры uAcademy*. Опыт кураторства дипломов: почему стажировок недостаточно Команда выросла, методы — остались «Ошибка выжившего» на примере спортсменов Испытание временем — как тестировать цифровой двойник, если физического объекта ещё не существует Как обычный кухонный таймер на ESP32 превратился в домашний центр уведомлений Как мы научили СХД TATLIN.OBJECT мигрировать данные из S3-хранилища MinIO Онлайн-приключение для IT-команд, как альтернатива корпоративу в Zoom Экскурсия по «зоопарку» сетевого трафика: топ-10 аномалий внутри вашего периметра Книга: «System Design. Проектирование мобильных систем. Подготовка к сложному интервью» Критическое мышление руководителя: как один красивый слайд может привести к дорогой ошибке Ecommerce на Laravel, или как мы собрали headless-слой для фронтов (6 часть) Обновление macOS для инженеров поддержки Делаем ностальгический фильмоскоп на Raspberry Pi Zero 2 W От баз данных до инструментов для ИИ-экосистем: проекты, которые получили гранты Yandex Open Source Больше, чем просто безопасность, или Зачем контролировать зависимости Тот неловкий момент, когда письмо от Джованни из Швейцарии не оказалось обманом Почему AAA-игры проваливаются? Разбираем примеры Как запустить 3D-приложение на сервере без GPU: от SwiftShader до WARP Благоустраиваем Firefox: встроенный VPN Современный Angular: Заменяем жизненные циклы на сигналы HR-бот на базе RAG: архитектура корпоративной базы знаний для ресторанного холдинга Почему ИИ не заменит аналитика при подготовке технического задания InSales без пушей: как бесплатно перенести уведомления о заказах в Telegram на Yandex Cloud Serverless Александрийская библиотека: краткая история античной системы хранения Почему японские компании занимаются всем подряд Откуда берутся молнии? Ответ на этот вопрос становится всё интереснее 1C Code Bench — бенчмарк для оценки способности LLM писать код на 1С
Cursor пишет вам unit‑тесты за минуту. 5 паттернов, на которых эти тесты пропустят любой баг
badcasedaily · 2026-05-29 · via Все публикации подряд на Хабре

Уровень сложностиСредний

Время на прочтение6 мин

Охват и читатели56

Мнение

Cursor пишет тесты быстро. Открыл класс, нажал Ctrl+I, кинул промпт «напиши unit‑тесты» — через минуту в файле сорок строк с моками, ассертами и красивыми именами вроде shouldReturnUserWhenIdIsValid. Прогнал — зелёные. Закоммитил, замержил, побежал дальше. Покрытие в проекте растёт, скорость написания тестов раза в три‑четыре выше, чем руками.

А потом замечаешь, что тесты есть, а толку от них всё меньше. Регрессия пролетает мимо них и падает в проде. Открываешь тот самый тест, который должен был это ловить, — формально зелёный, но если присмотреться, не проверяет вообще ничего.

Ниже — пять типичных паттернов вайбкодинга unit‑тестов, которые сейчас встречаются практически в каждом проекте, где разработчики делегируют тесты Cursor, Copilot или Claude. Примеры на Java с JUnit и Mockito, но в pytest и Jest картина один в один.

Cursor пишет один happy‑path тест и считает работу выполненной

@Test
void shouldDivideTwoNumbers() {
    assertEquals(2, calculator.divide(10, 5));
}

Один тест на счастливый путь, и на этом Cursor останавливается — никаких проверок «что, если делитель ноль», «что, если переполнение int», «что, если оба значения отрицательные». Сделал ровно то, что просили: «напиши тест для метода divide», метод делит два числа — вот тест на деление двух чисел. От регрессий защита нулевая, можно сломать в divide вообще всё, кроме случая 10 / 5 = 2, и тест останется зелёным.

Лечится тем, что edge cases приходится проговаривать в промпте явно: «напиши тесты для divide, включая граничные случаи — деление на ноль, переполнение, отрицательные значения, ноль в делимом». После такой формулировки Cursor выдаёт уже три‑пять тестов вместо одного. Но просить нужно каждый раз, сам по дефолту edge cases часто не вспоминает, останавливается на самом простом сценарии.

Ассерт по строке там, где надо было по значению

assertEquals(
    "User created successfully",
    response.getMessage()
);

Cursor взял текущее значение из реализации и зафиксировал его в тесте. Через полгода продактам надоело «User created successfully», переименовали на «Пользователь зарегистрирован» и двести тестов краснеют разом, хотя в коде ничего не сломано.

Если в ассерте сравнивается строка, рядом должен быть комментарий о том, почему важна именно эта строка — контракт с фронтом, документация API, ещё какая‑то внешняя завязка. Если такого объяснения нет, проверять надо структуру, а не текст:

assertThat(response.getStatus()).isEqualTo(Status.CREATED);
assertThat(response.getUserId()).isNotNull();
assertThat(response.getCreatedAt()).isAfter(beforeTest);

Cursor про это правило не знает, и его надо явно прописывать либо в шаблоне промпта для каждой задачи, либо в системном промпте проекта (./cursor/rules или аналогичный конфиг).

Тест проверяет, что мок отдал то, что мок отдал

when(userRepository.findById(1L))
    .thenReturn(new User(1L, "Alice"));

User result = userService.getById(1L);

assertEquals("Alice", result.getName());

Этот тест проверяет ровно одно — что Mockito работает. Если внутри userService.getById написать return new User(1L, "Alice") напрямую, без обращения к репозиторию, тест останется зелёным. Сам же метод можно переписать в обход всей логики, и тест ничего не заметит.

Самый рабочий способ такие тесты выявлять — mutation testing. Идея очень простая: в тестируемый код вносятся мутации (+ меняется на -, < на <=, true на false), тесты прогоняются заново. Если мутация осталась живой, а тесты при этом зелёные — значит, они её не ловят, и реальной защиты в них нет. Для Java стандарт — PIT (pitest), для Python — mutmut, для JavaScript — Stryker. В PR с вайбкоженными тестами mutation score обычно болтается в районе 10–15%: то есть 85% потенциальных багов вносятся в код, а тесты их прозевают.

Mutation score ниже шестидесяти процентов — нормальный порог, после которого тесты идут на доработку, не доходя до мержа.

Cursor повторяет баг из кода прямо в ассерте

Cursor смотрит в код, видит, что метод делает X, и пишет тест, который ровно это X и подтверждает — даже если X на самом деле неправильное.

Допустим, в коде сидит такой баг:

if (price > 1000) {
    discount = price * 0.1;  // по ТЗ должно быть 0.15

Cursor читает реализацию, видит коэффициент 0.1, генерит тест:

@Test
void should10PercentDiscountForExpensive() {
    order.setPrice(2000);
    assertEquals(200, order.getDiscount());  // 200 = 10% от 2000
}

Тест зелёный, баг живёт в проде. Cursor посмотрел в код, увидел 0.1, написал тест ровно на 0.1. Имя теста — should10PercentDiscount — мимоходом цементирует баг: вот же, явно написано «должен быть 10%», всё работает по тестам, какие вопросы.

Профилактика — давать Cursor бизнес‑требования (спецификацию или ссылку на тикет с requirements), а не сам исходник, и просить написать тест по требованиям. Тогда у него есть с чем сверять код, и баг не уползает в тест автоматом. Для критической логики — платежи, скидки, расчёты по контрактам — это вообще должно быть железным правилом.

На замоканный сервис тест не ловит вообще ничего

@InjectMocks OrderService orderService;

@Mock OrderRepository repo;
@Mock PaymentService payments;
@Mock NotificationService notifications;
@Mock InventoryService inventory;
@Mock TaxCalculator tax;

@Test
void shouldCreateOrder() {
    when(repo.save(any())).thenReturn(new Order(1L));
    when(payments.charge(any())).thenReturn(true);
    when(inventory.reserve(any())).thenReturn(true);
    when(tax.calculate(any())).thenReturn(BigDecimal.TEN);

    Order result = orderService.create(buildRequest());

    assertNotNull(result);
}

В тесте замокано всё, и по факту проверяется одна строчка: что orderService.create возвращает не null. Любая логика между компонентами остаётся за бортом — поменяешь порядок вызовов в сервисе, удалишь вызов notifications.send, переставишь местами payments.charge и inventory.reserve, тест всё равно останется зелёным. Cursor такие тесты обожает: ничего сложного, никаких реальных баз, никаких контейнеров, никакого ожидания готовности, чистые моки.

Лучший фикс — там, где это уместно, перевести юнит‑тест на интеграционный с TestContainers и реальной Postgres, оставив моки только под внешние сервисы, которые недоступны в тестовом окружении. Cursor, кстати, с этим хорошо справляется: пишешь «перепиши этот юнит‑тест на интеграционный с TestContainers и реальной Postgres» — он переделывает за минуту. Проверить за ним надо только одно: чтобы замоканной не оказалась как раз та самая логика, которую тестом и хотите покрыть.

Итого

Чтобы вайбкодинг тестов реально работал, в процесс имеет смысл добавить две штуки. Первая — каждый PR с тестами от Cursor (или Copilot, или Claude в Cursor — без разницы) обязательно прогоняется через mutation testing. Mutation score меньше шестидесяти процентов — тесты на доработку. Вторая — на ревью к каждому тесту задаётся один вопрос: «Если в коде сделать баг X, этот тест его поймает?». Если ответ «нет» — тест либо переписывается, либо удаляется.

AI уже помогает писать тесты, генерировать кейсы и разбирать логи, но сам по себе он не делает тестирование надёжнее. Чтобы от него была польза, QA‑инженеру нужно понимать, где нейросеть ускоряет работу, а где начинает уверенно воспроизводить ошибки из кода, требований и моков.

На курсе «ИИ в тестировании: ускорение процессов и проверка ИИ‑функций» разберем, как применять AI‑инструменты в реальных QA‑процессах: от генерации тестовых сценариев и анализа дефектов до проверки функций, построенных на искусственном интеллекте.

Присмотритесь к бесплатным открытым урокам, которые проходят в рамках курса. Их проведут преподаватели‑практики: можно будет познакомиться с экспертами, протестировать формат обучения и задать вопросы.

И подписывайтесь на канал OTUS в MAX — там публикуем анонсы открытых уроков, полезные материалы по IT‑направлениям и подборки для тех, кто хочет развиваться в профессии без лишнего инфошума.