惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

aimingoo的专栏
aimingoo的专栏
量子位
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
S
Schneier on Security
Cisco Talos Blog
Cisco Talos Blog
T
ThreatConnect
J
Java Code Geeks
博客园 - 司徒正美
A
Arctic Wolf
T
True Tiger Recordings
C
Cybersecurity and Infrastructure Security Agency CISA
Cyberwarzone
Cyberwarzone
Know Your Adversary
Know Your Adversary
T
Threat Research - Cisco Blogs
V
Vulnerabilities – Threatpost
Recorded Future
Recorded Future
P
Palo Alto Networks Blog
The Hacker News
The Hacker News
The Register - Security
The Register - Security
S
Securelist
www.infosecurity-magazine.com
www.infosecurity-magazine.com
C
CXSECURITY Database RSS Feed - CXSecurity.com
Application and Cybersecurity Blog
Application and Cybersecurity Blog
I
Intezer
P
Privacy & Cybersecurity Law Blog
Scott Helme
Scott Helme
K
Kaspersky official blog
博客园 - 聂微东
Last Week in AI
Last Week in AI
V
V2EX
小众软件
小众软件
F
Fox-IT International blog
Martin Fowler
Martin Fowler
Apple Machine Learning Research
Apple Machine Learning Research
T
Tenable Blog
F
Future of Privacy Forum
Microsoft Security Blog
Microsoft Security Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
腾讯CDC
Stack Overflow Blog
Stack Overflow Blog
C
Check Point Blog
阮一峰的网络日志
阮一峰的网络日志
GbyAI
GbyAI
T
Threatpost
I
InfoQ
P
Proofpoint News Feed
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
T
Tor Project blog
G
GRAHAM CLULEY
D
DataBreaches.Net

Все публикации подряд на Хабре

Reactive Forms vs Signal Forms: Эволюция сложных форм в Angular TorFlash — приложение для Linux: поиск торрентов, скачивание и копирование на флешку в одно нажатие Как я решил проблему русской диктовки для ИИ Оверинжиниринг, потопивший немецкую подлодку или некоторые «баги» не чинятся десятилетиями Как ставить цели и не забывать о них: пошаговая система с примерами в таск-менеджере Как настроить observability в Spring Boot 3 HackTheBox. Прохождение Mini Pro Lab Puppet Обзор серверного ускорителя NVIDIA Tesla V100 16 Gb в корпусе от RTX 4090: Часть 3 — Запуск локальных моделей ИИ Редактирование текста нейросетью: как сделать диплом и курсовую более человечными Самодельный ARM ноутбук, реально ли? Как 100+ авторов пишут 100+ процессов в 3 версиях и не путаются. Или как мы переехали с Wiki на Git Прошла AnalystDays – хорошие выступления и нетворкинг VSCode как IDE для embedded разработки Моделирование широкополосной антенны с двойной круговой поляризацией и высокой изоляцией Ваше прошлое физически существует прямо сейчас. И вы заморожены там навсегда От списка инструментов к technical output: как security engineer’у описывать hands-on опыт в CV и на интервью I just want an agent. Часть 1. Как я научил ИИ собирать ИИ-агентов за пользователей и выиграл конкурс I just want an agent. Часть 1. Как я научил ИИ собирать ИИ-агентов за пользователей и выиграл конкурс Вайбкодинг спас меня от подрядчиков. А потом я поняла, что сама стала подрядчиком для своих агентов Святой Августин и GAN: почему борьба добра и зла — это генеративная состязательная сеть В каждом QR-коде зашита половина лишней информации. Намеренно Я открываю автомат ключом, меняю рулон бумаги и зарабатываю 180 тысяч в месяц с точки Мастер восстановления. Культура достиженства и выгорание Недельный геймдев: #279 — 24 мая, 2026 Защита от дублирования кода агентами: семантические концепции Frontend Status: свежий дайджест фронтенда и AI — 25.05.2026 Где искать IT-работу кроме HH: подборка платформ 2026 Почему простые числа собираются в спирали? OCR для Data Lakehouse: от Apache Tika к собственному решению на базе Docling Jira — Тьюринг-полная Kubernetes-аудит после Wiz и Prisma: как живут без CNAPP в 2026 «Тестируем MVP в 4 раза быстрее»: как нейросети изменили жизнь предпринимателей На каком стеке и железе работает умное наблюдение в вашем городе: обзор технологий от разработчиков видеоаналитики Как мы ускорили согласования на двух заводах в 24 раза Heartbeat-мониторинг cron-job'ов: dead-man-switch на FastAPI [Перевод] Сегодня нет джуниоров, а в 2031 году не станет и синьоров Профайлер для PostgreSQL: от идеи до работающего MVP за сутки [Перевод] Ограничения размера cookie в ASP.NET Core в продакшене: причины и способы решения Проблема «божественного» Obsidian: почему я отказался от централизованного подхода в работе Лицензии GNU GPL: как пройти проверку Минцифры и заказчика для госзакупок и КИИ Хакатон Samsung IT Academy Hack 2026: как студенты оптимизировали поиск в корпоративном мессенджере Хакатон Samsung IT Academy Hack 2026: как студенты оптимизировали поиск в корпоративном мессенджере MTProxy jumper — делаем автоматическое переключение прокси-серверов Telegram Ты уже используешь агента. Просто не заметил Книжный салон. Послевкусие и благодарности Как отлаживать мини‑приложения в MAX и почему без DevTools это боль Cбор биометрических данных. Как защищается наша биометрия на практике Как запустить учет активов без цифровой свалки: первые 90 дней CGE: визуализация кравлера и скрытых связей между поддоменами Зачем банки тратят миллиарды на науку (спойлер: не благотворительности ради) Книга: «Современный Java Concurrency. Глубокое погружение в Virtual Threads, Structured Concurrency и Scoped Values» Как использовать подписку ChatGPT и Claude в Cursor без оплаты за API токены Специализированная ИСУП или модуль в универсальной платформе: вот в чем вопрос Обход белых списков через WebRTC на стероидах (с поддержкой iOS и десктопа) Регата INFOSTART CIO CAMP: когда команда проверяется не в переговорной, а на воде Пет-проект, который не умер: система бронирования устройств как полигон для AI-разработки Не надо встраивать ИИ в каждую корпоративную систему, это архитектурная ошибка Нейросети для дизайна интерьера: Выбираем лучший ИИ для генерации концептов и планировок квартиры Что там с Ил-114-300 Что такое DAS: как и зачем продукт-менеджеры саботируют запуск новых продуктов 8% компаний измеряют критическое мышление руководителей. Что делают остальные 92% CVE, Shell и побег из контейнера: испытываем возможности PT Cloud Application Firewall Как я научил Алису петь: генерация музыки по голосовой команде Восстановление данных с помощью бесплатной утилиты Easy Disk Checker Как мы построили сквозную аналитику в Power BI Год разработки iOS-игры, 266 тысяч показов и $33: как я делал Vault и почти ничего не заработал Ты прокрастинируешь потому, что избегаешь напрасных усилий, а не чрезмерных нагрузок Я построила диагностику «стоит ли это автоматизировать» — и она трижды говорила глупости. Разбор ошибок Как устроены world models, что показал Google на прошлой неделе и где это меняет gamedev и робототехнику Двухдневная рабочая неделя — будущий стандарт CPU не умер, он просто ждал. Китай строит двухэксафлопсный суперкомпьютер без единого GPU — прорыв, необходимость, фейк? 3Sound: поиск бесплатных звуков для игр больше не боль? 3 Тбит/с по-русски: почему DDoS в 2026 году стал угрозой для любого бизнеса 10 Гбит/с — зачем вам такая скорость передачи данных в облаке Ремонтируем аналоговый XY-самописец Endim 622 [Перевод] IPO компании SpaceX: хорошая попытка, но нет «Ща будет шрифт»: история одного русского embedded‑шрифта Как аквариум на подоконнике превратился в full-stack платформу с AI GiftsHub — из чат-бота в полноценный backend-продукт Пиратство, копирайт и DMCA: как Napster, The Pirate Bay и YouTube изменили закон. Часть II Как найти внутренние резервы для развития предприятия Как один французский чиновник от безысходности начал платил зарплаты картами и практически изобрёл банкноты RAG в энтерпрайзе: почему демо работает, а прод нет AI-агент для финансовых процессов: как мы научили ИИ считать числа из базе данных без галлюцинаций Автопостинг на 8 платформах: архитектура waterfall, custom publisher'ы и API-ловушки Кинетика против бронзы: Почему Голиаф был обречен в дуэли с Давидом [Перевод] Масштабирование LLM: от одного чипа до ЦОДа. Глава 2. Шардинг LLM не работает за вас. Она работает с вами Чем лучше защищает минеральный SPF, тем страшнее он выглядит Стимпанк как часть жизни. История паровых двигателей и место, которое они занимали в мире в XIX-XX веках. Часть 1 Гастарбайтеры ворвались в IT и зарабатывают на рекламе: тут вам не снег лопатой кидать Новые методы и инструменты: как мы обновили курсы по тестированию в Яндекс Практикуме Java 21 в стиле «клятый энтерпрайз» на одноплатном компьютере возрастом 13 лет Ваши секреты внутри LLM. Куда уходят промпты и чего стоит опасаться? 10× труда. 10% к бонусу. Главный риск AI-эпохи — это сениор AI-инженер, который умеет считать Сапожник с сапогами Минимум, который удержит тебя на плаву в период дедлайнов Как без проблем переносить курсы между платформами? Обзор формата SCORM Когда Claude Code ошибается не по своей вине: документационный долг в соло-проектах 70% кода с AI — и ни на день быстрее
Security Week 2622: эффективность Claude Mythos по версии Cloudflare
Kaspersky_La · 2026-05-26 · via Все публикации подряд на Хабре

Время на прочтение4 мин

Охват и читатели6

На прошлой неделе компания Cloudflare поделилась своими впечатлениями о работе ИИ-модели Claude Mythos. Эта модель разработана компанией Anthropic, и в данный момент доступ к ней предоставляется «по приглашениям» в рамках проекта Project Glasswing. Одной из причин такого закрытого процесса тестирования является достаточно высокая эффективность ИИ-ассистента при поиске и обнаружении уязвимостей. Независимые подтверждения этой эффективности уже были опубликованы ранее, например от команды разработчиков браузера Mozilla Firefox.

В отличие от отчета Mozilla, Cloudflare в своей публикации не приводит примеры обнаруженных уязвимостей. Говорится только о том, что Mythos тестировалась на кодовой базе Cloudflare и что уязвимости действительно были обнаружены. Зато Cloudflare не ограничивается простым тезисом о том, что для эффективной работы ИИ-модели требуется разработка соответствующей обвязки, а подробно описывает, на какие этапы внутри этой обвязки разбивается автоматизированный поиск уязвимостей.

Согласно отету Cloudflare, помимо собственно обнаружения ошибок (с которым справляются и другие ИИ-модели) Mythos способна конструировать цепочку эксплуатации ошибок в коде и в итоге может предоставить доказательство опасности бага в виде полноценного эксплойта. Это улучшает соотношение «сигнала» (реально опасные, эксплуатируемые ошибки в ПО) и «шума» (неэксплуатируемые или вовсе несущественные проблемы). В Cloudflare говорят о возможности регулировки этого соотношения по «требованию заказчика»: они специально настроили модель так, чтобы специалисты имели больше информации для дальнейшей оценки, даже если это приводит к увеличению количества мусорной информации.

Даже эффективная модель не справится, если просто направить ее на репозиторий с предложением «что-нибудь там найти». При обсуждении требований к той самой обвязке вокруг ИИ-ассистента в Cloudflare скорее моделировали работу «человеческого» исследователя по безопасности. А такой специалист не пытается проанализировать весь код проекта с наскока, а фокусируется на отдельных элементах, будь то конкретная функция, класс уязвимостей или защитный механизм.

В результате предлагается следующее «правило жизни ИИ» для анализа кода: намеренное сужение фронта работ, но зато с возможностью проводить множество исследований параллельно. Там же авторы публикации упоминают интересные методы повышения эффективности работы с ИИ. Например, запросы «есть ли ошибки в этом коде» и «может ли атакующий добраться до бага, чтобы его эксплуатировать» очевидно приведут к разным ответам. Есть смысл делать эти запросы по отдельности, а не скопом — так больше шансов получить адекватный ответ на оба. Отдельный интерес представляет предложенная процедура верификации выводов одной модели с помощью другой. Не обязательно, впрочем, сталкивать друг с другом именно разные модели: автоматизированный контроль может проводить та же модель просто с другим набором промптов.

Собственно обвязка у Cloudflare выглядит примерно следующим образом. На первом этапе репозиторий анализируется и разбивается на отдельные элементы, идентифицируются важные параметры кода. Создается набор задач, каждая из которых нацелена на поиск уязвимостей, потенциально приводящих к атакам конкретного типа. Результат выполнения задачи сканируется отдельным контролирующим агентом. На этапе Gapfill выделяются участки кода, которые не были затронуты на предыдущих этапах: так борются с тенденцией ИИ к зацикливанию, когда модель снова и снова ищет ранее обнаруженные типы уязвимостей. Результаты работы ИИ группируются по общему источнику проблемы, а он дополнительно тестируется на предмет реалистичности эксплуатации. Еще одна цепь обратной связи вновь запускает поиск уязвимостей, подобных найденным, если была доказана их практическая опасность. Наконец, формируется отчет для дальнейшего изучения.

Отдельно в отчете Cloudflare затрагивается проблема закрытия уязвимостей в ситуации, когда их стало легче обнаруживать. Логичным, но неверным шагом было бы повышение скорости выпуска заплаток. Это, по мнению Cloudflare, приносит свои проблемы, так как каждый патч надо тестировать и далеко не всегда это можно делать с достаточной скоростью. Соответственно, растет опасность, что скороспелые заплатки приведут к появлению других багов. Вместо этого предлагается сфокусироваться на разработке комплексных систем защиты внутри программного обеспечения или сервиса: проектировать архитектуру приложения так, чтобы обнаруживаемые баги было труднее эксплуатировать в принципе. Чем сложнее эксплуатация, тем больше времени у разработчика на закрытие проблемы.

Эффективность ИИ-моделей в поиске уязвимостей может использоваться и во вред, точнее, уже используется. Закрытое распространение наиболее действенных инструментов может только отсрочить момент появления столь же эффективных моделей на стороне злоумышленников. В Cloudflare отмечают, что, хотя у Mythos и есть встроенные ограничители, способные уменьшить вероятность быстрой разработки эксплойтов, работают они плохо. Простое изменение формулировки запроса или даже повторный запрос в другое время позволяли эти ограничители обойти. Тем важнее выглядит идея улучшения системной защиты в ПО, отсутствие которой может привести к катастрофическим инцидентам. Косвенно эта мысль отражена и в отчете по браузеру Firefox: там упоминается случай, когда после получения нескольких отчетов об однотипных уязвимостях разработчики не стали исправлять их по очереди, а внесли архитектурное изменение, сделавшее эксплуатацию этих ошибок невозможной. Позднее, при сканировании кода с помощью Mythos, в Mozilla видели множество попыток ИИ эксплуатировать именно этот тип уязвимостей, и все были безуспешными.

Что еще произошло

Исследователи «Лаборатории Касперского» опубликовали подробный анализ уязвимости CVE-2026-3102 в утилите ExifTool. Авторы статьи использовали в качестве отправной точки более раннюю проблему 2021 года. Уязвимость теоретически может приводить к выполнению произвольного кода на компьютерах под управлением Mac OS. Еще одна статья разбирает свежие приемы группировки Cloud Atlas, нацеленной на организации в России и Беларуси.

Новая массовая атака на пакеты в репозитории NPM привела к компрометации более 300 релизов, включая проекты с десятками миллионов загрузок. Атака нацелена прежде всего на разработчиков ПО, причем был зафиксирован необычный способ эксфильтрации приватных данных: если вредоносный код находит ключи доступа к репозиторию на GitHub, похищенная информация загружается прямо туда.

Microsoft закрыла внеочередным патчем две уязвимости нулевого дня в защитном механизме Windows Defender.