惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

A
About on SuperTechFans
K
Kaspersky official blog
P
Privacy & Cybersecurity Law Blog
The Hacker News
The Hacker News
S
Security Affairs
Attack and Defense Labs
Attack and Defense Labs
Simon Willison's Weblog
Simon Willison's Weblog
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
C
Cyber Attacks, Cyber Crime and Cyber Security
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
F
Fortinet All Blogs
Jina AI
Jina AI
H
Hacker News: Front Page
L
LINUX DO - 最新话题
C
Check Point Blog
J
Java Code Geeks
有赞技术团队
有赞技术团队
G
Google Developers Blog
H
Hackread – Cybersecurity News, Data Breaches, AI and More
T
The Blog of Author Tim Ferriss
U
Unit 42
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
Recent Commits to openclaw:main
Recent Commits to openclaw:main
爱范儿
爱范儿
S
Secure Thoughts
Webroot Blog
Webroot Blog
V
V2EX
MyScale Blog
MyScale Blog
Blog — PlanetScale
Blog — PlanetScale
L
LINUX DO - 热门话题
D
Docker
Recorded Future
Recorded Future
The Last Watchdog
The Last Watchdog
云风的 BLOG
云风的 BLOG
AWS News Blog
AWS News Blog
月光博客
月光博客
酷 壳 – CoolShell
酷 壳 – CoolShell
The GitHub Blog
The GitHub Blog
Google DeepMind News
Google DeepMind News
P
Privacy International News Feed
MongoDB | Blog
MongoDB | Blog
Recent Announcements
Recent Announcements
AI
AI
O
OpenAI News
Hugging Face - Blog
Hugging Face - Blog
Stack Overflow Blog
Stack Overflow Blog
S
SegmentFault 最新的问题
博客园 - 聂微东
Martin Fowler
Martin Fowler

Все публикации подряд на Хабре

Ловим музу за клавиатуру: как айтишнику стать автором Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента Никто не любит писать тесты, но ИИ может исправить это IPv8 выглядит как мечта. Поэтому почти наверняка не взлетит Производители вернули в продажу материнки с DDR3. Что происходит? Управление агентом с телефона через Telegram теперь в KodaCode От координации к лидерству: как меняется роль руководителя разработки Я сделала родителям бизнес вместо пенсии: зарабатываем 70 тысяч, мама не даёт продать В три раза быстрее приемка товара и оптимизация трудозатрат на 73%: как «РСТ-Инвент» помог Gulliver Group ИИ-шечный мир победил? О влиянии искусственного интеллекта на игропром Кремль снижает давление на Телеграмм пока Европа строит интернет по паспорту Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением Как (не) потерять домен за выходные Вместо 8 разных VPS: как я организовал практику студентам на одном сервере Почему твой Open Source проект не замечают? R&D: искусство управления неопределенностью в разработке AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет Мы отдали управление роботами OpenClaw. Что из этого вышло Галактический ID: система идентификации для всех форм разумной жизни Шесть основ бизнес-анализа: начинаем с вопроса «Кто в игре?» Код-ревью, в котором дело не в коде Данные переехали. Команда — нет Системной подход к сдаче OSWE в 2025 Почему комната управления реактором покрашена в цвет морской пены 4 YAML-файла вместо PySpark: как аналитикам строить пайплайны без разработчиков LLM-агент для поиска свободных доменов: автоматизируем подбор Когда, зачем и как правильно начинать новую сессию в Claude Code? Как я заставил нейросеть писать макросы для FreeCAD Анатомия ИИ‑агента для подбора персонала. От тысячи резюме к топ‑10 за минуты Опыт разработчика как экономика внимания Автономность как точка невозврата: кто будет субъектом в цифровом будущем Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты Как измерить LLM для задач кибербеза: обзор открытых бенчмарков Где хранить код? Сравнение GitHub, GitLab и Bitbucket Математика объясняет, почему нормальное распределение встречается повсюду Почему ваш FinOps не работает: 12 тезисов от практиков Как подписать проектную документацию УКЭП с использованием бесплатных лицензий Pilot Адаптивное администрирование Sigla Vision Я грузил уран в бочки, а потом 20 лет строил ИТ в атомной отрасли Чем позвонить с Эвереста? История и обзор спутниковой связи. Часть 2 Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии Как не передать на desktop свой IP в РКН Анатомия SAP Privileges: как устроено управление правами в macOS MoneyDev: Сказка про три главных слова Обновлённый токенизатор видео K-VAE 2.0 от Сбера Как сделать диспетчеризацию дома на 1284 квартиры почти бесплатно Как мы разогнали железную дорогу Мы дали агентам рутину. Теперь надо решить — что делать с освободившимся временем Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM Умный город начинается с точного взгляда: как «Фалькон Тех» меняет пространство к лучшему Навайбкодил приложение для анализа графов Почему Дюну так интересно читать? Упрощаем работу с рутиной или как стать Гендальфом Белым Деконструкция Go: CPU, RAM и что там происходит. Go Assembler база. Часть 1.1 Какие профессии исчезнут из-за ИИ, а какие появятся? И что с этим делать Как мы построили IT-отдел, где хочется расти: архитектурные встречи, прозрачные метрики и книжные подарки Rufler: Делаем из Claude Code автономный рой через один YAML-конфиг Sing-box и белый список приложений Как построить надёжный обмен сообщениями в микросервисах: лучшие практики для enterprise OpenAI строит MLM-пирамиду, а McKinsey и Accenture помогают ей в этом Дом, который не построил Фишер (Часть 2) «Сверхзвуковой математик» против «Вдумчивого логиста»: битва алгоритмов 3D-упаковки Мультимодальные модели – грубый и дорогой инструмент Разговоры ничего не стоят. Код тоже Проверки физических лиц: с кого начнет ФНС Топ-10 бесплатных нейросетей для создания видео в 2026 году Первые слои кода: как наши решения сегодня определяют архитектуру ИИ на десятилетия Разработка нового статического анализатора: PVS-Studio JavaScript Поиск уязвимостей ПО: базовый минимум или роскошный максимум Почему оценка персонала не работает как инструмент управления Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50% Как я ушел из найма, нажарил косточек и продал на маркетплейсах на 168 млн в год Когда 1С:ERP уже внедрена, а нормального производственного плана всё ещё нет Как я сделал Claude мультимодальным, подключив к нему Qwen Omni Как приглашение на вакансию мечты превращается в атаку Infrastructure as Code: философия и лучшие практики IaC Тестируем Yandex Code Assistant на задаче, в которой нужно хранить секреты nxs-universal-chart v3.0: новое поколение универсального Helm-чарта Callback Injection: Техника, которая отправила Microsoft Defender в глухой нокаут «Все идеи на стол»: митап как способ вывести проект из тупика Сегодня я узнал нечто новое о GPU благодаря багу в своей игре Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать Карта событий как фундамент аналитики: практический кейс для E-commerce Что выбрать для AI: x86, ARM или RISC-V? Дайджест железа за март Роль соматических мутаций в развитии аутоиммунных заболеваний: путь к избирательной терапии Mythos от Anthropic — тревожный сигнал для всех, а не только для банков Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение Финансовая гонка вооружений: почему умные люди добровольно в ней участвуют Эра ИИ-агентов наступила: выбираем лучшего цифрового сотрудника # Практический опыт внедрения WinCC Redundancy на производственном предприятии Сделал MVP за 3 дня, а потом неделю прикручивал оплату. Оно того стоило? Физика против Маска: почему Starship V3 может оказаться ещё одной катастрофой Нефть Венесуэлы: крупнейшие запасы в мире, но не крупнейшая нефтяная держава JPA 4. Переосмысление Hibernate Почему зеркальная фотокамера Nikon D5 десятилетней давности идеально подошла для миссии «Артемида-2» Проект «Уровень-Спутник» или как мы сделали платформу для гидрологов «Замедлиться, чтобы ускориться»: почему ИИ повышает цену ошибок в требованиях и архитектуре Как с нуля поднять трафик IT-компании на 1657% при бюджете 55 тыс. и выжить Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь
Ваш KYC не работает: почему цифровые подделки документов стали опаснее бумажных
SmartEngines · 2026-06-17 · via Все публикации подряд на Хабре

Простой

7 мин

5

Когда говорят о подделке документов, обычно подразумевают попытку обмануть человека. Но сегодня документы все чаще проверяют не сотрудники банков и служб безопасности, а алгоритмы цифрового онбординга, KYC и удаленной идентификации.

Поэтому появились подделки нового типа — рассчитанные не на людей, а на компьютеры. Их задача не выглядеть идеально, а заставить систему распознавания извлечь нужные реквизиты и пропустить заявку дальше.

Как выглядят такие атаки, почему существующие решения часто оказываются к ним не готовы и зачем мы создали открытый датасет цифровых подделок документов MIDV-DM — расскажем под катом.

Кто в зоне риска

Как мы уже отмечали в нашей прошлой статье про статистику связанных с документами преступлений, физические подделки широко распространены и их производство поставлено на поток. Однако такие подделки дороги; а зная особенности автоматизированных процессов в онлайн онбординге и KYC процедур - использовать их для обмана компьютеров, а не людей, - невыгодно. Другое дело цифровые подделки: берется любое фото настоящего документа (а утечки с такими данными, к сожалению, регулярны), далее следуют всего пара манипуляций в фоторедакторе или обращений к генеративному ИИ - и подделка готова при минимальных или вовсе нулевых затратах. Нацелены такие подделки, прежде всего, на финансовый сектор, особенно на банковские и микрофинансовые организации. Автоматизация генерации позволяет буквально “спамить” финансовые организации заявками на кредиты в надежде, что на очередной отправке фото документа система распознавания и проверяющий за ней сотрудник пропустят фейк. Цифровые подделки также используют для обхода KYC процедур и онлайн верификации.

При этом дешевизна цифровой подделки не говорит о ее примитивности. На беглый взгляд человек может не заметить подвоха: детали могут быть видны только при увеличении изображения и сравнении подозрительных регионов с окружением. Но мошенники прекрасно понимают, что системы распознавания смотрят на документ иначе: для них изображение документа это просто набор реквизитов, которые необходимо извлечь в структурированной форме. А значит, неидеальная замена фото владельца или несовпадения в резкости вставленных букв не являются недостатком.

Восемь способов подделать фото документа

Мы проанализировали большое количество реальных подделок документов и составили список наиболее распространенных типов атак. Что мы выделили: 

Copy-Move подмена символов. Поменяли одну цифру на другую внутри одной картинки путем копирования из другого поля на этом же изображении. Интересный факт: наиболее часто так правят дату рождения.

Примеры модификаций типа Copy-Move на уровне символов. В первой строке оригинальные изображения, во второй модифицированные, в третьей маски с модифицированными областями.

Примеры модификаций типа Copy-Move на уровне символов. В первой строке оригинальные изображения, во второй модифицированные, в третьей маски с модифицированными областями.

Подмена поля. Перенесли ФИО или иные реквизиты из другого документа.

Примеры модификаций в виде подмены полей документа. В первой строке оригинальные изображения, во второй модифицированные, в третьей маски с модифицированными областями.

Примеры модификаций в виде подмены полей документа. В первой строке оригинальные изображения, во второй модифицированные, в третьей маски с модифицированными областями.

Подмена фотографии. Фото владельца заменяется другим.

Примеры модификаций в виде подмены фото владельца документа. В первой строке оригинальные изображения, во второй модифицированные, в третьей маски с модифицированными областями.

Примеры модификаций в виде подмены фото владельца документа. В первой строке оригинальные изображения, во второй модифицированные, в третьей маски с модифицированными областями.

Подмена целого документа. Замена документа в кадре другим документом.

Примеры модификаций в виде замены документа в кадре. В первой строке оригинальные изображения, во второй модифицированные, в третьей маски с модифицированными областями.

Примеры модификаций в виде замены документа в кадре. В первой строке оригинальные изображения, во второй модифицированные, в третьей маски с модифицированными областями.

Склейка. Документ собран из других документов путем объединения их частей.

Примеры модификаций в виде склейки документов с разных изображений в одном кадре. В первой строке оригинальные изображения, во второй модифицированные, в третьей маски с модифицированными областями.

Примеры модификаций в виде склейки документов с разных изображений в одном кадре. В первой строке оригинальные изображения, во второй модифицированные, в третьей маски с модифицированными областями.

Наложение текста. Добавление новых данных поверх изображения встроенными функциями фоторедакторов.

Примеры модификаций в виде наложения текста поверх поля в фоторедакторе. В первой строке оригинальные изображения, во второй модифицированные, в третьей маски с модифицированными областями.

Примеры модификаций в виде наложения текста поверх поля в фоторедакторе. В первой строке оригинальные изображения, во второй модифицированные, в третьей маски с модифицированными областями.

Маскирование информации. Скрытие нежелательных реквизитов.

Примеры модификаций в виде маскирования информации. В первой строке оригинальные изображения, во второй модифицированные, в третьей маски с модифицированными областями.

Примеры модификаций в виде маскирования информации. В первой строке оригинальные изображения, во второй модифицированные, в третьей маски с модифицированными областями.

Посторонние объекты. Мошенники нередко пытаются загрузить образцы документов с интернета. Такие изображения содержат водяные знаки, надписи, графические элементы в виде линий и т.п.

Примеры модификаций в виде наложения одиночных водяных знаков, сигнализирующих о шаблоне документа.

Примеры модификаций в виде наложения одиночных водяных знаков, сигнализирующих о шаблоне документа.

Примеры модификаций в виде наложения периодических водяных знаков.

Примеры модификаций в виде наложения периодических водяных знаков.

Примеры модификаций в виде графических элементов, присущих шаблонам документа с открытых источников с объяснением значений реквизитов.

Примеры модификаций в виде графических элементов, присущих шаблонам документа с открытых источников с объяснением значений реквизитов.

Чтобы иметь возможность защититься от таких атак, необходимы качественные данные с подробной разметкой для обучения соответствующих моделей выявления модификаций. Поэтому, мы решили создать собственный набор данных, который был бы ориентирован на документы, удостоверяющие личность.

Как создавался MIDV-DM

Часть вышеописанных методов модификаций изображений не встречаются в опубликованных датасетах. А те, которые встречаются, имеют существенные отличия в домене - многие датасеты для задачи выявления модификаций изображений составлены из фотографий людей, городских и природных сцен (см. CoMoFoD, MICC-F220, CASIAv1 и CASIAv2). Copy-move крупного животного в сцене зоопарка и одного маленького символа на фотографии документа в высоком разрешении кардинально отличаются по сложности детектирования. Наборы изображений документов с модификациями, такие как DocTamper, FantasyID или T-SROIE, не покрывают все описанные выше атаки: фокус в них сделан на детально проработанных модификациях, тогда как грубые вставки или вотермарки не рассматриваются. Чтобы исправить ситуацию, мы решили сделать набор данных со всеми вышеописанными видами атак на изображения документов, который назвали MIDV-DM. Его название состоит из следующих частей: MIDV - Mobile Identity Document Video (название семейства датасетов), и DM - Document Manipulation.

В качестве основы датасета мы взяли набор MIDV-2020. Он содержит 10 типов документов, удостоверяющих личность, для каждого типа доступно 100 уникальных по заполнению шаблонов. Все шаблоны в этом датасете были распечатаны, заламинированы и отсняты на камеры смартфонов в сложных сценариях. Для имитации каждой из 8 типов атак мы выполняли геометрическую нормализацию документа, производили соответствующую модификацию с помощью OpenCV или ImageMagick, затем вставляли документ обратно на фон и генерировали маску для изображения с модифицированной областью.

В итоге получили 8000 модифицированных изображений с детальной разметкой, которые могут использоваться учеными для совершенствования методов выявления поддельных изображений документов. Также в датасет включены 1000 оригинальных фото документов из MIDV-2020, не содержащих цифровых модификаций. Набор данных MIDV-DM доступен для скачивания через FTP по ссылке ftp://smartengines.com/midv-dm/.

Мы взяли один из лучших детекторов редактирования изображений. И он не справился...

Задача выявлений модификаций изображений может рассматриваться в одной из следующих постановок: детекции и локализации. В задаче детекции необходимо установить только факт модификации, тогда как в задаче локализации - точное положение модифицированной области. Сразу уточним, что для применения моделей в индустриальных системах задача ставится в терминах локализации, так как только в таком случае достигается интерпретируемость ответа системы.

Чтобы оценить сложность созданного MIDV-DM датасета, мы рассмотрели state-of-the-art решения для выявления модификаций изображения. В качестве тестируемой модели была выбрана IML-ViT - нейросеть на основе архитектуры трансформер, показавшая существенное превосходство на популярных бенчмарках CASIAv1, COVER, NIST16, IMD-20 и многих других. Она работает с изображением в достаточно высоком разрешении (1024×1024), и позволяет одновременно решать как задачу детекции, так и локализации.

Прогнав через IML-ViT 9000 фото документов из MIDV-DM (1000 оригинальных фото из MIDV-2020 и 8000 модифицированных), мы замерили качество детекции и локализации в терминах классических метрик Recall, Precision и F1-Score. Отдельно мы также замерили критически важную для практических систем метрику частоты ложных срабатываний (FPR, False Positive Rate). Получили следующие результаты по качеству детекции (т.е. качество бинарной классификации факта модификации на уровне изображений):

Датасет/метрика

FPR

Recall

Precision

F1-Score

MIDV-DM (порог=0.5)

1.00

1.0

0.889

0.941

MIDV-DM (порог=0.961)

0.987

0.991

0.889

0.937

Видим, что в рамках решения задачи детекции IML-ViT помечает практически все настоящие изображения из MIDV-2020 как модифицированные (FPR близок к 1 даже после донастройки порога принятия решения). 

Далее мы попробовали проанализировать ответ модели по части локализации модифицированных областей. Получили такие результаты:

Датасет/метрика

FPR

Recall

Precision

F1-Score

CASIAv1

-

-

-

0.795

MIDV-DM (порог=0.5)

0.056

0.447

0.184

0.261

MIDV-DM (порог=0.961)

0.012

0.302

0.409

0.347

При тестировании IML-ViT мы также построили график зависимости значений метрик от порога принятия решения.

График зависимости метрик качества работы IML-ViT на датасете MIDV-DM в зависимости от порога принятия решения.

График зависимости метрик качества работы IML-ViT на датасете MIDV-DM в зависимости от порога принятия решения.

Как локализатор, state-of-the-art модель IML-ViT тоже не справляется в домене документов: если на сценах природы из CASIAv1 по метрике F1-Score IML-ViT достигает значения 0.795, то на MIDV-DM получается всего 0.261 “из коробки”, и 0.347 после настройки порога.

Разница в качестве более чем в 2 раза!

Заключение

Ввиду активной цифровизации финансовых и KYC сервисов, большинство атак на сегодня происходит не на бумажный документ, а на его цифровое представление. Опасность таких подделок заключается в их массовости, вызванной, прежде всего, дешевизной их автоматической генерации. Поэтому современный цифровой онбординг требует не только OCR и проверки подлинности документа, но и технологий обнаружения цифровых манипуляций.

Мы надеемся, что разработанный нами датасет MIDV-DM поможет исследователям в разработке эффективных решений определения цифровых подделок в домене документов.

Другие наши открытые датасеты для задач распознавания и проверки подлинности документов можно посмотреть здесь: https://smartengines.ru/science/dataset/

Статья написана по мотивам доклада,  представленного на международной конференции ICMV-2025 в г. Париж, Франция. Ссылка на работу: A. V. Chuiko, I. A. Kunina, S. A. Usilin, C. Chen, S. Tan, D. P. Nikolaev and V. V. Arlazarov, “MIDV-DM: A Document-Oriented Dataset for Image Manipulation Detection and Localization,” Computer Optics, vol. 49, no 6, pp. 1093-1101, 2025, DOI: 10.18287/COJ1768.

Ссылка на IML-ViT: Ma X, Du B, Jiang Z, Du X, Al Hammadi A Y, Zhou J. IML-ViT: Benchmarking image manipulation localization by vision transformer. arXiv preprint arXiv:2307.14863 (2024).

P.S. Кстати, против нас все это не работает. Мы уже давно такое ловим и даже круче.