
Изображения, видео, музыка и тексты, производимые искусственным интеллектом, сейчас становятся куда более качественными, чем на старте развития генеративных моделей, и отличать их от контента, созданного человеком, дается все с большим трудом. Проблема давно вышла за пределы обычных экспериментов и теперь затрагивает соцсети, новости, поисковики и другие ресурсы, которыми люди пользуются каждый день, что неминуемо ведет к распространению недостоверной информации.
Google и команда DeepMind уже несколько лет разрабатывают SynthID — систему скрытой маркировки контента, созданного искусственным интеллектом. Недавно компания объявила, что помимо использования в собственных сервисах технология начинает внедряться и в продукты других крупных разработчиков ИИ. SynthID уже на этапе генерации добавляет в изображение, видео, аудио или текст специальный незаметный сигнал. Такой маркер сохраняется даже после редактирования, сжатия или пересылки и помогает определить, что материал был создан нейросетью.

Что представляет собой SynthID
На данный момент Google не отказывается от используемых ранее методов маркировки, включая стандарт C2PA с криптографическими подписями. Однако технология SynthID отличается от всего, что пробовали раньше: вместо того чтобы прикреплять к файлу внешние метаданные или видимые метки, которые легко удаляются при сохранении или пересылке, система закладывает специальный сигнал прямо в структуру самого контента еще во время генерации. В изображениях он распределяется по пикселям, в видео — по последовательности кадров, в аудио — по звуковой волне, а в тексте — по вероятностям выбора токенов. Сигнал формируется статистически и распознается только обученным детектором, человеческие же глаза или уши его не замечают.
За время работы в сервисах Google через SynthID прошло уже больше ста миллиардов изображений и видеофрагментов, а объем обработанного аудио сравним с 60 000 лет непрерывного звучания. Маркировка добавляется автоматически во время генерации и не требует никаких действий от пользователя, поэтому технологию удается быстро внедрять в массовые продукты.
Как SynthID работает с изображениями, видео и аудио
При генерации изображений специальный блок нейросети — embedder — начинает работать одновременно с основной генеративной моделью. Он вносит крошечные, математически рассчитанные корректировки в значения пикселей, распределяя их равномерно по всей площади кадра. Эти изменения формируют уникальный статистический «узор», который не создает видимых артефактов и не влияет на четкость, цвета или композицию. Детектор в последствии анализирует этот узор по всему изображению, а не по отдельным участкам, что позволяет восстановить информацию даже после обрезки или поворота. То же самое касается и маркировки видео — «прошивается» сразу множество кадров, что позволяет распознать SynthID даже если видео сжато или обрезано.
В случае со звуком система использует особенности человеческого слуха. Во время генерации SynthID встраивает маркер прямо в звуковую волну, но делает это в тех частях сигнала, которые человеческое ухо не улавливает. В моделях вроде Lyria для музыки или NotebookLM для озвученных обзоров система уже работает в штатном режиме. Учитывает она, как и в случае с другими форматами, все типичные манипуляции — сжатие, наложение эффектов или перезапись.
С текстом SynthID работает иначе, чем с изображениями или звуком. Во время генерации система слегка меняет вероятность выбора отдельных слов и фраз, формируя скрытый статистический отпечаток. Для читателя текст выглядит совершенно обычным — не меняется ни стиль, ни смысл, ни связность изложения. Однако специальный детектор в дальнейшем может проанализировать последовательность токенов и определить, что материал был создан моделью с поддержкой SynthID. При этом саму языковую модель не нужно переобучать: технология подключается уже на этапе генерации текста.
Google уже открыла часть технологии для других разработчиков, чтобы похожий механизм можно было встроить и в сторонние языковые модели. При небольших правках или легком перефразировании маркер обычно сохраняется и продолжает распознаваться детектором. Если же текст полностью переписать или перевести через другую модель, точность определения снижается. Тем не менее для большинства обычных сценариев редактирования сигнал остается читаемым, а сама система позволяет использовать единый подход к маркировке текста, изображений, видео и аудио.
Партнерства и расширение по отрасли
В мае 2026 года Google объявила о значительном расширении круга участников. Теперь SynthID внедряют OpenAI для изображений в ChatGPT, Codex и через API, NVIDIA в своих моделях Cosmos, а также Kakao и ElevenLabs. Каждая компания сохраняет свои особенности генерации, но добавляет совместимый слой идентификации, который распознается общими инструментами.

Однако значительная часть проектов на данный момент все же использует собственные способы маркировки ИИ-контента или вообще обходится без них, из-за чего происхождение изображений, видео, аудио и текстов часто остается неясным. Подключение нескольких крупных разработчиков к SynthID делает систему более универсальной и позволяет проверять материалы, созданные в разных сервисах, одним и тем же способом. Если таких участников станет больше, распознавание синтетического контента может со временем стать заметно проще, независимо от платформы.
Пользователи уже могут проверять подозрительный контент прямо через Gemini. Достаточно загрузить изображение, аудио, видео или вставить текст, после чего система попытается определить наличие маркера SynthID. Однако модель честно пишет, что проверяет только генерацию Google AI и не может гарантировать, что контент не был сгенерирован с помощью других сервисов. Планируется добавить инструменты проверки в Chrome, поиск и мобильные сервисы вроде Lens и Circle to Search.
OpenAI также запустила собственный инструмент проверки, который умеет работать и с метаданными C2PA, и с сигналами SynthID. С его помощью можно быстро проверить происхождение изображения или другого материала без установки отдельных программ. Кроме того, компании готовят API для бизнеса, чтобы подобную проверку можно было встраивать в сторонние сервисы и рабочие процессы.
Пока доступ к полному API ограничен, чтобы не дать злоумышленникам времени на эксперименты, но в будущем его планируют расширять. Проверка занимает секунды и выдает понятный результат даже для тех, кто далек от технических деталей. В итоге любой желающий сможет быстро разобраться, откуда взялся тот или иной контент.
Что еще
На каком этапе сейчас внедрение технологии? Пока что SynthID работает только в тех моделях и сервисах, где технология встроена изначально. Если изображение, текст, аудио или видео были созданы другой нейросетью без поддержки такой маркировки, детектор ничего не обнаружит. Кроме того, на данный момент система не дает стопроцентной гарантии даже в поддерживаемых моделях. Если материал сильно переписан, многократно обработан или собран из нескольких источников, точность определения может заметно снижаться.
Проблемой остаются и попытки обхода подобных механизмов. Разработчики постоянно тестируют устойчивость маркеров к редактированию, сжатию и другим изменениям, но полностью исключить возможность удаления или повреждения сигнала пока нельзя. Поэтому SynthID скорее помогает определить вероятное происхождение контента, чем служит абсолютным доказательством. Но лиха беда начало.
Тем не менее такие системы постепенно становятся дополнительным инструментом проверки наряду с метаданными C2PA и другими способами идентификации. Если их начнет поддерживать больше сервисов и моделей, проверять происхождение изображений, видео, аудио и текстов может стать заметно проще.
























