惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

C
Comments on: Blog
GbyAI
GbyAI
B
Blog RSS Feed
Microsoft Security Blog
Microsoft Security Blog
罗磊的独立博客
人人都是产品经理
人人都是产品经理
F
Full Disclosure
IT之家
IT之家
Know Your Adversary
Know Your Adversary
Engineering at Meta
Engineering at Meta
K
Kaspersky official blog
T
Tor Project blog
V
Visual Studio Blog
S
SegmentFault 最新的问题
P
Proofpoint News Feed
V
Vulnerabilities – Threatpost
T
True Tiger Recordings
H
Hackread – Cybersecurity News, Data Breaches, AI and More
The Hacker News
The Hacker News
MyScale Blog
MyScale Blog
Latest news
Latest news
Blog — PlanetScale
Blog — PlanetScale
Cyberwarzone
Cyberwarzone
Stack Overflow Blog
Stack Overflow Blog
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
Apple Machine Learning Research
Apple Machine Learning Research
Project Zero
Project Zero
AWS News Blog
AWS News Blog
Martin Fowler
Martin Fowler
F
Fox-IT International blog
C
CXSECURITY Database RSS Feed - CXSecurity.com
Scott Helme
Scott Helme
C
Check Point Blog
博客园 - Franky
P
Proofpoint News Feed
S
Securelist
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
U
Unit 42
P
Privacy & Cybersecurity Law Blog
NISL@THU
NISL@THU
T
The Blog of Author Tim Ferriss
Google DeepMind News
Google DeepMind News
D
Docker
Hacker News - Newest:
Hacker News - Newest: "LLM"
WordPress大学
WordPress大学
李成银的技术随笔
A
Arctic Wolf
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
S
Schneier on Security
N
Netflix TechBlog - Medium

Все публикации подряд на Хабре

preIPO Anthropic, OpenAI, SpaceX. Разбираемся — стоит ли участвовать? Entaxy ION + OPC UA: два способа получить данные с промышленного оборудования Память на миллион, а толку ноль: как мы спасали ИИ-агента от «тупости» РСЯ, AdSense или myTarget: что на самом деле в 2026 приносит больше денег сайту и причем тут монетизаторы Практическое построение сервисов на Go под реальный трафик PostgreSQL и аналитика: что меняется, когда хранилище становится общим Codex за 5 месяцев 2026: мой топ-5 релизов, что не зашло и где OpenAI обогнал Anthropic Как создать короткое видео с помощью нейросетей: Полный гайд по Veo 3.1, Kling 3.0 и Happy Horse 1.0 Алгоритм проверок физлиц от экс сотрудника ФНС Как ИИ портит резюме студентам Системные вызовы в сфере ИТ в 2026: стратегический взгляд для ИТ-руководителей Вайбкодинг заканчивается на localhost: как я строю SaaS для цифровизации коттеджных поселков с Codex Производственные риски в небольшом кастомном производстве. С чем я сталкивалась и как научилась это учитывать Подключаем ИИ органы чувств: bash-демон, пайка и самосознание на Raspberry Pi Я хотел повторить Growing Neural CA за вечер. Ушёл месяц Промт для генерации текста без ИИ следа — как писать уникальные тексты через нейросеть От capabilities к AppArmor: что реально остановит атакующего в контейнере CactOS Вектора интересов: как находить настоящую мотивацию и усиливать команды Цена безопасности [Перевод] Цена безопасности “Рубик” от пет-проекта до прода или ITIL 4 для строительно-торговых центров Чего ждать (и не ждать) от ремейка AC4 Black Flag Архитектурный тупик корпоративного хранения: почему смена модели не снимает ограничений и что с этим делать Атаки через подрядчиков, дефицит кадров и квест с импортозамещением: главные вызовы ИБ в 2026 году Я не оставлю детям наследства Почему порты стали «дверями» в сервер, и кто решил, что SSH будет 22 Почему зарубежные разработчики чипов возвращаются на китайские фабрики Как у меня НЕ получился торговый бот на Polymarket Проектирование архитектуры в нотации ArchiMate с использованием ИИ. Часть 2 Как превратить домашнюю файлопомойку в умную AI-галерею на основе сборки из x99+Xeon и видеокарты за 2 тыс рублей Перспективы заселения нашей галактики Кризис менеджмент в ИТ Reactive Programming не спасёт вас. Если вы не решили эти 5 проблем — у вас просто медленный монолит с Flux Как я делаю DIY-контроллер для ПК: громкость, приложения, MIDI, OBS Миграция микросервисов на Python с помощью LLM: экономим месяцы для разработчиков Программирование микросхем GAL и им подобных Почему таск-трекер не заменяет ИСУП: из чего состоит полноценный контур управления проектами Всё об информационной безопасности. Кибербезопасность. DevOps, CI/CD. Хакеры. Алексей Федулаев Как импортировать базу клиентов в amoCRM и навести порядок в контактах Как мы четыре раза переписали Outbox Сексизм в IT: данные вместо домыслов Один фронтенд, чтоб править всеми, один фронтенд, чтоб всех найти: 1 точка входа, разные BI ИИ в тестировании: зачем мы пошли в пилот и почему начали с чата, а не с агентов Как я научила Telegram-бота наводить порядок в чате с мемами: пересылка по хештегам в соответствующую тему Как мы сделали внутреннюю CRM для управления студией – опыт Doubletapp Десятипальцевый метод — как печатать цифру " Шесть "? Партнерская программа по нейросетям: зарабатывай на ИИ, приводя клиентов в AI-сервис Как я сделал «клик по элементу → открыть в VS Code» за один вечер Эволюция Telegram‑бота на C++: от «лапши» в main() до ООП, in‑memory кэша и мутов по Фибоначчи Как я (внезапно) стал адвокатом вайб‑кодинга в корпорации Дизайн за 5 минут. Дайджест мая 2026 Только 17% всех 64-битных целых чисел можно разложить на два 32-битных 0,000000001% × ∞ = 100%. Вы осознаёте что любое событие неизбежно? «Вы либо трусы наденьте, либо крестик снимите». Как мы выиграли еще один суд против PR-агентства PRslon Почему вы тратите время не на переговоры, а на чужую внутреннюю драму. Как проходят переговоры с крупными компаниями Как приоритизировать регрессионные проверки, когда сжаты сроки релиза Электронные транспортные накладные: технический разбор нововведений 2026 года для логистов, разработчиков и бизнеса Как определить LLM под капотом чат-бота: учебный эксперимент по black-box fingerprinting Хабру 20 лет — зовём вас отметить это к нам Домой iPad как инструмент разработчика в эпоху агентного программирования Inspector v3: как я сделал свой центр управления Kubernetes на старом ноутбуке Как мы осваивали производство гибко-жёстких печатных плат: от проб и ошибок к рабочей технологии 30 лет мы внедряли в России Ansys. А потом он ушёл — и пришлось садиться писать собственный CAE для аддитивной печати Цифровой рубль и цифровой чек Облако под защитой от DDoS: чем On-Demand отличается от Always-On Распродажа в издательстве «Питер» Почему современный стадион больше похож на ЦОД, чем на арену Машина, которая учится думать Запихнули игровую приставку в короб и в первый же месяц продали на 3 млн Игровой ноутбук vs игровой ПК за те же деньги: что изменилось в 2026 году ГИС для Minecraft. Часть 1 Смена старого оборудования на новое убирает огромные затраты на его эксплуатацию — но куда девать всё это старое? Project Manager 2026: как AI-инструменты меняют профессию SLA как инструмент, а не отчёт. Часть 1. Как подружить бизнес и инженеров через общие цифры Послания от ангелов и первый шаг к компьютерам: стеганография Средневековья и Ренессанса Что новенького есть в CSS в 2026 году? Хватит мучить ChatGPT. Почему ваш промпт не сработает Как и зачем мы писали семантический слой для ИИ аналитики – SLayer Маленькая EVPN/VXLAN-фабрика без тупика: как мы запускали площадку в Амстердаме Репликация по DDIA: что я понял, только когда сам сломал прод RAG без downtime: настраиваем инкрементальное обновление документов на Qdrant и LangChain Тени истории: война машин. Как «Энигма» и «Фиалка» определили исход Второй мировой войны Как ускорить распознавание объектов нейросетями среди множества классов, не жертвуя памятью и точностью Как я хотел две странички для SAMBA и NFS, а сделал полноценную панель управления NAS на 20+ страницах Kubernetes для баз данных? CloudNativePG делает PostgreSQL по-настоящему Cloud-Native Как мы анализировали поведение пользователей Яндекс Музыки на 50 млн событий Как я разработал PoC-конструктор для приложений Android Стек российского сисадмина в 2026 Как я сделал обычную посудомоечную машину умной, с Home Assistant/ESPHome Контент-завод в 2026 году: разбор автономных систем, который отговорит вас это покупать I just want an agent. Часть 2. Как мы построили виртуальную команду для разработки ИИ-агентов Прототип игры с помощью Flowith: личный опыт и ограничения AI-инструмента Что вы не знаете об альтернативных документах, удостоверяющих личность Программные модули в DATAREON Platform: выносим повторяющуюся логику в C# функции Не прячьте интерфейс в код: защищаем внешний вид как промобразец, изобретение и товарный знак Могут ли взрослые учить язык как дети? Технология многовидового представления в nanoCAD BIM Строительство DRAйверы для GPU: как Kubernetes научился выделять устройства через стандартный API Рубрика эксперименты (в дизайне): наш опыт генерации и проверки гипотез
Google предлагает единый «водяной знак» для изображений, видео и текста, созданных ИИ
TrexSelectel · 2026-05-26 · via Все публикации подряд на Хабре

Время на прочтение5 мин

Охват и читатели4.2K

Изображения, видео, музыка и тексты, производимые искусственным интеллектом, сейчас становятся куда более качественными, чем на старте развития генеративных моделей, и отличать их от контента, созданного человеком, дается все с большим трудом. Проблема давно вышла за пределы обычных экспериментов и теперь затрагивает соцсети, новости, поисковики и другие ресурсы, которыми люди пользуются каждый день, что неминуемо ведет к распространению недостоверной информации.

Google и команда DeepMind уже несколько лет разрабатывают SynthID — систему скрытой маркировки контента, созданного искусственным интеллектом. Недавно компания объявила, что помимо использования в собственных сервисах технология начинает внедряться и в продукты других крупных разработчиков ИИ. SynthID уже на этапе генерации добавляет в изображение, видео, аудио или текст специальный незаметный сигнал. Такой маркер сохраняется даже после редактирования, сжатия или пересылки и помогает определить, что материал был создан нейросетью.

Источник.

Источник.

Что представляет собой SynthID

На данный момент Google не отказывается от используемых ранее методов маркировки, включая стандарт C2PA с криптографическими подписями. Однако технология SynthID отличается от всего, что пробовали раньше: вместо того чтобы прикреплять к файлу внешние метаданные или видимые метки, которые легко удаляются при сохранении или пересылке, система закладывает специальный сигнал прямо в структуру самого контента еще во время генерации. В изображениях он распределяется по пикселям, в видео — по последовательности кадров, в аудио — по звуковой волне, а в тексте — по вероятностям выбора токенов. Сигнал формируется статистически и распознается только обученным детектором, человеческие же глаза или уши его не замечают.

За время работы в сервисах Google через SynthID прошло уже больше ста миллиардов изображений и видеофрагментов, а объем обработанного аудио сравним с 60 000 лет непрерывного звучания. Маркировка добавляется автоматически во время генерации и не требует никаких действий от пользователя, поэтому технологию удается быстро внедрять в массовые продукты.

Арендуйте GPU за 1 рубль!

Выберите нужную конфигурацию в панели управления Selectel. *

Подробнее →

Как SynthID работает с изображениями, видео и аудио

При генерации изображений специальный блок нейросети — embedder — начинает работать одновременно с основной генеративной моделью. Он вносит крошечные, математически рассчитанные корректировки в значения пикселей, распределяя их равномерно по всей площади кадра. Эти изменения формируют уникальный статистический «узор», который не создает видимых артефактов и не влияет на четкость, цвета или композицию. Детектор в последствии анализирует этот узор по всему изображению, а не по отдельным участкам, что позволяет восстановить информацию даже после обрезки или поворота. То же самое касается и маркировки видео — «прошивается» сразу множество кадров, что позволяет распознать SynthID даже если видео сжато или обрезано.

В случае со звуком система использует особенности человеческого слуха. Во время генерации SynthID встраивает маркер прямо в звуковую волну, но делает это в тех частях сигнала, которые человеческое ухо не улавливает. В моделях вроде Lyria для музыки или NotebookLM для озвученных обзоров система уже работает в штатном режиме. Учитывает она, как и в случае с другими форматами, все типичные манипуляции — сжатие, наложение эффектов или перезапись.

С текстом SynthID работает иначе, чем с изображениями или звуком. Во время генерации система слегка меняет вероятность выбора отдельных слов и фраз, формируя скрытый статистический отпечаток. Для читателя текст выглядит совершенно обычным — не меняется ни стиль, ни смысл, ни связность изложения. Однако специальный детектор в дальнейшем может проанализировать последовательность токенов и определить, что материал был создан моделью с поддержкой SynthID. При этом саму языковую модель не нужно переобучать: технология подключается уже на этапе генерации текста.

Google уже открыла часть технологии для других разработчиков, чтобы похожий механизм можно было встроить и в сторонние языковые модели. При небольших правках или легком перефразировании маркер обычно сохраняется и продолжает распознаваться детектором. Если же текст полностью переписать или перевести через другую модель, точность определения снижается. Тем не менее для большинства обычных сценариев редактирования сигнал остается читаемым, а сама система позволяет использовать единый подход к маркировке текста, изображений, видео и аудио.

Партнерства и расширение по отрасли

В мае 2026 года Google объявила о значительном расширении круга участников. Теперь SynthID внедряют OpenAI для изображений в ChatGPT, Codex и через API, NVIDIA в своих моделях Cosmos, а также Kakao и ElevenLabs. Каждая компания сохраняет свои особенности генерации, но добавляет совместимый слой идентификации, который распознается общими инструментами.

Источник.

Источник.

Однако значительная часть проектов на данный момент все же использует собственные способы маркировки ИИ-контента или вообще обходится без них, из-за чего происхождение изображений, видео, аудио и текстов часто остается неясным. Подключение нескольких крупных разработчиков к SynthID делает систему более универсальной и позволяет проверять материалы, созданные в разных сервисах, одним и тем же способом. Если таких участников станет больше, распознавание синтетического контента может со временем стать заметно проще, независимо от платформы.

Пользователи уже могут проверять подозрительный контент прямо через Gemini. Достаточно загрузить изображение, аудио, видео или вставить текст, после чего система попытается определить наличие маркера SynthID. Однако модель честно пишет, что проверяет только генерацию Google AI и не может гарантировать, что контент не был сгенерирован с помощью других сервисов. Планируется добавить инструменты проверки в Chrome, поиск и мобильные сервисы вроде Lens и Circle to Search.

OpenAI также запустила собственный инструмент проверки, который умеет работать и с метаданными C2PA, и с сигналами SynthID. С его помощью можно быстро проверить происхождение изображения или другого материала без установки отдельных программ. Кроме того, компании готовят API для бизнеса, чтобы подобную проверку можно было встраивать в сторонние сервисы и рабочие процессы.

Пока доступ к полному API ограничен, чтобы не дать злоумышленникам времени на эксперименты, но в будущем его планируют расширять. Проверка занимает секунды и выдает понятный результат даже для тех, кто далек от технических деталей. В итоге любой желающий сможет быстро разобраться, откуда взялся тот или иной контент.

Что еще

На каком этапе сейчас внедрение технологии? Пока что SynthID работает только в тех моделях и сервисах, где технология встроена изначально. Если изображение, текст, аудио или видео были созданы другой нейросетью без поддержки такой маркировки, детектор ничего не обнаружит. Кроме того, на данный момент система не дает стопроцентной гарантии даже в поддерживаемых моделях. Если материал сильно переписан, многократно обработан или собран из нескольких источников, точность определения может заметно снижаться.

Проблемой остаются и попытки обхода подобных механизмов. Разработчики постоянно тестируют устойчивость маркеров к редактированию, сжатию и другим изменениям, но полностью исключить возможность удаления или повреждения сигнала пока нельзя. Поэтому SynthID скорее помогает определить вероятное происхождение контента, чем служит абсолютным доказательством. Но лиха беда начало.

Тем не менее такие системы постепенно становятся дополнительным инструментом проверки наряду с метаданными C2PA и другими способами идентификации. Если их начнет поддерживать больше сервисов и моделей, проверять происхождение изображений, видео, аудио и текстов может стать заметно проще.