Googleは完璧なディープフェイクエンジンを開発した。隠れたピクセルの信号で混乱を阻止できるか？

フィードをスクロールしていると、自分が動く車の上でバックフリップをしている、完璧に描かれた物理的にも正確な動画を見かけます

バックフリップのやり方を知りません。あの車の近くにいたこともありません。しかし、照明は完璧です。ジャケットが風を捉える流れ動きは全くリアルに見えます。あなたの声はあなたそのものです。

これはもはや数百万ドルのハリウッドビジュアルエフェクトプロジェクトではなくなりました。これはただのインターネットの火曜日で、Googleの新しいGemini Omniモデルのおかげです.

Google I/O 2026で発表されたOmniは、生成エンジンとしての絶対的な巨匠です。ユーザーはどの動画にも自分をドロップさせ、ハイレベルなリアリズムのAIアバターを作成し、単一のテキストプロンプトから驚くほど正確な映像を生成することができます。

ところで、Google I/O 2026で発表された他のすべてのことを素早く解説したい場合は、この短いキーノートの再放送をご覧いただけます：

無線式の現実歪曲エンジンを一般に提供することには、社会を変えるほどの大きな後遺症が伴います。今年に入り、ディープフェイクの事件は驚異的な900％増加しました。

オムニがスマートフォンを持つ誰にでもエリートレベルのビデオ操作を可能にしたことで、私たちはオンラインメディアの大部分が完全に合成される未来を目前に立つことになります。

Googleは火薬を配ることを知っています。デジタル世界が燃え落ちるのを防ぐため、彼らは消火器を展開しています。

この合成的洪水に対する主要な防御機構は、C2PA認証情報とDeepMind SynthIDウォーターマークの二つの大きな柱に依存しています。

矛盾：神と警察官を同時に演じる

この技術的進歩の中心には深い皮肉があります。Googleは同時に究極の偽造品作成者と主要な認証官として行動しています。

彼らは事実とフィクションの境界を曖昧にするようなツールを作成している。同時に、実際に何が本当のものかを教えてくれるインフラを必死で構築しようとしている.

Omniはネイティブマルチモーダルシステムだ。古いモデルは不器用にテキストエンジンからイメージエンジンへ、そしてビデオジェネレーターへタスクを渡していたのに対し、Omniはテキスト、音声、画像、ビデオを同時に一つの統一された脳で処理する。

ビデオをアップロードして会話形式で編集できます。明かりを暗くする、カメラの角度を変える、または目に見える物体を透明にするなど指示できます。結果は驚くほど一貫しています。

この必然的に引き起こす混沌を打ち消すために、Googleは深偽検知を最も多く利用されているプラットフォームに直接統合しています。

すぐに、Chromeで画像を右クリックしたり、電話でCircle to Searchを使って、単一の質問を簡単に尋ねることができるようになります。

「これはAIで作成されましたか？」

しかし、システムは実際にどうやって知ることができるのでしょうか。

防衛：メタデータ対ピクセルの深い信号

Googleの検証戦略は二層構造のアプローチに依存しており、単一に依存するのは失敗へのレシピです。

レイヤー1：C2PAコンテンツクレデンシャル

C2PAをデジタルメディアの暗号学的な栄養表示と考える。

これはファイルに添付されるメタデータで、コンテンツがどのように作成され、どのツールが使用されたかの検証可能な履歴を記録している。Googleはこれを強く推し進め、ChromeやSearchに深く組み込んでいる。

C2PAの問題は、脆さにある。

悪意のある行為者はファイルからメタデータを削除できます。さらに悪いことに、多くのソーシャルメディアプラットフォームはアップロードを自動的に圧縮するため、意図せずにその重要な栄養表示を消去してしまう可能性があります。有効なC2PAマニフェストは人間による作成を主張することができますが、それ自体の画像の意味論的な真実を保証するものではありません.

レイヤー2: SynthID

ここで本格的な作業が行われます。Google DeepMindによって開発されたSynthIDは、コンテンツそのものに直接埋め込まれた見えないデジタルウォーターマークです。

画像や動画では、ウォーターマークはピクセルレベルでビジュアルスペクトラムに組み込まれています。

音声では、信号は波形の深い部分に隠されています。

テキストでは、トークン生成プロセスをわずかに変更し、検出器が認識できる統計的なパターンを作成します。

SynthIDは戦争のために作られています。cropping、重いフィルター、フレームレートの変更、損失のある圧縮を生き延びるように設計されています。元のメディアを破壊しないと、それを拭き去ることはできません。

誰かがGemini Omniビデオを撮影し、Instagramフィルターをかけて、WhatsAppで圧縮し、それをTikTokに再アップロードした場合でも、SynthIDはGoogleの検出ツールによってスキャンされると警報が鳴ります

勝てない戦争？

SynthIDが最初にリリースされて以来、Googleは既に1000億以上の画像とビデオにウォーターマークを付けています

OpenAI、カカオ、エレベンラボスのような強力なプレイヤーを業界に引き入れて、この見えないシグナルを標準化しようとしています

しかし、問題は残ります：ウォーターマークが実際にAI生成メディアの莫大な量に追いつけますか？

インターネットのハッカー意識は、企業のトラッキングに対して自然と反発します。オープンソース開発者たちはすでに、これらの目に見えないシグナルをバイパスしたり、削除したりするモデルを構築しようとしています.

さらに、SynthIDは参加しているモデルによって生成されたコンテンツのみをマークします。悪質な行為者が自分のローカルマシンでサブネットビデオジェネレーターを起動した場合、Googleのウォーターマークは付与されません.

私たちは二層構造のインターネットへ急速に進んでいます。

一方には、C2PAセンサーデータとSynthIDチェックによって確認された現実があり、

他方には、確認されていないが非常に説得力のある合成コンテンツの大きな海がある。

Googleは、我々に現実を思う存分に変えることができるツールを手渡している。SynthIDは素晴らしいエンジニアリングの成果だが、それだけで真のインターネットを救うことを期待するのはあまりにも多くのことかもしれない。

この技術はディープフェイクを特定できますが、私たちが見ている動画が実際に起こったのかどうかを気にかけるのは最終的には私たち次第です。

おすすめ購読元

DEV Community