慣性聚合 関心のあるブログ、ニュース、テクノロジーを効率的に追跡
原文を読む 慣性聚合で開く

おすすめ購読元

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

DEV Community

Authentication Security Deep Dive: From Brute Force to Salted Hashing (With Java Examples) Why AI Systems Don’t Fail — They Drift Spilling beans for how i learn for exam😁"Reinforcement Learning Cheat Sheet" I Replaced Chrome with Safari for AI Browser Automation. Here's What Broke (and What Finally Worked) How Python Borrows Other People's Work The $40 Architecture: Processing 1 Billion API Requests with 99.99% Uptime Vibe Coding: A Workflow Guide (From Zero to SaaS) Most webhook security guides protect the wrong side. The scary part is delivery. Headless CMS for TanStack Start: Build a Blog with Cosmic EU Age Verification App "Hacked in 2 Minutes" — What Actually Happened Comfy Cloud’s delete function does not actually remove files Running AI Models on GPU Cloud Servers: A Beginner Guide Event-driven media intelligence with AWS Step Functions and Bedrock I scored 500 AI prompts across 8 quality dimensions — here's what broke How to Call Google Gemini API from Next.js (Free Tier, No Backend Needed) The Portal Protocol: Reclaiming Human Connection in the Age of AI How to Fix Your Team's Scattered Knowledge Problem With a Self-Hosted Forum Intro to tc Cloud Functors: A Graph-First Mental Model for the Modern Cloud Designing Multi-Tenant Backends With Both Ownership and Team Access I Built a Neumorphic CSS Library with 77+ Components — Here's What I Learned PostgreSQL Performance Optimization: Why Connection Pooling Is Critical at Scale Cómo construí un SaaS multi-rubro para gestionar expensas en Argentina con FastAPI + Vue 3 🚀 I Built an Ethical Hacking Scanner Tool – Open Source Project I Replaced /usage and /context in Claude Code With a Single Statusline A Pythonic Way to Handle Emails (IMAP/SMTP) with Auto-Discovery and AI-Ready Design I Collected 8.9 Million Polymarket Price Points — Here's What I Found About How Markets Really Move EcoTrack AI — Carbon Footprint Tracker & Dashboard Everyone's Using AI. No One Agrees How. 5 self-hosted ebook managers worth trying in 2026 Building Your First AI Agent with LangChain: From Chatbot to Autonomous Assistant Common SOC 2 Failures (Real World) Stop Vibe-Checking Your AI App: A Practical Guide to Evals How to Use SonarQube and SonarScanner Locally to Level Up Your Code Quality Your Next To-Do App Is Dead — I Replaced Mine with an OpenClaw AI Sign a Nostr event in 60 lines of Python using coincurve — no nostr-sdk, no nbxplorer, no rust toolchain ITGC Audit Explained Like You’re in Big 4 Patch Tuesday abril 2026: Microsoft parcha 163 vulnerabilidades y un zero-day en SharePoint Stop scraping everything: a better way to track competitor price changes Listing on MCPize + the Official MCP Registry while routing payments OUTSIDE the marketplace — how I kept 100% of my x402 revenue Building an AI-Powered Risk Intelligence System Using Serverless Architecture Why We Ripped Function Overloading Out of Our AI Toolchain Testing AI-Generated Code: How to Actually Know If It Works SaaS Churn Is Killing Your Business. Here Is What to Do About It (Without a Support Team) The Speed of AI Is No Longer Linear - And Self-Improving Models Are Why How to Implement RBAC for MCP Tools: A Practical Guide for Engineering Teams From Standard Quote to Persuasive Proposal: AI Automation for Arborists I built a CLI that scaffolds complete multi-tenant SaaS apps Axios CVE-2025–62718: The Silent SSRF Bug That Could Be Hiding in Your Node.js App Right Now The dashboard that ended our friendship Data Pipelines Explained Simply (and How to Build Them with Python)
Googleは完璧なディープフェイクエンジンを開発した。隠れたピクセルの信号で混乱を阻止できるか?
Kumar Kislay · 2026-05-24 · via DEV Community

フィードをスクロールしていると、自分が動く車の上でバックフリップをしている、完璧に描かれた物理的にも正確な動画を見かけます

バックフリップのやり方を知りません。あの車の近くにいたこともありません。しかし、照明は完璧です。ジャケットが風を捉える流れ動きは全くリアルに見えます。あなたの声はあなたそのものです。

これはもはや数百万ドルのハリウッドビジュアルエフェクトプロジェクトではなくなりました。これはただのインターネットの火曜日で、Googleの新しいGemini Omniモデルのおかげです.

Google I/O 2026で発表されたOmniは、生成エンジンとしての絶対的な巨匠です。ユーザーはどの動画にも自分をドロップさせ、ハイレベルなリアリズムのAIアバターを作成し、単一のテキストプロンプトから驚くほど正確な映像を生成することができます。

ところで、Google I/O 2026で発表された他のすべてのことを素早く解説したい場合は、この短いキーノートの再放送をご覧いただけます:

無線式の現実歪曲エンジンを一般に提供することには、社会を変えるほどの大きな後遺症が伴います。今年に入り、ディープフェイクの事件は驚異的な900%増加しました。

オムニがスマートフォンを持つ誰にでもエリートレベルのビデオ操作を可能にしたことで、私たちはオンラインメディアの大部分が完全に合成される未来を目前に立つことになります。

Googleは火薬を配ることを知っています。デジタル世界が燃え落ちるのを防ぐため、彼らは消火器を展開しています。

この合成的洪水に対する主要な防御機構は、C2PA認証情報とDeepMind SynthIDウォーターマークの二つの大きな柱に依存しています。

矛盾:神と警察官を同時に演じる

この技術的進歩の中心には深い皮肉があります。Googleは同時に究極の偽造品作成者と主要な認証官として行動しています。

彼らは事実とフィクションの境界を曖昧にするようなツールを作成している。同時に、実際に何が本当のものかを教えてくれるインフラを必死で構築しようとしている.

Omniはネイティブマルチモーダルシステムだ。古いモデルは不器用にテキストエンジンからイメージエンジンへ、そしてビデオジェネレーターへタスクを渡していたのに対し、Omniはテキスト、音声、画像、ビデオを同時に一つの統一された脳で処理する。

ビデオをアップロードして会話形式で編集できます。明かりを暗くする、カメラの角度を変える、または目に見える物体を透明にするなど指示できます。結果は驚くほど一貫しています。

この必然的に引き起こす混沌を打ち消すために、Googleは深偽検知を最も多く利用されているプラットフォームに直接統合しています。

すぐに、Chromeで画像を右クリックしたり、電話でCircle to Searchを使って、単一の質問を簡単に尋ねることができるようになります。

「これはAIで作成されましたか?」

しかし、システムは実際にどうやって知ることができるのでしょうか。

防衛:メタデータ対ピクセルの深い信号

Googleの検証戦略は二層構造のアプローチに依存しており、単一に依存するのは失敗へのレシピです。

レイヤー1:C2PAコンテンツクレデンシャル

C2PAをデジタルメディアの暗号学的な栄養表示と考える。

これはファイルに添付されるメタデータで、コンテンツがどのように作成され、どのツールが使用されたかの検証可能な履歴を記録している。Googleはこれを強く推し進め、ChromeやSearchに深く組み込んでいる。

C2PAの問題は、脆さにある。

悪意のある行為者はファイルからメタデータを削除できます。さらに悪いことに、多くのソーシャルメディアプラットフォームはアップロードを自動的に圧縮するため、意図せずにその重要な栄養表示を消去してしまう可能性があります。有効なC2PAマニフェストは人間による作成を主張することができますが、それ自体の画像の意味論的な真実を保証するものではありません.

レイヤー2: SynthID

ここで本格的な作業が行われます。Google DeepMindによって開発されたSynthIDは、コンテンツそのものに直接埋め込まれた見えないデジタルウォーターマークです。

画像や動画では、ウォーターマークはピクセルレベルでビジュアルスペクトラムに組み込まれています。

音声では、信号は波形の深い部分に隠されています。

テキストでは、トークン生成プロセスをわずかに変更し、検出器が認識できる統計的なパターンを作成します。

SynthIDは戦争のために作られています。cropping、重いフィルター、フレームレートの変更、損失のある圧縮を生き延びるように設計されています。元のメディアを破壊しないと、それを拭き去ることはできません。

誰かがGemini Omniビデオを撮影し、Instagramフィルターをかけて、WhatsAppで圧縮し、それをTikTokに再アップロードした場合でも、SynthIDはGoogleの検出ツールによってスキャンされると警報が鳴ります

勝てない戦争?

SynthIDが最初にリリースされて以来、Googleは既に1000億以上の画像とビデオにウォーターマークを付けています

OpenAI、カカオ、エレベンラボスのような強力なプレイヤーを業界に引き入れて、この見えないシグナルを標準化しようとしています

しかし、問題は残ります:ウォーターマークが実際にAI生成メディアの莫大な量に追いつけますか?

インターネットのハッカー意識は、企業のトラッキングに対して自然と反発します。オープンソース開発者たちはすでに、これらの目に見えないシグナルをバイパスしたり、削除したりするモデルを構築しようとしています.

さらに、SynthIDは参加しているモデルによって生成されたコンテンツのみをマークします。悪質な行為者が自分のローカルマシンでサブネットビデオジェネレーターを起動した場合、Googleのウォーターマークは付与されません.

私たちは二層構造のインターネットへ急速に進んでいます。

一方には、C2PAセンサーデータとSynthIDチェックによって確認された現実があり、

他方には、確認されていないが非常に説得力のある合成コンテンツの大きな海がある。

Googleは、我々に現実を思う存分に変えることができるツールを手渡している。SynthIDは素晴らしいエンジニアリングの成果だが、それだけで真のインターネットを救うことを期待するのはあまりにも多くのことかもしれない。

この技術はディープフェイクを特定できますが、私たちが見ている動画が実際に起こったのかどうかを気にかけるのは最終的には私たち次第です。