想像一下你在瀏覽時看到一段完美呈現、物理準確的影片,片中你正從移動的汽車上做空翻
你從未學過做空翻。你從未靠近那輛汽車。但光線無懈可擊。你的外套在風中飄動的流體力學看起來完全真實。你的聲音聽起來跟你一模一樣。
這已經不再是千萬美元的好萊塢視覺效果專案。這只是谷歌新Gemini Omni模型的另一個網路星期二。
在Google I/O 2026上揭曉,Omni是一個絕對強大的生成引擎。它允許用戶把自己投入任何影片中,創造極其逼真的AI虛擬形象,並從單一文字提示中生成極其準確的影片。
話說,如果你想知道在Google I/O 2026上宣布的其他所有事情的快速總結,你可以在此觀看這段短小的主題演講回顧:
向公眾推出無線現實扭曲引擎帶來了巨大的、改變社會的宿醉。深度偽造事件在本年度之前激增了驚人的900%。
由Omni讓高階視頻操作變得人人可達,我們正面對一個未來,其中絕大多數的網路媒體可能完全是由人工合成.
Google知道它正在發放火柴。所以,為了防止數位世界燃燒殆盡,它們正在推出滅火器。
對抗這種合成洪水的首要防禦機制依賴於兩大支柱:C2PA憑證和DeepMind SynthID水印
矛盾之處:同時扮演上帝與警察
這項技術突破的核心存在著深刻的諷刺。Google同時扮演著最終的偽造者和首席認證官。
他們正在創造那些模糊事實與想像界線的工具。同時,他們拼命地想要建立基礎設施來告訴我們什麼才是真正的現實。
Omni 是一個原生多模態系統。與舊型號那樣笨拙地將任務從文字引擎交給圖像引擎,再交給影片生成器不同,Omni 在一個統一的腦中同時處理文字、音訊、圖像和影片。
你可以上傳影片並以對話方式編輯它。你可以告訴它調暗燈光、改變攝影機角度,或將可見物體變得不見。結果令人毛骨悚然地一致。
為了對抗這些技術必然會釋放的混亂,Google 正將深度偽造偵測直接整合到其最受歡迎的平台上。
即將來你將可以在 Chrome 中右鍵單擊圖片,或是在手機上使用 Circle to Search,並輕鬆提出單一問題.
"這是用 AI 做的嗎?"
但系統實際上是怎麼知道的呢?
防禦:元數據對比像素深度信號
Google 的驗證策略依賴於雙層方法,因為僅依賴單一方法是失敗的公式。
第一層:C2PA 內容憑證
將 C2PA 視為數位媒體的加密營養標籤
它是一段附加到檔案上的元資料,記錄了內容是如何被創建以及使用了哪些工具的可驗證歷史。Google 正大力推廣這項技術,甚至深入地將其擴展到 Chrome 和搜尋中
C2PA 的問題在於其脆弱性。
惡意行為者可以移除檔案的元資料。更糟的是,許多社交媒體平台會自動壓縮上傳內容,這可能無意中清除了那個關鍵的營養標籤。一個有效的 C2PA 清單可能聲稱是人類製作,但它並不證明圖片本身的語義真實性.
第二層:SynthID
這裡才是真正的重點。由Google DeepMind開發的SynthID,是一種直接嵌入內容本身的不可見數位版權標記。
在圖像和影片中,版權標記是在像素層級嵌入到視覺光譜中。
在音訊中,信號則隱藏在波形深處。
在文字中,它稍微改變了詞元生成的過程,創造了一個偵測器可以識別的統計模式.
SynthID是為戰爭而建造的。它是設計來抵禦裁剪、重型濾鏡、帧率變化和有損壓縮的。你不能在不破壞底層媒體的情況下將它擦除掉。
如果有人拍攝了 Gemini Omni 影片,透過 Instagram 濾鏡處理,在 WhatsApp 上壓縮,並重新上傳到 TikTok,當透過 Google 的偵測工具掃描時,SynthID 仍然會發出警報。
無法獲勝的軍備競賽?
自從 SynthID 首次推出以来,Google 已為超過 1000 億張圖片和影片加上水印。
他們現在正將 OpenAI、Kakao 和 ElevenLabs 等重量級玩家納入旗下,以標準化這個無形的信號行業內.
但問題仍然存在:水印能否實際上跟得上 AI 媒體的龐大數量?
互聯網的黑客精神自然反對企業追蹤。開源開發者已經試圖建立能夠繞過或清除這些無形信號的模型。
此外,SynthID 只標記由參與模型生成的內容。如果惡意行為者在本地電腦上啟動了一個流氓視頻生成器,它不會帶有 Google 水印。
我們正在快速走向一個兩級互聯網。
在我們一邊,將有經過驗證的現實,由 C2PA 传感器數據和 SynthID 檢查所支持。
在另一邊,將有廣闊的、未經驗證的、高度說服力的合成內容海洋。
Google 正在給我們一個能夠實實在在地隨意改變現實的工具。SynthID 是一項卓越的工程創造,但期望它能單獨拯救真正的互聯網或許是要求過高了。
這項技術可以標示出深度偽造影片,但最終有沒有關心我們所觀看的影片是否真的發生過,則取決於我們自己。












