對我們這些勘探地質學家而言,衛星影像是一筆黃金(一個故意的文字遊戲)。無論是製圖熱液變質區、識別構造斷層,或是在難以進入的區域規劃野外考察活動,我們都高度依賴遙感技術.
但傳統的流程是一種技術上的地獄:
- 下載百萬像素級原始影像(Sentinel、Landsat、ASTER)。
- 花費數天時間進行大氣校正和雲/植被掩蔽。
- 操作複雜波段比值(例如粘土或鐵氧化物比值),以突顯礦物學。
Google 及 DeepMind 帶來了革命性的 AlphaEarth 基礎模型,改變了我們的習慣。現在我們不再處理原始像素,而是能夠利用衛星嵌入技術 (Satellite Embeddings)。
我叫 Gérard Cubaka,在這篇文章中,我將解釋這項技術如何讓我們像查詢普通文本資料庫一樣查詢地球的地質資料。
🧠 概念:64維的地球地質與光譜印記
如果你熟悉LLM(例如GPT),你知道它們將文字轉換為數學向量(嵌入)。AlphaEarth 正是對地球表面做同樣的事情。
該模型已整合多年多感測器數據:光學影像(反射率)、Sentinel-1雷達數據(地表粗糙度、地形、結構)以及氣候數據。它將所有這些物理動態壓縮為每個10公尺像素的64維單一向量,並每年更新一次。
這些64個通道(命名為A00至A63 在 Google Earth Engine) 不代表一個精確的光譜帶。它們形成一個整體的語義簽名。
為何這是探索上的革命?兩個地表地質背景相同的區域——例如,同一種熱液變質簽名、同一種風化層或相似的長石岩露頭——即使分佈在兩個不同的大陸上,它們的數學向量也會非常接近(餘弦距離較小)。
🛠 資料集技術規格
此全球數據集可在Google Earth Engine (GEE)目錄中免費訪問,識別碼為GOOGLE/SATELLITE_EMBEDDING/V1_ANNUAL.
- 空間解析度:每個像素10米(適合區域識別 / Greenfield)。
- 格式:64個波段影像(標準化向量)。
- 頻率 : 每年總結 (目前可用的範圍為 2017 年至 2025 年)。
💻 實際操作:透過幾行程式碼進行相似性搜索
對地質學家而言,最強大的應用案例是範例查詢(Recherche par cible)。想像一下,您在您的執照上識別了一個礦物質指標或一個已知的礦床。您可以提取它的向量,並要求模型找出國家內所有具有相同數學簽名的區域.
這是如何透過Google Earth Engine的Python API載入這些數據:
import ee
# Initialiser la connexion à Earth Engine
ee.Initialize()
# Charger la collection mondiale de Satellite
Embeddingsembeddings_collection = ee.ImageCollection("GOOGLE/SATELLITE_EMBEDDING/V1_ANNUAL")
# Filtrer sur les données les plus récentes (ex: 2024)
embeddings_recent = embeddings_collection.filter(ee.Filter.date('2024-01-01', '2024-12-31')).first()
# Afficher les 64 dimensions disponibles (A00 à A63)
print("Bandes d'exploration disponibles :",
embeddings_recent.bandNames().getInfo())
如何將其整合至您的探索工作流程中?
快速區域定位:透過將GEE連接到像BigQuery Vector Search這樣的向量資料庫,您可以計算您感興趣區域的向量(您的模型小屋)與您研究區域其他部分的歐幾里得距離,以幾秒鐘內生成礦產優勢地圖。
地層圖與植被圖:該模型天生整合了由基質引發的植被變化(生物地球化學反應)。在這些64個波段上運行一個簡單的非監督算法(K-Means)可以無人為偏見地劃分主要地質區域。
⚖️ 地質學上的優點與限制
✅ 的:
- 跳過「數據預處理」階段:完成雲層清理或不同時代場景的複雜馬賽克。數據集已準備好進行分析。
- 光學雷達協同:該向量融合了光譜響應(組成)和雷達響應(紋理、分形、地形),這通常非常難以手動完成。
- 適合全新項目 : 允許以較低的計算成本掃描廣闊區域(如盆地、綠岩帶),再派遺野外隊伍。
缺點❌ :
-
黑色箱效應 : 與傳統 ASTER 光譜比率(您可以確定目標是黃鐵礬或高嶺石)不同,數學上難以解釋確切是哪種地質特性使
A12或A45的波段產生反應。 - 植被限制 : 這個模式減輕了雲的影響,但在密集的赤道森林區域,光學穿透力仍然有限於林冠層(儘管內置的Sentinel-1雷達有助於結構形態學)。
- 年分辨率 : 這不是一個地質學問題(因為在地質時間尺度上變化不大!),但這意味著這個工具不適合用來追蹤活躍礦山每日挖掘工作的進度.
🚀 結論
衛星嵌入 代表數據科學與地球科學融合的轉折點。透過將地球表面轉換為向量空間,Google為地質勘探人員提供了一種前所未有的宏觀定位工具,大幅縮短了在圖像處理螢幕前所花費的時間,而將更多精力投入到實地工作中。
您已經使用人工智能或機器學習進行地質目標設定嗎?您偏好使用哪些框架 (TorchGeo, Rasterio, QGIS) 來處理這些數據?在評論中與我們討論吧!
如果這篇文章對您有所啟發,請留下 ❤️ 或 🦄!關注我的 DEV.to 帳號,以獲取更多結合科技、Python 和地質空間人工智能的內容。
— Gérard Cubaka












