慣性聚合 関心のあるブログ、ニュース、テクノロジーを効率的に追跡
原文を読む 慣性聚合で開く

おすすめ購読元

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

DEV Community

Authentication Security Deep Dive: From Brute Force to Salted Hashing (With Java Examples) Why AI Systems Don’t Fail — They Drift Spilling beans for how i learn for exam😁"Reinforcement Learning Cheat Sheet" I Replaced Chrome with Safari for AI Browser Automation. Here's What Broke (and What Finally Worked) How Python Borrows Other People's Work The $40 Architecture: Processing 1 Billion API Requests with 99.99% Uptime Vibe Coding: A Workflow Guide (From Zero to SaaS) Most webhook security guides protect the wrong side. The scary part is delivery. Headless CMS for TanStack Start: Build a Blog with Cosmic EU Age Verification App "Hacked in 2 Minutes" — What Actually Happened Comfy Cloud’s delete function does not actually remove files Running AI Models on GPU Cloud Servers: A Beginner Guide Event-driven media intelligence with AWS Step Functions and Bedrock I scored 500 AI prompts across 8 quality dimensions — here's what broke How to Call Google Gemini API from Next.js (Free Tier, No Backend Needed) The Portal Protocol: Reclaiming Human Connection in the Age of AI How to Fix Your Team's Scattered Knowledge Problem With a Self-Hosted Forum Intro to tc Cloud Functors: A Graph-First Mental Model for the Modern Cloud Designing Multi-Tenant Backends With Both Ownership and Team Access I Built a Neumorphic CSS Library with 77+ Components — Here's What I Learned PostgreSQL Performance Optimization: Why Connection Pooling Is Critical at Scale Cómo construí un SaaS multi-rubro para gestionar expensas en Argentina con FastAPI + Vue 3 🚀 I Built an Ethical Hacking Scanner Tool – Open Source Project I Replaced /usage and /context in Claude Code With a Single Statusline A Pythonic Way to Handle Emails (IMAP/SMTP) with Auto-Discovery and AI-Ready Design I Collected 8.9 Million Polymarket Price Points — Here's What I Found About How Markets Really Move EcoTrack AI — Carbon Footprint Tracker & Dashboard Everyone's Using AI. No One Agrees How. 5 self-hosted ebook managers worth trying in 2026 Building Your First AI Agent with LangChain: From Chatbot to Autonomous Assistant Common SOC 2 Failures (Real World) Stop Vibe-Checking Your AI App: A Practical Guide to Evals How to Use SonarQube and SonarScanner Locally to Level Up Your Code Quality Your Next To-Do App Is Dead — I Replaced Mine with an OpenClaw AI Sign a Nostr event in 60 lines of Python using coincurve — no nostr-sdk, no nbxplorer, no rust toolchain ITGC Audit Explained Like You’re in Big 4 Patch Tuesday abril 2026: Microsoft parcha 163 vulnerabilidades y un zero-day en SharePoint Stop scraping everything: a better way to track competitor price changes Listing on MCPize + the Official MCP Registry while routing payments OUTSIDE the marketplace — how I kept 100% of my x402 revenue Building an AI-Powered Risk Intelligence System Using Serverless Architecture Why We Ripped Function Overloading Out of Our AI Toolchain Testing AI-Generated Code: How to Actually Know If It Works SaaS Churn Is Killing Your Business. Here Is What to Do About It (Without a Support Team) The Speed of AI Is No Longer Linear - And Self-Improving Models Are Why How to Implement RBAC for MCP Tools: A Practical Guide for Engineering Teams From Standard Quote to Persuasive Proposal: AI Automation for Arborists I built a CLI that scaffolds complete multi-tenant SaaS apps Axios CVE-2025–62718: The Silent SSRF Bug That Could Be Hiding in Your Node.js App Right Now The dashboard that ended our friendship Data Pipelines Explained Simply (and How to Build Them with Python)
「Satellite Embeddings」が地球を検索空間ベクトルとしてどのように変換するか
Gérard Cubak · 2026-05-24 · via DEV Community

私たち探査地質学者にとって、衛星画像は金の山(遊び心のある比喩)。水熱変質の地図作成、構造線の特定、アクセス困難な地域での現地調査計画——これら全てにおいて、私たちは強くテレデテクションに依存している.
しかし、従来のパイプラインは技術的に地獄だ:

  1. ペタオクテットの brut scene をダウンロード (Sentinel, Landsat, ASTER).
  2. 日々、大気補正と雲/植生のマスキングを行う.
  3. 複雑なバンド比率(例:粘土や酸化鉄の比率)を操作して、矿物学を際立たせる.

Google と DeepMind は、彼らの基盤モデル AlphaEarth でこれらの習慣を覆しました。生のピクセルを処理する代わりに、私たちは現在、Satellite Embeddings(衛星埋め込み)を活用できるようになりました。

私は Gérard Cubaka と申します。この記事では、この技術がどのようにして地球の地質を単なるテキストデータベースのようにクエリできるかを説明します。


🧠 コンセプト:64次元の地質的およびスペクトルの跡

LLM(GPTなど)に慣れているなら、それらが単語を数学的ベクトル(埋め込み)に変換することを知っているでしょう。AlphaEarthは、地球の表面に対しても同じことを行います。
モデルは複数のセンサーデータを数年間蓄積しています:光学イメージング(反射率)、Sentinel-1レーダーデータ(表面粗さ、地形、構造)および気象データ。これらの物理的な動きを、10メートルピクセルあたりの64次元の単一のベクトルに圧縮し、毎年更新しています。
これらの64チャンネル(A00と呼ばれます)A63 は Google Earth Engine における正確なスペクトルバンドではありません。全体の意味的サインaturesを形成します。

なぜこれが探査における革命なのか?同じ地表地質環境を示す二つの地域——たとえば、同じ熱水変質のサイン、同じタイプの風化層、または似たようなペグマタイトの露出——は、数学的に非常に近いベクトルを持つ(小さい余弦距離)ものの、二つの異なる大陸に位置している場合がある。


🛠 データセットの技術仕様

この世界のデータセットは、Google Earth Engine(GEE)のカタログで無料で利用でき、IDはGOOGLE/SATELLITE_EMBEDDING/V1_ANNUAL.

  • 空間解像度:ピクセルあたり10メートル(地域の認識/グリーンフィールドに最適)。
  • 形式:64チャンネルの画像(正規化ベクトル)。
  • 頻度 : 年次の合成(現在、2017年から2025年まで利用可能)。

💻 実際には:数行で類似検索を実行する

地質学者にとって最も強力なユースケースは「例を示して検索する(Query-by-Example)」です。想像してみてください、あなたがあなたの許可区域内で知識ある鉱物の示唆や鉱脈を特定したとします。そのベクターを抽出し、モデルに国全体の同じ数学的シグネチャを持つすべての地域を見つけるように依頼できます.
これらのデータをEarth EngineのPython APIを通じてロードする方法は以下の通りです.

import ee
# Initialiser la connexion à Earth Engine
ee.Initialize()

# Charger la collection mondiale de Satellite 
Embeddingsembeddings_collection = ee.ImageCollection("GOOGLE/SATELLITE_EMBEDDING/V1_ANNUAL")

# Filtrer sur les données les plus récentes (ex: 2024)
embeddings_recent = embeddings_collection.filter(ee.Filter.date('2024-01-01', '2024-12-31')).first()

# Afficher les 64 dimensions disponibles (A00 à A63)
print("Bandes d'exploration disponibles :", 
embeddings_recent.bandNames().getInfo())

Enter fullscreen mode フルスクリーンモードを終了

どのようにしてあなたの探索ワークフローに組み込むのですか?

  1. 迅速な地域的ターゲティング:GEEをBigQuery Vector Searchのようなベクター検索ベースに接続することで、あなたの関心エリア(モデルのゲイト)のベクターとあなたの研究地域の残りの部分とのユークリッド距離を計算し、数秒で有利な鉱物地図を生成することができます。

  2. リコリスと植生の地図作成:モデルは自然に基盤による植生の変化(生物地球化学的応答)を取り込みます。これらの64バンドに対する単純な非監督アルゴリズム(K-Means)により、人間のバイアスなしで主要な地質的領域をセクタリングできます。


⚖️ 地質学における利点と限界

✅ の方:

  • 「データ準備」のステップをスキップ : 雲のクリーンアップや複雑な時代のシーンのモザイックが終わりました。データセットは分析準備完了です。
  • 光学+レーダー : このベクトルはスペクトル応答(構成)とレーダー応答(テクスチャー、フラクタル、地形)を融合させ、これまでの手動での実現が非常に重かったことを行います。
  • グリーンフィールドに最適です : 大きなエリア(湖沼、緑の岩帯)を低コストでスキャンし、現地のチームを派遣する前に使用します。

❌の欠点:

  • ブラックボックス効果 : アステルの通常のバンド比率とは異なり(アステルで明確にアルミナイトまたはカオリナイトをターゲットとしている場合)、数学的にどの具体的な地質的特徴がバンドA12またはA45を反応させるのか説明するのは難しい。
  • 植物相の限界 : 雲の影響を軽減するが、エクアトリアル熱帯雨林の密集地帯では、光学の透過はカノープに限定される(センターレルタ1の統合されたレーダーが構造的形態を支援するものの)。
  • 年間時間解像度 : それは地理学的問題ではありません(人間のスケールではあまり変わらないからです!)、しかし、それはこのツールが、活動中の鉱山の発掘作業の毎日の進捗を追跡するのに適していないことを意味します.

🚀 結論

Les Satellite Embeddingsは、データサイエンスと地球科学の融合において画期的な転換を意味します。私たちの惑星の表面をベクトル空間に変換することで、Googleは探査地質学者に、従来にないマクロなターゲット設定ツールを提供し、画像処理の画面の前に過ごす時間を劇的に削減し、現地での作業を促進しています。
すでにAIや機械学習を地質的ターゲティングに利用していますか? どのフレームワーク(TorchGeo, Rasterio, QGIS)を使うのがお好みですか? コメントで議論しましょう!


この記事に共感しましたら、❤️か🦄を残してください! Tech、Python、Geospatial AIを組み合わせたコンテンツは、私のDEV.toプロフィールで追跡してください。

— ジェラール・クバカ