慣性聚合 関心のあるブログ、ニュース、テクノロジーを効率的に追跡
原文を読む 慣性聚合で開く

おすすめ購読元

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

DEV Community

Authentication Security Deep Dive: From Brute Force to Salted Hashing (With Java Examples) Why AI Systems Don’t Fail — They Drift Spilling beans for how i learn for exam😁"Reinforcement Learning Cheat Sheet" I Replaced Chrome with Safari for AI Browser Automation. Here's What Broke (and What Finally Worked) How Python Borrows Other People's Work The $40 Architecture: Processing 1 Billion API Requests with 99.99% Uptime Vibe Coding: A Workflow Guide (From Zero to SaaS) Most webhook security guides protect the wrong side. The scary part is delivery. Headless CMS for TanStack Start: Build a Blog with Cosmic EU Age Verification App "Hacked in 2 Minutes" — What Actually Happened Comfy Cloud’s delete function does not actually remove files Running AI Models on GPU Cloud Servers: A Beginner Guide Event-driven media intelligence with AWS Step Functions and Bedrock I scored 500 AI prompts across 8 quality dimensions — here's what broke How to Call Google Gemini API from Next.js (Free Tier, No Backend Needed) The Portal Protocol: Reclaiming Human Connection in the Age of AI How to Fix Your Team's Scattered Knowledge Problem With a Self-Hosted Forum Intro to tc Cloud Functors: A Graph-First Mental Model for the Modern Cloud Designing Multi-Tenant Backends With Both Ownership and Team Access I Built a Neumorphic CSS Library with 77+ Components — Here's What I Learned PostgreSQL Performance Optimization: Why Connection Pooling Is Critical at Scale Cómo construí un SaaS multi-rubro para gestionar expensas en Argentina con FastAPI + Vue 3 🚀 I Built an Ethical Hacking Scanner Tool – Open Source Project I Replaced /usage and /context in Claude Code With a Single Statusline A Pythonic Way to Handle Emails (IMAP/SMTP) with Auto-Discovery and AI-Ready Design I Collected 8.9 Million Polymarket Price Points — Here's What I Found About How Markets Really Move EcoTrack AI — Carbon Footprint Tracker & Dashboard Everyone's Using AI. No One Agrees How. 5 self-hosted ebook managers worth trying in 2026 Building Your First AI Agent with LangChain: From Chatbot to Autonomous Assistant Common SOC 2 Failures (Real World) Stop Vibe-Checking Your AI App: A Practical Guide to Evals How to Use SonarQube and SonarScanner Locally to Level Up Your Code Quality Your Next To-Do App Is Dead — I Replaced Mine with an OpenClaw AI Sign a Nostr event in 60 lines of Python using coincurve — no nostr-sdk, no nbxplorer, no rust toolchain ITGC Audit Explained Like You’re in Big 4 Patch Tuesday abril 2026: Microsoft parcha 163 vulnerabilidades y un zero-day en SharePoint Stop scraping everything: a better way to track competitor price changes Listing on MCPize + the Official MCP Registry while routing payments OUTSIDE the marketplace — how I kept 100% of my x402 revenue Building an AI-Powered Risk Intelligence System Using Serverless Architecture Why We Ripped Function Overloading Out of Our AI Toolchain Testing AI-Generated Code: How to Actually Know If It Works SaaS Churn Is Killing Your Business. Here Is What to Do About It (Without a Support Team) The Speed of AI Is No Longer Linear - And Self-Improving Models Are Why How to Implement RBAC for MCP Tools: A Practical Guide for Engineering Teams From Standard Quote to Persuasive Proposal: AI Automation for Arborists I built a CLI that scaffolds complete multi-tenant SaaS apps Axios CVE-2025–62718: The Silent SSRF Bug That Could Be Hiding in Your Node.js App Right Now The dashboard that ended our friendship Data Pipelines Explained Simply (and How to Build Them with Python)
Dataform 1の奥深くへ:APIの探求
Ben Watson · 2026-05-24 · via DEV Community

Ben Watson

セリーズの概要

このブログシリーズは、Dataformの基本的な機能を超えて探索したいDataformユーザーを対象としています。他に、Dataformの強力なAPIに掘り下げ、GitHub Actionsで自動化されたCI/CDプロセスを作成し、コストを監視するパイプラインを構築し、config {}ブロックをコードを通じて変更します。

DataformのAPIは、Dataformのより強力でドキュメント化されていない機能に飛び込むための自然な出発点です。APIの理解を深めることで、ユーザーはDataformを自動化された現代のデータプラットフォームのすべての力を持つハブとして活用することができます.

Dataform APIの基本概念

APIには、どのワークフローにおいても基本的な構成要素として機能する二つのオブジェクトがあります:

  1. CompilationResult - 特定の時点におけるDataformワークスペースのコンパイル済み状態(によるの構築の結果)です。
  2. WorkflowInvocation - CompilationResultの単一の実行(によるの実行の結果)です。

CompilationResult

from google.cloud import dataform_v1

client = dataform_v1.DataformClient()

project_id = "my-project"
region = "europe-west2"
repository_id = "analytics"
workspace_id = "dev"

workspace = client.workspace_path(
    project_id,
    region,
    repository_id,
    workspace_id,
)

repository = client.repository_path(
    project_id,
    region,
    repository_id,
)

compilation_result = dataform_v1.CompilationResult(
    workspace=workspace
)

response = client.create_compilation_result(
    parent=repository,
    compilation_result=compilation_result,
)

print(response.name)

フルスクリーンモードを開始 フルスクリーンモードを終了

応答は以下の形式で提供されますprojects/<project_id>/locations/<region>/repositories/<repository_id>/compilationResults/<compilation_result_id><compilation_result_id> が UUID v4 である場所).

A CompilationResult オブジェクトは、Dataform UI でコード変更が検出されるたびに生成され、UI はその ID を隠す。ID は、実行後の UI の Executions ページで確認できる。

Dataform has generated a  raw `CompilationResult` endraw

CompilationResult は、Dataform ワークスペース内の各ジョブに関する情報を含んでおり、ユーザーがコードを通じて DAG をたどり、各ファイルの config {} ブロックなどの情報を抽出することができます。各ジョブは次のように反復処理できます:

request = dataform_v1.QueryCompilationResultActionsRequest(
    name=COMPILATION_RESULT
)
response = client.query_compilation_result_actions(
    request=request
)
for action in response.compilation_result_actions:
    ...

Enter fullscreen mode Exit fullscreen mode

WorkflowInvocation

from google.cloud import dataform_v1

client = dataform_v1.DataformClient()

project_id = "my-project"
region = "europe-west2"
repository_id = "analytics"

repository = client.repository_path(
    project_id , region, repository_id 
)

# compilation_result comes from the previous snippet
invocation = dataform_v1.WorkflowInvocation(
    compilation_result=compilation_result.name
)

response = client.create_workflow_invocation(
    parent=repository,
    workflow_invocation=invocation,
)

print(f'{response.name}: {response.state}')

Enter fullscreen mode Exit fullscreen mode

AWorkflowInvocation は、実行が実行されるたびに Dataform UI で生成されます:

A Dataform execution in the UI

WorkflowInvocationには、実行された各ジョブに関する情報が含まれており、ユーザーはジョブを BigQuery ジョブ ID に紐付け、作成されたオブジェクト(テーブルやビューなど)を確認できます。各実行されたジョブは、以下を通じて反復処理できます:

request = dataform_v1.QueryWorkflowInvocationActionsRequest
    name=WORKFLOW_INVOCATION
)
response = client.query_workflow_invocation_actions(
    request=request
)
for action in response.workflow_invocation_actions:
    ...

フルスクリーンモードを開始 フルスクリーンモードを終了

それらを結びつける

DataformのAPIの真正の力は、これら二つのオブジェクトが組み合わさった時に現れる。典型的なワークフローはこんな感じだ:

  • ワークスペースが更新される(手動またはGitを通じて)、
  • ワークスペースからCompilationResultが生成される、
  • そのコンパイルからWorkflowInvocationが作成される、
  • BigQueryがその結果としてのDAGを実行する。

Mermaid architecture diagram showing the relationship between  raw `CompilationResult` endraw  and  raw `WorkflowInvocation` endraw

これらの2つのオブジェクトで、Dataform UIの外でDataform DAGの構築と実行を自動化することが可能です。これは、後の投稿で詳しく説明するCI/CDパイプラインを容易にします。