인셔셔RSS 관심 있는 블로그, 뉴스, 기술 정보를 효율적으로 추적하고 읽으세요
원문 읽기 InertiaRSS에서 열기

추천 피드

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

DEV Community

Authentication Security Deep Dive: From Brute Force to Salted Hashing (With Java Examples) Why AI Systems Don’t Fail — They Drift Spilling beans for how i learn for exam😁"Reinforcement Learning Cheat Sheet" I Replaced Chrome with Safari for AI Browser Automation. Here's What Broke (and What Finally Worked) How Python Borrows Other People's Work The $40 Architecture: Processing 1 Billion API Requests with 99.99% Uptime Vibe Coding: A Workflow Guide (From Zero to SaaS) Most webhook security guides protect the wrong side. The scary part is delivery. Headless CMS for TanStack Start: Build a Blog with Cosmic EU Age Verification App "Hacked in 2 Minutes" — What Actually Happened Comfy Cloud’s delete function does not actually remove files Running AI Models on GPU Cloud Servers: A Beginner Guide Event-driven media intelligence with AWS Step Functions and Bedrock I scored 500 AI prompts across 8 quality dimensions — here's what broke How to Call Google Gemini API from Next.js (Free Tier, No Backend Needed) The Portal Protocol: Reclaiming Human Connection in the Age of AI How to Fix Your Team's Scattered Knowledge Problem With a Self-Hosted Forum Intro to tc Cloud Functors: A Graph-First Mental Model for the Modern Cloud Designing Multi-Tenant Backends With Both Ownership and Team Access I Built a Neumorphic CSS Library with 77+ Components — Here's What I Learned PostgreSQL Performance Optimization: Why Connection Pooling Is Critical at Scale Cómo construí un SaaS multi-rubro para gestionar expensas en Argentina con FastAPI + Vue 3 🚀 I Built an Ethical Hacking Scanner Tool – Open Source Project I Replaced /usage and /context in Claude Code With a Single Statusline A Pythonic Way to Handle Emails (IMAP/SMTP) with Auto-Discovery and AI-Ready Design I Collected 8.9 Million Polymarket Price Points — Here's What I Found About How Markets Really Move EcoTrack AI — Carbon Footprint Tracker & Dashboard Everyone's Using AI. No One Agrees How. 5 self-hosted ebook managers worth trying in 2026 Building Your First AI Agent with LangChain: From Chatbot to Autonomous Assistant Common SOC 2 Failures (Real World) Stop Vibe-Checking Your AI App: A Practical Guide to Evals How to Use SonarQube and SonarScanner Locally to Level Up Your Code Quality Your Next To-Do App Is Dead — I Replaced Mine with an OpenClaw AI Sign a Nostr event in 60 lines of Python using coincurve — no nostr-sdk, no nbxplorer, no rust toolchain ITGC Audit Explained Like You’re in Big 4 Patch Tuesday abril 2026: Microsoft parcha 163 vulnerabilidades y un zero-day en SharePoint Stop scraping everything: a better way to track competitor price changes Listing on MCPize + the Official MCP Registry while routing payments OUTSIDE the marketplace — how I kept 100% of my x402 revenue Building an AI-Powered Risk Intelligence System Using Serverless Architecture Why We Ripped Function Overloading Out of Our AI Toolchain Testing AI-Generated Code: How to Actually Know If It Works SaaS Churn Is Killing Your Business. Here Is What to Do About It (Without a Support Team) The Speed of AI Is No Longer Linear - And Self-Improving Models Are Why How to Implement RBAC for MCP Tools: A Practical Guide for Engineering Teams From Standard Quote to Persuasive Proposal: AI Automation for Arborists I built a CLI that scaffolds complete multi-tenant SaaS apps Axios CVE-2025–62718: The Silent SSRF Bug That Could Be Hiding in Your Node.js App Right Now The dashboard that ended our friendship Data Pipelines Explained Simply (and How to Build Them with Python)
데이터폼 1: API 탐색에 대해 더 깊이 들어가기
Ben Watson · 2026-05-24 · via DEV Community

Ben Watson

시리즈 개요

이 블로그 시리즈는 Dataform의 핵심 기능을 넘어서기 원하는 Dataform 사용자를 대상으로 합니다. 다른 것들 중에서 우리는 Dataform의 강력한 API를 탐구하고, GitHub Actions에서 자동화된 CI/CD 프로세스를 만들고, 비용을 모니터링하기 위한 파이프라인을 구축하고, 코드를 통해 config {} 블록을 수정할 것입니다.

Dataform의 API는 Dataform의 더 강력하고 덜 문서화된 기능으로 들어가기에 자연스러운 출발점입니다. API에 대한 이해는 사용자가 Dataform을 자동화된 현대 데이터 플랫폼의 모든 힘 있는 허브로 활용할 수 있게 합니다.

Dataform API 주요 개념

API는 워크플로우의 핵심 구성 요소로서 두 개의 객체를 가지고 있습니다:

  1. CompilationResult- 특정 시점의 Dataform 워크스페이스의 컴파일된 상태(결과로부터)건물DAG(그래프 아키텍처)입니다.
  2. WorkflowInvocation- 하나의 실행CompilationResult(결과는달리는DAG(그래프 아키텍처)입니다.

CompilationResult

from google.cloud import dataform_v1

client = dataform_v1.DataformClient()

project_id = "my-project"
region = "europe-west2"
repository_id = "analytics"
workspace_id = "dev"

workspace = client.workspace_path(
    project_id,
    region,
    repository_id,
    workspace_id,
)

repository = client.repository_path(
    project_id,
    region,
    repository_id,
)

compilation_result = dataform_v1.CompilationResult(
    workspace=workspace
)

response = client.create_compilation_result(
    parent=repository,
    compilation_result=compilation_result,
)

print(response.name)

전체 화면 모드로 입력하세요 전체 화면 모드 종료

응답은 형태를 취합니다projects/<project_id>/locations/<region>/repositories/<repository_id>/compilationResults/<compilation_result_id> (여기서 <compilation_result_id>는 UUID v4입니다).

A CompilationResult 객체는 코드 변경이 감지될 때마다 Dataform UI에서 생성되지만, UI는 그 ID를 숨깁니다. ID는 실행 후 UI의 Executions 페이지에서 볼 수 있습니다.

Dataform has generated a  raw `CompilationResult` endraw

CompilationResult는 Dataform 작업 공간 내의 각 작업에 대한 정보를 포함하며, 사용자가 코드를 통해 DAG를 탐색하고 각 파일의 config {} 블록과 같은 정보를 추출할 수 있게 합니다. 그런 다음 각 작업은 다음을 통해 반복할 수 있습니다:

request = dataform_v1.QueryCompilationResultActionsRequest(
    name=COMPILATION_RESULT
)
response = client.query_compilation_result_actions(
    request=request
)
for action in response.compilation_result_actions:
    ...

전체 화면 모드 전체 화면 모드

WorkflowInvocation

from google.cloud import dataform_v1

client = dataform_v1.DataformClient()

project_id = "my-project"
region = "europe-west2"
repository_id = "analytics"

repository = client.repository_path(
    project_id , region, repository_id 
)

# compilation_result comes from the previous snippet
invocation = dataform_v1.WorkflowInvocation(
    compilation_result=compilation_result.name
)

response = client.create_workflow_invocation(
    parent=repository,
    workflow_invocation=invocation,
)

print(f'{response.name}: {response.state}')

전체 화면 모드 전체 화면 모드

AWorkflowInvocation는 실행이 실행될 때마다 Dataform UI에서 생성됩니다:

A Dataform execution in the UI

WorkflowInvocation에는 실행된 각 작업에 대한 정보가 포함되어 있어 사용자가 작업을 BigQuery 작업 ID에 연결하고 생성된 객체(예: 테이블 또는 뷰)를 볼 수 있습니다. 각 실행된 작업은 다음을 통해 반복할 수 있습니다:

request = dataform_v1.QueryWorkflowInvocationActionsRequest
    name=WORKFLOW_INVOCATION
)
response = client.query_workflow_invocation_actions(
    request=request
)
for action in response.workflow_invocation_actions:
    ...

전체 화면 모드를 입력합니다 전체 화면 모드를 종료합니다

그들을 함께 연결합니다

Dataform의 API의 실제 힘이 두 객체가 결합될 때 나타납니다. 일반적인 워크플로우는 이렇게 보입니다:

  • 워크스페이스가 업데이트됩니다(수동으로 또는 Git을 통해),
  • 워크스페이스에서 CompilationResult가 생성됩니다,
  • 그 컴파일에서 WorkflowInvocation가 생성됩니다,
  • BigQuery가 결과 DAG를 실행합니다.

Mermaid architecture diagram showing the relationship between  raw `CompilationResult` endraw  and  raw `WorkflowInvocation` endraw

이 두 가지 객체만으로 Dataform UI 외에서 빌드 및 실행을 자동화할 수 있습니다. 이는 나중에 다룰 포스트에서 CI/CD 파이프라인을 쉽게 만들 수 있게 합니다.