慣性聚合 関心のあるブログ、ニュース、テクノロジーを効率的に追跡
原文を読む 慣性聚合で開く

おすすめ購読元

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

DEV Community

Authentication Security Deep Dive: From Brute Force to Salted Hashing (With Java Examples) Why AI Systems Don’t Fail — They Drift Spilling beans for how i learn for exam😁"Reinforcement Learning Cheat Sheet" I Replaced Chrome with Safari for AI Browser Automation. Here's What Broke (and What Finally Worked) How Python Borrows Other People's Work The $40 Architecture: Processing 1 Billion API Requests with 99.99% Uptime Vibe Coding: A Workflow Guide (From Zero to SaaS) Most webhook security guides protect the wrong side. The scary part is delivery. Headless CMS for TanStack Start: Build a Blog with Cosmic EU Age Verification App "Hacked in 2 Minutes" — What Actually Happened Comfy Cloud’s delete function does not actually remove files Running AI Models on GPU Cloud Servers: A Beginner Guide Event-driven media intelligence with AWS Step Functions and Bedrock I scored 500 AI prompts across 8 quality dimensions — here's what broke How to Call Google Gemini API from Next.js (Free Tier, No Backend Needed) The Portal Protocol: Reclaiming Human Connection in the Age of AI How to Fix Your Team's Scattered Knowledge Problem With a Self-Hosted Forum Intro to tc Cloud Functors: A Graph-First Mental Model for the Modern Cloud Designing Multi-Tenant Backends With Both Ownership and Team Access I Built a Neumorphic CSS Library with 77+ Components — Here's What I Learned PostgreSQL Performance Optimization: Why Connection Pooling Is Critical at Scale Cómo construí un SaaS multi-rubro para gestionar expensas en Argentina con FastAPI + Vue 3 🚀 I Built an Ethical Hacking Scanner Tool – Open Source Project I Replaced /usage and /context in Claude Code With a Single Statusline A Pythonic Way to Handle Emails (IMAP/SMTP) with Auto-Discovery and AI-Ready Design I Collected 8.9 Million Polymarket Price Points — Here's What I Found About How Markets Really Move EcoTrack AI — Carbon Footprint Tracker & Dashboard Everyone's Using AI. No One Agrees How. 5 self-hosted ebook managers worth trying in 2026 Building Your First AI Agent with LangChain: From Chatbot to Autonomous Assistant Common SOC 2 Failures (Real World) Stop Vibe-Checking Your AI App: A Practical Guide to Evals How to Use SonarQube and SonarScanner Locally to Level Up Your Code Quality Your Next To-Do App Is Dead — I Replaced Mine with an OpenClaw AI Sign a Nostr event in 60 lines of Python using coincurve — no nostr-sdk, no nbxplorer, no rust toolchain ITGC Audit Explained Like You’re in Big 4 Patch Tuesday abril 2026: Microsoft parcha 163 vulnerabilidades y un zero-day en SharePoint Stop scraping everything: a better way to track competitor price changes Listing on MCPize + the Official MCP Registry while routing payments OUTSIDE the marketplace — how I kept 100% of my x402 revenue Building an AI-Powered Risk Intelligence System Using Serverless Architecture Why We Ripped Function Overloading Out of Our AI Toolchain Testing AI-Generated Code: How to Actually Know If It Works SaaS Churn Is Killing Your Business. Here Is What to Do About It (Without a Support Team) The Speed of AI Is No Longer Linear - And Self-Improving Models Are Why How to Implement RBAC for MCP Tools: A Practical Guide for Engineering Teams From Standard Quote to Persuasive Proposal: AI Automation for Arborists I built a CLI that scaffolds complete multi-tenant SaaS apps Axios CVE-2025–62718: The Silent SSRF Bug That Could Be Hiding in Your Node.js App Right Now The dashboard that ended our friendship Data Pipelines Explained Simply (and How to Build Them with Python)
AutoMLガイド
Luis M · 2026-05-24 · via DEV Community

Luis M

SynapCores AutoML ガイド

SQL内でPythonコードを書かずに強力な機械学習モデルを直接構築します.

概要

SynapCores AutoMLは、SQL構文を通じて機械学習実験を作成するための包括的なオプションを提供します。慣れ親しんだデータベースコマンドを使用して、本番環境に適したモデルをトレーニング、チューニング、デプロイします.

タスクの種類

タスクの種類 説明 デフォルトメトリクス
regression 連続値予測 R平方
binary_classification 二値分類 AUC
classification/multiclass 多クラス分類 精度
clustering 無教師分類 シルエットスコア
anomaly 異常検知 F1スコア
time_series 時系列予測 MAPE

AutoML実験の作成

基本構文

オプション1:AS構文

CREATE EXPERIMENT <experiment_name> AS
<SELECT_query>
WITH (<options>)

フルスクリーンモードに入る フルスクリーンモードから退出する

オプション2:USING構文

CREATE EXPERIMENT <experiment_name>
USING (<SELECT_query>)
TARGET <target_column>
OPTIONS (<options>)

フルスクリーンモードに入る フルスクリーンモードから退出する

設定オプション

一般オプション

オプション タイプ デフォルト 説明
task_type 文字列 'binary_classification' MLタスクの種類
target_column 文字列 必須 予測する列
max_trials 整数 100 最大トレーニング試行回数
time_budget_minutes 整数 60 最大時間予算
validation_split 浮動小数点数 0.2 検証データの割合
cv_folds 整数 5 クロス検証の折り重ね
optimization_metric 文字列 タスク依存 最適化するメトリクス
ensemble ブーリアン アンサンブルモデルの作成
early_stopping_patience 整数 10 改善しない試行回数
random_seed 整数 42 再現性のためのランダムシード

利用可能なアルゴリズム

  • 'linear_regression' - 線形回帰
  • 'logistic_regression' - ロジスティック回帰
  • 'decision_tree' - 決定木
  • 'random_forest' - ランダムフォレスト
  • 'gradient_boosting' - 勾配ブースティング
  • 'xgboost' - XGBoost
  • 'neural_network' - ニューラルネットワーク
  • 'knn' - k-近傍法
  • 'naive_bayes' - ナイーブベイズ
  • 'svm' - サポートベクターマシン

アルゴリズム選択戦略

  • 'all' - 利用可能な全てのアルゴリズムを試す
  • 'fast' - 高速アルゴリズムのみ(線形モデル、決定木、ナイーブベイズ、kNN)
  • 'accurate' - 高度な精度のアルゴリズムのみ(ランダムフォレスト、勾配ブースティング、XGBoost、ニューラルネットワーク)
  • 'interpretable' - 解釈可能なアルゴリズムのみ(線形回帰、ロジスティック回帰、決定木)

アルゴリズム固有のオプション

ランダムフォレスト

ハイパーパラメータ タイプ デフォルト 説明
n_estimators 整数 100 木の数
max_depth 整数 なし 最大木の深さ
min_samples_split 整数 2 分割するための最小サンプル数
max_features 文字列/浮動小数点数 'sqrt' 考慮する特徴
WITH (
  task_type='classification',
  algorithms=['random_forest'],
  n_estimators=200,
  max_depth=10
)

フルスクリーンモードを開始 フルスクリーンモードを終了

ニューラルネットワーク

ハイパーパラメータ タイプ デフォルト 説明
hidden_layers 配列 [100] 隠れ層のサイズ
learning_rate 浮動小数点数 0.001 初期学習率
batch_size 整数 32 ミニバッチサイズ
n_epochs 整数 100 最大エポック数
activation 文字列 'relu' 活性化関数
dropout_rate 浮動小数点数 0.0 ドロップアウト率
WITH (
  task_type='classification',
  algorithms=['neural_network'],
  hidden_layers=[128, 64, 32],
  dropout_rate=0.2
)

全画面表示モードに入る フルスクリーンモードを終了

グラデーションブースティング / XGBoost

ハイパーパラメータ タイプ デフォルト 説明
n_estimators 整数 100 ブースティングステージの数
learning_rate 浮動小数点数 0.1 学習率
max_depth 整数 3 木の最大深さ
subsample float 1.0 サンプルの割合

特徴工学オプション

オプション タイプ デフォルト 説明
auto_features boolean true 特徴を自動生成
polynomial_degree 整数 2 多項式特徴量の次数
interaction_features ブーリアン false 交差特徴量の生成
scaling 文字列 'standard' 特徴量のスケーリング方法
missing_values 文字列 'mean' 欠損値の扱い
categorical_encoding 文字列 'onehot' カテゴリカルエンコーディング方法

スケーリング方法

  • 'standard' - 標準化(平均0、分散1)
  • 'minmax' - 最小-最大スケーリングで[0, 1]
  • 'robust' - 中位数とIQRを使用したロバストスケーリング
  • 'none' - スケーリングなし

カテゴリカルエンコーディング

  • 'onehot' - one-hotエンコーディング
  • 'label' - ラベルエンコーディング
  • 'target' - ターゲットエンコーディング
  • 'ordinal' - 順位エンコーディング

完全な例

顧客離脱予測

CREATE EXPERIMENT churn_prediction AS
SELECT customer_id, age, tenure, monthly_charges, total_charges, churned
FROM customers
WITH (
  task_type='binary_classification',
  target_column='churned',
  max_trials=50,
  validation_split=0.2
);

フルスクリーンモードを開く フルスクリーンモードを閉じる

家屋価格回帰

CREATE EXPERIMENT house_price_model AS
SELECT * FROM housing_data
WITH (
  task_type='regression',
  target_column='price',
  algorithms=['random_forest', 'xgboost', 'gradient_boosting'],
  max_trials=100,
  n_estimators=200
);

フルスクリーンモードを開く フルスクリーンモードを閉じる

特徴エンジニアリングによる不正検知

CREATE EXPERIMENT fraud_detection AS
SELECT * FROM transactions
WITH (
  task_type='binary_classification',
  target_column='is_fraud',
  algorithms=['xgboost', 'neural_network'],
  auto_features=true,
  polynomial_degree=2,
  interaction_features=true,
  scaling='robust',
  categorical_encoding='target',
  max_trials=150
);

フルスクリーンモードを開始 フルスクリーンモードを終了

時系列予測

CREATE EXPERIMENT sales_forecast AS
SELECT date, product_id, sales, promotions, holidays
FROM sales_data
WITH (
  task_type='time_series',
  target_column='sales',
  algorithms=['gradient_boosting', 'neural_network'],
  cv_folds=5
);

フルスクリーンモードを開始 フルスクリーンモードを終了

説明可能なモデルによるコンプライアンス

CREATE EXPERIMENT loan_approval AS
SELECT * FROM loan_applications
WITH (
  task_type='binary_classification',
  target_column='approved',
  algorithms=['logistic_regression', 'decision_tree'],
  max_depth=5
);

フルスクリーンモードを開始 フルスクリーンモードを終了

モデルの操作

すべての実験を表示

SHOW MODELS;

フルスクリーンモードを開始 フルスクリーンモードを終了

モデルのデプロイ

DEPLOY MODEL best_model FROM EXPERIMENT churn_prediction
WITH (replicas=3, memory='2Gi');

フルスクリーンモードを開始 フルスクリーンモードを終了

予測を行う

PREDICT churn_probability, risk_score
USING churn_model
AS SELECT customer_id, age, tenure FROM new_customers;

フルスクリーンモードを開始 フルスクリーンモードを終了

モデルを説明

DESCRIBE MODEL churn_model;

フルスクリーンモードを開始 フルスクリーンモードを終了

モデルをドロップ

DROP MODEL old_model;

フルスクリーンモードに入る フルスクリーンモードを終了

ベストプラクティス

  1. パラメータチューニング:互換性があるすべての選択されたアルゴリズムにアルゴリズム固有のオプションが適用されます.

  2. デフォルト値:すべてのオプションには適切なデフォルト値があります。デフォルト値と異なるオプションのみを指定してください。

  3. リソース制限:実験はmax_trialstime_budget_minutesの両方を尊重します。いずれかの制限に達したときに停止します。

  4. 再現性random_seedを設定して、実行ごとに一貫した結果を得ます。

  5. アルゴリズムの互換性:各タスクタイプごとにシステムが互換性のないアルゴリズムを自動的にフィルタリングします。


文書バージョン:1.0
最終更新日:2025年12月
ウェブサイトhttps://synapcores.com


初版公開元synapcores.com — SynapCoresは、無料の単一バイナリAIネイティブデータベース(ベクトル+グラフ+SQL+LLM)です。