慣性聚合 関心のあるブログ、ニュース、テクノロジーを効率的に追跡
原文を読む 慣性聚合で開く

おすすめ購読元

Google DeepMind News
Google DeepMind News
人人都是产品经理
人人都是产品经理
M
MIT News - Artificial intelligence
博客园 - 叶小钗
MyScale Blog
MyScale Blog
V
Visual Studio Blog
月光博客
月光博客
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
量子位
I
InfoQ
有赞技术团队
有赞技术团队
阮一峰的网络日志
阮一峰的网络日志
Jina AI
Jina AI
V
V2EX
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
Blog — PlanetScale
Blog — PlanetScale
Last Week in AI
Last Week in AI
雷峰网
雷峰网
Stack Overflow Blog
Stack Overflow Blog
博客园 - Franky

DEV Community

Authentication Security Deep Dive: From Brute Force to Salted Hashing (With Java Examples) Why AI Systems Don’t Fail — They Drift Spilling beans for how i learn for exam😁"Reinforcement Learning Cheat Sheet" I Replaced Chrome with Safari for AI Browser Automation. Here's What Broke (and What Finally Worked) How Python Borrows Other People's Work The $40 Architecture: Processing 1 Billion API Requests with 99.99% Uptime Vibe Coding: A Workflow Guide (From Zero to SaaS) Most webhook security guides protect the wrong side. The scary part is delivery. Headless CMS for TanStack Start: Build a Blog with Cosmic EU Age Verification App "Hacked in 2 Minutes" — What Actually Happened Comfy Cloud’s delete function does not actually remove files Running AI Models on GPU Cloud Servers: A Beginner Guide Event-driven media intelligence with AWS Step Functions and Bedrock I scored 500 AI prompts across 8 quality dimensions — here's what broke How to Call Google Gemini API from Next.js (Free Tier, No Backend Needed) The Portal Protocol: Reclaiming Human Connection in the Age of AI How to Fix Your Team's Scattered Knowledge Problem With a Self-Hosted Forum Intro to tc Cloud Functors: A Graph-First Mental Model for the Modern Cloud Designing Multi-Tenant Backends With Both Ownership and Team Access I Built a Neumorphic CSS Library with 77+ Components — Here's What I Learned PostgreSQL Performance Optimization: Why Connection Pooling Is Critical at Scale Cómo construí un SaaS multi-rubro para gestionar expensas en Argentina con FastAPI + Vue 3 🚀 I Built an Ethical Hacking Scanner Tool – Open Source Project I Replaced /usage and /context in Claude Code With a Single Statusline A Pythonic Way to Handle Emails (IMAP/SMTP) with Auto-Discovery and AI-Ready Design I Collected 8.9 Million Polymarket Price Points — Here's What I Found About How Markets Really Move EcoTrack AI — Carbon Footprint Tracker & Dashboard Everyone's Using AI. No One Agrees How. 5 self-hosted ebook managers worth trying in 2026 Building Your First AI Agent with LangChain: From Chatbot to Autonomous Assistant Common SOC 2 Failures (Real World) Stop Vibe-Checking Your AI App: A Practical Guide to Evals How to Use SonarQube and SonarScanner Locally to Level Up Your Code Quality Your Next To-Do App Is Dead — I Replaced Mine with an OpenClaw AI Sign a Nostr event in 60 lines of Python using coincurve — no nostr-sdk, no nbxplorer, no rust toolchain ITGC Audit Explained Like You’re in Big 4 Patch Tuesday abril 2026: Microsoft parcha 163 vulnerabilidades y un zero-day en SharePoint Stop scraping everything: a better way to track competitor price changes Listing on MCPize + the Official MCP Registry while routing payments OUTSIDE the marketplace — how I kept 100% of my x402 revenue Building an AI-Powered Risk Intelligence System Using Serverless Architecture Why We Ripped Function Overloading Out of Our AI Toolchain Testing AI-Generated Code: How to Actually Know If It Works SaaS Churn Is Killing Your Business. Here Is What to Do About It (Without a Support Team) The Speed of AI Is No Longer Linear - And Self-Improving Models Are Why How to Implement RBAC for MCP Tools: A Practical Guide for Engineering Teams From Standard Quote to Persuasive Proposal: AI Automation for Arborists I built a CLI that scaffolds complete multi-tenant SaaS apps Axios CVE-2025–62718: The Silent SSRF Bug That Could Be Hiding in Your Node.js App Right Now The dashboard that ended our friendship Data Pipelines Explained Simply (and How to Build Them with Python)
Gemma for Dummies: 何も知らなかった。今はラップトップでAIを実行している。
Aditthya SS · 2026-05-24 · via DEV Community

 dev.toでGemma 4のチャレンジを見つけました。参加したかったのですが、どこから始めればいいのか全く分かりませんでした。

チャレンジのページを開いたところ、「Gemma 4モデルをローカルで実行する」というのが最初に見えました。その文をしばらく見つめていました。

ローカルで実行するとは一体どういう意味なんですか?

本気でAIは大きなサーバーにしか存在しないと思っていました。タイプして、考え、返信する。それがどうやって動いているか疑問に思ったことはありませんでした。ただ動いていただけでした。

だから基本的な質問を始めました。本当に基本的な質問です。

「ローカルで何が動いている?」
「RAMが足りない場合どうなる?」
「なぜ私のラップトップを誰にでもサーバーとして使えないのか?」

ゆっくりと — 質問ごとに — それが意味を成し始めた.

この投稿は私が学んだすべてのことだ。数日前に存在した私のバージョンのために書かれた.


"ローカルで実行する"とは何を意味するのか?

ChatGPTを使用すると、あなたのメッセージはインターネットに行き、遠くのサーバーに到達し、処理され、戻ってくる。あなたは他人のコンピューターを使用している。

ローカルで実行するとは、AIがあなたのコンピューターで動作することを意味します。 インターネットは不要。月額料金はありません。他のサーバーも不要。ただあなたのラップトップが考え事をします。

それが全体のコンセプトです。無意味に複雑に考え込んでいました。


ゲルマ4とは何ですか?

Googleが作成したAIモデルで、ダウンロードして自分で実行できるように無料で提供されています。

さまざまなサイズがあります:

モデル サイズ 適しているもの
E2B ~2 GB スマートフォン、エッジデバイス
E4B ~4 GB ほとんどのラップトップ
31B ~20 GB 高性能デスクトップ/サーバー

より大きいほど賢くなるが、より遅くなり、より多くのメモリが必要。

通常のラップトップの場合 — E4Bから始めてください.


私のセットアップ

私はWindowsで8GBのRAMとNvidia GPU(4GB VRAM)を使用しています.

誰かが私にターミナルを開いて次のように入力すると言っていました.

nvidia-smi

フルスクリーンモードに入る フルスクリーンモードから抜ける

それが何を表示するか全く分かりませんでした。入力してEnterを押すと次のようになりました.

NVIDIA-SMI 566.07    Driver Version: 566.07    CUDA Version: 12.7

フルスクリーンモードに入る フルスクリーンモードを終了

完全に理解できなかった。しかし明らかにそれは良いことだ——あなたのGPUは準備できている

CUDAはあなたのNvidia GPUがAIソフトウェアと話すことを可能にするものだ。Ollama——Gemmaを実行するために私たちが使用するツール——は自動的にあなたのGPUを使用してより速くする。モデルの一部はGPUメモリにロードされ、一部はRAMにロードされる。あなたのグラフィックカードはAI推論を開始する

それは本当に面白かった


Gemma 4 を実行する方法(3つのステップ)

ステップ1: Ollama を ollama.com/download

の通常のインストーラーからダウンロードし、アプリケーションと同様にインストールします。

ステップ2:ターミナルを開き、以下のコマンドを入力します:

ollama run gemma3:4b

Enter fullscreen mode Exit fullscreen mode

モデルをダウンロードし、チャットを開きます。完了です。

ステップ3: それと話す.

>>> What is photosynthesis?
>>> Write me a Python function to sort a list
>>> You are a helpful doctor. Answer my health questions simply.

フルスクリーンモードに入る. フルスクリーンモードから抜ける.

インターネットがない。APIキーがない。コストがない。AIはあなたのマシン上で動いている.


この考え方を変えた質問

ある時点で私は問いかけた — 「なぜ私のラップトップをサーバーとして使って、皆がアクセスできるようにできないのか?」

それを聞いたら答えは明らかでした:

  • ラップトップは24時間365日稼働する必要があります
  • 家庭インターネットは受信トラフィックのために設計されていません
  • 同時に10人のユーザーがいるとクラッシュします
  • そして何より — インターネットがない人々のために何も解決していない 最後の点は思いがけない場所へと私を連れて行ってくれた

本当にワクワクしたもの

インターネットが利用できない村を想像してみてください.

クラウドAPIを呼び出すチャットボットはそのような場所では役に立ちません. シグナルが落ちればチャットボットは死にます.

しかし, Gemma E2Bをローカルで実行している小さくて安価なデバイスがコミュニティセンターやクリニックに置かれているとしたら? インターネットは一切必要ありません. AIはその場所に物理的に存在します. 人々はローカルWiFiを通じて接続し、答えを得ます.

Googleが小さなモデルを構築した理由です。E2Bは80~300ドルのコストのハードウェアで動作します。誰もがクラウドインターネットを持っているわけではありません。Gemma 4はその現実を考慮して設計されました.

それから「ローカルで実行する」というのが開発者の仕方ではなく、実際に大きな影響を与えるものとして感じられるようになりました.


APIを使うべき場合

インターネットを通じて実際のユーザーがアクセスするアプリの場合 — ラップトップで実行しない。Gemma APIを使用する。

最も簡単な方法はOpenRouterだ — 一つのアカウント、一つのAPIキー、Gemma 4への無料アクセス。設定の手間がない。

シンプルなルール:

ローカルのOllama = 学習と実験
API = 建設とデプロイ


それだけだ

数日前、モデルとは何か分かりませんでした。CUDAとは何か分かりませんでした。RAMがなぜ重要であるか分かりませんでした.

今ではGemma 4が私のラップトップで動作しており、実際にその理由が理解できるようになりました.

学習曲線は外から見ると急でした。それは実際にはそうではありませんでした.

Ollamaをダウンロードし、一つのコマンドを実行し、それが動作することを見てください。それ以外はすべて順調です。


初心者ですか?コメントを残してください——動作させるのを手伝うのが楽しみです

Gemmaを使ってオフラインや農村コミュニティで何かを作っていますか?それについて聞かせてください