dev.toでGemma 4のチャレンジを見つけました。参加したかったのですが、どこから始めればいいのか全く分かりませんでした。
チャレンジのページを開いたところ、「Gemma 4モデルをローカルで実行する」というのが最初に見えました。その文をしばらく見つめていました。
ローカルで実行するとは一体どういう意味なんですか?
本気でAIは大きなサーバーにしか存在しないと思っていました。タイプして、考え、返信する。それがどうやって動いているか疑問に思ったことはありませんでした。ただ動いていただけでした。
だから基本的な質問を始めました。本当に基本的な質問です。
「ローカルで何が動いている?」
「RAMが足りない場合どうなる?」
「なぜ私のラップトップを誰にでもサーバーとして使えないのか?」
ゆっくりと — 質問ごとに — それが意味を成し始めた.
この投稿は私が学んだすべてのことだ。数日前に存在した私のバージョンのために書かれた.
"ローカルで実行する"とは何を意味するのか?
ChatGPTを使用すると、あなたのメッセージはインターネットに行き、遠くのサーバーに到達し、処理され、戻ってくる。あなたは他人のコンピューターを使用している。
ローカルで実行するとは、AIがあなたのコンピューターで動作することを意味します。 インターネットは不要。月額料金はありません。他のサーバーも不要。ただあなたのラップトップが考え事をします。
それが全体のコンセプトです。無意味に複雑に考え込んでいました。
ゲルマ4とは何ですか?
Googleが作成したAIモデルで、ダウンロードして自分で実行できるように無料で提供されています。
さまざまなサイズがあります:
| モデル | サイズ | 適しているもの |
|---|---|---|
| E2B | ~2 GB | スマートフォン、エッジデバイス |
| E4B | ~4 GB | ほとんどのラップトップ |
| 31B | ~20 GB | 高性能デスクトップ/サーバー |
より大きいほど賢くなるが、より遅くなり、より多くのメモリが必要。
通常のラップトップの場合 — E4Bから始めてください.
私のセットアップ
私はWindowsで8GBのRAMとNvidia GPU(4GB VRAM)を使用しています.
誰かが私にターミナルを開いて次のように入力すると言っていました.
nvidia-smi
それが何を表示するか全く分かりませんでした。入力してEnterを押すと次のようになりました.
NVIDIA-SMI 566.07 Driver Version: 566.07 CUDA Version: 12.7
完全に理解できなかった。しかし明らかにそれは良いことだ——あなたのGPUは準備できている
CUDAはあなたのNvidia GPUがAIソフトウェアと話すことを可能にするものだ。Ollama——Gemmaを実行するために私たちが使用するツール——は自動的にあなたのGPUを使用してより速くする。モデルの一部はGPUメモリにロードされ、一部はRAMにロードされる。あなたのグラフィックカードはAI推論を開始する
それは本当に面白かった
Gemma 4 を実行する方法(3つのステップ)
ステップ1: Ollama を ollama.com/download
の通常のインストーラーからダウンロードし、アプリケーションと同様にインストールします。
ステップ2:ターミナルを開き、以下のコマンドを入力します:
ollama run gemma3:4b
モデルをダウンロードし、チャットを開きます。完了です。
ステップ3: それと話す.
>>> What is photosynthesis?
>>> Write me a Python function to sort a list
>>> You are a helpful doctor. Answer my health questions simply.
インターネットがない。APIキーがない。コストがない。AIはあなたのマシン上で動いている.
この考え方を変えた質問
ある時点で私は問いかけた — 「なぜ私のラップトップをサーバーとして使って、皆がアクセスできるようにできないのか?」
それを聞いたら答えは明らかでした:
- ラップトップは24時間365日稼働する必要があります
- 家庭インターネットは受信トラフィックのために設計されていません
- 同時に10人のユーザーがいるとクラッシュします
- そして何より — インターネットがない人々のために何も解決していない 最後の点は思いがけない場所へと私を連れて行ってくれた
本当にワクワクしたもの
インターネットが利用できない村を想像してみてください.
クラウドAPIを呼び出すチャットボットはそのような場所では役に立ちません. シグナルが落ちればチャットボットは死にます.
しかし, Gemma E2Bをローカルで実行している小さくて安価なデバイスがコミュニティセンターやクリニックに置かれているとしたら? インターネットは一切必要ありません. AIはその場所に物理的に存在します. 人々はローカルWiFiを通じて接続し、答えを得ます.
Googleが小さなモデルを構築した理由です。E2Bは80~300ドルのコストのハードウェアで動作します。誰もがクラウドインターネットを持っているわけではありません。Gemma 4はその現実を考慮して設計されました.
それから「ローカルで実行する」というのが開発者の仕方ではなく、実際に大きな影響を与えるものとして感じられるようになりました.
APIを使うべき場合
インターネットを通じて実際のユーザーがアクセスするアプリの場合 — ラップトップで実行しない。Gemma APIを使用する。
最も簡単な方法はOpenRouterだ — 一つのアカウント、一つのAPIキー、Gemma 4への無料アクセス。設定の手間がない。
シンプルなルール:
ローカルのOllama = 学習と実験
API = 建設とデプロイ
それだけだ
数日前、モデルとは何か分かりませんでした。CUDAとは何か分かりませんでした。RAMがなぜ重要であるか分かりませんでした.
今ではGemma 4が私のラップトップで動作しており、実際にその理由が理解できるようになりました.
学習曲線は外から見ると急でした。それは実際にはそうではありませんでした.
Ollamaをダウンロードし、一つのコマンドを実行し、それが動作することを見てください。それ以外はすべて順調です。
初心者ですか?コメントを残してください——動作させるのを手伝うのが楽しみです
Gemmaを使ってオフラインや農村コミュニティで何かを作っていますか?それについて聞かせてください











