慣性聚合 高效追蹤和閱讀你感興趣的部落格、新聞、科技資訊
閱讀原文 在慣性聚合中打開

推薦訂閱源

Google DeepMind News
Google DeepMind News
人人都是产品经理
人人都是产品经理
M
MIT News - Artificial intelligence
博客园 - 叶小钗
MyScale Blog
MyScale Blog
V
Visual Studio Blog
月光博客
月光博客
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
量子位
I
InfoQ
有赞技术团队
有赞技术团队
阮一峰的网络日志
阮一峰的网络日志
Jina AI
Jina AI
V
V2EX
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
Blog — PlanetScale
Blog — PlanetScale
Last Week in AI
Last Week in AI
雷峰网
雷峰网
Stack Overflow Blog
Stack Overflow Blog
博客园 - Franky

DEV Community

Authentication Security Deep Dive: From Brute Force to Salted Hashing (With Java Examples) Why AI Systems Don’t Fail — They Drift Spilling beans for how i learn for exam😁"Reinforcement Learning Cheat Sheet" I Replaced Chrome with Safari for AI Browser Automation. Here's What Broke (and What Finally Worked) How Python Borrows Other People's Work The $40 Architecture: Processing 1 Billion API Requests with 99.99% Uptime Vibe Coding: A Workflow Guide (From Zero to SaaS) Most webhook security guides protect the wrong side. The scary part is delivery. Headless CMS for TanStack Start: Build a Blog with Cosmic EU Age Verification App "Hacked in 2 Minutes" — What Actually Happened Comfy Cloud’s delete function does not actually remove files Running AI Models on GPU Cloud Servers: A Beginner Guide Event-driven media intelligence with AWS Step Functions and Bedrock I scored 500 AI prompts across 8 quality dimensions — here's what broke How to Call Google Gemini API from Next.js (Free Tier, No Backend Needed) The Portal Protocol: Reclaiming Human Connection in the Age of AI How to Fix Your Team's Scattered Knowledge Problem With a Self-Hosted Forum Intro to tc Cloud Functors: A Graph-First Mental Model for the Modern Cloud Designing Multi-Tenant Backends With Both Ownership and Team Access I Built a Neumorphic CSS Library with 77+ Components — Here's What I Learned PostgreSQL Performance Optimization: Why Connection Pooling Is Critical at Scale Cómo construí un SaaS multi-rubro para gestionar expensas en Argentina con FastAPI + Vue 3 🚀 I Built an Ethical Hacking Scanner Tool – Open Source Project I Replaced /usage and /context in Claude Code With a Single Statusline A Pythonic Way to Handle Emails (IMAP/SMTP) with Auto-Discovery and AI-Ready Design I Collected 8.9 Million Polymarket Price Points — Here's What I Found About How Markets Really Move EcoTrack AI — Carbon Footprint Tracker & Dashboard Everyone's Using AI. No One Agrees How. 5 self-hosted ebook managers worth trying in 2026 Building Your First AI Agent with LangChain: From Chatbot to Autonomous Assistant Common SOC 2 Failures (Real World) Stop Vibe-Checking Your AI App: A Practical Guide to Evals How to Use SonarQube and SonarScanner Locally to Level Up Your Code Quality Your Next To-Do App Is Dead — I Replaced Mine with an OpenClaw AI Sign a Nostr event in 60 lines of Python using coincurve — no nostr-sdk, no nbxplorer, no rust toolchain ITGC Audit Explained Like You’re in Big 4 Patch Tuesday abril 2026: Microsoft parcha 163 vulnerabilidades y un zero-day en SharePoint Stop scraping everything: a better way to track competitor price changes Listing on MCPize + the Official MCP Registry while routing payments OUTSIDE the marketplace — how I kept 100% of my x402 revenue Building an AI-Powered Risk Intelligence System Using Serverless Architecture Why We Ripped Function Overloading Out of Our AI Toolchain Testing AI-Generated Code: How to Actually Know If It Works SaaS Churn Is Killing Your Business. Here Is What to Do About It (Without a Support Team) The Speed of AI Is No Longer Linear - And Self-Improving Models Are Why How to Implement RBAC for MCP Tools: A Practical Guide for Engineering Teams From Standard Quote to Persuasive Proposal: AI Automation for Arborists I built a CLI that scaffolds complete multi-tenant SaaS apps Axios CVE-2025–62718: The Silent SSRF Bug That Could Be Hiding in Your Node.js App Right Now The dashboard that ended our friendship Data Pipelines Explained Simply (and How to Build Them with Python)
Gemma 對新手:我什麼也不知道。現在我在我的筆記型電腦上運行 AI。
Aditthya SS · 2026-05-24 · via DEV Community

 我在dev.to上看到Gemma 4挑戰。我想參加。我完全不知道從哪裡開始。

我打開挑戰頁面,第一眼看到的便是「在本地運行Gemma 4模型」。我盯著那句话看了一會兒。

在本地運行甚至意味著什麼?

我原本以為AI只存在於某處的大型伺服器上。你輸入,它思考,它回覆。我從未質疑它是如何運作的。它就是能運作。

所以我開始問一些基本的問題。非常基本的問題。

「本地端運行的是什麼?」
「如果我的RAM不夠用會怎麼樣?」
「為什麼我不能直接用我的筆記型電腦當作為所有人提供服務的伺服器?」

然後慢慢地 — 一個問題一個問題地 — 它開始有了意義.

這篇文章是我所學到的所有內容。寫給幾天前存在的我.


「本機運行」是什麼意思?

當你使用ChatGPT時,你的訊息會傳到網路上,到達遠方的伺服器,經過處理後再回來。你在使用別人的電腦。

在本地運行是指 AI 在您的電腦上運行.不需要互聯網。沒有月費。沒有別人的伺服器。只是您的筆記型電腦在進行思考.

這就是整個概念。我沒有理由在腦中把它想得太複雜.


Gemma 4 是什麼?

它是 Google 製作的 AI 模型——他們已經讓它免費下載並自行運行.

它有不同的大小:

模型 大小 適合
E2B ~2 GB 手機、邊緣設備
E4B ~4 GB 大多數筆記型電腦
31B ~20 GB 強大的桌面/伺服器

越大越聰明但越慢,需要更多記憶體。

對於一般筆記型電腦 — 從 E4B 開始.


我的設定

我使用 Windows,有 8 GB RAM 和一個 Nvidia GPU,VRAM 為 4 GB.

有人建議我打開終端機並輸入:

nvidia-smi

進入全螢幕模式 退出全螢幕模式

我不知道那會顯示什麼。我輸入後,按下 Enter,得到:

NVIDIA-SMI 566.07    Driver Version: 566.07    CUDA Version: 12.7

進入全螢幕模式 退出全螢幕模式

我沒有完全理解。但顯然那很好 — 你的 GPU 已經準備好了

CUDA 是讓你的 Nvidia GPU 能與 AI 軟體溝通的東西。Ollama — 我們用來運行 Gemma 的工具 — 會自動使用你的 GPU 來加快速度。模型的其中一部分會載入到 GPU 內存,另一部分則載入到 RAM。你的顯卡開始進行 AI 推理

那感覺真的很酷。


如何運行Gemma 4 (3個步驟)

步驟 1:ollama.com/download

下載正常安裝程式。像安裝任何應用程式一樣安裝它.

步驟 2: 開啟您的終端機並輸入:

ollama run gemma3:4b

Enter fullscreen mode Exit fullscreen mode

它下載模型並打開聊天室。完成了。

步驟 3: 與它對話.

>>> What is photosynthesis?
>>> Write me a Python function to sort a list
>>> You are a helpful doctor. Answer my health questions simply.

進入全螢幕模式 離開全螢幕模式

沒有網路。沒有 API 金鑰。沒有費用。AI 執行在你的電腦上.


變更了我對這件事看法的問題

在某個時候我問 — "為什麼我不能直接把我的筆記型電腦當作伺服器,讓大家都能存取它?"

聽到答案後,我就知道答案很明顯了:

  • 你的筆記型電腦需要24/7開機
  • 家庭網路並非設計用於接收流量
  • 一次有 10 個用戶會導致它崩潰
  • 最重要的是 — 你為沒有網路的人沒有解決任何問題 那最後一點讓我意外。

讓我真正興奮的事

想像一個沒有可靠網際網路的村落.

一個呼叫雲端API的對話機器人那裡無用.信號消失 — 對話機器人就死亡.

但一個小而便宜的裝置在社區中心或診所本地運行Gemma E2B?不需要任何網際網路.這個AI實際上存在於那個位置.人們透過本地WiFi連接並獲得答案.

這就是為什麼Google開發了小型模型。E2B在成本為80-300美元的硬體上運行。不是每個人都有雲端互聯網。Gemma 4的設計考慮到了這一現實。

這就是當「本機運行」不再感覺像一個開發者技巧,而是開始感覺像某種真正有影響力的事情的時候。


當應用API時

對於用戶透過互聯網訪問的應用程式 — 不要在你的電腦上運行它。使用 Gemma API.

最簡單的方法是 OpenRouter — 一個帳戶,一個 API 金鑰,免費訪問 Gemma 4。沒有設定煩惱.

簡單的規則:

本地 Ollama = 學習和實驗
API = 開發和部署


就這樣

幾天前我不知曉模型是什麼。我不知曉CUDA代表什麼。我不知曉為何RAM很重要。

現在我手機上運行著Gemma 4,我實際上理解了為何。

從外面看,學習曲線看起來很陡峭。其實並不如此。

下載Ollama。運行一條命令。看到它運作。其他一切都跟隨著。


你是完全的新手嗎?留言告訴我——我很樂意幫你啟動它.

為離線或鄉村社區用Gemma建構些什麼?我很想聽聽關於它的事。