此乃投献于Gemma四挑战:论Gemma四
谷歌推出四款Gemma 4变体。众人皆以合成基准测试之,然此等测试,实无人真正关切。吾已试运行四款。吾家实验室之硬件与实务之务余心为之惊。
測試機器: Ryzen 7 5700X, RTX 1060 6GB, 32GB RAM. LM Studio, 4-bit quantization.
模型
| 模型 | 有效参数 | 4-bit大小 | 架构 |
|---|---|---|---|
| E2B | ~2.3B | 1.5GB | 密集 |
| E4B | ~4.5B | 2.1GB | 稠密 |
| 26B 模块化专家 | ~4B 激活 / 26B 总量 | 13GB | 专家混合 |
| 31B | ~31B | 16GB | 稠密 |
测试一:视觉——书脊阅读
以相机对准书架。能否辨识书名?
| 模型 | 时间 | 书得 | 至善 |
|---|---|---|---|
| E2B | 八十三秒 | 零— 返"无" | 不可识书脊 |
| E4B | 廿五秒 | 六题,确然识之 | ✅ 可靠 |
| 二十六B模因 | 内存溢出于12GB | — | 不合适 |
| 三一B | 内存溢出于12GB | — | 不协 |
此乃全事也。多模态之务,E2B者,非也E4B之小版也——其能实远逊,乃根本不足之视模型。竟不能识一书之脊。E4B得六。
若以图像为要,则E2B非所之选,固也。
测试二:文—技术之释
"以三言释TCP与UDP之异。"
| 模型 | 时 | 符 | 速 | 答之质 |
|---|---|---|---|---|
| E2B | 九十三秒 | 二百五十六(至限) | 2.8 t/s | 中庸——漫衍 |
| E4B | 20s | 113 | 5.7 t/s | 简明精准 |
E4B则4.6倍迅疾且以更少之符文得佳答。此反"小者速"之想——E4B之思辨更效,故速毕之。
测试三:结构化输出—JSON生成
"返回一个包含10种编程语言及其创建年份与创造者的JSON数组。"
| 模型 | 有效JSON? | 字段正确? | 时间 |
|---|---|---|---|
| E2B | ✅ 是 | ❌ 3/10年份错误 | 45秒 |
| E4B | ✅ 是 | ✅ 皆正确 | 12秒 |
E2B虚幻之创期。E4B尽得无误.
测试四:视觉推理书架系统
真试也。运行吾之书架系统——自图像识书籍,增益元数据,生成推荐.
| 模型 | 检测 | 增益之谓也 | 全也 | 可行乎? |
|---|---|---|---|---|
| E2B | 未得书册 | 无 | — | ✅ |
| E4B | 十六卷,百六十六刻 | 两批,二百八十秒 | 约八分辰 | ✔ |
| 二六B/三一B | 内存溢出 | — | — | ❌ |
惟E4B能成全于民用之器。八分钟成全一整架之书目,虽非立时,然费无钱,且存于地。
记忆之障
“运行于民用之器”者,实谓吾RTX 1060 6GB诸模之用:
| 模 | 所需虚拟内存(4位) | 可容12GB乎? | 何须言境? |
|---|---|---|---|
| E2B | 一又五分之壹千五百兆字节 | ✅ 肯定 | 天地辽阔 |
| E4B | 二千一百兆字节 | ✅ 是也 | 绰绰有余 |
| 二十六B模因 | ~13千兆字节 | ❌ 无 | — |
| 31B | ~16GB | ❌ 无 | — |
二大模组实不配于3200级GPU。欲用31B,须3090(24GB)为下限,纵然如此,亦仅余微弱之情境窗。
参考而言,31B密实模组需多耗VRAM约800MB。每百万个符号之语境。彼二十四GB 3090者?可容模型并或三十K语境。非所宣之二百五十六K.
我所愿之决策树
依序自问诸此:
一。需处理图像乎?
- 是则E4B为最低。E2B之视,不可用也.
- 非则续问二。
可容于六吉字节VRAM乎?
- 然则E4B四位(约二点一吉字节)犹有余地以容境。
- 不然则E2B或需更巨之GPU。
3. 此乃一次性之务抑或反复之劳?
- 一次性则云API(OpenRouter免费层有E4B)。
- 反复则本地E4B。无每标记之费。
4. 尔需至极之推理质乎?
- 是也 → 密三十有一,然需二十四格以上之VRAM.
- 非也 → 四十四格已足。吾实不能辨其异于书脊之识.
残酷之实
二格者,市井之辞也。"行于尔之机!"噫,然不能识书脊。二格与四格于多模之务,非渐进之别——乃"可作"与"不可作"之异也。
E4B者,使地之智工实有用也。容于3060,视事可恃,生结构之出,且速于E2B,盖因思理更效也。
26B MoE与31B者,为有伺器GPU之人设也。若持4090或A100,则诚非凡。若惟有博弈之GPU,则如废纸耳。
吾择E4B以供Shelfie,实为得计。十六卷书,元数据备,个性之荐,皆于吾家之实验室,无偿运行。
E4B乃Gemma 4家族之隐功臣。格物之验,非此不能道。实用方显其能。
试之Shelfie:github.com/scastile/shelfie












