


























这是一个创建于 72 天前的主题,其中的信息可能已经有所发展或是发生改变。
替换下面指令中的 model ID 为你本地 Ollama 里启动的版本。
openclaw onboard --non-interactive \
--auth-choice custom-api-key \
--custom-base-url "http://127.0.0.1:11434/v1" \
--custom-model-id "gemma4:31b-it-q4_K_M" \
--custom-api-key "ollama" \
--secret-input-mode plaintext \
--custom-compatibility openai \
--accept-risk
1 0U0 4 月 4 日需要什么配置才能跑得动 |
3 Visoar 4 月 4 日 |
4 pkuphy 4 月 4 日 via iPhone这个模型真的好用 |
5 senooo 4 月 4 日手机上的 e2b 2G PC 端的 e2b 7G |
7 v2gba 4 月 4 日站长这个得 30+的内存才能跑了吧? |
8 zivn 4 月 4 日32G M3 Pro 不论用 mlx 还是 ollama 跑 31b 基本没法用。 |
9 zivn 4 月 4 日mlx 版本在 huggingface 上,mlx-community/gemma-4-31b-it-nvfp4 ,需要用 mlx-vlm 运行。 |
10 huanxianghao 4 月 4 日很棒。 |
11 paranoiagu 4 月 4 日 via Android龙虾的上下文太长了,我 24G 显卡,跑 27B 的 qwen3.5 ,开了 64K 上下文,再大就爆显存了。但是 64K 龙虾不够。 |
12 chipipi 4 月 4 日 via Android目前什么设备能跑得动? |
13 dinjufen 4 月 4 日16G 内存的 mac mini m4 能跑动吗 |
14 zoozobib 4 月 4 日测试 qwen3.5-27b q4 和 gemma4-31b q4 。200K ctx 同样的代码问题,后者一把过,测试用例还是少 |
15 zoozobib 4 月 4 日但前者能跑到 38 /t 后 只能到 33/t |
16 levn 4 月 4 日27b q4 使用 32G 显存,就可以开 200k 上下文 |
18 learnshare 4 月 4 日16G M2 Mac mini 勉强能跑起来低配两个版本,但仅能跑起来,没啥可用性 |
20 zoozobib 4 月 4 日新测,加了 2b 的 draft , 提升到 45/t ;Draft 接受率 不错,5 成 |
24 c0xt30a 4 月 5 日我用微调版 Qwen3.5 的经验是:只要虾虾不试图修改代码错误,运行还算顺利。技能运行不成功修改代码的时候,有很大的几率把自己搞瘫痪。 |
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。