

























1、下载对应版本的程序
/opt/ollama# wget https://github.com/ollama/ollama/releases/download/v0.15.5-rc3/ollama-linux-amd64.tar.zst
2、解压
# tar -I zstd -xvf ollama-linux-amd64.tar.zst
3、把ollama可执行程序从bin文件夹移出来,每次多打个文件夹,麻烦
/opt/ollama# mv bin/ollama .
/opt/ollama# rm -rf bin/
4、后台启动服务
/opt/ollama# ./ollama serve &
或者:
/opt/ollama# OLLAMA_HOST=0.0.0.0 OLLAMA_PORT=11435 ollama serve &
5、指定下载路径
export OLLAMA_MODELS="/opt/ollama/models"
6、下载模型
/opt/ollama# ./ollama pull qwen3-coder-next
7、运行某个模型
CUDA_VISIBLE_DEVICES=0,1,2,3 ./ollama run --think=false qwen3-next:latest
——————————————————————————————————————————————
上面的方法安装的ollama用不起来显卡,得这么装!!!
1、安装指定版本的ollama
curl -fsSL https://ollama.com/install.sh | sh
2、这是以服务形式启动的,修改指定模型位置、模型常驻显存、局域网可访问并指定端口。
vim /etc/systemd/system/ollama.service
[Service]段最后添加(有多个Environment会都生效)
Environment="OLLAMA_MODELS=/opt/ollama/models" Environment="OLLAMA_KEEP_ALIVE=-1" Environment="OLLAMA_HOST=0.0.0.0:11434"
新的ollama是以ollama用户运行的,所以需要修改models文件夹的权限,否则可能会提示没权限的问题。
chown -R ollama:ollama /opt/ollama/models
3、重启服务生效
systemctl daemon-reload
systemctl restart ollama
4、查看模型是否已经是被加载
5、运行某个模型
ollama run qwen3-coder-next:q8_0
离开命令行(不会退出),在ollama命令行输入
6、查看模型运行情况
7、结束模型运行
ollama stop qwen3-coder-next:q8_0
如过模型一直在stoping状态,无法退出,直接重启ollama服务。
——————————————————————————
有多张显卡,想不同的模型运行在不同的显卡上,因为指定显卡需要再服务文件里加环境配置,如下:
[Service] # 告诉Ollama使用哪几块GPU (0,1 代表你2张卡的索引) Environment="CUDA_VISIBLE_DEVICES=0,1" # 让Ollama尽可能将模型分散到所有可用的GPU上,而不是优先塞满一张 Environment="OLLAMA_SCHED_SPREAD=1"
那么,只能是启动多个服务实现分显卡运行多个模型:
# 复制系统原有的 Ollama 服务文件,创建一个新的服务实例 cp /etc/systemd/system/ollama.service /etc/systemd/system/ollama23.service # 在新服务的配置文件中指定新显卡 vim /etc/systemd/system/ollama23.service ########## [Service] # 指定使用 GPU 2 和 3 Environment="CUDA_VISIBLE_DEVICES=2,3" # 重启服务 systemctl daemon-reload systemctl start ollama23.service # 如果想开机自启 systemctl enable ollama23.service # 验证服务状态 systemctl status ollama-gpu23.service
__________________________________________
升级新版本,再次执行:
curl -fsSL https://ollama.com/install.sh | sh
升级后,之前配置的 /etc/systemd/system/ollama.service 里的信息丢失,需要重新配置
然后重启服务。
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。