惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

酷 壳 – CoolShell
酷 壳 – CoolShell
H
Hacker News: Front Page
P
Palo Alto Networks Blog
T
ThreatConnect
Apple Machine Learning Research
Apple Machine Learning Research
博客园_首页
T
True Tiger Recordings
P
Privacy & Cybersecurity Law Blog
B
Blog
IT之家
IT之家
Last Week in AI
Last Week in AI
F
Full Disclosure
Hacker News: Ask HN
Hacker News: Ask HN
C
Comments on: Blog
Microsoft Azure Blog
Microsoft Azure Blog
C
Cybersecurity and Infrastructure Security Agency CISA
Microsoft Security Blog
Microsoft Security Blog
博客园 - 【当耐特】
N
News and Events Feed by Topic
NISL@THU
NISL@THU
腾讯CDC
雷峰网
雷峰网
Security Latest
Security Latest
李成银的技术随笔
M
Microsoft Research Blog - Microsoft Research
L
LangChain Blog
L
Lohrmann on Cybersecurity
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
C
Check Point Blog
Y
Y Combinator Blog
Recent Announcements
Recent Announcements
博客园 - Franky
N
News | PayPal Newsroom
V
V2EX
A
About on SuperTechFans
The Register - Security
The Register - Security
月光博客
月光博客
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
Google Online Security Blog
Google Online Security Blog
MyScale Blog
MyScale Blog
Cisco Talos Blog
Cisco Talos Blog
Vercel News
Vercel News
WordPress大学
WordPress大学
C
Cyber Attacks, Cyber Crime and Cyber Security
The Hacker News
The Hacker News
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
爱范儿
爱范儿
A
Arctic Wolf
L
LINUX DO - 最新话题
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More

博客园 - 见路非道

Flag Tone:如何匹配旗子条纹颜色(2026完整指南) Mog Omegle 2026 完全指南:如何运行一场 AI PSL 颜值对比 Toon Tone:用更简洁、更易分享的色彩匹配游戏练习色彩记忆 CurateClick 2026年4月每周精选:发现、访问与创意AI Hy-MT1.5-1.8B-2bit:腾讯开源 574MB 能打败 72B 巨人的移动端翻译模型 Qwen3.6-35B-A3B 全面评测:阿里开源模型如何超越前沿级水平 SBTI 和 SBTI Skill 完全指南:Claude 驱动的超大型人格测试 Happy Horse:重新定义2026年AI视频生成的最强模型 OpenClaw Dreaming 完全指南 2026:AI 代理的后台记忆整合 Qwen3.6-Plus:阿里低调憋大招,百万Token上下文企业级AI旗舰发布 CurateClick 应用推荐(2026年3月22日版) 2026年完全指南:OpenClaw LCM 插件 — 再也不会丢失任何对话 ACE-Step 1.5:2026年开源AI音乐生成完全指南 用 OpenClaw 构建 CBT 疗法 Agent — 2026 年完整指南 Claude Code Telegram 官方插件:完整配置指南 2026 小米 MiMo-V2 系列完全指南 2026:Pro/Omni/TTS 三大模型全面解读 MiroThinker-1.7:改变深度研究的新一代SOTA开源AI研究代理 GLM-5-Turbo完全指南2026:中国新世代前沿AI模型 OpenClaw Skills 机制总结 Openclaw MemorySearch 配置 OpenClaw ACP 配置 2026 完整指南:Moltbook — AI Agent 社交网络革命 Moltbot: 2026年终极个人AI助手完整指南 Qwen3-TTS:2026年开源语音克隆与AI语音生成完全指南
OpenClaw imageModel 配置指南
见路非道 · 2026-03-08 · via 博客园 - 见路非道

OpenClaw imageModel 配置指南

一、什么是 imageModel

imageModel 是 OpenClaw 中专门用于视觉理解的模型配置,独立于主对话模型(model)。当对话涉及图片或视觉内容时,OpenClaw 会自动切换到 imageModel 指定的模型来处理。

二、为什么需要单独配置

主模型(model.primary)不一定支持视觉输入。例如:

  • MiniMax-M2.5-highspeed 是纯文本模型,无法处理图片
  • moonshot/kimi-k2.5 支持多模态(文本+图片)

单独配置 imageModel 可以做到:文本走快模型,图片走多模态模型,兼顾速度和能力。

三、配置方式

在 OpenClaw 配置文件中(openclaw config edit):

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "minimax-portal/MiniMax-M2.5-highspeed",
        "fallbacks": ["moonshot/kimi-k2.5", "anthropic/claude-opus-4-6"]
      },
      "imageModel": {
        "primary": "moonshot/kimi-k2.5",
        "fallbacks": ["openrouter/qwen/qwen-2.5-vl-72b-instruct:free"]
      }
    }
  }
}

两种写法都支持:

// 简写(只设主模型,无回退)
"imageModel": "moonshot/kimi-k2.5"

// 完整写法(主模型 + 回退链)
"imageModel": {
  "primary": "moonshot/kimi-k2.5",
  "fallbacks": ["openrouter/google/gemini-2.0-flash-vision:free"]
}

四、CLI 管理命令

# 查看当前 imageModel 状态
openclaw models status

# 设置 imageModel 主模型
openclaw models set-image moonshot/kimi-k2.5

# 管理 imageModel 回退链
openclaw models image-fallbacks list
openclaw models image-fallbacks add openrouter/qwen/qwen-2.5-vl-72b-instruct:free
openclaw models image-fallbacks remove openrouter/qwen/qwen-2.5-vl-72b-instruct:free
openclaw models image-fallbacks clear

五、触发场景

用户发送图片 照片、截图等图片附件,agent 需要"看图说话"时 用户发送 PDF PDF 含扫描页/图片,需视觉分析时(先查 pdfModel,未配则回退到 imageModel媒体理解管线 收到的图片/视频截帧经过自动媒体理解流程时 agent 工具调用 agent 使用内置的 image 工具分析图片时
场景 说明

六、回退逻辑

imageModel.primary  →  imageModel.fallbacks[0]  →  fallbacks[1]  →  ...

逐个尝试,第一个成功即返回。全部失败则报错:

"No image model configured. Set agents.defaults.imageModel.primary or agents.defaults.imageModel.fallbacks."

七、与 pdfModel 的关系

PDF 处理优先级:pdfModel → imageModel → 内置 provider 默认值

如果没有配置 pdfModel,PDF 工具会自动回退到 imageModel 的配置。

八、内置默认图像模型(无配置时)

当未配置 imageModel 且系统检测到对应 provider 的 API key 时,会使用内置默认:

OpenAI gpt-5-mini Anthropic claude-opus-4-6 Google gemini-3-flash-preview MiniMax MiniMax-VL-01 ZAI glm-4.6v
Provider 默认模型

九、完整配置示例

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "minimax-portal/MiniMax-M2.5-highspeed",
        "fallbacks": ["moonshot/kimi-k2.5", "anthropic/claude-opus-4-6"]
      },
      "imageModel": {
        "primary": "moonshot/kimi-k2.5",
        "fallbacks": ["openrouter/google/gemini-2.0-flash-vision:free"]
      },
      "pdfModel": {
        "primary": "anthropic/claude-opus-4-6"
      },
      "models": {
        "moonshot/kimi-k2.5": { "alias": "kimi" },
        "minimax-portal/MiniMax-M2.5-highspeed": { "alias": "mm" }
      }
    }
  }
}

效果:

  • 纯文本对话 → MiniMax-M2.5-highspeed
  • 发图片 → moonshot/kimi-k2.5,失败则 → gemini-2.0-flash-vision
  • 发 PDF → claude-opus-4-6,未配则回退到 imageModel 链