gen-images — 给 Claude Code 用的 Skill :调用 gpt-image2 图片生成 / 改图
Herbivore
·
2026-04-24
·
via LINUX DO - 最新话题
我在 Claude Code 调用gpt-image2,封装整理成了一个可复用的 skill,名字叫 gen-images 。 它的目标很简单: 在 Claude Code 里直接用自然语言生成图片 支持文生图和改图 支持自动触发,也支持手动用 /gen-images ... 自动读取当前用户 Claude Code 配置里的 API Base URL 和 Token 自动把生成结果保存到本地目录 如果你也在用 CLIProxyAPI 反代Codex到 Claude Code ,这套 skill 可以直接复用。 一、这个 skill 能做什么 1. 文生图 可以直接这样用: /gen-images 生成一张透明背景的猫咪头像,1024x1024,png 或者自然语言触发: 使用 gpt-image-2 生成一张透明背景的猫咪头像 2. 改图 / 编辑图片 例如: /gen-images 把 ./input.png 改成水彩风,保留主体,输出 webp 支持的图片来源: 本地文件路径 图片 URL data URL 3. 自动补字段 这个 skill 会自动从自然语言里提取常见参数,比如: 尺寸 size 质量 quality 背景 background 输出格式 output_format 生成张数 n 如果缺少关键字段: 文生图缺提示词,会追问 prompt 改图缺图片来源,会提示你提供: 本地路径 图片 URL / data URL 二、使用前提 在安装和使用这个 skill 之前,请先确认以下条件满足: 1. CLIProxyAPI 版本要求 CLIProxyAPI 版本必须 ≥ v6.9.34 这是前提条件。低版本不保证支持当前这套图片接口能力和参数。 2. Python 环境 本 skill 通过 Python 脚本真正发起图片接口请求,因此本机需要可用的 Python 环境。 建议确认至少满足: py --version 如果这条命令能正常输出版本号,就说明基本满足运行条件。 3. Claude Code 配置中已设置 API 信息 本 skill 会自动从 Claude Code 当前用户配置中读取: env.ANTHROPIC_BASE_URL env.ANTHROPIC_AUTH_TOKEN 读取位置: ~/.claude/settings.json 也就是说,你需要先让 Claude Code 当前环境本身已经配置好 Base URL 和 Token。 4. 后端已支持图片接口 你的反代链路需要支持以下接口: POST /v1/images/generations POST /v1/images/edits 三、支持的 size 规则 目前这版 gen-images 中,size 规则整理成了下面这些: 1024x1024 ( 1:1 ) 1024x1536 ( 3:4 ) 1536x1024 ( 4:3 ) 2048x2048 ( 1:1 ) 3840x2160 ( 16:9 ) 2160x3840 ( 9:16 ) auto 也就是说,下面这些写法都能识别: 1:1 3:4 4:3 16:9 9:16 1024x1024 1024x1536 1536x1024 2048x2048 3840x2160 2160x3840 auto 其中: 2160x3840 3840x2160 在我当前这套 CLIProxyAPI + gpt-image-2 链路里已经做过实测,可以成功生成, 但是提示词不能过于复杂,否则会报错:stream disconnected before completion 需要注意的是,这两个值不等同于 OpenAI 官方公开文档中列出的标准 size 枚举,它们更准确地说是: 当前链路下实测可用的兼容尺寸 所以如果你换了不同的代理版本、不同后端或者不同模型,建议自己再做一次最小对照测试。 四、安装方法 把 gen-images 整个目录复制到你的 Claude Code 用户级 skills 目录: ~/.claude/skills/ 最终结构应为: ~/.claude/skills/gen-images/SKILL.md ~/.claude/skills/gen-images/scripts/gen_images.py ~/.claude/skills/gen-images/references/fields.md Windows 下通常对应: C:\Users\你的用户名\.claude\skills\gen-images\ 复制完成后: 重启 Claude Code 或执行插件 / skill 重载 然后直接测试 /gen-images 五、使用示例 示例 1:文生图 /gen-images 生成一张透明背景的猫咪头像,1024x1024,png 示例 2:竖版高分辨率图 /gen-images 生成一张赛博朋克风格的机甲少女全身像,9:16,png,高清 示例 3:改图 /gen-images 把 ./input.png 改成水彩风,保留主体,输出 webp 示例 4:信息图 / 图鉴类 /gen-images 根据{明代女子图鉴}自动生成一张博物馆图鉴式中文拆解信息图,9:16,png,高清 六、输出行为 默认情况下,生成结果会保存到当前工作目录下: ./gen-images/ 成功后,Claude 会返回类似这样的结果: 图片已生成, 图片路径: C:\Users\xxx\gen-images\20260424-003204-01.png 实际使用的关键参数: model=gpt-image-2, size=2160x3840, quality=high, output_format=png, n=1 失败时则会返回简短错误原因,例如: 生成失败: 缺少 prompt 七、这个 skill 的特点 我自己比较看重的点有这些: 1. 不需要手动拼接口请求 不用自己写 curl、也不用每次都手写 JSON。 2. 支持自然语言参数提取 比如: 高清 → quality=high 透明背景 → background=transparent 9:16 → size=2160x3840 png/webp/jpg → output_format 3. 同时支持自动触发和 slash 调用 既可以直接说: 使用 gpt-image-2 生成图片 也可以手动输入: /gen-images ... 4. 自动读取当前 Claude Code 配置 不需要在 skill 里额外写死 API Base URL 和 Token。 八、适合哪些人用 这套 skill 比较适合: 已经在用 Claude Code 已经通过 CLIProxyAPI 接好了图片模型 想把"生图 / 改图"变成日常工作流的一部分 不想每次手动拼图片接口请求 九、注意事项 本 skill 依赖 Python 环境 本 skill 默认从 ~/.claude/settings.json 读取 API 配置 你的 CLIProxyAPI 版本必须 ≥ v6.9.34 2160x3840 / 3840x2160 是当前链路实测可用,不代表所有后端都一致支持 如果复杂长提示词在超大尺寸下偶发失败,优先做最小提示词对照测试,判断是尺寸问题还是后端稳定性问题 十、如果你也想装同款 skill 你只需要: 把 gen-images 文件夹复制到 ~/.claude/skills/ 确认 CLIProxyAPI >= v6.9.34 确认本机可运行 py --version 确认 ~/.claude/settings.json 里已经配置好: env.ANTHROPIC_BASE_URL env.ANTHROPIC_AUTH_TOKEN 然后就可以直接开始用。 如果你后面还想扩展,我觉得还可以继续往下做: 加更多自然语言参数映射 加白名单校验 加更完整的错误提示 加 README / 仓库打包 / 发布版说明 十一、结语 如果你本身就在用 Claude Code + CLIProxyAPI,这个 gen-images skill 其实很适合拿来当一个可复用的图片工作流入口。 它不是单纯的脚本,而是把: 参数识别 交互补全 接口调用 文件落地 结果回传 整合成了 Claude Code 里可直接使用的一套体验。 如果论坛里有人需要,我也建议你们在自己环境里先跑一次最小提示词测试,确认当前代理链路对高分辨率尺寸的支持情况,再正式投入日常使用。 附带 gen-images.zip (16.2 KB) 1 个帖子 - 1 位参与者 阅读完整话题
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。