慣性聚合 高效追讀感興趣之博客、新聞、科技資訊
閱原文 以慣性聚合開啟

推薦訂閱源

博客园 - 司徒正美
V
V2EX
T
Tailwind CSS Blog
有赞技术团队
有赞技术团队
aimingoo的专栏
aimingoo的专栏
Apple Machine Learning Research
Apple Machine Learning Research
IT之家
IT之家
Blog — PlanetScale
Blog — PlanetScale
A
About on SuperTechFans
月光博客
月光博客
T
The Blog of Author Tim Ferriss
宝玉的分享
宝玉的分享
Martin Fowler
Martin Fowler
博客园 - 聂微东
The GitHub Blog
The GitHub Blog
V
Visual Studio Blog
WordPress大学
WordPress大学
酷 壳 – CoolShell
酷 壳 – CoolShell
Engineering at Meta
Engineering at Meta
GbyAI
GbyAI

博客园 - 许雪里

人机Agent团队协同:从Managed Agents原理到Multica实践 AI规范编程:从SDD理念到Spec-Kit落地实践 AI编程实战:Claude Code + IDEA 的沉浸式编程方案 XXL-JOB v3.4.0 发布 | OpenClaw集成、合并调度、健壮性及体验增强 使用OpenClaw+Skill自动发布微信公众号文章 OpenClaw部署并集成QQ搭建自动化AI助理 使用Milvus搭配Ollama搭建RAG知识库 XXL-JOB v3.3.2 发布 | 优雅停机、Docker Compose、健壮性增强 XXL-CONF v2.2.0 | 分布式配置中心与注册中心 XXL-TOOL v2.4.0 发布 | 布隆过滤器、Excel流式读写、高性能BeanCopy XXL-JOB v3.3.1 发布 | 升级SpringBoot4、健壮性增强 XXL-JOB v3.3.0 | 分布式任务调度平台 XXL-TOOL v2.3.0 发布 | Java工具类库 XXL-TOOL v2.1.0 发布 | Java工具类库 XXL-JOB v3.2.0 | 分布式任务调度平台 XXL-BOOT v1.2.0 | 快速开发平台 XXL-CACHE v1.4.0 | 多级缓存框架 XXL-CRAWLER v1.5.0 | Java爬虫框架 XXL-SSO v2.0.0 发布|单点登录框架 XXL-TOOL v2.0.0 发布 | Java工具类库 使用XXL-SSO实现登录认证以及权限管控 XXL-TOOL v1.5.0 发布 | Java工具类库
开源AI Agent:OpenCode融汇OMO理念及践行
许雪里 · 2026-05-24 · via 博客园 - 许雪里

序言

岁在丙申,孟夏之际,OpenCode于GitHub之上,得星十五万有奇,为今之开源AI编程助手中,瞩目者之一。其旨,在于为众开发者,设一全然开放、无囿于某家之Agent利器。
是篇之作,将述OpenCode之核心系统架构,暨OMO(Oh My OpenAgent)之多Agent编排增补插件,并论OpenCode如何应于实务之业。

第一章:AI编程工具全景对比

今之主流AI编程工具,皆已兼CLI与桌面之能。吾辈循其官启之讯,对三款最盛者,为客观之较。

维度 Claude Code (Anthropic) OpenAI Codex OpenCode
官方定位 Anthropic官方所出之终端AI编程工具 OpenAI所出之代码生成模型/API生态 开源社区所驱之命令行AI编程智能体
多端能力 TUI + IDE插件 + 客户端 TUI + IDE插件 + 客户端 TUI + IDE插件 + 客户端 + Web界面 + Server模式
模型绑定 仅支持Anthropic Claude系列模型 仅支持OpenAI GPT系列模型 可容诸主流大模,自择配置
授权之式 闭源商业订阅 闭源计Token之费 全然开源,容用户自备API
达项目级上下文之识 按需检取载项目之文,容至1M Token上下文 预构全码库索引,容跨文件速查 主动探项目之构,容插件扩上下文之能
执行之能 直书文、行终端命、操Git 容文改命行,桌端供沙箱安制 生而能操文牍、行Shell之命、御Git之政,可藉配置以制权之细
其可延 能设自钩、简Agent,然其延有度 依API而开,其生赖他工之饰 本于插件之设,可延自工与技
其遇 对言于终,凡改必请人诺 可应CLI之令、亦可操桌之形 纯CLI所驭,合于命行之原务

其宜之境:

  • Claude Code:宜于繁复项目之研,信闭源之务,习Anthropic模型之能者,开箱即用,体验甚畅,然模型相系,致成本高昂,兼有厂商锁之患。
  • OpenAI Codex:宜于长周期自主之务、第三方代码之安,恃OpenAI模型之生态者,模型之能成熟稳定,API之生态完备,然闭源之制,犹不能应定制之需。
  • OpenCode:宜于求开源可控、自由切换模型、重灵活及扩展插件之能者,与团队,原生插件化之设计,为多智能体之编提供了至佳之底座,乃构建自定义AI开发流程之最优选。

若不能受闭源之系,或需完全可定制之AI开发助手,则OpenCode无疑为今之至善。

第二章:OpenCode系统架构

2.1 OpenCode者何?

OpenCode者,纯然开源之AI编程Agent也。非徒生代码片段以供人抄录粘贴之对话之窗,实乃能亲自动作于汝之开发环境者,可谓「任务执行者」。汝但于终端中描述所求之事,OpenCode即自主动察汝之项目结构,洞悉既有之代码,继而自动完成文件之读写、命令之执行、Git之操作等系列开发之动作,终成可直接运行之成果。

OpenCode异于同类闭源编程Agent(如Claude Code、GitHub Copilot)之要,在于三途抉择:

  • 代码开源可控:OpenCode循MIT之约,其核心理路昭然于众。凡人皆可察其行、告其弊、自改而布之。此于企业之私网尤显其要,数据无复流于外者。
  • LLM开放不绑定:OpenCode容75+ LLM之供,用户可择其宜,乃至并置众模以成动态导引。此供者无别之策,其利在于:随模之能渐同、价渐下,用户可自择而无须易其工具,大降其用之阈、长之费,亦促模之生态以多。
  • 可插拔开放分层架构‌:OpenCode采客主分居之构,通一象接,以容多端之延。模之适配层开纳可插,以易其用;延之层容自造之件,全然开源,可深定之。

2.2 核心技术架构

2.2.1 整体架构

OpenCode 采客户端/服务器之分离构:

  • 服务器层运行于本地,监听 HTTP/WebSocket 之请,提供会话管理、文件操作、LSP 进程控制等核心之能。
  • 客户端层通过 REST API 与之通信,是故 TUI 仅为可选之前端——服务器可全然脱离 UI 而独运行,乃至支持远距离连接,移动端亦可作为操控端。
┌──────────────────────────────────────────────────────────────┐
│                      Client Layer                            │
│  ┌───────────────┐   ┌──────────────┐    ┌─────────────────┐ │
│  │  TUI (SolidJS)    │  │ Web UI    │    │ Desktop (Tauri) │ │
│  └──────┬────────┘   └──────┬───────┘    └────────┬────────┘ │
└─────────┼───────────────────┼─────────────────────┼──────────┘
          │                   │                     │
          └───────────────────┴─────────────────────┘
                              │ HTTP/WebSocket
┌─────────────────────────────┼────────────────────────────────┐
│                     Server Layer                             │
│  ┌──────────────────────────────────────────────────────┐    │
│  │              OpenCode Server (Node.js/Bun)           │    │
│  │  ┌────────┐  ┌──────────┐  ┌─────────┐  ┌─────────┐  │    │
│  │  │ Agent  │  │   LSP    │  │Provider │  │ Session │  │    │
│  │  │ Engine │  │ Manager  │  │  Router │  │ Manager │  │    │
│  │  └────────┘  └──────────┘  └─────────┘  └─────────┘  │    │
│  └──────────────────────────────────────────────────────┘    │
└──────────────────────────────────────────────────────────────┘

2.2.2 核心模块

核心模块:

  • Agent Engine:Agent 核心逻辑、Prompt 管理、生成策略
  • Provider Router:LLM 供者道途、模元拣择、认证
  • LSP 管理者:LSP 佥客/佥主之治、符索索引、诊察
  • 会话管理者:众会话之治、工木隔阂
  • 主者:HTTP/WebSocket 之主道途与间介
  • 佥者
    • TUI:基于 SolidJS 之终人界面,供交互式对谈与命辞输入
    • Web 界面:基于 React 之瀛寰界面,供可视交互之体验
    • Desktop:以Tauri为基之桌面应用,供本地化体验

2.2.3 多Agent机制

OpenCode自设计之初即采多Agent分工架构,异种Agent各司其职,免单一Agent角色混糅而能降。

  • Build:具全权。主力编码执行者,司文件读写、代码修易、命行等核心编码之务。
  • Plan:唯读模式。专司需求析与架构设,唯出设计文而不直改代码,保方案设计之独立。
  • General:内调之子Agent。司复杂索与多步任务。

2.2.4 内置 LSP 支持

OpenCode 原生集成 Language Server Protocol(LSP),支持多语言代码理解、实时诊断与增量补全:

  • 通语言代码解之LSP(Language Server Protocol)供精准之符索引、引寻、义亮,不倚模型之语推能。
  • 即时诊疗:无需用户手动配置 IDE,OpenCode 启动时自动检测项目并启动对应语言之 LSP 服务器。
  • 增补文脉,贯通始末:Agent 可于修改之前,询 LSP 以得确之作用域,免以 token 数量"度"代码之构。

所载LSP服务器,遍及众流之语,其详则系乎项目内是否具此语言服务器之配置文。

2.2.5 可延插件之制

OpenCode之实能,源于其可延之器,其核器已周全开发之需:

  • 内置核器:文之读写索、终之命之行、Git之版本管、Playwright之浏览器自、联之索最新文。
  • 插件延制:持以MCP服务器延自造之能,开发者可依己之业需,造专属之器。
  • 权限隔:异器可配置异之执行权,避危之操。

2.2.6 权限安之模

OpenCode 设细权制,护开发之境安。

  • 凡权限,皆依项目之配置而立。异项目者,可设殊异之安规。
  • 经由opencode.json配置之文,可精制令之可施与不可施之域。
  • 開發之境可開放更多權限以提效,生產之境可嚴限權限以避禍

第三章:OMO(Oh My OpenAgent)之深析

三一,OMO为何物?

OMO(Oh My OpenAgent)者,多智能体编排之增强插件也,号曰“最强 Agent Harness”,主“Batteries-included”之理念。其以模块化之工作流,析繁任务而分派诸智能体并行处理,遂能深解多仓库之结构、繁构建之流程、巨项目之上下文,而高效操之。

其核心之长,有:

  • 多智能体协同:众智能体相协,各司其职,析繁任务而分派之,以增效率、益质量。内置多智能体,若 Build、Plan、General 等,十有馀专业智能体,遍及开发之全流程。
  • 内置二十余自动化钩子:集常用自动化之务,若代码生成、测试、编译、部署等,涵开发全流程;
  • MCP(Model Context Protocol)集成:模型上下文之协议,供模型与工具间数据交互共享,成模型与工具间联动协同;
  • 完整LSP支持:语言模型与LSP服务器之集成,供精确符号索引、引用查找及语义高亮,不倚模型对语言推理之力;
  • 高度可配置:通过配置之文,可精确控允许执行与禁止执行之命范围,成开发环境安全控制;

OMO旨在解以下问题:

  • 角色模糊::同一AI既为架构设计,又为代码编写,复为测试,难于各环节皆达专业之境,往往每环节皆不精。
  • 规范缺失:AI生成代码,往往不循团队工程之规,TDD开发流程、Git分支管理之规范,易为AI所忽,终致代码难于维护。
  • 效率瓶颈:单模型单线程执行,复杂任务只能串行处理,无法通过并行分工以缩交付之期。

OMO,即为解此等问题而生,乃OpenCode生态中最成熟之多Agent编排增强插件,将单一AI编码执行者,升为由多专业角色组成之虚拟开发团队,通过专业化分工并行开发,以提升交付之质与开发之效。

3.2 OMO分层设计

OMO之架构,分为三层,自规划至执行,形成完整闭环:

  1. Sisyphus编排系统

    • OMO之核心编排引擎,司整个开发流程之主调。
    • 自需求输入始,毕规划拆解、任务分发、并行执行、结果校验之全流程调度
    • 擅自动作,自若不群。Ultrawork模式,唯需一令,即可触发全流程自动开发。
  2. 十加专业化角色代理
    OMO内置十数专业角色Agent,每角色专司一务,其能愈精专。

    • Oracle(架构师):司繁难技术之决断与方案之设
    • 图书管事(Librarian):检寻案牍之文与外技之籍,供上下文之鉴
    • 代码搜索员(Explorer):速巡码库,定其功能之定义与调用之脉络
    • 前端工程师(Frontend):专司前页之制与交互之设
    • 后端工程师(Backend):专司后端之接口与业务之理
    • 代码审查员(Momus):自动检其码之规与安之漏
    • 初级开发者(Sisyphus-Junior):司基础码之生与简之改
  3. 动态多模型路由:依任务之型,自配最宜之模

    • 支持开发者自定路由之规,以适不同团队之模本成本与能力所好
    • 支持多钥负载均衡,以避单钥触发速率之限

3.3 超级工作模式

超级工作模式触发最大精度:自动规划、深度研究、并行 Agent、自我纠正循环。系统直至完成方止,无需监守

在 OMO 安装后,于终端击 Ultrawork(或 ulw)即可触发,诸代理同时启动,自动分析项目、规划任务、分派执行,直至完成方休

ulw:击三字母,即可离去

此非仅一令,实乃一套完整之工作流:

  • 普罗米修斯:先访察汝,明真实之需与范围
  • 西西弗斯:剖析任务,定优先之序
  • 赫淮斯托斯:与众专业之使并行而为之
  • 拉尔夫循环(自反之环):持续检视成之程度,直至百之百

3.4 OMO核心之使

OMO内蕴众专业化之使,各司其职,成完整之责链:

使名 定位 系统权限 核心之能与责 适用之境
西西弗斯 全才总帅 全权 — 诸文件读写得之,调度众智能体 通晓人意、剖解事理,协调唤诸智体,可自为常日编码之务 诸务之枢,自能调遣诸 Agent。
普罗米修斯(Prometheus) 谋略之师 唯阅 — 制策/谋略,勿更码/不可遣智体 唯梳理需求,不著代码,以言谈明界,而后出详尽之工计。 繁难之事之谋策制定
阿特拉斯(Atlas) 待办之事理之 分任以事、调遣子智、察其进、汇其果,无统御之权、不可更其本策 承继 Prometheus 之务,依序推进诸事,踪迹其程,分派子务,不直躬于编码。 踪迹多程之务,察其进退
赫菲斯托斯(Hephaestus) 深自主工作者 全权(专意编码)— 代码读写、依存安装、测试施行、可唤辅智体,不可委核智体 精研高质核心逻辑之编码,应高复杂度之深度开发任,承 Sisyphus 之托。 久时、高力之独编之务

要职脉络总述:

  • 西西弗斯:全能总指挥,规划、执行、编排全栈,日常首选。
  • 普罗米修斯:纯规划专家,只读、访谈式输出正式计划,适于大型模糊需求。
  • 阿特拉斯:计划执行枢纽,按单调度、并行落地,承接普罗米修斯计划高效执行。
  • 赫淮斯托斯:深度编码能手,自主攻坚、端到端实现,复杂代码场景最优。

第四章:工具安装

4.1 OpenCode 安装

OpenCode 提供多种产品形态,包括:CLI、Web、客户端、IDE插件等,用户可据己之习惯择安装。

  • CLI方式安装

官方所供终端一键安装之脚本,适于Mac、Linux、Windows诸系统。Mac用户可循brew之法安装:

brew install anomalyco/tap/opencode

image

  • 客户端安装

OpenCode 官方复供桌面客户端,可径直下载安装:OpenCode下载地址

image

4.2 LLM模型配置

OpenCode默认内集众Free模型,如deepseek-v4、minimax等,开箱即用;凡日常轻量之用,足矣,若无重度使用之境,可略模型配置。

针对重度使用之境,当别集三方上乘模型(如DeepSeek、GLM等),续行如下配置:

4.2.1 模型API Key之取法

OpenCode 支持众多种类之第三方模型API,用户可依己需择取相应模型,并获取其API Key。

以DeepSeek为例,可注册登录DeepSeek官网,取DeepSeek模型之API Key,下文将用之。

4.2.2 CC-Switch之安装

CC-Switch乃一款开源之桌面应用,具图形化界面,用以管理并切换众多种类API Provider之配置,支持OpenCode、Claude Code、Codex等主流AI编程工具。

宜于Mac之境,荐以Homebrew法施之。既立,可凭图示之界,添置并理顺Coding Plan之配置(如API Key等)。详者,可参之。CC Switch 文档

# 添加 tap
brew tap farion1231/ccswitch

# 安装
brew install --cask cc-switch
# 更新
brew upgrade --cask cc-switch

四二三开码模型API配置

启 CC-Switch,转 OpenCode 配置之界,存 API Key。重启 OpenCode 配置,乃得生效。
参酌CC-Switch操作文牍

4.3 OMO 安装

可循下列命辞以安 OMO(Oh My OpenAgent)之插件:

bunx oh-my-openagent install

倘示command not found: bunx,须先以次命辞以安bun

Bun者,今之 JavaScript 运行时也,OpenCode Server 依之以供更效之能、更速之启)。
Bun 官网:https://bun.sh/

curl -fsSL https://bun.sh/install | bash

第五章:实战演练

Step 1:ULW 模式启任务

启 OpenCode 并择Ultrawork范式,输入境遇之需:

/ulw-loop 设计一个 企业网站,体现科技感,动态网页效果。网站内容维护在 markdown里,动态加载更新

注:ulw 模式将启 OMO 全程自开,Sisyphus 依输入之需,自规任务,分派诸 Agent 并行施为,直至成事。

第二步:普罗米修斯规划技术方案

OpenCode 接纳事功之入,自能发应。Prometheus智能代理辨析规画,并呈详技之策,如左图所示。SPEC.md所示内容:

image

第三步:赫淮斯托斯与阿特拉斯共营之

依循Prometheus之规画也。Sisyphus可委以事HephaestusAtlas二智能體並行施事:

  • Atlas:司任務追蹤與進度管理,使諸子任務依計畫竟功。
  • Hephaestus:司核心功能之深研,若前鋒頁面設計、後端接口實施等。

image

第四步:啟運

任務既畢,可令OpenCode直運項目。OpenCode自會啟動開發服務器,參照下圖。

image

第五步:效驗

訪OpenCode啟動之服務器端口地址,效驗如次:

  • 功能完備度:體驗以來,OpenCode依SPEC.md百還功能需求,六頁悉數實現,且施粒子之效,合乎預期。
  • 动态数据:OpenCode 乃能动态载数据,以 Markdown 维护网站之实,页面动态询载,合乎预期。
  • 项目规范:OpenCode 选用主流技术栈,项目结构规范明晰,代码质量粗观较合标准,亦合乎预期。

image

image