开源AI Agent：OpenCode融汇OMO理念及践行

博客园 - 许雪里

人机Agent团队协同：从Managed Agents原理到Multica实践 AI规范编程：从SDD理念到Spec-Kit落地实践 AI编程实战：Claude Code + IDEA 的沉浸式编程方案 XXL-JOB v3.4.0 发布 | OpenClaw集成、合并调度、健壮性及体验增强使用OpenClaw+Skill自动发布微信公众号文章 OpenClaw部署并集成QQ搭建自动化AI助理使用Milvus搭配Ollama搭建RAG知识库 XXL-JOB v3.3.2 发布 | 优雅停机、Docker Compose、健壮性增强 XXL-CONF v2.2.0 | 分布式配置中心与注册中心 XXL-TOOL v2.4.0 发布 | 布隆过滤器、Excel流式读写、高性能BeanCopy XXL-JOB v3.3.1 发布 | 升级SpringBoot4、健壮性增强 XXL-JOB v3.3.0 | 分布式任务调度平台 XXL-TOOL v2.3.0 发布 | Java工具类库 XXL-TOOL v2.1.0 发布 | Java工具类库 XXL-JOB v3.2.0 | 分布式任务调度平台 XXL-BOOT v1.2.0 ｜快速开发平台 XXL-CACHE v1.4.0 ｜多级缓存框架 XXL-CRAWLER v1.5.0 ｜ Java爬虫框架 XXL-SSO v2.0.0 发布｜单点登录框架 XXL-TOOL v2.0.0 发布 | Java工具类库使用XXL-SSO实现登录认证以及权限管控 XXL-TOOL v1.5.0 发布 | Java工具类库

许雪里 · 2026-05-24 · via 博客园 - 许雪里

序言

岁在丙申，孟夏之际，OpenCode于GitHub之上，得星十五万有奇，为今之开源AI编程助手中，瞩目者之一。其旨，在于为众开发者，设一全然开放、无囿于某家之Agent利器。
是篇之作，将述OpenCode之核心系统架构，暨OMO（Oh My OpenAgent）之多Agent编排增补插件，并论OpenCode如何应于实务之业。

第一章：AI编程工具全景对比

今之主流AI编程工具，皆已兼CLI与桌面之能。吾辈循其官启之讯，对三款最盛者，为客观之较。

维度	Claude Code (Anthropic)	OpenAI Codex	OpenCode
官方定位	Anthropic官方所出之终端AI编程工具	OpenAI所出之代码生成模型/API生态	开源社区所驱之命令行AI编程智能体
多端能力	TUI + IDE插件 + 客户端	TUI + IDE插件 + 客户端	TUI + IDE插件 + 客户端 + Web界面 + Server模式
模型绑定	仅支持Anthropic Claude系列模型	仅支持OpenAI GPT系列模型	可容诸主流大模，自择配置
授权之式	闭源商业订阅	闭源计Token之费	全然开源，容用户自备API
达项目级上下文之识	按需检取载项目之文，容至1M Token上下文	预构全码库索引，容跨文件速查	主动探项目之构，容插件扩上下文之能
执行之能	直书文、行终端命、操Git	容文改命行，桌端供沙箱安制	生而能操文牍、行Shell之命、御Git之政，可藉配置以制权之细
其可延	能设自钩、简Agent，然其延有度	依API而开，其生赖他工之饰	本于插件之设，可延自工与技
其遇	对言于终，凡改必请人诺	可应CLI之令、亦可操桌之形	纯CLI所驭，合于命行之原务

其宜之境：

Claude Code：宜于繁复项目之研，信闭源之务，习Anthropic模型之能者，开箱即用，体验甚畅，然模型相系，致成本高昂，兼有厂商锁之患。
OpenAI Codex：宜于长周期自主之务、第三方代码之安，恃OpenAI模型之生态者，模型之能成熟稳定，API之生态完备，然闭源之制，犹不能应定制之需。
OpenCode：宜于求开源可控、自由切换模型、重灵活及扩展插件之能者，与团队，原生插件化之设计，为多智能体之编提供了至佳之底座，乃构建自定义AI开发流程之最优选。

若不能受闭源之系，或需完全可定制之AI开发助手，则OpenCode无疑为今之至善。

第二章：OpenCode系统架构

2.1 OpenCode者何？

OpenCode者，纯然开源之AI编程Agent也。非徒生代码片段以供人抄录粘贴之对话之窗，实乃能亲自动作于汝之开发环境者，可谓「任务执行者」。汝但于终端中描述所求之事，OpenCode即自主动察汝之项目结构，洞悉既有之代码，继而自动完成文件之读写、命令之执行、Git之操作等系列开发之动作，终成可直接运行之成果。

OpenCode 官网：OpenCode Official Websitehttps://opencode.ai
OpenCode GitHub：https://github.com/anomalyco/opencode

OpenCode异于同类闭源编程Agent（如Claude Code、GitHub Copilot）之要，在于三途抉择：

代码开源可控：OpenCode循MIT之约，其核心理路昭然于众。凡人皆可察其行、告其弊、自改而布之。此于企业之私网尤显其要，数据无复流于外者。
LLM开放不绑定：OpenCode容75+ LLM之供，用户可择其宜，乃至并置众模以成动态导引。此供者无别之策，其利在于：随模之能渐同、价渐下，用户可自择而无须易其工具，大降其用之阈、长之费，亦促模之生态以多。
可插拔开放分层架构‌：OpenCode采客主分居之构，通一象接，以容多端之延。模之适配层开纳可插，以易其用；延之层容自造之件，全然开源，可深定之。

2.2 核心技术架构

2.2.1 整体架构

OpenCode 采客户端/服务器之分离构：

服务器层运行于本地，监听 HTTP/WebSocket 之请，提供会话管理、文件操作、LSP 进程控制等核心之能。
客户端层通过 REST API 与之通信，是故 TUI 仅为可选之前端——服务器可全然脱离 UI 而独运行，乃至支持远距离连接，移动端亦可作为操控端。

┌──────────────────────────────────────────────────────────────┐
│                      Client Layer                            │
│  ┌───────────────┐   ┌──────────────┐    ┌─────────────────┐ │
│  │  TUI (SolidJS)    │  │ Web UI    │    │ Desktop (Tauri) │ │
│  └──────┬────────┘   └──────┬───────┘    └────────┬────────┘ │
└─────────┼───────────────────┼─────────────────────┼──────────┘
          │                   │                     │
          └───────────────────┴─────────────────────┘
                              │ HTTP/WebSocket
┌─────────────────────────────┼────────────────────────────────┐
│                     Server Layer                             │
│  ┌──────────────────────────────────────────────────────┐    │
│  │              OpenCode Server (Node.js/Bun)           │    │
│  │  ┌────────┐  ┌──────────┐  ┌─────────┐  ┌─────────┐  │    │
│  │  │ Agent  │  │   LSP    │  │Provider │  │ Session │  │    │
│  │  │ Engine │  │ Manager  │  │  Router │  │ Manager │  │    │
│  │  └────────┘  └──────────┘  └─────────┘  └─────────┘  │    │
│  └──────────────────────────────────────────────────────┘    │
└──────────────────────────────────────────────────────────────┘

2.2.2 核心模块

核心模块：

Agent Engine：Agent 核心逻辑、Prompt 管理、生成策略
Provider Router：LLM 供者道途、模元拣择、认证
LSP 管理者：LSP 佥客/佥主之治、符索索引、诊察
会话管理者：众会话之治、工木隔阂
主者：HTTP/WebSocket 之主道途与间介
佥者：
- TUI：基于 SolidJS 之终人界面，供交互式对谈与命辞输入
- Web 界面：基于 React 之瀛寰界面，供可视交互之体验
- Desktop：以Tauri为基之桌面应用，供本地化体验

2.2.3 多Agent机制

OpenCode自设计之初即采多Agent分工架构，异种Agent各司其职，免单一Agent角色混糅而能降。

Build：具全权。主力编码执行者，司文件读写、代码修易、命行等核心编码之务。
Plan：唯读模式。专司需求析与架构设，唯出设计文而不直改代码，保方案设计之独立。
General：内调之子Agent。司复杂索与多步任务。

2.2.4 内置 LSP 支持

OpenCode 原生集成 Language Server Protocol（LSP），支持多语言代码理解、实时诊断与增量补全：

通语言代码解之LSP（Language Server Protocol）供精准之符索引、引寻、义亮，不倚模型之语推能。
即时诊疗：无需用户手动配置 IDE，OpenCode 启动时自动检测项目并启动对应语言之 LSP 服务器。
增补文脉，贯通始末：Agent 可于修改之前，询 LSP 以得确之作用域，免以 token 数量"度"代码之构。

所载LSP服务器，遍及众流之语，其详则系乎项目内是否具此语言服务器之配置文。

2.2.5 可延插件之制

OpenCode之实能，源于其可延之器，其核器已周全开发之需：

内置核器：文之读写索、终之命之行、Git之版本管、Playwright之浏览器自、联之索最新文。
插件延制：持以MCP服务器延自造之能，开发者可依己之业需，造专属之器。
权限隔：异器可配置异之执行权，避危之操。

2.2.6 权限安之模

OpenCode 设细权制，护开发之境安。

凡权限，皆依项目之配置而立。异项目者，可设殊异之安规。
经由opencode.json配置之文，可精制令之可施与不可施之域。
開發之境可開放更多權限以提效，生產之境可嚴限權限以避禍

第三章：OMO（Oh My OpenAgent）之深析

三一，OMO为何物？

OMO（Oh My OpenAgent）者，多智能体编排之增强插件也，号曰“最强 Agent Harness”，主“Batteries-included”之理念。其以模块化之工作流，析繁任务而分派诸智能体并行处理，遂能深解多仓库之结构、繁构建之流程、巨项目之上下文，而高效操之。

OMO 官网：https://ohmyopenagent.com/zh
OMO Github：https://github.com/code-yeongyu/oh-my-openagent

其核心之长，有：

多智能体协同：众智能体相协，各司其职，析繁任务而分派之，以增效率、益质量。内置多智能体，若 Build、Plan、General 等，十有馀专业智能体，遍及开发之全流程。
内置二十余自动化钩子：集常用自动化之务，若代码生成、测试、编译、部署等，涵开发全流程；
MCP（Model Context Protocol）集成：模型上下文之协议，供模型与工具间数据交互共享，成模型与工具间联动协同；
完整LSP支持：语言模型与LSP服务器之集成，供精确符号索引、引用查找及语义高亮，不倚模型对语言推理之力；
高度可配置：通过配置之文，可精确控允许执行与禁止执行之命范围，成开发环境安全控制；

OMO旨在解以下问题：

角色模糊：：同一AI既为架构设计，又为代码编写，复为测试，难于各环节皆达专业之境，往往每环节皆不精。
规范缺失：AI生成代码，往往不循团队工程之规，TDD开发流程、Git分支管理之规范，易为AI所忽，终致代码难于维护。
效率瓶颈：单模型单线程执行，复杂任务只能串行处理，无法通过并行分工以缩交付之期。

OMO，即为解此等问题而生，乃OpenCode生态中最成熟之多Agent编排增强插件，将单一AI编码执行者，升为由多专业角色组成之虚拟开发团队，通过专业化分工并行开发，以提升交付之质与开发之效。

3.2 OMO分层设计

OMO之架构，分为三层，自规划至执行，形成完整闭环：

Sisyphus编排系统
- OMO之核心编排引擎，司整个开发流程之主调。
- 自需求输入始，毕规划拆解、任务分发、并行执行、结果校验之全流程调度
- 擅自动作，自若不群。Ultrawork模式，唯需一令，即可触发全流程自动开发。
十加专业化角色代理
OMO内置十数专业角色Agent，每角色专司一务，其能愈精专。
- Oracle（架构师）：司繁难技术之决断与方案之设
- 图书管事（Librarian）：检寻案牍之文与外技之籍，供上下文之鉴
- 代码搜索员（Explorer）：速巡码库，定其功能之定义与调用之脉络；
- 前端工程师（Frontend）：专司前页之制与交互之设；
- 后端工程师（Backend）：专司后端之接口与业务之理；
- 代码审查员（Momus）：自动检其码之规与安之漏；
- 初级开发者（Sisyphus-Junior）：司基础码之生与简之改；
动态多模型路由：依任务之型，自配最宜之模
- 。
- 支持开发者自定路由之规，以适不同团队之模本成本与能力所好
- 支持多钥负载均衡，以避单钥触发速率之限

3.3 超级工作模式

超级工作模式触发最大精度：自动规划、深度研究、并行 Agent、自我纠正循环。系统直至完成方止，无需监守

在 OMO 安装后，于终端击 Ultrawork（或 ulw）即可触发，诸代理同时启动，自动分析项目、规划任务、分派执行，直至完成方休

ulw：击三字母，即可离去

此非仅一令，实乃一套完整之工作流：

普罗米修斯：先访察汝，明真实之需与范围
西西弗斯：剖析任务，定优先之序
赫淮斯托斯：与众专业之使并行而为之
拉尔夫循环（自反之环）：持续检视成之程度，直至百之百

3.4 OMO核心之使

OMO内蕴众专业化之使，各司其职，成完整之责链：

使名	定位	系统权限	核心之能与责	适用之境
西西弗斯	全才总帅	全权 — 诸文件读写得之，调度众智能体	通晓人意、剖解事理，协调唤诸智体，可自为常日编码之务	诸务之枢，自能调遣诸 Agent。
普罗米修斯（Prometheus）	谋略之师	唯阅 — 制策/谋略，勿更码/不可遣智体	唯梳理需求，不著代码，以言谈明界，而后出详尽之工计。	繁难之事之谋策制定
阿特拉斯（Atlas）	待办之事理之	分任以事、调遣子智、察其进、汇其果，无统御之权、不可更其本策	承继 Prometheus 之务，依序推进诸事，踪迹其程，分派子务，不直躬于编码。	踪迹多程之务，察其进退
赫菲斯托斯（Hephaestus）	深自主工作者	全权（专意编码）— 代码读写、依存安装、测试施行、可唤辅智体，不可委核智体	精研高质核心逻辑之编码，应高复杂度之深度开发任，承 Sisyphus 之托。	久时、高力之独编之务

要职脉络总述：

西西弗斯：全能总指挥，规划、执行、编排全栈，日常首选。
普罗米修斯：纯规划专家，只读、访谈式输出正式计划，适于大型模糊需求。
阿特拉斯：计划执行枢纽，按单调度、并行落地，承接普罗米修斯计划高效执行。
赫淮斯托斯：深度编码能手，自主攻坚、端到端实现，复杂代码场景最优。

第四章：工具安装

4.1 OpenCode 安装

OpenCode 提供多种产品形态，包括：CLI、Web、客户端、IDE插件等，用户可据己之习惯择安装。

CLI方式安装：

官方所供终端一键安装之脚本，适于Mac、Linux、Windows诸系统。Mac用户可循brew之法安装：

brew install anomalyco/tap/opencode

客户端安装：

OpenCode 官方复供桌面客户端，可径直下载安装：OpenCode下载地址

4.2 LLM模型配置

OpenCode默认内集众Free模型，如deepseek-v4、minimax等，开箱即用；凡日常轻量之用，足矣，若无重度使用之境，可略模型配置。

针对重度使用之境，当别集三方上乘模型（如DeepSeek、GLM等），续行如下配置：

4.2.1 模型API Key之取法

OpenCode 支持众多种类之第三方模型API，用户可依己需择取相应模型，并获取其API Key。

以DeepSeek为例，可注册登录DeepSeek官网，取DeepSeek模型之API Key，下文将用之。

4.2.2 CC-Switch之安装

CC-Switch乃一款开源之桌面应用，具图形化界面，用以管理并切换众多种类API Provider之配置，支持OpenCode、Claude Code、Codex等主流AI编程工具。

CC-Switch官网：https://ccswitch.io/zh/
CC-Switch Github：https://github.com/farion1231/cc-switch/

宜于Mac之境，荐以Homebrew法施之。既立，可凭图示之界，添置并理顺Coding Plan之配置（如API Key等）。详者，可参之。CC Switch 文档

# 添加 tap
brew tap farion1231/ccswitch

# 安装
brew install --cask cc-switch
# 更新
brew upgrade --cask cc-switch

四二三开码模型API配置

启 CC-Switch，转 OpenCode 配置之界，存 API Key。重启 OpenCode 配置，乃得生效。
参酌CC-Switch操作文牍

4.3 OMO 安装

可循下列命辞以安 OMO（Oh My OpenAgent）之插件：

bunx oh-my-openagent install

倘示command not found: bunx，须先以次命辞以安bun。

Bun者，今之 JavaScript 运行时也，OpenCode Server 依之以供更效之能、更速之启）。
Bun 官网：https://bun.sh/

curl -fsSL https://bun.sh/install | bash

第五章：实战演练

Step 1：ULW 模式启任务

启 OpenCode 并择Ultrawork范式，输入境遇之需：

/ulw-loop 设计一个 企业网站，体现科技感，动态网页效果。网站内容维护在 markdown里，动态加载更新

注：ulw 模式将启 OMO 全程自开，Sisyphus 依输入之需，自规任务，分派诸 Agent 并行施为，直至成事。

第二步：普罗米修斯规划技术方案

OpenCode 接纳事功之入，自能发应。Prometheus智能代理辨析规画，并呈详技之策，如左图所示。SPEC.md所示内容：

第三步：赫淮斯托斯与阿特拉斯共营之

依循Prometheus之规画也。Sisyphus可委以事Hephaestus與Atlas二智能體並行施事：

Atlas：司任務追蹤與進度管理，使諸子任務依計畫竟功。
Hephaestus：司核心功能之深研，若前鋒頁面設計、後端接口實施等。

第四步：啟運

任務既畢，可令OpenCode直運項目。OpenCode自會啟動開發服務器，參照下圖。

第五步：效驗

訪OpenCode啟動之服務器端口地址，效驗如次：

功能完備度：體驗以來，OpenCode依SPEC.md百還功能需求，六頁悉數實現，且施粒子之效，合乎預期。
动态数据：OpenCode 乃能动态载数据，以 Markdown 维护网站之实，页面动态询载，合乎预期。
项目规范：OpenCode 选用主流技术栈，项目结构规范明晰，代码质量粗观较合标准，亦合乎预期。

此內容由慣性聚合(RSS閱讀器)自動聚合整理，僅供閱讀參考。原文來自 — 版權歸原作者所有。

推薦訂閱源

博客园 - 许雪里

序言

第一章：AI编程工具全景对比

第二章：OpenCode系统架构

2.1 OpenCode者何？

2.2 核心技术架构

2.2.1 整体架构

2.2.2 核心模块

2.2.3 多Agent机制

2.2.4 内置 LSP 支持

2.2.5 可延插件之制

2.2.6 权限安之模

第三章：OMO（Oh My OpenAgent）之深析

三一，OMO为何物？

3.2 OMO分层设计

3.3 超级工作模式

3.4 OMO核心之使

第四章：工具安装

4.1 OpenCode 安装

4.2 LLM模型配置

4.2.1 模型API Key之取法

4.2.2 CC-Switch之安装

四二三开码模型API配置

4.3 OMO 安装

第五章：实战演练

Step 1：ULW 模式启任务

第二步：普罗米修斯规划技术方案

第三步：赫淮斯托斯与阿特拉斯共营之

第四步：啟運

第五步：效驗