诸般 OpenCode Go 之指南,多始于模型。吾欲自其谬误之所在始:限额非以请求数计,乃以金数计也。
此言似为细末之别,实则非也。
所众人所忽者
OpenCode Go 初月费五金,继之则每月十金。其用度之限,每五时辰十二金,每周三十金,每月六十金。
于五时之内,以十二金购DeepSeek V4之速闪,可得约三万一千六百五十请。若以同金购GLM-5.1,则得约八百八十。预算无殊,而量之差,乃三十有六倍也。
此乃路由之要义也。若择一模型而通用于万事,则或耗贵求于不须之务,或屈廉价之能于未尽其用。至当之策,乃依每务之实需,分派模型焉。
MiniMax M2.5,月限十万请求数,不拘成本。仅启约十亿参数,输入令牌计价较Claude Opus 4.6低十六倍有奇。高量低繁者,此乃明选,然世人多未知其存焉。
单用高端模态所失者
言若尽纳于DeepSeek V4 Pro:五时之内,凡千二百求。此于轻用,似无不可。然吾OpenAgent,能并行多使。Prometheus析汝之务,Metis合其境,Atlas司其序,Sisyphus行其事,而Librarian阅其文。一务之繁,可衍三十至五十求,而汝未尝有所为。汝五时之度,顷刻间消于数时之勤。
非质之差为患也。V4 Pro 八十有六,与Claude Opus 4.7 八十七有半,相去七分之差,于寻常之务,此隙几不可见。患非在质之精,乃在多能之程,非每步皆需此精也。
等级细目,具数列之
今列诸模于码务之要,其分于标,并API之价,以明选道之算:
| 模式 | SWE-Bench验证 | 输入价格(每M tokens) | 5小时请求量($12) | 上下文 |
|---|---|---|---|---|
| Claude Opus 4.7 | 87.6% | $5.00 | ~480 | 20万tokens |
| DeepSeek V4 Pro | 80.6% | $0.435(促销,截止5月31日) | 至五千, | 百万元符号, |
| Kimi K2.6, | 八十有二, | $0.95, | 至二千五百, | 二十五万六千符号, |
| Claude Sonnet 4.6, | 七十九有六, | $3.00, | 至八百, | 二十万符号, |
| MiMo-V2.5-Pro, | 七十八有九, | 至$0.40。 | 至 | — |
| Qwen3.6 Plus | 七十八有八分之百 | $0.325 | 至 | 一百万令牌 |
| DeepSeek V4 Flash | 七十九有十分之百 | $0.14 | 至 | 一万七千 |
| 一百万令牌 | GLM-5.1 | SWE-Bench 五十八有四分之百__JHSNS_SEG_6117360a_55__至~$1.50 | 至一千六百 | 二十万令牌 |
| Qwen3.5 Plus | — | $0.08 | 至三万 | — |
| MiniMax M2.5 | — | $0.03 | 高达十万每月 | — |
(每五小时窗口内请求量约计每请求二千五百令牌。)
谨记: Kimi K2.6 原版于二零二六年五月廿五日停更。此型号犹存,然系列不再更迭。DeepSeek V4 Pro 之促销价(每兆分之四百三十五元)止于五月卅一日——其后价增,遂改请求每窗之算。
奥普斯四点七之成,实为今时编撰之最强模型,较之V4专业者高七分。然每符计价五元,较之德普寻V4闪存者,每符昂三十五倍。于十二元五时之限,可得奥普斯四点七请求数约四百八十,而德普寻闪存者可得一万七千。
深寻V4闪存之效能,较V4专业版仅逊一筹,然每单位代币之成本则低约三倍。凡寻常编程之事,此差距于实践中不显。V4闪存总参数二百八十四亿,激活参数十三亿;V4专业版总参数一千六百亿,激活参数四十九亿。
Kimi K2.6乃百亿参数之MoE模型,其活跃参数三十亿,八十有二成SWE-Bench验证。此量超Qwen3.6 Plus,近V4 Pro,故为真确多步推演之良选,当V4 Flash困顿时可用之。
GLM-5.1总参数七十四亿,活跃四十亿。其二百千字符之境,宜于深谋远虑之务,于中庸之价,善司Oracle与Prometheus之职。
吾之OpenAgent构造如何
吾之OpenAgent v4.2.3(截至2026年5月,获48K+GitHub星标)采用三层架构:
规划层处理战略分解与知识融汇。二位智能体:普罗米修斯(分解应行之事)与美提斯(融汇情境与既有知识)。
编排层 者乃泰坦也。持待办之录,序事之次,察成之迹。自不亲为。惟司其序,何事何序,悉在其掌。
执行之层 乃事之所为。西西弗斯为司事之主,有卅二仟之思虑之资。九人或以上之专司者,各掌其事之别。
之v4.0.0,增设隊列之制,啟用七鈎之額外者,合計六十一,較標準之制五十四為多。若君之行並行之功,則隊列之制,其值在啟用之。此制,初為禁用。
路由之配置
此乃社會所推薦之代理至模型之指派。此非由理論推演,乃經多番試錯而得:
| 代理 | 主要模型 | 备用 |
|---|---|---|
| 西西弗斯 | 木梨K2.6 | 深求V4专业版,次Qwen3.6加版 |
| 赫淮斯托斯 | 深求V4专业版 | 深求V4闪存版,次木梨K2.6 |
| 奥瑞克洛斯 | GLM-5.1 | 木梨K2.6,次深求V4专业版 |
| 图书管理员 | 深求V4闪存版 | Qwen3.5 Plus |
| 探求 | DeepSeek V4 Flash | 无 |
| Prometheus | GLM-5.1 | Qwen3.6 Plus,复DeepSeek V4 Pro |
| Metis | Qwen3.6 Plus | DeepSeek V4 Pro |
| Atlas | DeepSeek V4 Pro | DeepSeek V4 Flash |
| 代码审查者 | Kimi K2.6 | DeepSeek V4 Pro |
| 多模态观察者 | MiMo-V2.5-Pro | Qwen3.6 Plus |
西西弗斯得Kimi K2.6,以其能行思至32K tokens。汝欲最强之推理模型,纵量微亦可。Kimi之256K上下文窗,可容长执行之迹。
閣老與探險者得V4之閃。此二使閱文檔,採取境脈,行查索之事。無需邊境之思辨。浪費V4 Pro於閣老,乃吾所見最常之預算錯誤也。
歷代聖賢,皆得龍馬精神。規劃深思,乃龍馬精神之所在。非最廉,亦非最貴,然於此類開放式分解之任務,其表現甚佳。
赫淮斯托斯(主司编码者)以V4 Pro为主,V4 Flash为备。其间差距甚微,故于简易编码之事,退而用Flash,无可见之损。
于Multimodal-Looker之上用MiMo-V2.5-Pro,乃有意为之。其于SWE-Bench验证中得78.9分,专为代理工作流而设。
路由决策之则
凡百请超百者,当首由V4 Flash通之。倘V4 Flash滞涩,则告于Kimi K2.6或V4 Pro。
此法可行,盖V4 Flash以79.0%之SWE-Bench验证率,已能正解大半世务编程之务。与V4 Pro仅差一筹,此实然,然鲜现于寻常之务,惟遇艰险之题,方显其隙。届时,退回之链可应之。
勿遽升。令模失败,乃升之。遽升者,若焚窗于一时。
十元月费所购之实
月费六十为限,其算如下:
- 每日五时,五日计之,得二十五时。
- 每五时之窗:预算十二元
- 道达无碍,寻常OpenAgent会话,于中工之能,或需四百至六百之请,其重者乃V4 Flash与Qwen3.5 Plus也
然则:月行八至十二次大码之会,未觉其极。独用者,十元一月已足。OpenCode于二六年五月获十五万GitHub之星,亦因算术合宜故也。
诚然较之,若以同等质效相较,Claude API 之价,当计月费百五十至三百金。此即十至二十倍之价减之誉所本,而吾之验之,信然。
诚直之权衡
此栈与Claude Opus 4.7于现实之虫补间,相去约七分之差。此实情也。或有券需屡次迭代,而Claude一次即得之。计其费。
七点之差乃诸务之平均。若事目明晰、验收标准昭然,此差自收窄。此路由配置特为升迁至Kimi K2.6或V4 Pro而设,盖因任务中此差最显之处也。
此栈之困,在于要求之晦,文件之多而依存之隐,及于事之需解系统之隐行。于此,上品之器得偿其值。其道之配置,以置Kimi K2.6于最难之事,然Kimi之境窗仅256K,而Qwen3.6 Plus为1M,故极长之境务,或需别配。
真实之配置
二文件制诸事:opencode.json 在尔项目之根,及 .omc/config.json 为 Oh My OpenAgent 之路由。
opencode.json
{
"$schema": "https://opencode.ai/config.schema.json",
"theme": "opencode",
"autoshare": false,
"model": "deepseek-v4-flash",
"providers": {
"opencode": {
"models": [
"deepseek-v4-pro",
"deepseek-v4-flash",
"kimi-k2.6",
"glm-5.1",
"qwen3.6-plus",
"qwen3.5-plus",
"mimo-v2.5-pro",
"minimax-m2.5"
]
}
}
}
"model" 之域定尔之默认。V4 Flash 为宜,因其应众务于最低之费。
.omc/config.json
{
"version": "4.2.3",
"teamMode": false,
"agents": {
"sisyphus": {
"model": "kimi-k2.6",
"fallback": ["deepseek-v4-pro", "qwen3.6-plus"],
"thinkingBudget": 32000
},
"hephaestus": {
"model": "deepseek-v4-pro",
"fallback": ["deepseek-v4-flash", "kimi-k2.6"]
},
"oracle": {
"model": "glm-5.1",
"fallback": ["kimi-k2.6", "deepseek-v4-pro"]
},
"prometheus": {
"model": "glm-5.1",
"fallback": ["qwen3.6-plus", "deepseek-v4-pro"]
},
"metis": {
"model": "qwen3.6-plus",
"fallback": ["deepseek-v4-pro"]
},
"atlas": {
"model": "deepseek-v4-pro",
"fallback": ["deepseek-v4-flash"]
},
"librarian": {
"model": "deepseek-v4-flash",
"fallback": ["qwen3.5-plus"]
},
"explore": {
"model": "deepseek-v4-flash",
"fallback": []
},
"code-reviewer": {
"model": "kimi-k2.6",
"fallback": ["deepseek-v4-pro"]
},
"multimodal-looker": {
"model": "mimo-v2.5-pro",
"fallback": ["qwen3.6-plus"]
}
},
"routing": {
"escalationPolicy": "on-failure",
"budgetAlert": 10.00,
"windowBudget": 12.00
}
}
escalationPolicy: "on-failure"严守其本:模型仅主用失效时方升,未尝先动。budgetAlert于十元时鸣警,使知窗内尚余二元,未及顶也。
速启
# Install OpenCode Go
npm install -g opencode
# Install Oh My OpenAgent
npx omc install oh-my-openagent
# Create opencode.json and .omc/config.json from the templates above, then:
omc init --preset oh-my-openagent
# Check your current window spend
opencode usage --window current
知所处之位于十二窗之内,则升迁至高级模型之态有变矣.
欲求原配置之法之详,吾初启之指南乃贾廷·马利克之文:OpenCode Go + Oh My OpenAgent: The Complete Guide to SOTA Model Routing Without Hitting Limits。其详述初版之v4.0-v4.1配置,与斯文并览,实为有益。















