惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
IntelliJ IDEA : IntelliJ IDEA – the Leading IDE for Professional Development in Java and Kotlin | The JetBrains Blog
C
CXSECURITY Database RSS Feed - CXSecurity.com
博客园_首页
H
Hackread – Cybersecurity News, Data Breaches, AI and More
T
ThreatConnect
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
博客园 - 聂微东
H
Help Net Security
T
Threat Research - Cisco Blogs
Blog — PlanetScale
Blog — PlanetScale
A
Arctic Wolf
G
Google Developers Blog
量子位
U
Unit 42
I
InfoQ
V
V2EX
F
Fox-IT International blog
P
Privacy & Cybersecurity Law Blog
V
Visual Studio Blog
J
Java Code Geeks
大猫的无限游戏
大猫的无限游戏
C
CERT Recently Published Vulnerability Notes
博客园 - 三生石上(FineUI控件)
T
The Exploit Database - CXSecurity.com
T
Tailwind CSS Blog
SecWiki News
SecWiki News
Know Your Adversary
Know Your Adversary
MyScale Blog
MyScale Blog
宝玉的分享
宝玉的分享
The Hacker News
The Hacker News
Project Zero
Project Zero
Application and Cybersecurity Blog
Application and Cybersecurity Blog
月光博客
月光博客
Recent Commits to openclaw:main
Recent Commits to openclaw:main
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
G
GRAHAM CLULEY
C
Cisco Blogs
I
Intezer
Simon Willison's Weblog
Simon Willison's Weblog
O
OpenAI News
Recorded Future
Recorded Future
T
Tenable Blog
W
WeLiveSecurity
腾讯CDC
Stack Overflow Blog
Stack Overflow Blog
T
The Blog of Author Tim Ferriss
www.infosecurity-magazine.com
www.infosecurity-magazine.com
D
Docker
C
Cybersecurity and Infrastructure Security Agency CISA
PCI Perspectives
PCI Perspectives

博客园 - ayanmw

开源项目介绍 OpenTeam 命令行 检测验证网站的 SSL证书 是否安全 Nginx 使用自签名 SSL 证书 关闭夸克浏览器在windows资源管理器中,图片右键菜单的万能转换开关 golang的defer 深坑 Windows Terminal 清屏方法 Ctrl+Shift+K 免费二级域名以及设置SSL证书和解析 docker加速镜像 golang + AI 写一个可以 一键让nas下载百度网盘链接的文件 的程序 raid 为什么而不可以两个硬盘交叉读写和交叉备份? google-protobuf库 在golang语言下的插件扩展 golang 空切片和nil切片 有区别吗? golang json库 忽略 omitempty Go语言: golang如何判断一个结构体的一个方法是匿名组合的,还是该结构体自己的方法? golang 获得一个结构体的字节大小 吐槽 WPS 流氓行为: WPS 未经用户允许, 就建立了 WPS本地云盘 , 然后 云文档的文件 莫名其妙的的被删除了, 现在只能开会员恢复WPS云空间回收站的文件. 预测未来会有 内嵌AI大模型的游戏 好奇: windows10+都可以运行多个linux子系统了,为什么不支持运行多个windows子系统呢? gorm使用事务并发情况下切有最大mysql连接数限制的情况下的BUG,踩坑了 2024年 个人养老金 账户 应知应会 两个Mysql唯一索引的交换: 避免重复索引 Duplicate entry '3' for key 'priority_UNIQUE'
极度推荐: 9router 一个npm服务,可以让你将白嫖到的所有AI token以及付费API都集中到一起
ayanmw · 2026-05-28 · via 博客园 - ayanmw

极度推荐: 9router——集中管理所有AI Token的开源路由工具

起因:AI开发的痛点已经忍很久了

作为一线AI开发工程师,我日常工作重度依赖各类大模型服务,在接入和使用过程中踩了无数坑,核心痛点可以归纳为三点:

  1. 配置混乱:手头同时有多个免费Token、多个付费API密钥,每个工具需要单独配置不同服务商的信息,切换模型要反复修改地址和密钥,光配置笔记就写了满满一页
  2. 成本浪费
    • 订阅制额度经常用不完过期,白白损失费用
    • Git diff、终端日志等长文本输出会大量消耗Token,压缩率极低,造成不必要的成本支出
    • 简单任务习惯用高价模型,算力成本浪费严重
  3. 服务中断:开发过程中频繁遇到额度耗尽、速率限制导致服务中断,打断开发思路,大幅降低编码效率

试过多个开源的聚合管理工具,要么功能不全,要么部署复杂,直到发现9router,用了两周之后彻底解决了上述问题,今天从技术角度给大家拆解一下这个工具。

What:9router是什么?核心定位是什么?

9router是一款开源的本地AI模型路由代理工具,发布在npm生态中,核心定位是「AI开发工具与模型服务商之间的智能调度层」,主要解决的核心问题是多AI资源的统一管理与智能调度,它的核心能力可以总结为四点:

  1. 将所有AI资源(免费Token、付费API、本地模型)统一接入,对外输出标准化兼容接口
  2. 对终端输出等大体积上下文做自动Token压缩,降低成本消耗
  3. 根据额度优先级实现自动降级,保证服务永不中断
  4. 根据任务复杂度智能分流,把合适的任务分配给合适的模型

目前9router已经支持几乎所有主流的大模型服务商,适配全品类AI编程工具,是开源社区当前活跃度非常高的AI开发基础设施项目。

How:核心功能拆解,怎么解决我们的痛点?

下面从技术角度拆解9router的核心功能,看看它是怎么解决问题的:

1. 统一接口适配:抹平多服务商差异,一次配置全场景使用

9router的核心设计思路是入口归一,出口分发,具体能力包括:

  • 支持接入OpenAI、Anthropic、Google Gemini、智谱GLM、DeepSeek等几乎所有公开大模型API,同时支持本地Ollama等私有模型接入
  • 所有接入的模型统一对外输出OpenAI兼容格式接口,所有支持OpenAI接口的AI编程工具可以一键接入
  • 自带格式自动转换能力,自动完成OpenAI↔Claude↔Gemini的消息格式互转,不需要用户做任何代码适配

效果:所有AI工具只需要配置一次地址和密钥,就能调用所有你接入的模型,彻底解决多配置来回切换的问题,我目前所有AI工具都只配置了一个入口:http://localhost:20128/v1

2. 无损Token压缩:减少20%-80%冗余消耗

9router内置了灵感来自RTK (Rust Token Killer)的Token压缩模块,已经移植到JavaScript生态,核心能力是:

  • 自动识别git diff、grep、ls、find、tree、日志查询这类工具输出内容,自动做无损压缩
  • 只保留代码变更的核心上下文,去掉冗余空格、重复路径、无效注释等不影响AI理解的内容
  • 压缩过程完全自动,在转发请求给大模型之前自动完成,对上层工具完全透明

实际测试效果:常规git diff请求可以减少30%左右Token消耗,长日志输出最高可以减少87%的Token,我日常开发整体Token消耗降低了32%,成本优化效果非常明显。

3. 三层自动降级:保证服务永不中断

9router的核心调度策略是分层优先级调度,根据你配置的资源优先级自动完成切换,完全不需要人工干预:

  1. 第一层:优先消耗付费订阅额度:实时追踪每个付费订阅的剩余额度,优先走付费额度,确保订阅到期前能把所有额度用完,避免过期浪费,把付费价值拉满
  2. 第二层:自动切换低成本按量API:当付费额度耗尽后,自动无缝切换到你配置的低成本按量付费模型,这类模型单价一般是顶级模型的1/5-1/10,足以应对绝大多数日常开发任务,同时控制成本
  3. 第三层:免费模型兜底保障:当前两层额度都耗尽后,自动切换到免费模型服务,目前9router原生支持Kiro AI(免费无限Claude)、OpenCode Free(免密接入)等免费服务,基础编码完全可以支撑,保证开发过程永远不会中断

整个切换过程是无感知的,开发者不需要做任何操作,9router会自动帮你处理所有调度逻辑,完全不会打断开发思路。

4. 智能任务分流:把合适的任务给合适的模型

9router支持自定义分流规则,你可以配置不同任务类型自动匹配不同模型:

  • 代码审查、文件摘要、测试用例生成这类低复杂度、高Token消耗的任务,自动分配给低成本模型
  • 核心架构设计、复杂Bug调试这类高复杂度任务,自动分配给顶级大模型

相当于给你的AI资源做了分层调度,避免用顶级模型处理简单任务,浪费昂贵的算力额度,进一步优化了整体成本。

5. 全工具适配:不需要改造现有开发流

9router适配了当前几乎所有主流AI编程工具,包括:

  • CLI类:Claude Code、Codex
  • 编辑器插件类:Cursor、Continue、Cline、Copilot Chat
  • 其他第三方AI工具:全品类兼容

只要把工具的API地址改成9router的本地地址,替换密钥就可以完成接入,不需要修改任何现有代码,接入成本为零。

快速部署:五分钟完成安装配置

9router是npm包,部署非常简单,只要你的环境有Node.js,两步就能完成:

  1. 全局安装:

npm install -g 9router

  1. 启动服务:

9router

启动后会自动打开浏览器进入控制面板,默认地址是http://localhost:20128,初始密码是123456,后续只需要两步就能完成配置:

  1. 在提供商面板添加你所有的免费Token和付费API,要使用免费服务直接添加支持白嫖的服务商即可,不需要额外注册
  2. 在API配置页面生成一个本地访问密钥,把你的AI编程工具的Endpoint改成http://localhost:20128/v1,API Key替换成生成的密钥即可完成接入

如果偏好容器化部署,官方也提供Docker镜像,支持一键启动,配置过程和npm部署完全一致。

Thinking:为什么这个工具值得推荐?

聊完技术和用法,最后说一下我作为开发者为什么推荐这个工具:

  1. 痛点抓的准:它解决的不是伪需求,是每个重度AI开发者每天都会遇到的真问题,多资源管理、成本控制、服务稳定性这三个痛点,几乎所有AI开发者都能感同身受
  2. 设计足够简单:没有复杂的架构,就是一个本地代理调度层,npm一键安装,五分钟就能用,不需要搭建复杂的服务端,个人开发者也能零成本使用
  3. 开源免费,生态活跃:项目完全开源,代码托管在GitHub,当前更新频率很高,持续迭代新功能和新的服务商适配,社区生态也比较完善
  4. 适配所有开发者群体
    • 学生/个人开发者:可以把所有白嫖来的免费Token集中管理,实现零成本不间断AI开发
    • 重度付费用户:可以优化现有订阅的利用率,降低30%左右的Token成本,避免服务中断
    • 团队开发:可以统一管理团队AI资源,做成本管控和负载均衡,降低整体开发成本

如果你也正在被多AI资源管理的问题困扰,非常推荐你试试这个工具,安装成本极低,收益很高,我用了两周之后已经完全离不开了。

项目地址:https://github.com/decolua/9router </doc_start> 以上是根据你的要求生成的,如需调整口吻或补充细节可以随时提出。(AI生成)