惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

N
News and Events Feed by Topic
Malwarebytes
Malwarebytes
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
C
Cybersecurity and Infrastructure Security Agency CISA
F
Future of Privacy Forum
C
Cisco Blogs
T
The Exploit Database - CXSecurity.com
A
Arctic Wolf
S
Securelist
K
Kaspersky official blog
S
Schneier on Security
T
ThreatConnect
T
Tenable Blog
Spread Privacy
Spread Privacy
T
True Tiger Recordings
AWS News Blog
AWS News Blog
F
Fox-IT International blog
量子位
T
Threatpost
V
Vulnerabilities – Threatpost
C
CERT Recently Published Vulnerability Notes
Cisco Talos Blog
Cisco Talos Blog
GbyAI
GbyAI
宝玉的分享
宝玉的分享
腾讯CDC
G
Google Developers Blog
aimingoo的专栏
aimingoo的专栏
Cyberwarzone
Cyberwarzone
有赞技术团队
有赞技术团队
S
SegmentFault 最新的问题
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
V
Visual Studio Blog
U
Unit 42
雷峰网
雷峰网
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Simon Willison's Weblog
Simon Willison's Weblog
O
OpenAI News
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
The GitHub Blog
The GitHub Blog
The Register - Security
The Register - Security
MyScale Blog
MyScale Blog
小众软件
小众软件
A
About on SuperTechFans
Last Week in AI
Last Week in AI
Y
Y Combinator Blog
博客园 - 三生石上(FineUI控件)
美团技术团队
Google Online Security Blog
Google Online Security Blog
P
Proofpoint News Feed
MongoDB | Blog
MongoDB | Blog

博客园 - iTech

Google 开源分布式 Agent 运行时 AX:让 AI Agent 像微服务一样可靠 - iTech AI 技术日报 - 2026-05-25 Hermes Agent 接入 Microsoft Teams 全指南:6 步让你的 AI Agent 进群聊 Understand Anything:把任何代码库变成可交互知识图谱,23k star 的 AI 编程理解神器 腾讯开源 openclaw-weixin:让你的 AI Agent 直连微信,扫码即用 什么是 Agent-Native?如何把你的网站升级成面向 AI Agent 的网站 AI 技术日报 - 2026-05-24 Claude Code 为什么放弃 RAG 用 Grep 搜索代码?大型代码库最佳实践全解析 DeepSeek V4 Pro 永久降价 75%:旗舰推理模型进入白菜价时代 Runtime (YC P26):给每个团队配一个沙盒 AI Agent,产品经理也能提 PR Models.dev:查 AI 模型价格不用再开十几个网页了,4,844 个模型一站式对比 Superset (YC P26):Agent 时代的全新 IDE,同时跑 10 个 Claude Code 互不干扰 AI 技术日报 - 2026-05-23 3.5 个月 4.3 万 Star:nanobot 凭什么成为最火的开源 AI Agent CodeGraph:给 AI 编程助手装上代码知识图谱,省 35% 费用、减少 70% 工具调用 AI Engineering from Scratch:435 节课从线性代数到自主 Agent,每个算法手写一遍 Lucarne:不用盯着电脑也能掌控 AI Agent,微信/Telegram 远程遥控本地编码助手 财富正在向 AI 集中:三个万亿级 IPO 同场竞技,一场前所未有的造富运动 程序员必备核心技能手册:从 Linux 到 Docker 的实战速查 Deep:DeepSeek 版的 Aider / Claude Code,开源 CLI 编程工具新选择 AI 技术日报 - 2026-05-22 PUA vs NoPUA:用恐惧还是用爱驱动 AI Agent?一场 17000 Star 的路线之争 Anthropic 停招 L6 以下:当最强 AI 公司自己都不招初级工程师了 CLI for Microsoft 365 实战:用命令行操控 Teams 收发消息 面试 AI Agent 工程师会被问什么?40+ 真题 + 知识图谱全梳理 7 个标准正在重塑 AI 开发:从 MCP 到 AG-UI,一文看懂 Agent 时代的协议栈 SpaceX IPO:史上最大上市案,1.75万亿到2万亿美元的估值到底买了什么? DeepSeek 悄悄挂出 Agent Harness 岗位:Model + Harness = Agent,要做智能体产品了? AI 技术日报 - 2026-05-21 Claw 和 Hermes 精选 10 个零成本 Skills:让 AI Agent 能力翻倍 Stainless:AI 时代最被低估的幕后公司,你用的每个 SDK 可能都出自他们之手 飞书 CLI vs 企业微信 CLI vs 钉钉 CLI:三大办公平台终端工具横评 12-Factor Agents:从 21k Star 的开源项目看 AI Agent 的正确构建姿势 AI 技术日报 - 2026-05-20 Semble:让 AI Agent 搜代码的 Token 消耗直降 98%,怎么做到的 CloakBrowser:15k Star 的隐形浏览器,49 个 C++ 补丁干翻所有反爬检测 AI 技术日报 - 2026-05-19 面向 Agent 的软件开发:当软件的第一用户不再是人类 8MB 内存跑 AI 编程代理?Zerostack 用纯 Rust 证明:Agent 不需要那么重 AI 技术日报 - 2026-05-18 AI 技术日报 - 2026-05-17 AI 技术日报 - 2026-05-16 Anthropic 发布创始人手册:AI Native 公司不是多招几个工程师,是换一种活法 "不用 AI 就会被淘汰"——这是我听过最懒惰的恐吓 0.79ms 创建一个安全沙箱:zeroboot 用 COW 打穿 AI Agent 隔离的性能天花板 2000+ API 一把梭:agentic-ai-apis 让你少写 80% 的基础设施代码 AI 技术日报 - 2026-05-15 OpenHuman:一个让你在几分钟内拥有 AI 超级智能的开源项目 开源项目怎么选 License?个人免费、企业收费的 6 种方案全对比 browser-use vs browser-harness vs agent-browser:AI Agent 浏览器自动化工具终极选型指南 AI 技术日报 - 2026-05-14 一个 Deep Agent 到底能干什么?从功能视角拆解它的全部能力 Deep Agents SDK 功能全清单:我逐行读了源码,整理出这份完整参考手册 7MB 干翻 200MB?开源终端 Terax AI 能不能替代 Warp,我替你试了 Deep Agents vs Claude Code vs Cursor:2026 年 AI 编程 Agent 终极对比 15 个 Deep Agents 实战案例:从 Deep Research 到 Text-to-SQL,看看这个框架能做什么 用 Deep Agents CLI 替代 Claude Code:一条命令装好,任意模型驱动的终端 Agent 拆解 Deep Agents 架构:中间件、后端、Profile 三板斧,这设计比我想的还深 Deep Agents:LangChain 出品的 2026 年最强开源 Agent 框架,3 行代码搞定一切 AI 时代,我辞掉了大厂工作去做独立开发者——血泪换来的 7 条生存法则 中国 AI 六小虎估值大盘点:谁在泡沫上跳舞,谁在价值里扎根 AI 技术日报 - 2026-05-13 写好 AGENTS.md 相当于白嫖一次模型升级(写错了还不如不写) GitHub 49K Star!Ruflo 让 Claude 多 Agent 协作像带团队一样简单 AI 技术日报 - 2026-05-12 罗福莉访谈深度解析:Agent 时代普通人还能干什么 AWS DevOps Agent:亚马逊的自主运维 Agent 来了 Vercel vs Netlify vs Cloudflare Pages:2026 静态托管三巨头实测对比 AI 时代,为什么中国出不了英伟达、三星、海力士? Vercel 开源 Open Agents:把 Claude Code 搬上云,关机也能干活 黄仁勋 CMU 毕业演讲全文解读:计算范式 60 年来首次被重写,每个人都是程序员 AI 技术日报 - 2026-05-11 nuwa-skill 18K Star:16 个思维 Skill 全拆解 - iTech Hermes Web UI:把 AI Agent 装进浏览器,一个面板管到底 AI Agent 工具多到选不过来?Agent MGMT 帮你一次性看清全局 营收创新高却裁员 20%:Cloudflare 用 AI Agent 告诉我们,替代已经开始了 AI 技术日报 - 2026-05-10 23K Star 的 DeepSeek TUI,真能代替 Claude Code 吗? Gumroad创始人把《极简创业》做成AI技能包:10个斜杠命令,让Claude当你的创业顾问 Open Design:3.4万星的开源AI设计工作室,让你的编程Agent秒变设计师 免费搭一个 AI 新闻雷达:Horizon 开源项目部署实战 Cloudflare Agent Setup:一行指令让 AI Agent 帮你配好整个开发环境 AI 技术日报 - 2026-05-09 AI Agent 写完代码谁来测?这个开源沙箱把 CI/CD 和多 Agent 协作全包了 7万星的AI交易框架:让大模型模拟投行多空辩论,自动做交易决策 71000颗星的AI交易团队:让大模型模拟投行分工,自动做交易决策 13400颗星的开源项目:输入一句话,AI全自动帮你做短视频 102颗星的沙盒:当AI学会自己写代码、跑测试、做部署 AI 技术日报 - 2026-05-08 29k 星的 PageIndex:不用向量数据库,靠推理就能做 RAG 每天花两小时刷信息?这个开源项目帮你全自动搞定 读源码像读小说?试了 DeepWiki 和 Zread,我再也不想裸读 GitHub 了 Matt Pocock 开源的这套 .claude 技能,为什么让工程师集体上头? Cursor Team Kit:Cursor 官方团队在用的 17 个 AI 工作流 AI 技术日报 - 2026-05-07 AI 技术日报 - 2026-05-06 - iTech AI 技术日报 - 2026-05-05 Anthropic CEO 说 12 个月内程序员要失业,我扒完他的底牌,发现事情没那么简单 把工程师的肌肉记忆装进 Claude Code,这个 4300 Star 的项目我后悔没早用 AI 技术日报 - 2026-05-04
不用 Embedding 也能做知识 Agent?Vercel 用文件系统干掉了向量检索管线
iTech · 2026-05-25 · via 博客园 - iTech

不用 Embedding 也能做知识 Agent?Vercel 用文件系统干掉了向量检索管线

上周刷到 Vercel 的一篇博客,标题直接就是"Build knowledge agents without embeddings"。一开始以为是噱头——做知识检索不用向量数据库?读完发现,他们的思路确实巧妙:与其让 LLM 学会「语义检索」,不如让它做它最擅长的事——读文件、跑命令。

这个方案把成本砍了 75%,答案质量反而提高了。关键是调试变得极其直观:agent 答错了?打开 trace 看它跑了什么 grep 命令,拉了哪个文件的哪一段。几分钟定位问题。

本文提纲

  1. 传统 RAG 的困境
  2. Vercel 的替代方案:文件系统 + Agent
  3. 架构拆解:Sandbox + AI SDK + Chat SDK
  4. 核心组件详解
  5. 对比 Embedding 管线:什么场景该用什么

传统 RAG 的困境

绝大多数知识 Agent 的搭建路径是这样的:

  1. 选一个向量数据库(Pinecone、Weaviate、pgvector……)
  2. 搭 chunking 管线——文档切成小块
  3. 选 embedding 模型——把文本变成向量
  4. 调检索参数——top-k、相似度阈值、reranking
  5. 祈祷别出问题

然后 agent 回答错误。你开始排查:是哪个 chunk 被检索到了?为什么这个 chunk 得分 0.82 而正确答案只有 0.79?是 embedding 模型的问题?chunk 策略的问题?还是 reranking 逻辑的问题?

Embedding 管线擅长语义相似度检索,但在需要精确值的场景下经常翻车。 比如用户问"API 的速率限制是多少",embedding 可能返回一段提到速率限制但没给出具体数字的段落,而正确答案在另一个被截断的 chunk 里。

更痛苦的是调试。向量的相似度分数是一个黑盒数字——你没法直观地理解为什么 0.82 大于 0.79,更没法告诉用户"因为向量空间中这两个 chunk 更近"。

Vercel 的替代方案:文件系统 + Agent

Vercel 的思路是:LLM 天生就理解文件系统。

它们在训练数据里见过海量代码——遍历目录、grep 搜索文件、跨文件管理状态。代码补全、文件操作本身就是 LLM 的强项。与其教模型一个新技能(向量检索),不如用它最擅长的能力(文件操作)。

核心架构异常简洁:

MERMAID_BLOCK_0

工作流程:
1. 数据源(GitHub repo、YouTube 字幕、Markdown 文档)同步到文件系统
2. 用户提问时,Vercel Sandbox 启动一个临时 Linux VM
3. Agent 在 Sandbox 里用 Bash 命令搜索文件(grepfindcat
4. 拿到搜索结果后,LLM 生成答案
5. 返回答案,附带来源引用

没有向量数据库,没有 chunking 管线,没有 embedding 模型。 文件就是文件,命令就是命令,结果可追溯。

成本数据也很直接:单次调用从 ~$1.00 降到 ~$0.25,降了 75%。

架构拆解:Sandbox + AI SDK + Chat SDK

Vercel 把这套方案打包成了 Knowledge Agent Template,一个开源模板,可以一键 fork、定制、部署到 Vercel。

技术栈由三个核心组件撑起:

组件 作用 技术
Vercel Sandbox 安全执行环境 Firecracker MicroVM,隔离的临时 Linux
AI SDK Agent 编排 TypeScript,支持多模型
Chat SDK 多平台接入 Discord、Slack、Teams、GitHub 等适配器

Vercel Sandbox:用完即焚的 Linux VM

Sandbox 是整个方案的关键基础设施。它本质上是一个 Firecracker MicroVM——和 Vercel 每天 200 万次构建用的同一套底层技术。

import { Sandbox } from "@vercel/sandbox";

const sandbox = await Sandbox.create({
  source: {
    url: "https://github.com/your-org/your-docs.git",
    type: "git",
  },
  resources: { vcpus: 4 },
  runtime: "node24",
});

// Agent 在 Sandbox 里执行搜索
const result = await sandbox.runCommand({
  cmd: "grep",
  args: ["-r", "rate limit", "--include=*.md", "."],
  stdout: process.stdout,
});

每次搜索请求启动一个干净的 VM,跑完即销毁。没有状态污染,没有安全问题——agent 跑的是不可信代码,但被安全隔离在 MicroVM 里。

AI SDK:Agent 的编排大脑

AI SDK(GitHub: vercel/ai,24k+ stars)是 Vercel 的 AI 工具链,支持多种 LLM provider。在 Knowledge Agent 里,它负责:

  • 工具调用(Tool Calling):给 agent 提供 grepfindcat 等文件操作工具
  • 流式响应:实时输出答案
  • 模型路由:根据问题复杂度自动选模型

模板里内置了一个 智能复杂度路由器(Complexity Router)

简单问题 → 快速便宜的模型(如 GPT-4o-mini)
复杂问题 → 强力但昂贵的模型(如 Claude Sonnet)

这一层路由进一步压低了成本。大部分 FAQ 级别的问题用轻量模型就够了,只有需要多步推理的复杂问题才动用重模型。

Chat SDK:一次开发,全平台部署

知识 Agent 不应该只活在网页里。你的工程师在 Slack 上,社区在 Discord 上,Bug 报告在 GitHub 上——agent 应该跟到用户所在的地方。

Chat SDK 提供了一组平台适配器:

// Discord 适配器
import { createDiscordAdapter } from "@vercel/chat-sdk/discord";

// GitHub 适配器
import { createGitHubAdapter } from "@vercel/chat-sdk/github";

// 都指向同一个 Agent 管线
discordAdapter.onMention(async (message) => {
  const response = await agentPipeline(message.text);
  return response;
});

每个适配器处理平台特有的认证、事件格式、消息格式,而 agent 本身的逻辑保持不变。模板开箱自带 GitHub 和 Discord 适配器,Chat SDK 还支持 Slack、Microsoft Teams、Google Chat 等。

核心组件详解

数据源管理

通过 Admin 界面添加数据源,内容存入 Postgres。支持的数据源类型:

  • GitHub 仓库:直接 clone,agent 用 grep 搜索代码和文档
  • YouTube 字幕:自动提取,存为文本文件
  • Markdown 文档:直接作为知识库文件
  • 自定义数据:API 拉取或手动上传

数据同步后就是一堆普通文件,不需要任何预处理。

智能搜索策略

Agent 不是简单地跑一个 grep 就完了。它有完整的搜索策略:

  1. 先用 find 定位相关文件
  2. grep 搜索关键词
  3. cat 读取具体段落
  4. 必要时用多轮搜索交叉验证

这些步骤由 LLM 动态编排——它会根据问题类型决定搜索策略。简单的事实查询可能只需要一轮 grep,复杂的技术问题可能需要多轮交叉检索。

Admin 管理面板

模板自带完整的 Admin 界面:

  • 使用统计:调用量、响应时间、token 消耗
  • 错误日志:每个失败的请求都可追溯
  • 用户管理:权限控制
  • 数据源配置:添加/删除/同步
  • AI Admin Agent:可以直接问"过去 24 小时有什么错误"或"用户最常问什么问题"

这个 Admin Agent 本身也是一个知识 Agent——它用 Vercel 的 Instrumentation 提供日志查询能力,让你用自然语言调试 agent。

对比 Embedding 管线:什么场景该用什么

维度 文件系统方案 Embedding 管线
精确检索 ✅ grep 精确匹配,无歧义 ❌ 语义相似度可能模糊
语义理解 ⚠️ 依赖 LLM 的理解能力 ✅ 天然支持语义搜索
调试难度 ✅ 看命令和文件即可 ❌ 向量相似度是黑盒
成本 ✅ ~$0.25/调用 ❌ ~$1.00/调用
规模 ⚠️ 文件数量极大时搜索变慢 ✅ 向量检索 O(log n)
实时性 ✅ 文件更新立即可搜 ❌ 需要 re-embed
搭建复杂度 ✅ 无需额外基础设施 ❌ 向量 DB + 管线
非文本数据 ❌ 主要适用于文本 ✅ 多模态 embedding

文件系统方案最适合的场景

  • 知识库以文档/代码为主(技术文档、API 文档、代码仓库)
  • 需要精确答案而非模糊匹配
  • 团队需要快速调试和迭代
  • 数据源经常更新,需要实时同步

Embedding 管线仍然适合的场景

  • 超大规模数据(百万级文档)
  • 多模态内容(图片、音频的语义搜索)
  • "给我类似的内容"这种模糊查询

这两种方案不互斥。Vercel 的思路是:很多团队在不需要 Embedding 的场景下被迫用 Embedding,因为这是"标准做法"。而文件系统方案提供了一个更简单、更可调试、更便宜的替代——至少在特定场景下。

一键部署到 Vercel,配置数据源,开始回答问题。没有向量数据库,没有 chunking 管线,没有 embedding 模型。


作者: itech001
来源: 公众号:AI人工智能时代
网站: https://www.theaiera.cn/
每日分享最前沿的AI新闻资讯和技术研究。

本文首发于 AI人工智能时代,转载请注明出处。