惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Project Zero
Project Zero
D
Darknet – Hacking Tools, Hacker News & Cyber Security
Scott Helme
Scott Helme
Know Your Adversary
Know Your Adversary
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
WordPress大学
WordPress大学
AWS News Blog
AWS News Blog
小众软件
小众软件
www.infosecurity-magazine.com
www.infosecurity-magazine.com
Jina AI
Jina AI
AI
AI
美团技术团队
人人都是产品经理
人人都是产品经理
S
Secure Thoughts
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
V
Visual Studio Blog
宝玉的分享
宝玉的分享
Security Latest
Security Latest
P
Privacy & Cybersecurity Law Blog
C
Cisco Blogs
大猫的无限游戏
大猫的无限游戏
Google Online Security Blog
Google Online Security Blog
L
LINUX DO - 最新话题
罗磊的独立博客
Recent Announcements
Recent Announcements
H
Hacker News: Front Page
博客园 - 【当耐特】
K
Kaspersky official blog
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
SecWiki News
SecWiki News
Schneier on Security
Schneier on Security
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Apple Machine Learning Research
Apple Machine Learning Research
F
Full Disclosure
Google DeepMind News
Google DeepMind News
V
V2EX
博客园 - 聂微东
量子位
云风的 BLOG
云风的 BLOG
C
Check Point Blog
J
Java Code Geeks
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
W
WeLiveSecurity
Engineering at Meta
Engineering at Meta
V2EX - 技术
V2EX - 技术
Vercel News
Vercel News
L
LINUX DO - 热门话题
T
The Exploit Database - CXSecurity.com
L
Lohrmann on Cybersecurity
The GitHub Blog
The GitHub Blog

博客园 - 秃头星AI

如果没有 Tools,Agent 什么都做不了 当大模型开始控制设备:我是怎么理解 Agent 架构的 AI 真正的突破,不是更聪明,而是开始能「行动」 Prompt 一旦超出上下文窗口,该怎么办? 别再把 RAG 当搜索:它本质上是在重构 Context 你以为AI记住了你,其实没有:大模型记忆机制拆解 看见,才会回答:Context 如何重塑 AI 的能力边界 你以为在给 AI 下命令,其实你在改写它的概率分布 AI真的会思考吗?当我们拆开大语言模型,看到的是一个完全反直觉的真相 三、控制权之争:从 Workflow 到 Claude Skills,AI 正在进入「执行契约时代」 二、LLM进化史:从“复读机”到“牛马员工”,Agent到底是个什么鬼? 一、大语言模型上班记:从只会接话到会查资料的进化史 .Net 使用 Consul Consul Windows部署 C#/C++ 通过ODBC连接OceanBase Oracle租户 线程同步构造 C# lock 和 Monitor C++调用C# (使用C++/CLI) C#调用C++ (使用C++/CLI)
为什么 Agent 一定要“思考→行动→观察”?聊聊 ReAct 循环
秃头星AI · 2026-03-16 · via 博客园 - 秃头星AI

如果我们看过一些 Agent 框架,比如:

  • LangChain
  • AutoGen
  • CrewAI

可能会发现一个有点奇怪的现象。

这些框架看起来功能很多:

  • Tool 调用
  • Memory
  • 多 Agent 协作
  • 任务规划

但如果真的去翻源码或者架构,我们会发现一个事实:

很多 Agent 系统的核心逻辑其实非常简单。

大多数框架,本质上都在实现同一个循环:

思考 → 行动 → 观察 → 再思考

也就是所谓的 ReAct( Reasoning + Acting )

第一次看到这个结构的时候,我其实有点意外。
因为它简单得有点不像一个“AI 架构”。

但后来越看越发现:
几乎所有 Agent 系统,都离不开这个循环。


为什么复杂任务必须“分步骤做”

先说一个很基础的问题。

大模型本身其实只会做一件事:

根据输入生成一段文本。

比如用户问:

帮我总结一下 AI Agent 的技术趋势

模型可以直接生成一段总结。

但如果任务变复杂一点,比如:

写一份 AI Agent 行业分析报告

这件事情如果是人来做,一般不会一步完成。

大多数人会这样做:

  1. 先去搜索一些资料
  2. 找几篇文章或报告看一看
  3. 整理出几个关键观点
  4. 想好文章结构
  5. 最后再写成一份完整报告

我们会发现,这其实是一个多步骤过程

每一步都在决定:
下一步该做什么。

问题就在这里。

普通的大模型并不会自动拆分这些步骤,它只会根据当前输入生成一个结果。

但现实世界的大多数任务,其实都是一种 连续决策过程

所以如果想让 AI 真的去“完成任务”,就必须给它一种机制,让它可以:

  • 一步一步思考
  • 在过程中调用工具
  • 根据结果调整下一步动作

这就是 ReAct 想解决的问题。


ReAct:其实就是把“思考”和“行动”串起来

ReAct 这个概念来自一篇论文:

ReAct: Synergizing Reasoning and Acting in Language Models

这篇论文的想法其实很简单:

让模型在推理过程中,不只是输出最终答案,而是同时输出三种信息:

Thought(思考)
Action(行动)
Observation(观察结果)

例如:

Thought: 需要先查一下最新的 Agent 技术趋势
Action: search("AI Agent trend 2025")
Observation: 返回搜索结果

然后继续:

Thought: 需要整理这些资料
Action: summarize(content)
Observation: 得到总结

整个过程看起来大概是这样:

Thought → Action → Observation
            ↑
            └──── 再回到 Thought

换句话说,模型不再是“一次回答完问题”,而是在执行过程中不断调整下一步动作。


从工程角度看,它其实就是一个循环

如果用程序员的视角来看,ReAct 其实没那么神秘。

它本质上就是一个循环。

伪代码甚至可以写得很简单:

while (task_not_finished)
{
    thought = LLM(reasoning)

    action = choose_tool(thought)

    observation = run_tool(action)

    update_context(observation)
}

模型负责做一件事:

决定下一步要做什么

系统负责做另一件事:

执行工具
拿到结果
把结果再喂给模型

整个系统就可以不断运行,直到任务完成。

很多 Agent 框架,其实只是把这个循环封装得更好用而已。


为什么这个循环这么关键

这个循环真正解决的问题其实只有一个:

让 AI 在执行过程中可以不断修正自己的决策。

举个简单例子。

如果用户说:

查一下最近最火的 AI Agent 框架

Agent 可能会这样工作:

第一步:

Thought: 需要先搜索
Action: search("AI Agent framework")

第二步:

Observation: 得到搜索结果
Thought: 需要整理这些框架
Action: summarize()

第三步:

Observation: 得到总结
Thought: 可以输出最终结果

这个过程其实和人做事情很像。

先找信息,再整理信息,最后给出结果。

如果没有这个循环,模型只能一次性生成一个答案,很难处理中间过程。


放到设备控制系统里,这个循环会更明显

在我们做的一个工业控制系统里,这个循环其实非常直观。

假设用户输入:

把 Stage 移动到 X=100, Y=50

Agent 可能会这样执行:

第一步:

Thought: 需要先确认 Stage 是否已经 Home
Action: query_stage_status

第二步:

Observation: Stage 未 Home
Thought: 需要先执行 Home
Action: stage_home

第三步:

Observation: Stage 已 Home
Thought: 可以执行移动
Action: stage_move(100, 50)

第四步:

Observation: Stage 移动成功
Thought: 任务完成

如果把这个过程画出来,其实就是:

思考 → 行动 → 观察 → 再思考

这和 ReAct 的循环结构是完全一致的。


所有 Agent 系统,本质都绕不开这个循环

不管是:

  • LangGraph
  • AutoGen
  • CrewAI

底层其实都离不开这个结构。

差别只是在于:

有些系统在这个循环上增加了更多能力,比如:

  • Memory
  • Planning
  • Multi-Agent
  • Workflow

但如果把这些东西都拿掉,剩下的核心,其实还是这个 Agent Loop