惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

NISL@THU
NISL@THU
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
D
Darknet – Hacking Tools, Hacker News & Cyber Security
阮一峰的网络日志
阮一峰的网络日志
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
WordPress大学
WordPress大学
IT之家
IT之家
Cyberwarzone
Cyberwarzone
博客园_首页
博客园 - 聂微东
V
Visual Studio Blog
Cisco Talos Blog
Cisco Talos Blog
V
Vulnerabilities – Threatpost
Google DeepMind News
Google DeepMind News
Schneier on Security
Schneier on Security
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
The Hacker News
The Hacker News
雷峰网
雷峰网
Last Week in AI
Last Week in AI
Spread Privacy
Spread Privacy
L
Lohrmann on Cybersecurity
O
OpenAI News
人人都是产品经理
人人都是产品经理
AWS News Blog
AWS News Blog
小众软件
小众软件
T
Tailwind CSS Blog
The Cloudflare Blog
L
LINUX DO - 最新话题
有赞技术团队
有赞技术团队
Know Your Adversary
Know Your Adversary
The GitHub Blog
The GitHub Blog
L
LINUX DO - 热门话题
Y
Y Combinator Blog
Stack Overflow Blog
Stack Overflow Blog
B
Blog
MyScale Blog
MyScale Blog
S
SegmentFault 最新的问题
S
Schneier on Security
The Last Watchdog
The Last Watchdog
Application and Cybersecurity Blog
Application and Cybersecurity Blog
Security Archives - TechRepublic
Security Archives - TechRepublic
大猫的无限游戏
大猫的无限游戏
罗磊的独立博客
Blog — PlanetScale
Blog — PlanetScale
博客园 - Franky
I
InfoQ
P
Proofpoint News Feed
量子位
S
Security @ Cisco Blogs

博客园 - 秃头星AI

如果没有 Tools,Agent 什么都做不了 当大模型开始控制设备:我是怎么理解 Agent 架构的 AI 真正的突破,不是更聪明,而是开始能「行动」 Prompt 一旦超出上下文窗口,该怎么办? 别再把 RAG 当搜索:它本质上是在重构 Context 你以为AI记住了你,其实没有:大模型记忆机制拆解 看见,才会回答:Context 如何重塑 AI 的能力边界 你以为在给 AI 下命令,其实你在改写它的概率分布 AI真的会思考吗?当我们拆开大语言模型,看到的是一个完全反直觉的真相 三、控制权之争:从 Workflow 到 Claude Skills,AI 正在进入「执行契约时代」 二、LLM进化史:从“复读机”到“牛马员工”,Agent到底是个什么鬼? 一、大语言模型上班记:从只会接话到会查资料的进化史 .Net 使用 Consul Consul Windows部署 C#/C++ 通过ODBC连接OceanBase Oracle租户 线程同步构造 C# lock 和 Monitor C++调用C# (使用C++/CLI) C#调用C++ (使用C++/CLI)
为什么 Agent 一定要“思考→行动→观察”?聊聊 ReAct 循环
秃头星AI · 2026-03-16 · via 博客园 - 秃头星AI

如果我们看过一些 Agent 框架,比如:

  • LangChain
  • AutoGen
  • CrewAI

可能会发现一个有点奇怪的现象。

这些框架看起来功能很多:

  • Tool 调用
  • Memory
  • 多 Agent 协作
  • 任务规划

但如果真的去翻源码或者架构,我们会发现一个事实:

很多 Agent 系统的核心逻辑其实非常简单。

大多数框架,本质上都在实现同一个循环:

思考 → 行动 → 观察 → 再思考

也就是所谓的 ReAct( Reasoning + Acting )

第一次看到这个结构的时候,我其实有点意外。
因为它简单得有点不像一个“AI 架构”。

但后来越看越发现:
几乎所有 Agent 系统,都离不开这个循环。


为什么复杂任务必须“分步骤做”

先说一个很基础的问题。

大模型本身其实只会做一件事:

根据输入生成一段文本。

比如用户问:

帮我总结一下 AI Agent 的技术趋势

模型可以直接生成一段总结。

但如果任务变复杂一点,比如:

写一份 AI Agent 行业分析报告

这件事情如果是人来做,一般不会一步完成。

大多数人会这样做:

  1. 先去搜索一些资料
  2. 找几篇文章或报告看一看
  3. 整理出几个关键观点
  4. 想好文章结构
  5. 最后再写成一份完整报告

我们会发现,这其实是一个多步骤过程

每一步都在决定:
下一步该做什么。

问题就在这里。

普通的大模型并不会自动拆分这些步骤,它只会根据当前输入生成一个结果。

但现实世界的大多数任务,其实都是一种 连续决策过程

所以如果想让 AI 真的去“完成任务”,就必须给它一种机制,让它可以:

  • 一步一步思考
  • 在过程中调用工具
  • 根据结果调整下一步动作

这就是 ReAct 想解决的问题。


ReAct:其实就是把“思考”和“行动”串起来

ReAct 这个概念来自一篇论文:

ReAct: Synergizing Reasoning and Acting in Language Models

这篇论文的想法其实很简单:

让模型在推理过程中,不只是输出最终答案,而是同时输出三种信息:

Thought(思考)
Action(行动)
Observation(观察结果)

例如:

Thought: 需要先查一下最新的 Agent 技术趋势
Action: search("AI Agent trend 2025")
Observation: 返回搜索结果

然后继续:

Thought: 需要整理这些资料
Action: summarize(content)
Observation: 得到总结

整个过程看起来大概是这样:

Thought → Action → Observation
            ↑
            └──── 再回到 Thought

换句话说,模型不再是“一次回答完问题”,而是在执行过程中不断调整下一步动作。


从工程角度看,它其实就是一个循环

如果用程序员的视角来看,ReAct 其实没那么神秘。

它本质上就是一个循环。

伪代码甚至可以写得很简单:

while (task_not_finished)
{
    thought = LLM(reasoning)

    action = choose_tool(thought)

    observation = run_tool(action)

    update_context(observation)
}

模型负责做一件事:

决定下一步要做什么

系统负责做另一件事:

执行工具
拿到结果
把结果再喂给模型

整个系统就可以不断运行,直到任务完成。

很多 Agent 框架,其实只是把这个循环封装得更好用而已。


为什么这个循环这么关键

这个循环真正解决的问题其实只有一个:

让 AI 在执行过程中可以不断修正自己的决策。

举个简单例子。

如果用户说:

查一下最近最火的 AI Agent 框架

Agent 可能会这样工作:

第一步:

Thought: 需要先搜索
Action: search("AI Agent framework")

第二步:

Observation: 得到搜索结果
Thought: 需要整理这些框架
Action: summarize()

第三步:

Observation: 得到总结
Thought: 可以输出最终结果

这个过程其实和人做事情很像。

先找信息,再整理信息,最后给出结果。

如果没有这个循环,模型只能一次性生成一个答案,很难处理中间过程。


放到设备控制系统里,这个循环会更明显

在我们做的一个工业控制系统里,这个循环其实非常直观。

假设用户输入:

把 Stage 移动到 X=100, Y=50

Agent 可能会这样执行:

第一步:

Thought: 需要先确认 Stage 是否已经 Home
Action: query_stage_status

第二步:

Observation: Stage 未 Home
Thought: 需要先执行 Home
Action: stage_home

第三步:

Observation: Stage 已 Home
Thought: 可以执行移动
Action: stage_move(100, 50)

第四步:

Observation: Stage 移动成功
Thought: 任务完成

如果把这个过程画出来,其实就是:

思考 → 行动 → 观察 → 再思考

这和 ReAct 的循环结构是完全一致的。


所有 Agent 系统,本质都绕不开这个循环

不管是:

  • LangGraph
  • AutoGen
  • CrewAI

底层其实都离不开这个结构。

差别只是在于:

有些系统在这个循环上增加了更多能力,比如:

  • Memory
  • Planning
  • Multi-Agent
  • Workflow

但如果把这些东西都拿掉,剩下的核心,其实还是这个 Agent Loop