智能体的角色定位和身份演化 (Agent Role Orientation and Identity Evolution)

中文博客 on 范叶亮 | Leo Van

多智能体系统 (Multi-Agent System) 确定性和掌控欲 - 你的 AI 不是你的 AI LLM Token 消耗节省计划 (How to Save Token for LLM) 本地部署 OpenClaw，QwenPaw 和 Hermes Agent (Local Deployment of OpenClaw, QwenPaw and Hermes Agent) 本地部署智能体 - OpenClaw，QwenPaw，Hermes Agent ... 部署 Matrix 服务器 Synapse (Deployment of Matrix Server Synapse) 部署 frp 内网穿透服务 (Deployment of frp NAT Traversal Service) 本地部署大模型服务 (Local Deployment of LLM Services) AI 时代的生产力和生产关系 (Forces and Relations of Production in AI Era) 业余无线电入门 - CQ, CQ, CQ, this is BD1CZP. Calling CQ and standing by. 重构 - 之于代码、之于工作、之于生活大语言模型微调 (Fine-tuning Large Language Models) 提升图片分辨率和质量 - Invoke AI 101 教程使用画布创建和组合生成新的图片 - Invoke AI 101 教程探索 AI 模型和概念适配器 - Invoke AI 101 教程理解图像到图像和降噪过程 - Invoke AI 101 教程使用控制层和指示控制图片的生成 - Invoke AI 101 教程使用 Invoke 创作你的第一张图片 - Invoke AI 101 教程在 OpenWrt 和群晖中自动申请和部署证书凡人歌 - 凡人，但不要烦心 Shell 调用方式 fork，exec 和 source (Run Shell with fork, exec and source) 重定向和管道 (Redirect and Pipe) 模型压缩和推理加速 (Model Compression and Inference Acceleration) 我们需要多少种编程语言 (How Many Programming Languages do We Need) 数据可视化小贴士 - 面向动态文档生成，秉承规范、统一和实用的理念从 rm -rf * 说起 - 喜新、怀旧、再出发当我谈摄影时，我谈些什么 - 色彩篇 Part 1 CSS 布局和定位 (CSS Layout and Position) 当我谈修图时，我谈些什么 - 色彩篇 Part 1 在 Windows 下利用 WSL2 和 Ubuntu 配置 GPU 机器学习环境文学编程和可重复性研究 (Literate Programming and Reproducible Research) 在 OpenWrt 中安装 Jellyfin 搭建家庭影音中心自私和贪婪 (Selfish and Greedy) 评分和排名算法 (Rating & Ranking Algorithms) 小记这一波裁员浪潮基于内容的图像检索 (Content-based Image Retrieval, CBIR) 你所应该知道的 A/B 测试 (A/B Test You Should Know) 一个人的摩旅 (Travel with My Motorcycle Alone) 设计语言初探 (A Glimpse of Design Language) Spark 集群搭建 (Spark Cluster Setup) Hive 安装和配置 (Hive Setup) Hadoop 集群搭建 (Hadoop Cluster Setup) 虚拟环境准备 (Virtual Environment Preparation) 大数据 SQL 性能调优 (Big Data SQL Performance Tuning) SQL 样式指南 (SQL Style Guide) 进程，线程和协程 (Process, Thread and Coroutine) - 实现篇进程，线程和协程 (Process, Thread and Coroutine) - 理论篇胶囊网络 (Capsule Network) 投票公平合理吗？图存储与计算 (Network Storage and Computing) - 复杂网络系列网络算法 (Network Algorithms) - 复杂网络系列真实世界网络结构 (Structure of Real-World Network) - 复杂网络系列网络表示，测度和度量 (Network Representation, Measures and Metrics) - 复杂网络系列文本相似度 (Text Similarity) 而立之前 (Life before 30) 最近邻搜索 (Nearest Neighbor Search) 无模型策略预测和控制 - 时序差分学习 (Model-Free Policy Prediction and Control - Temporal Difference Learning) - 强化学习系列无模型策略预测和控制 - 蒙特卡洛方法 (Model-Free Policy Prediction and Control - Monte-Carlo Learning) - 强化学习系列利用动态规划求解马尔可夫决策过程 (Planning by Dynamic Programming) - 强化学习系列贝叶斯优化 (Bayesian Optimization) 马尔可夫决策过程 (Markov Decision Process) - 强化学习系列多臂赌博机 (Multi-armed Bandit) - 强化学习系列强化学习简介 (Introduction of Reinforcement Learning) - 强化学习系列在群晖 NAS 上编译安装 tmux 隐马尔可夫，条件随机场和序列标注 (Hidden Markov Model, Conditional Random Fields and Sequence Labeling) 图嵌入和图神经网络 (Graph Embedding and Graph Neural Network) 预训练自然语言模型 (Pre-trained Models for NLP) toB 产品用户权限 (User Privileges of toB Products) 京东数科 HIPO 学习之旅 (JDD HIPO Learning Journey) 杭州和东京之旅 (Tour of Hangzhou and Tokyo) 国际智慧温室种植挑战赛 (International Autonomous Greenhouse Challenge) 记忆中的儿时 (My Childhood in Memory) 启发式算法 (Heuristic Algorithms) 关不掉的浏览器标签页 (Browser Tabs You do not Close) 贝塞尔曲线 (Bézier Curve) 如何阅读一本书 (How to Read a Book) 相似性和距离度量 (Similarity and Distance Measurement) 集成学习算法 (Ensemble Learning) 计算复杂性与动态规划 (Computational Complexity and Dynamic Programming) 利用 Flask 和 Google App Engine 部署模型服务序列到序列和注意力机制 (Seq2Seq and Attention Machanism) 词向量 (Word Embeddings) 循环神经网络 (Recurrent Neural Network, RNN) 泰国之行 (Tour of Thailand) 媒介之战 (War of Medias) 卷积神经网络 (Convolutional Neural Network, CNN) 买书，囤书，看书 (Buy Books, Hoard Books and Read Books) Play Safe, Smart Choice & Yuppie 基于 PyQt5/PySide2 和 QML 的跨平台 GUI 程序开发流形学习 (Manifold Learning) 深度学习优化算法 (Optimization Methods for Deep Learning) 深度学习优化算法 (Optimization Methods for Deeplearning) 生成对抗网络简介 (GAN Introduction) Ising 模型，Hopfield 网络和受限的玻尔兹曼机 (Ising, Hopfield and RBM) 马尔科夫链蒙特卡洛方法和吉布斯采样 (MCMC and Gibbs Sampling) 特征值分解，奇异值分解和主成分分析 (EVD, SVD and PCA) 墨尔本之行 (Trip to Melbourne)

范叶亮 · 2026-04-19 · via 中文博客 on 范叶亮 | Leo Van

智能体的角色定位和身份演化

Agent Role Orientation and Identity Evolution

分类: AI, Tech101, 教程 / 字数: 3262 / 标签: 人工智能, AI, 智能体, ReAct, 个人助理, 数字员工, 数字分身, Harness Engineering, 机器人三定律

随着 OpenClaw 的爆火，智能体（Agent）一词已经成了大家每天都挂在嘴边儿上的话。从“智能体”成为 2025 年度科技热词以来，说这个词被滥用或许略显激进，但当一个词进入寻常百姓家时，或许我们应该重新审视一下到底什么是智能体，这个硅基生物之于我们碳基生物又是什么角色，“它”又是如何在改变着我们的生活呢？

智能体

我搜集了互联网上对于智能体的定义：

智能体（Agent）

智能体指一个可以观察周遭环境并作出行动以达到目标并且可以通过机器学习以及获取知识来提升自身性能的自主实体。 —— 维基百科

智能体是一种接收输入、解读输入，然后代表用户（无论是人类还是其他智能体）规划和执行操作的系统。 —— web.dev

AI 智能体是使用 AI 来实现目标并代表用户完成任务的软件系统。其表现出了推理、规划和记忆能力，并且具有一定的自主性，能够自主学习、适应和做出决定。 —— Google Cloud

智能体是一个系统，它利用人工智能模型与环境交互，以实现用户定义的目标。它结合推理、规划和动作执行（通常通过外部工具）来完成任务。 —— Hugging Face

如 ReAct 框架 ¹ 所述，智能体的主要特点如下：

推理：此核心认知过程涉及使用逻辑和可用信息来得出结论、进行推断及解决问题。具有强大推理能力的 AI 智能体可以分析数据、识别模式，并根据证据和上下文做出明智的决策。
行动：根据决策、计划或外部输入采取行动或执行任务的能力对于 AI 智能体与其环境进行互动和实现目标至关重要。这可能包括具身 AI 的物理动作，或发送消息、更新数据或触发其他流程等数字操作。
观察：通过感知或感应收集有关环境或情况的信息，对于 AI 智能体了解上下文并做出明智的决策至关重要。这可能涉及多种感知形式，例如计算机视觉、自然语言处理或传感器数据分析。
规划：制定战略计划以实现目标，是智能行为的一个关键方面。具有规划能力的 AI 智能体可以确定必要的步骤、评估潜在行动，并根据可用信息和预期结果选择最佳行动方案。这通常需要预见未来的状态，并考量可能遇到的障碍。
协作：在复杂且动态的环境中，与他人（无论是人类还是其他 AI 智能体）有效协作来实现共同目标变得越来越重要。协作离不开沟通、协调，以及理解并尊重他人观点的能力。
自我完善：自我改进和自适应能力是高级 AI 系统的标志。具有自我完善能力的 AI 智能体可以从经验中学习，根据反馈调整行为，并随着时间的推移不断提升性能和能力。这可能涉及机器学习技术、优化算法或其他形式的自行修改。

角色定位

以 OpenClaw 为例的智能体，其能力足够丰富，在企业实践中不同场景需要不同类型的智能体以便更好（例如：更快速、更安全等）地服务其目标客户。从业务视角出发在此将智能体划分为个人助理、数字员工和数字分身三类，这三类的差异对比如下：

角色	个人助理	数字员工	数字分身
服务对象	个人	他人	个人
所有权	个人	多种 ²	个人
身份	智能体自己	智能体自己	所有权人
定位	帮助所有权人处理个人需求	帮助所有权人处理他人需求	帮助所有权人以所有权人身份处理需求
示例	帮自己搜集信息	帮服务对象查询天气	帮自己去参加在线会议

结合 OpenClaw 的定义（OpenClaw is a self-hosted gateway …, and it becomes the bridge between your messaging apps and an always-available AI assistant. ³），其更符合个人助理的角色定位。数字分身相比另外两个角色最大的特点是其身份代表的是所有权人，除了技术实现难度外，更重要的是伦理问题。当数字员工出现问题时，是应该所有权人为其负责还是技术服务提供者为其负责呢？这个问题类似智能驾驶，当出现交通事故时，是应该由驾驶员承担责任还是自动驾驶服务提供商承担责任呢？目前来看，几乎全部责任仍是由驾驶人员承担。

从技术视角出发，个人助理和数字员工两个重要角色差异对比如下：

角色	个人助理	数字员工
知识	私有 + 共有	共有 + 权限管控
数据	私有 + 共有	共有 + 权限管控
技能	私有 + 共有	共有 + 权限管控
渠道	私有	共有 + 权限管控
定制化	程度高	程度低
核心目的	节省自己的资源（时间等）	节省组织的资源（人力等）

不难看出，个人助理和数字员工的一个核心差异在于权限。个人助理的权限管控并不在智能体内部实现，也就是说当你有某个权限的时候，只要你想个人助理就可以有，权限的边界在智能体之外。但数字员工的权限管控需要在智能体内部实现，数字员工使用同一个渠道对外提供服务，我们必须根据服务对象的不同采取不同的操作。个人助理是可以高度化定制的，只要你想怎么搞都是你自己的事。但数字员工受限就会很多，因为要面向多人服务，我们需要考虑响应的时效性、服务的稳定性、数据的安全性等等。

个人助理解决的是个人的长尾事务，只有将自己从重复繁琐的任务解放出来，我们才能够有更多的时间去思考更重要的事情。而数字员工解决更多的是通用类型的事务，这样才能够服务更多的用户，从而提高组织效能。

身份演化

其实我们也无需将个人助理和数字员工割裂来看，在个人助理上做一些适当的加减法就可以让其变成数字员工，同时数字员工之于个人助理也可以看作是一项技能而为其所用。我个人认为从个人助理进化到数字员工是一个先做减法再做加法的过程。

当前的个人助理已经是一个可以高度定制同时具有一定自主能力的智能体。在企业应用过程中，基于安全等因素的考虑我们必须在一定程度上限制其灵活性，才能够一方面高效的满足用户需求另一方面避免其成为一匹脱缰的野马。换句话说就是从个人助理的执行优先转变到数字员工的治理优先。这里感觉和当下的 Harness Engineering 有些许呼应，Harness 给到了系统运转的最佳范式，但同时也指定了相应的约束机制。约束的方式（代码层、Prompt 层、Skill 层）和约束的强度影响着任务执行的灵活程度。

图片来源：https://zhuanlan.zhihu.com/p/2020772553333941162

正如员工在进入组织前期，他首先要学习的就是组织的规章制度，什么可以做，什么不可以做。当员工对组织的要求清晰之后，才会被允许从事更加复杂的工作，才会被赋予更多的自主权。在这个过程中组织仍会定期观测，同时对必要的问题做出反馈并要求员工进行修正。在此也收集了智能体 ⁴、数字员工 ⁵ 和自动驾驶 ⁶ 的分级对比：

级别	自动驾驶	智能体	数字员工
L1	辅助驾驶车辆对方向盘和加减速中的一项操作提供驾驶，人类驾驶员负责其余的驾驶动作。	规则符号智能意图 + 行动	功能级-辅助工具作为工具被调用，人类执行并闭环任务。
L2	部分自动驾驶车辆对方向盘和加减速中的多项操作提供驾驶，人类驾驶员负责其余的驾驶动作。	推理决策智能意图 + 行动 + 推理和决策	任务级-任务执行执行被分解的任务，人类拆解分配任务。
L3	条件自动驾驶由车辆完成绝大部分驾驶操作，人类驾驶员需保持注意力集中以备不时之需。	记忆反思智能意图 + 行动 + 推理和决策 + 记忆和反思	协作级-协作自治自主拆解及分配任务、闭环执行，人和数字员工协作，人类监督。
L4	高度自动驾驶由车辆完成所有驾驶操作，人类驾驶员无需保持注意力集中，但限定道路和环境条件。	自主学习智能意图 + 行动 + 推理和决策 + 记忆和反思 + 自主学习 + 泛化	指导级-专业指导提供达到人类专家水平的定制化服务，人类参与。
L5	完全自动驾驶由车辆完成所有驾驶操作，人类驾驶员无需保持注意力集中。	个性群体智能意图 + 行动 + 推理和决策 + 记忆和反思 + 自主学习 + 泛化 + 人格 + 协作	智慧级-自主智慧超越人类专家水平的能力，全面自主，人类授权。

我认为我们目前正处于 L3 至 L4 之间的一个地带，我相信在不久的将来我们可以突破 L4 迈入 L5。我希望 AI 会一直是为人所用，而不希望如之前博客所描述的人类成为 AI 的奴隶。引用一下阿西莫夫的机器人三定律，希望在生产力高速发展的同时我们也可以更多的关注一下 AI 可能引起的一系列社会和伦理问题。

机器人三定律

机器人不得伤害人类，或坐视人类受到伤害。
除非违背第一法则，机器人必须服从人类的命令。
在不违背第一及第二法则下，机器人必须保护自己。

此内容由惯性聚合(RSS阅读器)自动聚合整理，仅供阅读参考。原文来自 — 版权归原作者所有。

推荐订阅源

中文博客 on 范叶亮 | Leo Van

智能体

角色定位

身份演化