惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Cloudbric
Cloudbric
E
Exploit-DB.com RSS Feed
SecWiki News
SecWiki News
Forbes - Security
Forbes - Security
N
News | PayPal Newsroom
S
Security @ Cisco Blogs
Schneier on Security
Schneier on Security
V
V2EX - 技术
S
Secure Thoughts
W
WeLiveSecurity
Google DeepMind News
Google DeepMind News
C
CERT Recently Published Vulnerability Notes
NISL@THU
NISL@THU
S
Securelist
S
Security Archives - TechRepublic
Know Your Adversary
Know Your Adversary
V
Vulnerabilities – Threatpost
Security Latest
Security Latest
Recent Commits to openclaw:main
Recent Commits to openclaw:main
G
GRAHAM CLULEY
H
Hacker News: Front Page
Microsoft Azure Blog
Microsoft Azure Blog
I
Intezer
Google Online Security Blog
Google Online Security Blog
美团技术团队
阮一峰的网络日志
阮一峰的网络日志
T
The Exploit Database - CXSecurity.com
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
Webroot Blog
Webroot Blog
Jina AI
Jina AI
Engineering at Meta
Engineering at Meta
P
Proofpoint News Feed
The Cloudflare Blog
I
InfoQ
L
LangChain Blog
U
Unit 42
P
Proofpoint News Feed
S
Schneier on Security
S
Security Affairs
Y
Y Combinator Blog
T
Tenable Blog
N
News and Events Feed by Topic
MyScale Blog
MyScale Blog
量子位
Google DeepMind News
Google DeepMind News
Cyberwarzone
Cyberwarzone
博客园 - 聂微东
D
Darknet – Hacking Tools, Hacker News & Cyber Security
GbyAI
GbyAI
AWS News Blog
AWS News Blog

博客园 - bonelee

最近2年前沿的agent智能体安全前沿技术研究 最近2年前沿的LLM推理安全前沿技术研究 最近2年前沿的RAG安全前沿技术研究 大模型安全:共享 GPU 本地内存泄露 大模型安全:提示注入(Prompt Injection) AI Agent 安全:生成内容不可追溯(水印窃取与擦除) AI Agent 安全:RAG 数据投毒 AI Agent 安全:MCP 工具相关安全威胁 AI Agent 安全:输入操纵攻击 AI Agent 安全:非预期远程代码执行(RCE)与代码注入攻击 大模型安全:模型窃取 大模型安全:安全大模型的部署环境威胁 大模型安全:模型加载过程的代码执行 AI大模型里的供应链攻击和典型案例 通过投毒打破模型输出长度限制实现DOS的方法——DENIAL-OF-SERVICE POISONING ATTACKS ON LARGE LANGUAGE MODELS 大模型微调后原有能力下降如何解决? 多智能体安全——Multi-Agent Security Tax: Trading Security and Collaboration 智能体安全——LLM-KG Framework for Robot Intention Prediction 文章要点总结 智能体安全—— intent detection in the age of llms 文章要点总结
智能体安全——Multi-Agent LLM Collaboration: A Comprehensive Survey
bonelee · 2025-07-12 · via 博客园 - bonelee

Multi-Agent LLM Collaboration: A Comprehensive Survey

主要探讨了基于大型语言模型(LLM)的多智能体系统(MAS)中的协作机制。它们概述了MAS的概念及其优势,例如解决复杂任务和提升集体智能。文章详细阐述了智能体之间协作的不同方式,包括合作、竞争和竞合等类型,以及规则、角色和模型等策略。此外,还分析了中心化、去中心化和分层等通信结构。最终,这些来源识别了该领域面临的挑战,例如统一治理、共享决策和可扩展性问题,并展望了未来的研究方向。

LLM驱动的多智能体系统(MAS)协作机制总结

本研究对**大型语言模型(LLM)驱动的多智能体系统(Multi-Agent Systems, MAS)**中的协作机制进行了全面调查,并提出了一个可扩展的协作框架,为未来的研究与应用提供指导。

一、研究动机与目标

1. LLM的局限性

尽管LLM在创意写作、推理和决策等任务中表现出色,但仍存在以下问题:

  • 幻觉问题 :生成内容可能偏离事实;
  • 自回归特性限制 :“快思考”模式难以进行深度逻辑推演;
  • 扩展定律瓶颈 :模型性能提升受限于参数规模和训练数据。

2. Agentic AI的兴起

Agentic AI通过将LLM作为核心“大脑”,结合外部工具、规划能力等模块,使智能体具备行动能力和环境交互能力。

3. 多智能体协作的必要性

单一LLM难以应对复杂任务,因此研究人员探索横向扩展——多个LLM智能体协同工作,实现集体智能 。

4. 研究目标

提供LLM驱动MAS协作机制的全景视角,聚焦有效协作的关键技术和设计原则,推动更智能、更具协作性的AI系统发展。

二、核心概念定义

1. 多智能体系统(MAS)

  • 定义 :由多个相互作用的智能体组成的计算机系统。
  • 关键组成 :
    • 智能体(角色、能力、行为、知识模型);
    • 环境(外部世界);
    • 交互机制(通信语言);
    • 组织结构(分层/分布式控制)。
  • 特点 :
    • 灵活性与可伸缩性;
    • 鲁棒性与协调性;
    • 实时操作能力;
    • 分工协作提高效率。

2. 大型语言模型(LLM)

  • 定义 :基于Transformer架构、大规模语料库训练的人工神经网络(数十亿至万亿参数)。
  • 核心优势 :
    • 规模大、涌现能力强(如零样本学习、类比推理);
    • 可作为MAS中各智能体的“大脑”。
  • 应用场景 :
    • 推理、语言理解、意图识别等复杂任务。

3. 协作式AI

  • 定义 :旨在与其他AI或人类协同工作的AI系统。
  • 发展方向 :
    • 多智能体间主动协作可显著提升系统效能;
    • 协作形式包括合作、竞争、竞合等多种机制。

4. 智能体与协作系统定义

  • 智能体表示 :
    a={m,o,e,x,y} ,其中:
    • m : AI模型;
    • o : 目标;
    • e : 环境;
    • x : 输入感知;
    • y : 输出/动作。
  • MAS协作系统表示 :
    S={A,Ocollab,E,C} ,其中:
    • A : 智能体集合;
    • Ocollab : 共享目标;
    • E : 共享环境;
    • C : 协作通道集合(按参与者、类型、结构、策略区分)。

三、协作机制框架维度

该协作框架从以下几个维度描述多智能体系统的协作机制:

1. 参与者(Actors)

  • 涉及的所有LLM智能体及其角色。

2. 类型(Types)

3. 结构(Structures)

4. 策略(Strategies)

5. 协调协议(Coordination Protocols)

四、MAS应用领域

1. 5G/B6G与工业5.0

  • LLM用于增强语义解码器,提升编码增益和鲁棒性;
  • 支持资源分配与信号处理优化。

2. 问答与自然语言生成(QA/NLG)

  • 通过MAS集成LLM显著提升生成质量;
  • 主要框架包括:
    • OpenAI Swarm (任务交接机制);
    • Microsoft Magentic-One System (高层规划);
    • IBM Bee Agent Framework (模块化工作流);
    • LangChain Agents (复杂推理支持);
  • 新评估框架:
    • Agent-as-a-Judge (评估其他智能体);
    • Benchmark Self-Evolving (自我演化测试);
  • 合成数据生成:如Orca-AgentInstruct缓解训练数据不足。

3. 社会与文化模拟

  • 社会互动模拟 :智能体扮演角色,展现对话、心智理论、非语言推理等能力;
  • 文化应用 :代表多元文化视角,促进跨文化理解;
  • 局限性 :
    • LLM无法完全模拟人类复杂行为;
    • 在信息不对称或冲突任务中表现有限。

五、开放问题与讨论

1. 迈向人工集体智能

  • 统一治理机制 :如何协调任务分配与决策;
  • 集体决策机制 :提升多样性和公平性;
  • 数字物种挑战 :LLM非为协作设计,易产生幻觉与对抗攻击;
  • 可伸缩性难题 :随着智能体数量增加,协调难度上升;
  • 意外泛化能力 :理解群体行为的涌现机制是关键。

2. 综合评估与基准测试

  • MAS评估标准尚不统一;
  • 需要涵盖系统性能、协作效率、情境适应性等指标;
  • 缺乏动态基准系统。

3. 伦理风险与安全问题

  • 幻觉信息可能在MAS中传播放大;
  • 智能体可能被操控执行有害行为;
  • 对AI赋予类人品质可能导致过度依赖。

六、经验教训总结