2024年10月13日

单智能体与多智能体

单智能体是一个核心 Agent 统一负责规划、工具调用和结果整合；多智能体则把任务拆给多个角色化 Agent，通过 supervisor、handoff 或 group chat 完成协作。

知识库大模型智能体与工具调用agentmulti-agent

单智能体与多智能体

先说结论

单智能体是一个核心 Agent 统一负责规划、工具调用和结果整合；多智能体则把任务拆给多个角色化 Agent，通过 supervisor、handoff 或 group chat 完成协作。

为什么我会单独记这一篇

随着任务变复杂，一个 Agent 往往会遇到：

上下文过载。
角色混杂，既要规划又要执行又要评审。
工具和权限边界不清。

多智能体的目标，是把复杂任务拆成更清晰的角色和责任边界；但它的代价是更高的协调复杂度。

核心机制

单智能体常见范式

ReAct
Plan-and-Execute
Tool-augmented reasoning

多智能体常见协作模式

Supervisor：总控 Agent 分发任务，子 Agent 执行。
Handoff：当前 Agent 把控制权交给下一个专家 Agent。
Group chat：多个 Agent 在共享会话里协商。
Map-reduce：并行解决子问题后再汇总。

关键对比

维度	单智能体	多智能体
架构复杂度	低	高
调试难度	低	高
成本	较低	较高
角色边界	弱	强
并行能力	弱	强
上下文负载	容易过载	可拆分

设计时真正要权衡什么

简单性 vs 专家分工：任务不复杂时，单智能体往往更优。
统一上下文 vs 分治协作：统一更简单，分治更可扩展。
单一权限域 vs 多角色分权：后者更安全，但编排更复杂。

容易踩的坑

任务规模不大却硬上多智能体，复杂度高于收益。
子 Agent 权限重叠，角色区分只停留在 prompt 名字上。
多 Agent 共享过多上下文，导致互相污染。
handoff 协议不清楚，导致状态丢失。
group chat 讨论很多，但没有明确终止条件和最终签发者。

工程落地时我会怎么做

默认从单智能体开始，只有在明显需要专家分工、并行执行或差异化权限时再升多智能体。
多智能体一定要定义清楚：谁路由、谁能调哪些工具、谁负责最终结果、什么条件终止。
更推荐 supervisor 或 handoff，不建议直接把无约束 group chat 上线。
共享状态要结构化，不能只靠自然语言转述。
对每个 Agent 建立清晰权限边界和 token 预算。

如果要对外讲，可以怎么概括

“单智能体和多智能体不是谁更高级，而是谁更匹配任务。大多数任务单智能体就够了，因为它更简单、更便宜、更好调。只有当任务天然存在专家分工、可并行子任务或者权限差异时，多智能体才真正有收益。否则很容易出现‘大家都在说，没人真正做事’。”

最后记几条

默认先从单智能体开始。
多智能体的收益来自角色边界和并行能力。
多智能体的代价是协调和可观测性复杂度。
supervisor 与 handoff 往往比开放 group chat 更实用。
多智能体一定要有结构化共享状态。

参考资料

延伸阅读

大模型总索引