多智能体(Multi-Agent)架构选型:四种模式,一张图看懂

多智能体(Multi-Agent)架构选型:四种模式,一张图看懂

摘要(先看结论)

多智能体不是“更高级”,而是用更高的系统复杂度换取:上下文隔离、并行化、分工协作、长流程可控。

  • 仍然能用“单 Agent + 好工具”解决:不要上多智能体
  • 需要强控制权 + 上下文隔离:选 Subagents(主-子集中编排)
  • 需要单 Agent 多专业化且保持交互简单:选 Skills(按需加载)
  • 需要多阶段顺序流程(每阶段职责清晰):选 Handoffs(状态驱动交接)
  • 需要多领域并行查询 + 合成答案:选 Router(路由分发 + 汇总)

一句话口诀:并行找 Router,顺序走 Handoffs,强控用 Subagents,轻量用 Skills。


先把三个词说清楚:Context / State / Tools

  • Context:模型每次调用能“看到”的输入(system prompt + history + reference),天然会变长、会漂移、会浪费 Token
  • State:系统保存的结构化进度(通常是 JSON/DB),描述“任务进行到哪了、已确认什么、下一步做什么”
  • Tools:确定性动作(查库/下单/发邮件/运行脚本),应该具备幂等、超时、错误码与可观测

多智能体的工程价值,本质是把:

  • “靠模型自己从上下文里悟出来该做什么”
  • 变成
  • “靠状态与契约决定下一步、靠工具做确定性动作”

什么时候需要从单 Agent 升级

  • Prompt 越写越长:塞了太多领域知识,Token 浪费 + 注意力被稀释
  • 任务跨度变大:一次请求要跨多个系统/团队/领域协作
  • 对吞吐/延迟有要求:希望并行查多个源或并行跑多个子任务
  • 长流程要可控:必须支持分阶段、可回滚、可恢复、可审计

把它更“工程化”地说:不是因为 Prompt 变长就一定要多智能体,而是出现了这些不可绕过的系统约束

单 Agent 常见痛点(症状) 触发的系统约束(原因) ────────────────────── ───────────────────── Prompt 越写越长/越难控 ───────────▶ 需要上下文隔离(Context Isolation) 一次请求跨多个系统/团队 ───────────▶ 需要分工协作(Distributed Ownership) 要同时查多个源/跑多个子任务 ─────────▶ 需要并行化(Parallel Fan-out) 流程分阶段且要可恢复/可审计 ─────────▶ 需要状态机(State Machine) 

升维前先问 4 个 Yes/No(只要命中 1 个“硬约束”,再考虑多智能体):

  • 你是否必须把某些领域知识与对话历史隔离开,否则质量会明显下降?
  • 你是否必须把能力拆给不同团队独立维护、独立发布?
  • 你是否必须把 2+ 个子任务并行执行,才能满足延迟/吞吐?
  • 你是否必须把流程做成可恢复的状态机(阶段、回滚、审计)?

四种模式(每种都用同一套模板理解)

方案一:Subagents(集中式编排)

  • 工作机制:主智能体(Supervisor/Main Agent)维护对话 Context 与编排;子智能体作为“工具”被调用,通常无状态、专注单一领域
  • 最佳场景:多领域协作,需要集中式工作流控制 + 强上下文隔离,子智能体无需直接与用户对话
  • 核心权衡:每次子调用都要“出去一趟再回来” → 延迟/Token 上升,但换来严格控制权与清晰边界
  • 你要补的工程能力:主编排层(任务拆解/并发/汇总)、子智能体输入输出契约、子调用可观测与限流
User Request ──▶ Main Agent (Supervisor, owns Context) │ ┌───────────┼───────────┐ │ │ │ ▼ ▼ ▼ Subagent A Subagent B Subagent C (Calendar) (Mail) (CRM) │ │ │ └─────── results merged ────────┘ ▼ Final Response 

方案二:Skills(渐进式揭示 / 按需加载)

  • 工作机制:同一个 Agent 按需加载“技能包”(短规则 + reference + scripts),临时切到某个专业流程
  • 最佳场景:单 Agent 多专业化,但仍要保持“用户直连”的交互体验(编码/写作/排障)
  • 核心权衡:简单、迭代快;但技能用多了,history 累积 → Token 膨胀、模型漂移
  • 你要补的工程能力:按需加载与裁剪(reference 分层、历史压缩)、技能的触发条件与禁止事项、输出格式强约束
User │ ▼ Agent ├─ load(skill: code-review) ──▶ follow fixed output ├─ load(skill: db-debug) ──▶ read reference/* if needed └─ load(skill: release) ──▶ run scripts/* if needed (conversation history grows if不裁剪) 

方案三:Handoffs(状态驱动交接)

  • 工作机制:系统维护显式 state(phase、facts、artifacts、nextActions…);当前活跃 Agent 完成本阶段后,把控制权交给下一阶段 Agent
  • 最佳场景:多阶段顺序工作流(客服/审批/排障/交付),每个阶段职责边界清晰
  • 核心权衡:流程可控、衔接自然;但 state 设计与一致性要求高,交接必须保证信息不丢失
  • 你要补的工程能力:state schema(字段/版本/持久化)、幂等与重试、阶段级观测与恢复策略

先用一句话理解:不是“谁更聪明就继续聊”,而是“state.phase 变了就换人做下一步”。

┌───────────────┐ handoff ┌───────────────┐ handoff ┌───────────────┐ │ Agent A │───────────▶│ Agent B │───────────▶│ Agent C │ │ (Collect Info) │ │ (Execute) │ │ (Verify/Close) │ └───────┬────────┘ └───────┬────────┘ └───────┬────────┘ │ update state │ update state │ update state ▼ ▼ ▼ state.phase=collect state.phase=execute state.phase=verify 

state 通常长这样(示意):

{"ticketId":"T-123","phase":"execute","facts":{"user":"u_001","device":"iOS","errorCode":"AUTH_403"},"artifacts":{"diagnosis":"token expired","toolResults":["reset_token:ok"]},"nextActions":["ask_user_relogin","verify_login_success"],"retry":{"count":1,"max":3}}

方案四:Router(路由分发 + 汇总合成)

  • 工作机制:Router 先分类/意图识别,再并行分发给多个专业 Agent;最后由汇总器合成最终结果
  • 最佳场景:企业级知识库、多垂直领域检索、多源比对(要并行“查”和“算”)
  • 核心权衡:无状态、一致性好、天然并行;但需要额外路由与合成层,路由误判会放大到最终答案
  • 你要补的工程能力:路由置信度与回退策略、并发控制与缓存、合成器(证据对齐/冲突消解)
 ┌──────────────┐ User ──────▶│ Router │ └──────┬────────┘ │ fan-out (parallel) ┌─────────┼──────────┐ │ │ │ ▼ ▼ ▼ Agent DomainA AgentB AgentC │ │ │ └─────────┴──────────┘ ▼ ┌──────────────┐ │ Aggregator │ └──────────────┘ ▼ Final Answer 

一张表对比(选型时只看这张也够)

模式分布式开发并行多跳顺序直接用户交互主要成本主要风险
Subagents弱(一般不直连)往返调用次数↑延迟、编排复杂度
Skillshistory 变长 Token↑技能污染上下文、漂移
Handoffs中/强状态管理成本↑交接丢信息、状态不一致
Router弱/中路由+合成开销路由误判、合成偏差

怎么选(决策树)

先问一句:单 Agent + 工具 + 约束化输出 是否已足够? └─ 是 → 先不升维 └─ 否 → 你的核心矛盾是什么? ├─ 要强控制 + 上下文隔离 + 多领域协作 → Subagents ├─ 要保持直连交互 + 按需专业化 → Skills ├─ 要分阶段顺序推进 + 进度可恢复可审计 → Handoffs └─ 要并行查多源 + 汇总合成 → Router 

三个典型场景(模式怎么落到业务)

场景更优模式为什么你要提前付的成本
一次性请求(单工具)Skills / 单 Agent需求简单,别为架构加延迟控制 history 增长
多阶段客服/审批Handoffs阶段边界清晰,进度可追踪state schema + 恢复策略
企业知识检索与比对Router天然并行,多源合成路由准确率 + 合成策略

客户端落地要点(端侧视角)

  • 体验预算:并行/多轮会拉长等待;必须有阶段进度、可取消、可恢复
  • 弱网与失败:超时/重试/幂等/降级要统一;错误码对齐到 UI 文案与引导
  • 可观测性:按 phase 记录耗时/失败/重试/取消;能追踪到子智能体/路由分支
  • 成本控制:对 fan-out 做限流;对 skills 做按需读取与历史裁剪;对 router 做缓存
  • 发布与回滚:所有分支要可灰度;关键开关尽量收敛到主编排层

最小实践清单(你要交付什么)

  • 写清楚“为何升到多智能体”:约束来自哪里(隔离/并行/状态/协作)
  • 为每个分支定义契约:输入/输出/错误码/证据包(日志、埋点、截图)
  • 设计 state(若选 Handoffs):phase、facts、artifacts、nextActions、retry、audit
  • 做可观测:阶段耗时、失败恢复率、取消率、路由命中率、合成一致性
  • 做回归与兜底:子调用失败如何降级;合成失败如何最小可用输出

参考

  • https://mp.weixin.qq.com/s/tuG5sqLhFpbsxN1Mo8juig

Read more

Flutter for OpenHarmony:Flutter 三方库 postgrest — 鸿蒙端直接访问 PostgreSQL 数据库的极速连接器

Flutter for OpenHarmony:Flutter 三方库 postgrest — 鸿蒙端直接访问 PostgreSQL 数据库的极速连接器

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net 前言 在开发 Flutter for OpenHarmony 应用时,传统的“端-接口-数据库”模式往往显得过于沉重。 如果只是为了实现基础的增删改查,却需要编写大量的后端 API 逻辑、处理复杂的 SQL 拼写以及繁琐的 JSON 打包,这不仅增加了开发成本,也导致系统在面对业务变动时极其脆弱。 postgrest 正是解决这一痛点的利器。它是专门为 PostgREST(一个能将 PostgreSQL 数据库直接转换为 RESTful API 的高性能网关)打造的 Dart 客户端驱动。通过它,开发者可以在鸿蒙端以类似于编写 SQL 的语义,直接完成对云端数据库的高级检索与操作。 今天,我们将深入探讨如何利用该库在鸿蒙平台上实现“零接口开发”的数据交互体验。 一、原理解析 / 概念介绍

Node.js 后端开发全解析:从核心原理架构到实战应用

Node.js 后端开发全解析:从核心原理架构到实战应用

文章目录 * 前言 * 一、 核心原理与架构 * 1.1 Node.js 架构分层 * 1.2 事件循环机制 * 二、 后端架构设计 * 2.1 经典 MVC 分层架构 * 2.2 API 请求处理流程 * 三、 实战应用 * 3.1 技术栈选型 * 3.2 代码实现示例 * 四、 优势与劣势分析 * 4.1 优势 * 4.2 劣势 * 五、 总结与建议 前言 Node.js 的出现让 JavaScript 走出了浏览器,成为了全栈开发的核心技术。以下将从核心原理架构、后端架构设计、

给数据“立规矩” —— MySQL 新手必学的表约束全指南

给数据“立规矩” —— MySQL 新手必学的表约束全指南

🔥海棠蚀omo:个人主页                 ❄️个人专栏:《初识数据结构》,《C++:从入门到实践》,《Linux:从零基础到实践》,《Linux网络:从不懂到不会》,《MySQL:新手入门指南》                 ✨追光的人,终会光芒万丈 博主简介: 目录 一.为什么要有表的约束? 二.表的约束 2.1空属性 2.2默认值 2.3列描述 2.4zerofill 2.5主键 2.5.1复合主键 2.6自增长 2.7唯一键 5.8外键 前言: 在上一篇文章中我们讲解了MySQL中的各种数据类型,那么正是因为有了各种数据类型,才会有今天我们要讲的表的约束相关知识,那么这中间到底是怎么回事呢?下面我们就一起来看看吧。 一.为什么要有表的约束? 在上一篇文章中,我们认识了很多的数据类型,并在它们的下面我们也通过例子进行了演示,