Eino ADK 核心 Agent 详解:ChatModelAgent 机制与实战
ChatModelAgent 是一个以 LLM 为决策核心、默认采用 ReAct 式循环来推进任务的 Agent。
很多人第一次看 ChatModelAgent,可能会下意识的认为:
不就是 ChatModel + Instruction + Tools 吗?
这句话不算错,但不全。
ChatModelAgent 在 ADK 里,承担的是'默认思考型 Agent'的角色。它不是单纯帮你调一次模型,而是把模型决策、工具调用、协作跳转、事件输出和扩展钩子,统一规范到一个可运行的 Agent 骨架里。
本篇不再重复 Runner / Console 多轮 这种入门动作,而是从以下 6 个更关键的问题入手:
ChatModelAgent 在 ADK 里到底是什么
- 它内部为什么是一个
ReAct 循环,而不是一次模型调用
ReturnDirectly / Exit / MaxIterations / OutputKey 这些字段到底解决什么问题
Tool、Transfer、AgentAsTool 到底怎么选
Middleware / Handler 为什么才是工程化分水岭
- 一个更贴后端场景的 Demo,应该怎么搭
1. 为什么很多人会把 ChatModelAgent 想简单
很多人一上来就把注意力放在这几个字段上:
然后得出一个很自然的结论:
这就是一个'会调模型、也会调工具'的配置对象。
但他的重点其实是另一层:
ChatModelAgent 是 ADK 里最核心、最常用的预构建 Agent 之一,它把'思考 + 决策 + 调工具 + 协作 + 输出事件'规范成了一个统一实现。
也就是说,它不是 ChatModel 的语法糖。
它解决的是:当一个 Agent 需要靠 LLM 自己判断下一步该答、该调工具、该转给别人、还是该退出时,系统应该怎么组织这段运行过程。
这也是为什么你会发现:
- 它有
ReAct 循环
- 它有
Transfer
- 它可以把别的 Agent 当 Tool
- 它有专门的
Handler
- 它还要把整个过程输出成
AgentEvent
如果只是'模型外面包一层',根本没必要长出这一整套能力。
2. ChatModelAgent 在 ADK 里到底是什么
官方定义很直接:
ChatModelAgent 是 Eino ADK 中的一个核心预构建 Agent,它封装了与大语言模型交互、并支持使用工具来完成任务的复杂逻辑。
这句话里最重要的词,不是'模型',而是'复杂逻辑'。
你可以把 ADK 里的几类 Agent 先粗分一下:
| 类型 | 主要职责 | 决策方式 |
|---|
ChatModelAgent | 负责思考、推理、工具调用、动态决策 | 由 LLM 决定 |
Workflow Agents | 负责顺序、循环、并行等固定流程 | 由预设流程决定 |
Supervisor / Plan-Execute | 负责多 Agent 协作范式封装 | 仍以内置 ChatModelAgent 为核心 |
Custom Agent | 负责高度定制的执行协议 | 由你自己实现 |
所以 ChatModelAgent 的位置,其实非常像默认的'脑子'。
当你的 Agent 需要:
- 根据上下文自行判断下一步动作
- 在回答和工具之间切换
- 在多个 Agent 之间转交任务
- 在运行过程中插入工程逻辑
那它通常就会成为第一个候选。
把这套关系放到运行时视角里,看起来会更清楚:
这张图里最该记住的是两点:
ChatModelAgent 不等于'模型输出一段话'
- 它真正对外暴露的是一整段可运行的决策过程
3. 其内部本质是一个 ReAct 循环
ChatModelAgent 的核心执行模式其实很清楚:它内部走的是 ReAct。
其内部是一个循环:
- 调模型,让模型先做判断
- 如果模型直接给答案,那就结束
- 如果模型发起 Tool Call,就执行工具
- 把工具结果回灌给模型
- 再让模型决定下一步
- 直到模型不再需要工具,或者 Agent 被强制结束
这套循环里,用以下四个词能直接对应上:
Reason:模型思考
Action:模型决定调用什么
Act:系统真的去执行动作
Observation:把动作结果喂回去
所以 ChatModelAgent 的关键,不在于'它能调工具'。
而在于:
它允许模型把一次复杂任务拆成多轮判断,而不是一口气把答案硬生成出来。
这也是它和我们直接手写一段 ChatModel.Generate(...) 的根本区别。
没有 Tool 时会怎样
可以这么说:
如果没有配置工具,ChatModelAgent 会退化为一次普通的 ChatModel 调用。
这意味着:
- 不是所有
ChatModelAgent 都一定会循环
- 只有当你给了工具、协作能力,或者模型真的产生 Tool Call,它才会进入完整的
ReAct 运行形态
为什么还需要 MaxIterations
ReAct 的好处是灵活,风险是兜不住时会一直绕。
所以 MaxIterations 本质上是一个保险丝。
默认值是 20。超过这个次数还没结束,Agent 会直接报错退出。
这在真实业务里非常有必要。否则你很容易遇到两种问题:
- 模型在几个工具之间来回试探,始终拖沓着
- Prompt 写得含糊,模型不知道该答还是该继续调工具
很多线上'为什么 Agent 一直在调用工具'的问题,本质上都不是框架 bug,而是没有把循环上限和结束策略设计清楚。
4. 哪几组配置真正决定了行为
Name / Description
这两个字段经常被初学者轻视。
但实际上它们比你想象的重要。
Name 是 Agent 的身份标识
Description 决定别的 Agent 会不会把任务转给它
尤其在 Transfer 场景里,Description 不是装饰品,而是模型判断'谁更适合接手这件事'的依据。
Instruction / Model
这两个字段是最直观的:
Instruction:Agent 的系统约束
Model:底层使用哪个 ChatModel
但有一点别搞混:
Instruction 决定行为风格,Model 决定能力底座。
ToolsConfig
这组配置是 ChatModelAgent 和普通模型调用真正拉开差距的地方。
其中有两个很关键的扩展字段起到了作用:
ReturnDirectly
EmitInternalEvents
ReturnDirectly
这个字段的意思是:
某些工具一旦被调用成功,就不要再把结果送回模型二次润色了,直接把结果带着返回。
这个能力特别适合两类场景:
- 工具结果本身就是最终答案
- 工具结果本身就是'交接单''审批单''跳转结果',再回模型反而会把结果弄脏
比如这篇后面 demo 里的 handoff_to_human,就很适合 ReturnDirectly。
EmitInternalEvents
这个配置只在 AgentAsTool 场景里有意义。
默认情况下,当你把一个 Agent 包成 Tool 后,外层只会拿到最终的 ToolResult,看不到内层 Agent 的事件流。
而 EmitInternalEvents=true 时,内层 Agent 产生的事件会继续往外透出,调用方就能实时看到里面到底在干什么。
这个能力特别适合:
- 你把一个复杂 Agent 当 Tool 用
- 但又希望前端或调用方还能看到它的实时输出
OutputKey
这个字段很实用:
把 Agent 最后一条输出消息,以某个 key 写进 SessionValues
如果你的后续 Agent、Workflow、或者外层业务逻辑还要继续消费这次结果,它比你手动到处传字符串干净得多。
Exit
你可以把它当作一个特殊 Tool。
模型调用这个 Tool 并成功执行后,ChatModelAgent 会直接退出,效果和 ReturnDirectly 很像,但语义更明确:
ReturnDirectly 更像'某个工具调用后直接收口'
Exit 更像'模型自己宣布:到这里结束,把这个最终结果拿出去'
ModelRetryConfig
这是一个典型的工程字段。
它解决的不是'让回答更聪明',而是'模型调用失败时,系统要不要重试,以及怎么重试'。
如果流式响应过程中发生错误,但策略允许重试,调用方读 stream 时会收到 WillRetryError。
所以在真实系统里做流式输出时,不能只管 happy path。否则一旦流中途断掉,你都不知道是彻底失败了,还是下一轮马上会补回来。
5. Tool、Transfer、AgentAsTool 到底怎么选
这一段是最值得展开讲的地方。
很多人第一次看这三种能力时,会觉得它们都像'把事情交给别人做'。但它们不是一回事。
普通 Tool
适合那种边界特别清晰、输入输出很稳定的能力,比如:
- 查错误码
- 查 runbook
- 算时间
- 调外部 HTTP 接口
它更像函数调用。
Transfer
Transfer 的意思不是'调用另一个能力',而是:
当前 Agent 判断,另一个 Agent 更适合接手这件事,于是把任务控制权转过去。
官方页对应的实现机制是:
- 给
ChatModelAgent 配置子 Agent
- 框架自动生成一个
Transfer Tool
- 模型根据各个 Agent 的
Description 决定要不要跳转
- Runner 收到 Transfer Event 后,切到目标 Agent 继续执行
最小示意像这样:
如果一个问题本来就该交给另一个 Agent 独立负责,那应该优先考虑 Transfer,而不是让当前 Agent 硬撑到底。
AgentAsTool
它的语义又不同:
我不是把任务彻底交出去,我只是把另一个 Agent 当成一个'高级工具'来用。
什么时候适合这么做?
当被调用的 Agent:
- 不需要完整运行上下文
- 只要一个明确请求参数就能独立完成工作
- 更像一个'复杂工具'而不是一个'新的控制者'
我这里从官方源码 NewAgentTool(...) 截取片段举例:
reporterTool := adk.NewAgentTool(ctx, reporterAgent) agent,_:= adk.NewChatModelAgent(ctx,&adk.ChatModelAgentConfig{ Name:"ops_assistant", Description:"负责处理线上故障", Model: cm, ToolsConfig: adk.ToolsConfig{ ToolsNodeConfig: compose.ToolsNodeConfig{ Tools:[]tool.BaseTool{reporterTool},}, EmitInternalEvents:true,},})
一句话记忆这三者:
Tool:调用一个函数
Transfer:把控制权交给另一个 Agent
AgentAsTool:把另一个 Agent 当函数来调
6. Middleware / Handler 才是工程化分水岭
如果说 Tool 解决的是'Agent 能干什么',那 Handler 解决的就是'Agent 在真实系统里怎么管'。
官方页给出的扩展点一共有几层:
BeforeAgent
BeforeModelRewriteState
AfterModelRewriteState
WrapModel
WrapInvokableToolCall / WrapStreamableToolCall
把它们放到一张执行图里,会比只看接口名字更容易懂:
BeforeAgent
这是最适合做'运行前改配置'的地方。
它能改的不是消息历史,而是本次运行的:
Instruction
Tools
ReturnDirectly
所以它很适合做这些事:
- 动态追加系统约束
- 按租户或环境动态加工具
- 把某个工具临时标记为
ReturnDirectly
BeforeModelRewriteState / AfterModelRewriteState
这两个钩子盯的是 Messages。
适合做:
- 历史裁剪
- 敏感信息脱敏
- 在模型调用前后检查消息状态
如果你只是想管'发给模型的消息长什么样',优先看这组。
WrapModel
这个钩子适合拦截模型调用本身。
典型用途是:
它的价值在于:你不用改业务代码,就能把'模型调用前后'的工程逻辑拦下来。
WrapInvokableToolCall / WrapStreamableToolCall
这两个钩子盯的是工具层。
特别适合:
- 打工具调用日志
- 统计耗时
- 做参数审计
- 对工具结果二次包装
为什么新代码更推荐 Handlers
官方和本地源码都已经把这个方向说得很明确了:
- 老的
AgentMiddleware 是 struct 风格,适合简单静态扩展
- 新的
ChatModelAgentMiddleware 是 interface 风格,更适合动态行为和上下文改写
如果你是现在开始写新的 ChatModelAgent 扩展,优先用 Handlers 更稳。
7. 实战:用 ChatModelAgent 搭一个故障分诊助手
目的:
做一个'故障分诊助手',能查 runbook、在高风险场景下直接升级给人工,并通过 handler 统一加上运行约束与工具日志。
本例子只演示三件事:
ChatModelAgent + Tool
ReturnDirectly
Handler
先装依赖
go get github.com/cloudwego/eino@latest go get github.com/cloudwego/eino-ext/components/model/qwen@latest
环境变量至少准备两个:
$env:DASHSCOPE_API_KEY="你的百炼 API Key"$env:QWEN_MODEL="qwen-plus"
完整代码
这段代码的目标不是做一个真正的运维平台,而是把 ChatModelAgent 这一页最重要的几个点跑通。
package main import("context""fmt""log""os""strings""github.com/cloudwego/eino/adk""github.com/cloudwego/eino/components/tool""github.com/cloudwego/eino/components/tool/utils""github.com/cloudwego/eino/compose""github.com/cloudwego/eino/schema""github.com/cloudwego/eino-ext/components/model/qwen")
这个 Demo 到底对应了什么
search_runbook 是普通 Tool,模型先查事实,再组织答案
handoff_to_human 被配置成 ReturnDirectly,一旦调用就直接退出
OpsGuardHandler 通过 BeforeAgent 和 WrapInvokableToolCall 把运行约束和工具日志插进来了
如果你本地跑的时候传一个'高风险但信息不足'的问题,比如:
go run ."payment 服务持续报错,但我只有一句日志:DB_TIMEOUT,请直接给我下一步动作。"
常见表现会是两种:
- 模型先调
search_runbook,再组织答案返回
- 模型判断信息不足或风险过高,直接调
handoff_to_human,然后因为 ReturnDirectly 立即结束
这正是 ChatModelAgent 和普通模型调用的差别:它不是只会说话,而是会决定下一步怎么干。
8. 总结
本篇最想帮你建立的,不是某个 API 记忆点,而是一个判断:
ChatModelAgent 不是'模型调用升级版',而是 ADK 里默认的思考型 Agent 实现。
它真正解决的是:
- 让模型在回答、调工具、转交任务之间做动态决策
- 让这些动作按照
ReAct 方式循环运行
- 让运行过程以
AgentEvent 形式输出
- 让你能通过
Handler 把日志、审计、裁剪、动态工具这些工程能力插进去