如何让 OpenClaw等AI Agent 从“能用”走向“可控、可引导、可落地”
tigerclaw-mail
如何让 OpenClaw等AI Agent 从“能用”走向“可控、可引导、可落地”
在 AI Agent 快速发展的今天,很多开发者已经开始接触类似 OpenClaw 这样的系统。
它们的特点是:
- 能力很强
- skill 很多
- 生态丰富
但在实际使用中,尤其是面向企业落地时,会遇到一个非常现实的问题:
❗ Skill 能跑 ≠ Skill 能用
一、AI Agent的一个重点是重做“使用方式”
AI Skill甚至MCP都在各个方向有了落地,但是OpenClaw存在配置麻烦,甚至有人提出“未来的AI是Cmd时代”。我们愿意回到“Dos”那个黑漆漆的Cmd时代,才能够让诸多的Skill用起来吗?
所以,这次发布的 我们的核心目标不是“更多能力”,而是:
✅ 让 skill 真正可用,而不是可配置
在新的AI入口的核心设计理念是:
- local-first(本地优先)
- low-token(低成本)
- workflow 驱动
- capability + prerequisite 预检
- 引导式交互(重点)
二、为什么 OpenClaw 很强,但很多人用不起来?
我们以一个最简单的场景为例:
👉 “读取未读邮件并生成摘要”
在 OpenClaw 中,通常需要:
- 安装 mail skill
- 编辑 skill 配置
- 填写:
- IMAP host
- port
- username
- password
- 确保 env / config 正确
- 手动测试
这个过程的问题在于:
- ❌ 用户必须理解 skill 结构
- ❌ 必须知道配置项
- ❌ 出错时不知道哪里错
- ❌ 完全没有引导
👉 本质问题:
系统在等用户“会用 skill”
三、引导式 Skill 使用,将是AI Agent入口的核心突破:
我们正在做到系统的设计反过来:
❗ 不要求用户会配置 skill
✅ 系统主动引导用户完成配置
四、真实演示:从 0 开始配置 Mail(核心亮点)
在本次 附着的的演示视频中,我们做了一件非常关键的事情:
🎬 场景:用户第一次使用邮件功能
用户输入:
读取今天未读邮件并生成摘要
第一步:系统不执行,而是检查条件
首先,我的理念不会直接尝试连接 IMAP,而是:
👉 检查 skill prerequisites:
- 是否存在邮箱账号?
- 是否配置 host?
- 是否配置密码?
第二步:返回引导信息
系统返回:
outcome = needs_user_input
并附带:
- issues(缺什么)
- suggestedPreferenceKeys(需要配置什么)
- remediationHint(怎么做)
第三步:进入“引导式对话”
然后,开始像一个助手一样引导:
请输入邮箱地址
👉 用户输入:[email protected]
系统:
已识别邮箱提供商,推荐 IMAP 配置
(内置 provider hint,而不是让用户自己查文档)
接下来:
请输入密码(已自动掩码)
第四步:自动完成配置并重试
用户完成输入后:
- 自动写入 SQLite preferences
- 自动重新执行 workflow
- 返回结果
🎯 关键体验变化
| 传统方式(OpenClaw) | 我的理念 |
|---|---|
| 配置 skill | 使用 skill |
| 查文档 | 跟着走 |
| 手动 debug | 系统提示 |
| 一次性配置 | 按需引导 |
五、为什么这件事很重要?
因为这解决了 AI Agent 的一个核心问题:
❗ 用户不会“配置能力”,但用户会“表达需求”
那么,我的设计理念是:
用户只负责说“要做什么”,系统负责引导“怎么做”
六、技术背后的关键机制
我的系统之所以能做到这一点,依赖三个核心设计:
1️⃣ Prerequisite 体系
每个 skill 定义:
- 必须配置什么
- 必须具备什么能力
2️⃣ Capability Preflight
在执行前:
- 检查环境
- 检查资源
- 检查策略
3️⃣ needs_user_input 机制
统一返回结构:
{
"outcome": "needs_user_input",
"issues": [...],
"suggestedPreferenceKeys": [...]
}
👉 这让 UI / CLI 都可以做引导式交互
七、未来方向(非常关键)
这次的发布是一个“可控起点”,但不是终点。
🚀 下一阶段能力
1. 多 Intent
从:
一句话 → 一个 intent
到:
一句话 → 多 intent 拆解
例如:
“帮我查未读邮件,然后整理成日报并发给老板”
2. 多 Workflow 编排
从:
单 workflow 顺序执行
到:
多 workflow 串联 / DAG 执行
3. 更智能的引导系统
未来不仅是:
- 缺配置 → 提示
而是:
- 自动推荐配置
- 自动生成默认值
- 自动修复错误
4. 标准化 Skill 交互规范(重点)
👉 这是最重要的一点:
所有 TigerClaw Skill 都必须支持“引导式使用”
八、关键理念:重新定义 Skill
OpenClaw 的 skill 更像:
一个可以被调用的工具
TigerClaw 的 skill 更像:
一个可以“被用户学会使用”的能力
九、总结(核心观点)
最后总结一句话:
❗ OpenClaw 解决的是:AI 能做什么
✅ 我解决的是:用户怎么用 AI
本次 Mail 示例的真正意义
🎯 我的系统通过 prerequisite + 引导式对话
👉 让 skill 从“需要配置”变成“自然使用”
十、结语
这次的版本不是一个“更强的 Agent”,而是一个:
更容易被用户真正用起来的 Agent Runtime
Github 地址:tigersaint88-app/tigerClawRuntime