【AI】为什么 OpenClaw 值得折腾?安装体验与架构原理深度解析

【AI】为什么 OpenClaw 值得折腾?安装体验与架构原理深度解析



👨‍💻程序员三明治个人主页
🔥 个人专栏: 《设计模式精解》《重学数据结构》

🤞先做到 再看见!


目录

一、OpenClaw 到底是什么

OpenClaw 是一个个人 AI 助手平台,跑在你自己的设备上,你的笔记本电脑、一台云服务器、机柜里的 Mac Mini,或者一个云容器。

它把 AI 模型和各种工具,连接到你日常用的聊天 App,例如,WhatsApp、Telegram、飞书、钉钉等等。

OpenClaw 把 AI 助手当作基础设施来构建,而不只是优化提示词。

打个比方,普通聊天机器人就像一个只会接电话的客服,你问什么它答什么。

而 OpenClaw 更像是给 AI 搭了一整套办公系统,有会话管理、有记忆系统、有工具权限控制、有消息路由

AI 模型扮演大脑的角色,OpenClaw 负责帮你落地。

AI 模型的 API 调用还是走 Anthropic、OpenAI 那些服务商,但对话记录、工具执行、会话状态、所有调度逻辑,全部留在你自己的设备上。

下面这些功能,你可以完全自主控制:

  • 助手跑在哪里
  • 消息怎么路由
  • 它能用哪些工具
  • 会话之间怎么隔离

那也就是说有了OpenClaw就相当于一个清华北大的博士给你打工?🤩那咱们也来玩玩看。

二、OpenClaw快速安装与卸载

安装claw之前需要两个必要环境:

  1. Nodejs22+,下载链接:https://nodejs.org/en/download
  2. git(下载代码,管理代码版本),下载链接:https://git-scm.com/install/mac

安装完成之后就可以安装OpenClaw了

进入官网:https://openclaw.ai/

下滑找到Quick Start,运行下面的命令

curl -fsSL https://openclaw.ai/install.sh | bash 

这里选择yes

配置token、网关服务

一路yes

  1. 打开claw的面板,进行新手引导
openclaw onboard 

选择模型

这里qwen是免费的,可以先使用qwen

选择要接入的IM软件

这里我们可以先跳过,后续通过网页端接入也可以

选择搜索供应商

这里也可以先跳过

配置skill

这里我只点了github

配置其他的API-KEY

这里我们都先不配

hooks我都开启了,没有跳过

重启网关服务,并选择龙虾打开方式

使用web方式打开龙虾

龙虾启动!

如何卸载?

openclaw uninstall 

三、OpenClaw 的原理

OpenClaw的原理可概括为:一个开源、自托管的AI Agent平台,通过四层解耦架构和持久的文件化记忆系统,将大语言模型(LLM)从被动的聊天工具转变为能自主执行任务的“数字员工”。

下图即为OpenClaw整体架构

各层职责是什么?

层级核心职责关键组件
客户端层提供用户交互界面,连接 GatewayCLI、WebChat、macOS App、Mobile Nodes
Gateway 层统一控制平面,协议转换,连接管理WS Server、HTTP API、Channel Manager、Plugin Manager
通道层对接各消息平台,处理入站/出站消息Channel Adapters、消息队列、媒体处理
Agent 层执行 AI 推理,管理工具调用Pi Runtime、Tool Registry、Session Manager
扩展层提供可插拔的扩展能力Plugin SDK、Hooks、Skills

1. 四层架构(Gateway-Node-Channel-Agent):

  • Gateway(网关):中央控制平面,作为24/7运行的守护进程,管理WebSocket服务、会话(Session)和Agent调度。默认只绑定本地回环地址(127.0.0.1),确保基础安全。
  • Node(节点):设备端执行器,负责在本地运行具体操作,如执行系统命令、控制摄像头、录屏等。
  • Channel(渠道):消息接入层,统一连接超过20个即时通讯平台(如WhatsApp、Telegram、飞书、钉钉、Discord等),将用户消息路由至Gateway。
  • Agent:真正干活的核心引擎,组装上下文、调用 AI 模型、执行工具操作(比如浏览网页、操作文件、定时任务等)、保存状态

2. 记忆系统

OpenClaw 给每个 agent 的 workspace 预设了 7 类核心文件:

1. SOUL.md — Agent 是谁

这个文件定义了 agent 的人格:语气、风格、边界、价值观。有意思的是,模板里写着一句话:“This file is yours to evolve. As you learn who you are, update it.”——这个文件是你自己的,随着你了解自己,去更新它。

也就是说,agent 的"人格"不是你一次写死的,是它在跟你互动的过程中,自己慢慢调整的。它发现你喜欢简洁直接的回答,就会把这个偏好写进自己的灵魂文件里。

2. USER.md — 用户是谁

这是 agent 对你的画像:你的名字、时区、工作习惯、技术偏好、沟通风格。每次对话中 agent 了解到关于你的新信息,就会更新这个文件。用得越久,这个画像越精准,agent 就越"懂你"。

3. AGENTS.md — 做事的规矩和踩过的坑

这是最关键的一个文件。它定义了 agent 的行为规范,更重要的是,记录了所有踩过的坑****。

我在源码里看到它的模板有一条明确的指令:“When you learn a lesson → update AGENTS.md”、“When you make a mistake → document it so future-you doesn’t repeat it.”

翻译成人话就是:你犯了一个错,把它记下来,这样以后的你就不会再犯。

这就是为什么 OpenClaw 越用越好用——不是因为模型变聪明了,是因为 AGENTS.md 里的踩坑记录越来越多。每一条记录都是一次错误的代价换来的经验,被固化成了一行文字,从此永远生效。

4. TOOLS.md — 环境备忘

记录你的工作环境:SSH 主机名、摄像头设备名、文件路径习惯等。agent 踩坑后自己补充。

5. SKILL.md × N — 各领域的操作手册

每个 SKILL.md 定义了一个特定领域的操作规范。OpenClaw 内置了 52 个 skill,涵盖 GitHub issue 管理、邮件处理、健康检查、代码审查等。

更关键的是,你可以自己写 skill。比如你每周都要出一份特定格式的周报,你可以把格式要求、数据来源、输出模板写成一个 SKILL.md,放到 workspace 里。从此 agent 每次做周报都会按照这个规范来,不需要你每次重新描述。

Skill 的加载有优先级:内置的优先级最低,workspace 里用户自定义的优先级最高。也就是说你可以覆盖任何内置 skill 的行为。

6. memory/YYYY-MM-DD.md — 日常记忆

Agent 每天会写一个日期命名的 md 文件,记录当天的对话要点、做了什么、学到什么。这些文件会被索引到 SQLite 数据库里,支持全文搜索和向量检索。

7. MEMORY.md — 提炼后的长期记忆

Agent 会定期把 daily memory 里的重要内容提炼到这个文件里。相当于从日记中整理出来的笔记精华。这个文件每次对话都会被加载进 prompt,所以 agent 的"长期记忆"就存在这里。

四、OpenClaw的创新点

官方文档写得很清楚:它在你的机器上跑一个 Gateway 进程,这个 Gateway 负责连接各种聊天渠道、维护会话、做路由,并把消息转给后面的 Agent。

所以它的基本形态不是:

用户 → 大模型网页

而是:

用户 → 聊天渠道(QQ/飞书/微信等)→ OpenClaw Gateway → 模型 + 工具 + agent 逻辑

这套结构有两个很重要的含义。

1. 它把“入口”从网页改成了消息通道

以前大多数 AI 产品的交互入口是网页、App、IDE,OpenClaw 试图把入口前移到你已经每天在用的消息系统里。

这件事看起来只是换个壳,实际上影响很大。因为一旦入口变成消息通道,AI 就不再只是“你主动打开它时才存在”,而是会更像一个常驻、可随时召唤、可跨设备触达的助手。

即使你不在电脑旁,只要你有手机或其他终端可以登陆这些通道,就可以随时随地远程操控你的AI,OpenClaw极大降低了我们和AI交互的成本。

2. 它把“对话”升级成了“会话驱动的任务执行”

官方文档里反复强调 Gateway 是会话和路由的单一事实来源,支持多 agent 路由、隔离 session、控制 UI、节点能力等。这说明它不是把消息简单转发给模型,而是在中间增加了一层 运行时编排层

也就是说,OpenClaw 真正的价值不在“会聊天”,而在“会接任务、会保留上下文、会调能力、会继续执行”。



如果我的内容对你有帮助,请辛苦动动您的手指为我点赞,评论,收藏。感谢大家!!

在这里插入图片描述

Read more

【架构】前端 pnpm workspace详解

前端 pnpm workspace 架构详解 一篇帮你搞懂 pnpm workspace 的实战向教程,从「为啥要用」到「怎么配」全给你捋清楚;每个知识点都会讲清是什么、为什么、怎么用、注意啥,方便你系统学习、随时查阅、直接落地。 一、先聊聊:我们到底遇到了啥问题? 做前端久了,多包、monorepo、组件库联调这些事一多,就会踩到一堆具体又磨人的坑。下面把这些痛点拆开说:具体表现 → 典型场景 → 对你有啥影响。搞清楚这些,后面再看 pnpm workspace 解决啥就一目了然。 1.1 node_modules 膨胀,磁盘和时间都遭殃 具体表现:用 npm 搞 monorepo 时,根目录一个

【前端】001 前端初识——数字世界的门面

今天我们就正式开始学习前端了,那么我们都需要做些什么呢?首先,需要搭建一个前端开发环境,其次,要学习html,CSS,JavaScript,最后,要进行一个前端的项目开发。 一.什么是前端?       1.前端,又名Web前端,用来直接给用户呈现一个一个的网页。一个软件通常情况下是由后端+前端完成。       2.生活中会遇到哪些前端页面?可以主要归结为三类:一类是Web页面,另一类是PC端应用程序页面,还有一类是移动端APP页面。       3.学了这个能达到什么样的水平呢?可以开发出来一个简单的Web页面。 二.什么是HTML?      HTML是一种超文本标记语言。(超文本:意味着我这样一个页面支持文本、声音、图片、视频、表格、链接等数据。那如何能做到一个页面能展示这些数据呢?原来是要通过许许多多的标签,这些标签就组成许许多多的标记)。      HTML页面是运行到浏览器上面的。(推荐下载chrome浏览器) 三.vscode开发工具搭建      为什么推荐vscode?因为vscode是企业开发前端的时候非常常用的一个开发工具。 在v

AI Skills:前端新的效率神器!

近来,AI 领域有个火爆的话题:Skills。 Github 上被疯狂 star 的仓库,很多都是和 skills 有关的。 有的仓库仅仅上线三个月就获得了快 50K 的 star,Skills 的火热可见一斑。 不管是大模型,还是 Cursor、Codex、Claude、Trae、Copilot 等编程 IDE 都在争先支持 Skills。 围绕 Skills,它们在做的就是为了完成一件事情:技能是通过学习和反复练习获得的,而 Skills 是把经验和最佳实践沉淀为 AI 能力,将“知道”转化为“做到”的本领。 详解什么是 Skills 要说清楚什么是 Skills,先来了解一下关于 AI 的 2

Google AI Studio生成的前端代码打包成安卓APK文件

前言    Google AI Studio 的 Build 模式(通常指 "Gemini Vibe Coding" 或可视化的应用构建功能)默认生成的通常是 Web 应用代码(主要是 React 或纯 HTML/JS),而不是原生的 Android (Java/Kotlin) 代码。这意味着你不能直接把它打包成 APK。你需要先进行一步“转换”,把这个 Web 应用“包裹”成一个安卓应用。 案例演示 下面以我生成的一个小的应用程序为例演示如何将它打包成APK文件并安装在手机上。 这是我使用Google的Gemini 3生成的一个滑卡软件(还有些BUG。。) 开源的github链接:YGJing7/flashflow: 闪流卡片 开源的gitee链接:AriYang/flashflow 基础环境准备 ※注意※