OpenClaw 101:从入门到实操,解锁“会动手”的AI智能体

OpenClaw 101:从入门到实操,解锁“会动手”的AI智能体

https://openclaw101.dev/

https://my.feishu.cn/wiki/MlyEwRKIwikkBlkGew0ckLfonEu

https://github.com/openclaw/openclaw

https://zhuanlan.zhihu.com/p/2002370444339212951

2026年初,OpenClaw(原Clawd、Moltbot)以72小时狂揽6万+ GitHub Stars的速度爆红,如今星标数已突破18万+,甚至带动Mac Mini全球卖断货、Cloudflare股价上涨20%。不同于ChatGPT等“只说不做”的聊天机器人,OpenClaw是一款开源的个人AI助手平台,核心定位是“真会动手办事”的数字员工——它能接管电脑操作权限,通过自然语言指令主动执行各类任务,真正实现“聊天框里办大事”。

本文作为OpenClaw 101入门指南,将从“是什么→怎么装→怎么用→核心原理→进阶技巧”逐步拆解,逻辑清晰、实操性强,无论是零基础新手还是有一定技术基础的开发者,都能快速上手,解锁这款AI工具的核心价值。

一、基础认知:OpenClaw到底是什么?

1.1 核心定位:不止是聊天,更是“能执行的AI助理”

OpenClaw的核心理念是“本地优先”(Local-first)和“执行优先”(Action-oriented),它被定义为一个“自托管的AI智能体框架”,区别于传统聊天机器人的核心优势的是:拥有“眼睛”和“手”——能操作浏览器、读写文件、执行脚本命令、模拟鼠标键盘,甚至管理邮箱、预订服务、填写表单,真正充当用户的贴身数字员工。

简单来说:ChatGPT能告诉你“如何清理邮箱”,而OpenClaw能直接帮你清理邮箱;ChatGPT能给出“预订餐厅的步骤”,而OpenClaw能直接完成预订并反馈结果,这就是“信息生成者”与“任务执行者”的本质区别。

1.2 核心特性:为什么OpenClaw能快速出圈?

- 本地优先,隐私可控:默认运行在用户本地设备(Windows、macOS、Linux,甚至树莓派),所有数据、对话历史和任务执行记录都保存在本地,不上传云端,彻底保障数据主权,尤其适合对隐私敏感的用户。

- 寄生式交互,零门槛使用:无需安装额外App,可嵌入WhatsApp、Telegram、Discord、飞书、钉钉等20+主流通讯软件,用户在熟悉的聊天界面就能发送指令,后台自动执行并反馈结果,极大降低使用门槛。

- 持续记忆,越用越懂你:采用“文件即状态”的记忆机制,能持久保存用户偏好、历史指令和关键信息(如配偶生日、工作习惯),不同于ChatGPT的上下文重置模式,OpenClaw能实现长期记忆,主动给出提醒和个性化建议,真正“越用越懂你”。

- 高度可扩展,技能自由:支持通过“技能(Skills)”扩展能力,既能安装社区开发的3000+插件,也能自定义编写脚本,甚至能自动生成新技能来满足用户的个性化需求,实现“自我进化”。

- 多模型兼容,灵活切换:可对接Anthropic Claude、OpenAI GPT、Gemini等云端模型,也支持Ollama等本地私有模型,用户可根据需求自由切换,兼顾性能与隐私。

1.3 适用人群:谁该学习OpenClaw?

无论是零基础的普通用户,还是有技术基础的开发者,都能从OpenClaw中获益:

- 普通用户:用它自动化处理重复任务(清理邮箱、管理日程、预订服务),提升日常效率;

- 开发者:基于其框架二次开发,自定义技能插件,或搭建专属AI助手;

- 企业用户:部署在私有服务器,实现内部流程自动化,保障数据安全。

二、实操入门:从零部署OpenClaw(新手友好)

部署OpenClaw有两种主流方式:本地部署(适合新手体验)和云端部署(适合长期稳定使用),本文重点讲解本地部署(Windows/WSL2、macOS通用),并补充阿里云云端部署的核心步骤,全程附可直接复制的命令,零基础也能轻松完成。

2.1 前置条件(必看)

- 系统要求:macOS 10.15+、Linux(推荐Ubuntu)、Windows(需安装WSL2,原生Windows未经充分测试,不推荐);

- 软件依赖:Node.js ≥ 22(核心依赖)、pnpm(可选,从源代码构建时推荐);

- 其他准备:AI模型API Key(Claude/OpenAI/KIMI均可,推荐Claude Sonnet 4.5,性价比高)、聊天渠道账号(Telegram/WhatsApp/飞书任选,Telegram功能最完善);

- 可选准备:Brave Search API密钥(用于网页搜索功能,提升AI的实时信息获取能力)。

2.2 本地部署步骤(3步搞定)

步骤1:安装OpenClaw CLI(命令行工具)

CLI是操作OpenClaw的核心工具,不同系统的安装命令如下,复制粘贴到终端/命令行即可:

- macOS/Linux:

curl -fsSL https://openclaw.ai/install.sh | bash

- Windows(WSL2内):

iwr -useb https://openclaw.ai/install.ps1 | iex

替代方案(全局安装):

npm install -g openclaw@latest
# 或用pnpm
pnpm add -g openclaw@latest

安装完成后,输入 openclaw --version,若显示版本号,说明安装成功。

步骤2:运行新手引导向导(自动配置核心参数)

OpenClaw提供了新手引导向导,能自动配置模型认证、网关设置、聊天渠道等,无需手动修改配置文件,新手优先选择此方式:

openclaw onboard --install-daemon

运行后,按照提示完成以下配置(全程中文引导,耐心操作即可):

1. 选择部署方式:本地Gateway(新手选这个)或远程Gateway;

2. 认证配置:输入AI模型API Key(如Claude),或选择OAuth认证;

3. 聊天渠道配置:选择你常用的渠道(如Telegram/WhatsApp),按提示完成登录(如WhatsApp扫描QR码、Telegram输入机器人令牌);

4. 守护进程安装:选择安装后台服务(launchd/systemd),让OpenClaw持续在后台运行,无需每次手动启动。

步骤3:启动Gateway并验证部署

如果在引导向导中安装了后台服务,Gateway会自动启动,可通过以下命令查看状态:

openclaw gateway status

若显示“Up”,说明Gateway运行正常;若未自动启动,手动启动命令:

openclaw gateway --port 18789 --verbose

启动后,可通过Web控制台验证:浏览器输入 http://127.0.0.1:18789/,粘贴引导向导生成的Token登录,能正常加载控制台即部署成功。

最后,在你配置的聊天渠道(如Telegram)发送指令“你好,帮我查看当前目录的文件”,若AI返回文件列表,说明整个部署流程无误,可正常使用。

2.3 云端部署简化版(阿里云,长期稳定)

如果想让OpenClaw 24小时不间断运行,推荐阿里云轻量应用服务器部署(成本低、操作简单),核心步骤如下:

1. 购买阿里云轻量应用服务器,选择“应用镜像→OpenClaw 2026新手版”(预置所有依赖),最低配置2vCPU+2GiB内存即可;

2. 放通18789端口,在阿里云控制台配置API Key(粘贴你的Claude/OpenAI Key);

3. 远程连接服务器,执行 docker ps | grep openclaw,查看容器运行状态;

4. 对接聊天渠道,执行 openclaw channels login,按提示配置Telegram/飞书等,完成测试。

三、核心操作:OpenClaw常用指令与场景实操

部署完成后,核心使用方式是“在聊天渠道发送自然语言指令”,OpenClaw会自动拆解任务、执行操作并反馈结果。以下是新手必学的常用指令和典型场景,直接复制发送即可体验。

3.1 基础指令(快速上手)

- 查看系统状态:帮我查看OpenClaw的运行状态,以及当前连接的模型;

- 文件操作:帮我创建一个名为openclaw_test的文件夹,然后在里面新建一个txt文件,写入“Hello OpenClaw”;

- 网页操作:帮我打开百度,搜索“OpenClaw最新技能”,并把搜索结果总结给我;

- 日程管理:帮我添加一个明天下午3点的会议,主题是“OpenClaw学习”,提醒我提前10分钟;

- 技能管理:帮我安装tavily-search技能(用于联网搜索)。

3.2 典型场景实操(解锁核心价值)

场景1:自动化清理邮箱

指令:帮我清理收件箱,删除所有来自广告邮箱的邮件,把标题包含“工作”的邮件标记为已读,并整理一份未读邮件清单发给我。

原理:OpenClaw调用邮箱技能,读取邮箱内容,根据关键词筛选邮件,执行删除、标记操作,最后生成清单反馈,全程无需手动操作。

场景2:远程控制电脑操作

指令:帮我远程打开电脑上的微信,发送一条消息给“张三”,内容是“明天的会议推迟到下午4点”。

原理:通过Gateway的实时通信能力,远程调用电脑的鼠标键盘模拟功能,打开应用、发送消息,适合不在电脑前但需要紧急操作的场景。

场景3:主动提醒服务

指令:记住我配偶的生日是10月1日,到9月30日的时候主动提醒我准备礼物。

原理:利用OpenClaw的长期记忆机制,将关键信息存储为本地文件,通过调度层的定时任务,到指定时间主动推送提醒,体现“贴身助理”的价值。

3.3 技能管理(扩展OpenClaw能力)

技能是OpenClaw的核心扩展方式,新手必装3个基础技能,装上后能解决80%的使用场景:

1. tavily-search:联网搜索技能,打破AI的知识局限,获取实时资讯和数据,安装命令:clawhub install tavily-search;

2. agent-browser:浏览器自动化技能,控制浏览器打开网页、填写表单、点击操作,默认已安装;

3. shell-skills:系统命令执行技能,允许OpenClaw执行Shell命令,实现更灵活的本地操作,安装命令:clawhub install shell-skills。

查看已安装技能:openclaw skills list;卸载技能:clawhub uninstall 技能名称。

四、深度解析:OpenClaw核心架构与工作原理

掌握了基础部署和操作后,我们深入拆解OpenClaw的核心架构——它之所以能实现“思考-执行-反馈”的闭环,得益于模块化的分层设计和独特的智能体循环机制。

4.1 六大核心子系统架构(从下到上)

OpenClaw采用模块化设计,分为六大核心子系统,各司其职、解耦独立,修改某一层不会影响其他层,便于扩展和维护,具体分工如下:

1. Gateway(网关层):系统的“神经中枢”,是一个常驻后台的Node.js进程,负责监听聊天渠道的消息、标准化处理指令、会话路由和安全认证,通过WebSocket实现实时双向通信,是用户远程控制的核心。

2. Router(路由层):负责“分发任务”,根据路由规则(如Peer ID、群组ID),将用户指令分配给对应的Agent实例,支持一个设备运行多个Agent,服务于不同场景。

3. Agent Loop(智能体循环):OpenClaw的“心脏”,遵循Lobster智能体循环模式,实现“思考-执行-观察-反馈”的闭环,也是它能完成复杂任务的核心:
        

  - 思考(Think):加载Agent的身份(Soul)、记忆(Memory)和技能(Skills),将用户指令拆解为可执行的子任务;

  - 执行(Act):调用底层工具或技能,执行具体操作(如打开浏览器、运行Shell命令);

  - 观察(Observe):获取执行结果(成功/失败信息);

  - 反馈(Reflect):将结果反馈给大模型,更新上下文,决定下一步行动或结束任务。

4. Brain(推理层):负责与大语言模型交互,支持多模型热切换,负责Prompt构建、模型调用和输出解析,是OpenClaw“理解指令”的核心。

5. Memory(记忆层):采用“文件即状态”的设计,将所有记忆存储为本地Markdown/YAML文件,而非复杂数据库,分为4类:
        

  - Soul(灵魂):存储Agent的身份、价值观和个性,定义“我是谁”;

  - Memory(记忆):存储用户长期偏好和关键信息,即长时记忆;

  - Session(会话):存储当前任务的上下文和短期记忆;

  - State(状态):用于多Agent协作,记录项目进度,实现协同工作。

6. Scheduler(调度层):实现主动式服务,支持心跳模式和定时模式,Agent可定期唤醒自己,主动执行任务(如每日早报、待办提醒),无需用户指令触发。

4.2 核心工作流程(以“预订餐厅”为例)

结合架构,我们拆解一个完整的任务执行流程,理解OpenClaw的工作逻辑:

1. 用户在Telegram发送指令:“帮我预订今晚7点附近的餐厅,偏好中餐,人均100元以内”;

2. Gateway接收消息,标准化处理后,通过Router分配给主Agent;

3. Agent Loop(思考阶段):拆解任务为“1. 搜索附近中餐餐厅;2. 筛选人均100元以内的选项;3. 打开订餐网站预订;4. 反馈预订结果”;

4. Agent Loop(执行阶段):调用tavily-search技能搜索餐厅,调用agent-browser技能打开订餐网站,填写预订信息;

5. Agent Loop(观察阶段):获取预订结果(成功/失败),若失败(如无空位),调整策略(更换餐厅)重新尝试;

6. Agent Loop(反馈阶段):将预订成功的信息(餐厅名称、地址、预订时间)反馈给Gateway,再由Gateway推送至用户Telegram;

7. Memory层更新:将用户的餐饮偏好(中餐、人均100元)保存为长期记忆,后续预订时自动匹配。

五、进阶技巧:自定义技能与安全优化

对于有一定开发基础的用户,可通过自定义技能和优化配置,让OpenClaw更贴合自身需求;同时,由于OpenClaw能控制本地设备,安全设置也至关重要。

5.1 自定义技能(简单脚本示例)

OpenClaw的技能本质是脚本文件,支持JavaScript/Python等语言,以下是一个简单的“每日天气提醒”技能示例(核心逻辑):

// 技能名称:daily-weather
// 功能:每日早上8点获取本地天气,推送至Telegram
module.exports = {
  name: "daily-weather",
  description: "每日天气提醒",
  schedule: "0 8 * * *", // 每日8点执行
  async run(agent) {
    // 调用天气API获取本地天气
    const weather = await agent.tools.web.search("今日本地天气");
    // 推送至Telegram
    await agent.channels.send("telegram", `今日天气:${weather},记得增减衣物哦~`);
    // 更新记忆,记录用户的天气偏好
    agent.memory.set("weather_preference", "每日8点提醒");
  },
};


将脚本保存至 ~/.openclaw/skills/daily-weather 目录,执行 openclaw skills reload,即可启用该技能。

5.2 安全优化(必做,避免风险)

由于OpenClaw拥有设备操作权限,不当配置可能导致安全风险,推荐以下3个安全设置:

1. 渐进式授权:初次使用时,仅给予AI只读权限,大部分操作(如发送邮件、删除文件)需用户确认,熟悉后再逐步开放权限;

2. 开启操作日志:执行 openclaw security audit --deep,开启操作日志,所有AI执行的任务都可追溯,若出现错误可及时排查;

3. 沙箱隔离:在配置文件中开启沙箱模式,隔离群组/渠道会话,避免恶意指令影响本地设备,配置示例:{
  "routing": {
    "agents": {
      "main": {
        "workspace": "~/.openclaw/workspace",
        "sandbox": { "mode": "non-main" }
      }
    }
  }
}

六、常见问题排查(新手避坑)

部署和使用过程中,新手容易遇到以下问题,整理了对应的解决方案,快速排查无需踩坑:

- 问题1:Gateway启动失败,提示端口18789被占用
解决方案:修改配置文件 ~/.openclaw/openclaw.json,将端口改为18790,重启服务:openclaw gateway restart。

- 问题2:聊天渠道无响应,发送指令没有反馈
解决方案:检查网络连通性,重启渠道服务:openclaw channels restart 渠道名称(如telegram),或重新配对:openclaw pairing approve 渠道名称 配对码。

- 问题3:API Key无效,模型调用失败
解决方案:检查API Key是否完整(无空格/字符遗漏),重新生成并配置,执行 openclaw configure --section brain 重新设置模型参数。

- 问题4:Windows系统部署后无法正常运行
解决方案:卸载原生Windows部署,安装WSL2(推荐Ubuntu),在WSL2内重新部署,避免原生Windows的兼容性问题。

七、总结与后续学习方向

本文从基础认知、部署实操、核心操作、架构解析到进阶技巧,完整覆盖了OpenClaw 101的核心内容,总结下来:OpenClaw的核心价值的是“将AI从聊天工具升级为执行工具”,通过本地优先、持续记忆、高度可扩展的特点,真正成为用户的贴身数字员工。

对于新手,建议先完成本地部署,熟悉基础指令和场景,再逐步尝试安装技能、自定义配置;对于开发者,可深入研究其架构源码,开发专属技能插件,甚至参与OpenClaw的开源贡献(GitHub地址:https://github.com/openclaw/openclaw)。

后续学习方向推荐:

- 深入学习Lobster智能体循环机制,理解AI的任务拆解逻辑;

- 开发复杂自定义技能,实现更个性化的自动化需求;

- 探索多Agent协作,搭建多个AI助理协同工作的场景;

- 研究OpenClaw的商业化与生态构建,了解技能商城、云端代管等模式。

随着AI Agent技术的发展,OpenClaw作为开源领域的标杆项目,未来还会持续迭代升级。希望本文能帮助你快速入门OpenClaw,解锁AI自动化的核心能力,让技术为效率赋能。
 

Read more

OpenClaw视觉操作实战:不写接口,让AI直接点按钮、操作软件

OpenClaw视觉操作实战:不写接口,让AI直接点按钮、操作软件

文章目录 * 前言 * 一、OpenClaw是啥?你的数字长工 * 二、视觉操作的核心:Snapshot快照系统 * 1. 告别元素定位地狱 * 2. 自适应界面变化 * 3. 跨应用操作 * 三、实战:手把手教你让AI自动填表 * 步骤1:安装与环境准备 * 步骤2:启动视觉模式 * 步骤3:编写自动化脚本 * 步骤4:进阶:自动下载报表 * 四、不止浏览器:桌面软件也能点 * 五、定时任务:让AI自己起床干活 * 六、数据安全:你的隐私留在本地 * 七、避坑指南:新手常踩的雷 * 1. 动态加载的坑 * 2. 弹窗处理 * 3. API额度控制 * 4. 元素编号会变 * 八、总结:从“码农”

ToDesk推出ToClaw:让AI Agent真正走进你的日常工作流

ToDesk推出ToClaw:让AI Agent真正走进你的日常工作流

2026开年,中文互联网最热的AI关键词之一,非“OpenClaw”莫属。这款开源AI助手在技术圈掀起热潮,让越来越多人意识到:AI不该只负责聊天,它应该开始替人干活。但问题也随之而来——复杂的Python环境配置、繁琐的API部署、全英文的文档,将大多数普通用户挡在了门外。 就在今天,国民级远控软件ToDesk给出了自己的答案:ToClaw。它不是另一个需要单独下载的新软件,而是完全封装在最新版ToDesk里的AI助手。打开ToDesk,左侧AI入口就能找到它——免安装、免部署,可直接体验。 从“装环境”到“直接干活”,零门槛的AI助理 如果你折腾过OpenClaw,就会知道它的魅力和门槛几乎是同时出现的。魅力在于它真的是Agent,能执行任务而不只是聊天;门槛在于你要先理解安装、模型、渠道、权限、运行环境,甚至还得接受“先踩坑,再用起来”的现实。 ToClaw走的是另一条路。 打开之后,不是黑乎乎的终端,也不是一堆配置文件,而是一个非常直接的桌面助手界面:输入框、场景入口、技能页、

OpenClaw 配置本地 Ollama 模型完整指南:零成本打造全离线个人 AI 助理

OpenClaw 配置本地 Ollama 模型完整指南:零成本打造全离线个人 AI 助理

OpenClaw 配置本地 Ollama 模型完整指南:零成本打造全离线个人 AI 助理(2026 最新版·含 Auth 配置) 大家好,我是你的 AI 技术博主。今天我们来聊一个 2026 年最火的本地 AI 助理项目——OpenClaw。它能帮你清理收件箱、发邮件、管理日历、处理文件、集成 Telegram/WhatsApp,甚至执行复杂任务,而且完全跑在你自己的电脑上。 配合 Ollama 运行本地模型(如 Qwen3、Qwen2.5、GLM-4.7、Llama3.3 等),你就可以实现真正零费用、零网络依赖、全隐私保护的智能体体验。官方从 Ollama 0.17

人工智能:深度学习中的卷积神经网络(CNN)实战应用

人工智能:深度学习中的卷积神经网络(CNN)实战应用

人工智能:深度学习中的卷积神经网络(CNN)实战应用 1.1 本章学习目标与重点 💡 学习目标:掌握卷积神经网络的核心原理、经典网络架构,以及在图像分类任务中的实战开发流程。 💡 学习重点:理解卷积层、池化层的工作机制,学会使用 TensorFlow 搭建 CNN 模型并完成训练与评估。 1.2 卷积神经网络核心原理 1.2.1 卷积层:提取图像局部特征 💡 卷积层是 CNN 的核心组件,其作用是通过卷积核对输入图像进行局部特征提取。 卷积核本质是一个小型的权重矩阵。它会按照设定的步长在图像上滑动。每滑动一次,卷积核就会与对应区域的像素值做内积运算,输出一个特征值。 这个过程可以捕捉图像的边缘、纹理等基础特征。 ⚠️ 注意:卷积核的数量决定了输出特征图的通道数,数量越多,提取的特征维度越丰富。 ① 定义一个 3×3 大小的卷积核,步长设为 1,填充方式为 SAME