OpenClaw 安装 + 接入飞书机器人完整教程

优质文章学习记录

11 Apr 2026 — 5 min read

OpenClaw 安装 + 接入飞书机器人完整教程

OpenClaw 曾用名：ClawdBot → MoltBot → OpenClaw（同一软件，勿混淆）
适用系统：Windows 10/11
最后更新：2026年3月

一、什么是 OpenClaw？

OpenClaw 是一款 2026 年爆火的开源个人 AI 助手，GitHub 星标已超过 10 万颗。

与普通 AI 聊天机器人的核心区别：

真正的执行能力：不只回答问题，能实际操作你的电脑
24/7 全天候待命：睡觉时也能主动完成任务
完全开源免费：数据完全掌控在自己手中
支持国内平台：飞书、钉钉等均已支持接入

二、安装前准备：安装 Node.js

建议提前手动安装 Node.js（版本 v22.x 以上），可加快后续安装速度并减少意外。

官方下载地址：https://nodejs.org/zh-cn/download

三、安装 OpenClaw

1. 设置 PowerShell 执行权限

以管理员身份运行 PowerShell（Win 键搜索 → 右键 → 以管理员身份运行），依次执行：

Set-ExecutionPolicy RemoteSigned -Scope CurrentUser Set-ExecutionPolicy-Scope Process-ExecutionPolicy Bypass

2. 执行一键安装命令

iwr-useb https://openclaw.ai/install.ps1 |iex

安装过程会自动完成：检测系统环境、安装依赖、下载核心文件、配置环境变量，并进入配置向导。

四、初始配置向导

1. 风险告知

按左方向键 ← 选择 Yes，回车确认继续。

2. 选择 QuickStart 模式

3. 配置 AI 模型 API Key

推荐使用国内智谱 GLM 模型，成本低且门槛低。

注册地址：https://www.bigmodel.cn
注册后获取 API Key，填入配置向导

4. 选择模型

选择 GLM-4.7（智谱当前旗舰模型）或其他你已有 Key 的模型。

5. 跳过通讯平台配置

飞书配置较复杂，此处选择 Skip，后续单独配置。

6. 跳过 Skills 配置

选择 No，后续通过 UI 界面配置。

7. 开启 Hooks

按空格键选中，再按回车确认。

8. 启动服务并打开 UI 界面

服务启动后，约等待 30 秒，选择 Open the Web UI，浏览器自动打开管理界面：

http://127.0.0.1:18789

五、接入飞书机器人

第一步：创建飞书应用

打开飞书开放平台：https://open.feishu.cn
点击右上角进入开发者后台
点击创建应用，填写应用名称和描述
进入应用详情，记录下 App ID 和 App Secret

第二步：添加机器人能力

在应用详情页，找到添加应用能力，选择并添加机器人。

第三步：配置权限

在权限管理页面，开通以下权限（即时通讯相关权限全部开通）：

获取与发送单聊、群组消息
读取用户基本信息
获取通讯录基本信息

第四步：创建版本并发布

在版本管理中创建新版本
提交发布，状态为在线应用
前往飞书客户端完成审批

第五步：安装飞书插件

打开 PowerShell，执行：

openclaw plugins install @m1heng-clawd/feishu

第六步：配置飞书插件

安装完成后，新开一个 PowerShell 窗口，执行：

openclaw config

按照向导依次完成：

步骤	操作
选择渠道	选择飞书
选择配置链接	选择对应链接
填写凭证	输入 App ID 和 App Secret
选择域名	选择中国区域
接受群组聊天	确认开启
完成配置	选择 Yes → Open → 继续

配置完成后重启服务使配置生效：

openclaw gateway stop openclaw gateway start

第七步：飞书后台设置事件回调

回到飞书开放平台 → 应用详情 → 事件订阅
选择使用长连接接收事件
点击添加事件，添加接收消息事件
重新发布版本（步骤同上）

第八步：开始使用

打开飞书客户端，找到你创建的机器人，直接发消息即可指挥 OpenClaw 干活！

六、常用命令速查

命令	功能
`openclaw onboard`	重新进入配置向导
`openclaw status`	查看运行状态
`openclaw health`	健康检查
`openclaw gateway start`	启动服务
`openclaw gateway stop`	停止服务
`openclaw update`	更新到最新版本
`openclaw doctor`	诊断问题
`openclaw uninstall`	卸载 OpenClaw

七、常见问题

Q：安装飞书插件提示 spawn npm ENOENT

这是 OpenClaw 在 Windows 上的已知 bug。找到以下文件：

C:\Users\你的用户名\AppData\Roaming\fnm\node-versions\v22.x.x\installation\node_modules\openclaw\dist\process\exec.js

找到 runCommandWithTimeout 函数中的 spawn 调用，在其前面添加 Windows npm 兼容处理：

let command = argv[0];let useShell =false;if(process.platform ==="win32"&& path.basename(command)==="npm"){ useShell =true;}const child =spawn(command, argv.slice(1),{ stdio, cwd,env: resolvedEnv,shell: useShell,});

Q：提示"openclaw 命令找不到"

关闭所有 PowerShell 窗口，重新打开后重试。如仍不行，重启电脑。

Q：安装卡住不动

按 Ctrl+C 中断，执行 openclaw doctor 检查问题，确认防火墙设置是否阻止了网络请求。

Q：端口 18789 被占用

openclaw gateway --port 18790

换用其他端口启动服务。

八、费用说明

OpenClaw 软件本身：完全免费
主要费用来源：AI 模型 API 调用（推荐使用智谱 GLM 等国内模型，成本更低）

（10-1）大模型时代的人形机器人感知：视觉-语言模型在机器人中的应用

本章内容聚焦大模型时代人形机器人的感知体系升级，系统介绍了视觉—语言模型、多模态Transformer与3D大模型在机器人中的核心作用，详细讲解了文本、视觉、点云与语音等信息的语义对齐与融合机制，介绍了从语言指令到视觉目标的Grounding、任务分解与意图理解方法，并通过闭环感知与决策联动，展示了大模型支撑机器人在复杂真实场景中的理解、规划与实时行动的用法。 10.1 视觉-语言模型在机器人中的应用视觉—语言模型（Vision-Language Model，VLM）通过统一建模视觉与自然语言，使机器人具备“看懂并理解语言”的能力，是大模型时代机器人感知与认知融合的核心技术。VLM不仅能够完成图像识别、目标检测等传统感知任务，还可以直接理解语言指令、进行语义推理，并将高层语义映射为可执行的感知与行动目标，在人形机器人中广泛应用于交互理解、场景认知和任务执行等环节。 10.1.1 CLIP/BLIP/Flamingo等模型简介随着大规模多模态数据与Transformer架构的发展，视觉—语言模型逐渐从“跨模态对齐”演进为“多模态理解与推理”。CLIP、BLIP与Flam

WebGIS + 无人机 + AI：下一代智能巡检系统?

WebGIS 遇上无人机，再叠加 AI 能力，巡检不再只是“看画面”，而是变成“智能决策系统”。一、为什么 WebGIS + 无人机 + AI 是趋势？在传统巡检场景中： * 电力巡检 → 人工拍照 * 工地巡查 → 人工记录 * 农业监测 → 靠经验判断 * 安防巡逻 → 事后回放问题： * 数据无法实时分析 * 缺乏空间关联 * 没有智能预警能力 * 无法形成可视化决策系统而结合： * WebGIS（三维可视化） * 无人机（数据采集） * AI（智能识别与分析）我们可以构建：一个真正的“空天地一体化智能巡检系统” 二、整体技术架构设计 1、系统分层架构 ┌──────────────────────────────┐ │ 前端可视化层 │ │ Cesium + Three.js + WebGL │ └──────────────┬───────────────┘ │ ┌──────────────▼───────────────┐ │ 业务中台层 │ │ AI推理

【异常】飞书OpenClaw机器人 HTTP 401: Invalid Authentication 报错排查与解决方案

飞书OpenClaw机器人 HTTP 401: Invalid Authentication 报错排查与解决方案一、报错内容在飞书客户端会话场景中，用户向企业OpenClaw机器人发送交互消息后，OpenClaw无预期业务响应，会话内持续返回标准化报错信息：HTTP 401: Invalid Authentication。该报错可稳定复现于单聊、群聊等所有机器人交互场景，表现为用户每触发一次机器人交互，就会同步返回该报错信息，无正常业务逻辑执行结果返回。二、报错说明 2.1 报错本质定义 HTTP 401 是HTTP协议标准定义的未授权（Unauthorized）状态码，核心含义为请求方身份认证无效，服务端拒绝执行本次请求。在飞书开放平台的机器人场景中，该报错的本质是：飞书开放平台服务端对自建机器人的全链路鉴权校验失败。无论是机器人接收飞书事件推送的上行请求，还是机器人主动调用飞书开放平台API的下行请求，只要身份凭证无效、鉴权逻辑校验不通过，飞书服务端就会返回该报错，并最终透传到飞书客户端会话窗口中。

【论文阅读+代码梳理】Multimodal Diffusion Transformer: Learning Versatile Behavior from Multimodal Goals

一、论文阅读借助deepseek和豆包，对此表示感谢。 1.1 摘要问题：现有的绝大多数模仿学习的方法只从个别的目标模态中学习，例如语言和图像。但是现有的大规模模仿学习数据集仅部分标注了语言标注，是的现有方法无法充分利用这些数据集中学习语言条件化行为。解决方案：MDT引入在多模态目标指令上同时训练的潜在目标条件状态表示来解决。CLIP将图像和语言的目标嵌入对齐，通过两个自监督辅助任务进行训练，让目标嵌入能够编码足够的信息预测未来状态。效果：在包含不到2%的语言注释的数据集任务中表现出右移的性能，展示了从稀疏标注中解决长时操纵的能力。创新点： 1. 提出了一种新的基于Transformer的扩散方法，Multimodal Diffusion Transformer，从多模态目标中学习。具体来说，CLIP对多模态目标信息（语言指令/未来20-50帧的图像）编码，Voltron&Perceiver/ResNet18对当前的图像（第三视角静态图像、机械臂腕部图像）进行编码，将编码得到的token concat然后输入到Multimodal TransformerEncod