OpenClaw 安装 + 接入飞书机器人完整教程

OpenClaw 安装 + 接入飞书机器人完整教程

OpenClaw 曾用名:ClawdBot → MoltBot → OpenClaw(同一软件,勿混淆)
适用系统:Windows 10/11
最后更新:2026年3月

一、什么是 OpenClaw?

OpenClaw 是一款 2026 年爆火的开源个人 AI 助手,GitHub 星标已超过 10 万颗。

与普通 AI 聊天机器人的核心区别:

  • 真正的执行能力:不只回答问题,能实际操作你的电脑
  • 24/7 全天候待命:睡觉时也能主动完成任务
  • 完全开源免费:数据完全掌控在自己手中
  • 支持国内平台:飞书、钉钉等均已支持接入

二、安装前准备:安装 Node.js

建议提前手动安装 Node.js(版本 v22.x 以上),可加快后续安装速度并减少意外。

官方下载地址:https://nodejs.org/zh-cn/download


三、安装 OpenClaw

1. 设置 PowerShell 执行权限

管理员身份运行 PowerShell(Win 键搜索 → 右键 → 以管理员身份运行),依次执行:

Set-ExecutionPolicy RemoteSigned -Scope CurrentUser Set-ExecutionPolicy-Scope Process-ExecutionPolicy Bypass 

2. 执行一键安装命令

iwr-useb https://openclaw.ai/install.ps1 |iex

安装过程会自动完成:检测系统环境、安装依赖、下载核心文件、配置环境变量,并进入配置向导。


四、初始配置向导

1. 风险告知

左方向键 ← 选择 Yes,回车确认继续。

2. 选择 QuickStart 模式

3. 配置 AI 模型 API Key

推荐使用国内智谱 GLM 模型,成本低且门槛低。

4. 选择模型

选择 GLM-4.7(智谱当前旗舰模型)或其他你已有 Key 的模型。

5. 跳过通讯平台配置

飞书配置较复杂,此处选择 Skip,后续单独配置。

6. 跳过 Skills 配置

选择 No,后续通过 UI 界面配置。

7. 开启 Hooks

空格键选中,再按回车确认。

8. 启动服务并打开 UI 界面

服务启动后,约等待 30 秒,选择 Open the Web UI,浏览器自动打开管理界面:

http://127.0.0.1:18789 

五、接入飞书机器人

第一步:创建飞书应用

  1. 打开飞书开放平台:https://open.feishu.cn
  2. 点击右上角进入开发者后台
  3. 点击创建应用,填写应用名称和描述
  4. 进入应用详情,记录下 App IDApp Secret

第二步:添加机器人能力

在应用详情页,找到添加应用能力,选择并添加机器人

第三步:配置权限

权限管理页面,开通以下权限(即时通讯相关权限全部开通):

  • 获取与发送单聊、群组消息
  • 读取用户基本信息
  • 获取通讯录基本信息

第四步:创建版本并发布

  1. 版本管理中创建新版本
  2. 提交发布,状态为在线应用
  3. 前往飞书客户端完成审批

第五步:安装飞书插件

打开 PowerShell,执行:

openclaw plugins install @m1heng-clawd/feishu 

第六步:配置飞书插件

安装完成后,新开一个 PowerShell 窗口,执行:

openclaw config 

按照向导依次完成:

步骤操作
选择渠道选择飞书
选择配置链接选择对应链接
填写凭证输入 App ID 和 App Secret
选择域名选择中国区域
接受群组聊天确认开启
完成配置选择 Yes → Open → 继续

配置完成后重启服务使配置生效:

openclaw gateway stop openclaw gateway start

第七步:飞书后台设置事件回调

  1. 回到飞书开放平台 → 应用详情 → 事件订阅
  2. 选择使用长连接接收事件
  3. 点击添加事件,添加接收消息事件
  4. 重新发布版本(步骤同上)

第八步:开始使用

打开飞书客户端,找到你创建的机器人,直接发消息即可指挥 OpenClaw 干活!


六、常用命令速查

命令功能
openclaw onboard重新进入配置向导
openclaw status查看运行状态
openclaw health健康检查
openclaw gateway start启动服务
openclaw gateway stop停止服务
openclaw update更新到最新版本
openclaw doctor诊断问题
openclaw uninstall卸载 OpenClaw

七、常见问题

Q:安装飞书插件提示 spawn npm ENOENT

这是 OpenClaw 在 Windows 上的已知 bug。找到以下文件:

C:\Users\你的用户名\AppData\Roaming\fnm\node-versions\v22.x.x\installation\node_modules\openclaw\dist\process\exec.js 

找到 runCommandWithTimeout 函数中的 spawn 调用,在其前面添加 Windows npm 兼容处理:

let command = argv[0];let useShell =false;if(process.platform ==="win32"&& path.basename(command)==="npm"){ useShell =true;}const child =spawn(command, argv.slice(1),{ stdio, cwd,env: resolvedEnv,shell: useShell,});

Q:提示"openclaw 命令找不到"

关闭所有 PowerShell 窗口,重新打开后重试。如仍不行,重启电脑。


Q:安装卡住不动

Ctrl+C 中断,执行 openclaw doctor 检查问题,确认防火墙设置是否阻止了网络请求。


Q:端口 18789 被占用

openclaw gateway --port 18790 

换用其他端口启动服务。


八、费用说明

  • OpenClaw 软件本身:完全免费
  • 主要费用来源:AI 模型 API 调用(推荐使用智谱 GLM 等国内模型,成本更低)

Read more

(10-1)大模型时代的人形机器人感知:视觉-语言模型在机器人中的应用

(10-1)大模型时代的人形机器人感知:视觉-语言模型在机器人中的应用

本章内容聚焦大模型时代人形机器人的感知体系升级,系统介绍了视觉—语言模型、多模态Transformer与3D大模型在机器人中的核心作用,详细讲解了文本、视觉、点云与语音等信息的语义对齐与融合机制,介绍了从语言指令到视觉目标的Grounding、任务分解与意图理解方法,并通过闭环感知与决策联动,展示了大模型支撑机器人在复杂真实场景中的理解、规划与实时行动的用法。 10.1  视觉-语言模型在机器人中的应用 视觉—语言模型(Vision-Language Model,VLM)通过统一建模视觉与自然语言,使机器人具备“看懂并理解语言”的能力,是大模型时代机器人感知与认知融合的核心技术。VLM不仅能够完成图像识别、目标检测等传统感知任务,还可以直接理解语言指令、进行语义推理,并将高层语义映射为可执行的感知与行动目标,在人形机器人中广泛应用于交互理解、场景认知和任务执行等环节。 10.1.1  CLIP/BLIP/Flamingo等模型简介 随着大规模多模态数据与Transformer架构的发展,视觉—语言模型逐渐从“跨模态对齐”演进为“多模态理解与推理”。CLIP、BLIP与Flam

WebGIS + 无人机 + AI:下一代智能巡检系统?

WebGIS + 无人机 + AI:下一代智能巡检系统?

WebGIS 遇上无人机,再叠加 AI 能力,巡检不再只是“看画面”,而是变成“智能决策系统”。 一、为什么 WebGIS + 无人机 + AI 是趋势? 在传统巡检场景中: * 电力巡检 → 人工拍照 * 工地巡查 → 人工记录 * 农业监测 → 靠经验判断 * 安防巡逻 → 事后回放 问题: * 数据无法实时分析 * 缺乏空间关联 * 没有智能预警能力 * 无法形成可视化决策系统 而结合: * WebGIS(三维可视化) * 无人机(数据采集) * AI(智能识别与分析) 我们可以构建: 一个真正的“空天地一体化智能巡检系统” 二、整体技术架构设计 1、系统分层架构 ┌──────────────────────────────┐ │ 前端可视化层 │ │ Cesium + Three.js + WebGL │ └──────────────┬───────────────┘ │ ┌──────────────▼───────────────┐ │ 业务中台层 │ │ AI推理

【异常】飞书OpenClaw机器人 HTTP 401: Invalid Authentication 报错排查与解决方案

【异常】飞书OpenClaw机器人 HTTP 401: Invalid Authentication 报错排查与解决方案

飞书OpenClaw机器人 HTTP 401: Invalid Authentication 报错排查与解决方案 一、报错内容 在飞书客户端会话场景中,用户向企业OpenClaw机器人发送交互消息后,OpenClaw无预期业务响应,会话内持续返回标准化报错信息:HTTP 401: Invalid Authentication。 该报错可稳定复现于单聊、群聊等所有机器人交互场景,表现为用户每触发一次机器人交互,就会同步返回该报错信息,无正常业务逻辑执行结果返回。 二、报错说明 2.1 报错本质定义 HTTP 401 是HTTP协议标准定义的未授权(Unauthorized) 状态码,核心含义为请求方身份认证无效,服务端拒绝执行本次请求。 在飞书开放平台的机器人场景中,该报错的本质是:飞书开放平台服务端对自建机器人的全链路鉴权校验失败。无论是机器人接收飞书事件推送的上行请求,还是机器人主动调用飞书开放平台API的下行请求,只要身份凭证无效、鉴权逻辑校验不通过,飞书服务端就会返回该报错,并最终透传到飞书客户端会话窗口中。

【论文阅读+代码梳理】Multimodal Diffusion Transformer: Learning Versatile Behavior from Multimodal Goals

【论文阅读+代码梳理】Multimodal Diffusion Transformer: Learning Versatile Behavior from Multimodal Goals

一、论文阅读 借助deepseek和豆包,对此表示感谢。 1.1 摘要 问题:现有的绝大多数模仿学习的方法只从个别的目标模态中学习,例如语言和图像。但是现有的大规模模仿学习数据集仅部分标注了语言标注,是的现有方法无法充分利用这些数据集中学习语言条件化行为。 解决方案:MDT引入在多模态目标指令上同时训练的潜在目标条件状态表示来解决。CLIP将图像和语言的目标嵌入对齐,通过两个自监督辅助任务进行训练,让目标嵌入能够编码足够的信息预测未来状态。 效果:在包含不到2%的语言注释的数据集任务中表现出右移的性能,展示了从稀疏标注中解决长时操纵的能力。 创新点: 1. 提出了一种新的基于Transformer的扩散方法,Multimodal Diffusion Transformer,从多模态目标中学习。具体来说,CLIP对多模态目标信息(语言指令/未来20-50帧的图像)编码,Voltron&Perceiver/ResNet18对当前的图像(第三视角静态图像、机械臂腕部图像)进行编码,将编码得到的token concat然后输入到Multimodal TransformerEncod