2026最新保姆级教程:手把手教你零基础安装与配置本地 AI 智能体 OpenClaw
文章目录
- 前言
- 一、下载并安装 OpenClaw
- 二、启动配置向导与绑定 AI 大脑
- 三、连接通讯渠道 (Telegram)
- 第四步:安装扩展插件与重启服务
- 第五步:设备安全授权与最终测试 (见证奇迹!)
- 核心命令
- 实际用例
- 结语
前言
听说现在的 AI 不仅能聊天,还能直接读取你的电脑文件、帮你写代码、执行终端命令?没错,OpenClaw 就是这样一个能让大模型长出“手脚”接管你本地电脑的神器!
OpenClaw 是一款功能强大的 本地 AI 智能体(Agent)框架。它的核心理念是将云端的大语言模型(LLM)的“大脑”与你本地计算机的“手脚”连接起来,让 AI 能够突破网页对话框的限制,直接读取你的本地文件、执行系统命令,甚至自动化完成日常的开发与运维工作。
核心架构与工作原理
OpenClaw 的运行机制由三个关键部分组成:
- 本地网关 (Gateway Engine):这是运行在你电脑后台的守护进程(Daemon)。它类似于一个微型服务器,负责监听指令、管理权限以及调度底层的 AI 模型,是整个框架的控制中枢。
- 可插拔的“大脑” (LLM 接入):OpenClaw 本身不直接提供大模型计算,而是作为一个载体。你可以自由接入各类顶尖模型(如 Moonshot Kimi、Gemini 等),通过配置 API Key 为其注入思考和推理能力。
- 交互渠道 (Channels):它是你与 AI 沟通的物理桥梁。目前最成熟的方案是 Telegram Bot,这意味着你可以随时随地通过手机或平板向处于开机状态的电脑下发工作指令。
核心功能与应用场景
- 本地系统接管:只要在你授权的工作区(Workspace)范围内,它可以直接分析目录结构、读取代码文件内容、甚至替你执行命令行的脚本。
- 丰富的技能插件 (Skills Ecosystem):OpenClaw 支持通过安装额外的依赖库来针对性扩充能力。
- 多端可视化控制:除了即时通讯软件,它还内置了本地的 Web Dashboard 控制台(默认运行在 http://127.0.0.1:18789),可以清晰地查看进程日志、Token 消耗状态和模型链路。对于开发者,它还提供了 VS Code 插件版本,无缝融入代码编辑器环境。
很多新手一看到命令行就头疼,别怕!这篇教程为你准备了从零开始的全流程图文指引。不用懂复杂的原理,跟着截图一步步敲键盘,今天就让你的专属 AI 助理在你的电脑里“活”过来!
一、下载并安装 OpenClaw
首先,我们需要把 OpenClaw 这个软件下载到你的电脑上。打开你电脑的命令行工具(Windows 用户打开 CMD 或 PowerShell,Mac 用户打开终端 Terminal),在黑框框里输入以下命令并按下回车(Enter)键:
npm install -g openclaw
二、启动配置向导与绑定 AI 大脑
安装完成后,我们需要给它做一个基础的“开机设置”,顺便给它装上一个聪明的“AI 大脑”。
1. 启动向导
在终端里输入以下命令并回车:openclaw onboard
这会唤醒 OpenClaw 的初始化配置程序。
2. 确认账户类型
系统会问你使用什么账户,默认选择 Yes 即可(代表作为个人账户继续)。使用键盘方向键选择,回车确认。
3. 选择快速入门模式
对于新手,强烈建议在这里选择 QuickStart (快速入门)。这个模式会自动帮你跳过很多复杂的底层配置,提供最顺畅的新手引导。
4. 选择大模型 (AI 大脑)
现在我们要给机器人挑选一个“大脑”。OpenClaw 支持很多国内外大模型。
对于国内开发者来说,为了网络稳定和中文理解能力,这里推荐使用方向键选择 Moonshot AI (Kimi K2.5)
5. 选择 API 接口区域
紧接着,选择 Kimi API key (.cn)
这是目前国内开发者的主流选择,直连国内服务器,速度最快
6. 填入你的专属 API Key
系统会提示你输入 API Key。这个 Key 就像是你使用 Kimi 大脑的“专属密码”。
需要先去 Moonshot 开放平台 注册并生成一个 API Key
将你申请到的 API Key 复制,然后在此处粘贴,按下回车。
三、连接通讯渠道 (Telegram)
大脑装好了,我们得找个地方跟它聊天下指令。OpenClaw 支持把机器人接入常见的聊天软件中。
1. 选择 Telegram
在列表里选择 Telegram (Bot API)
Telegram 对开发者极其友好,是目前控制机器人最丝滑的平台。
2. 绑定机器人的 Token
系统会要求你输入 Telegram bot token。
你需要提前在 Telegram 里搜索 @BotFather
然后发送 /newbot 创建一个机器人,它会发给你一串像 123456:ABCDefg... 这样的长代码。
把这串代码粘贴到终端里,按下回车。
第四步:安装扩展插件与重启服务
接下来系统会问你是否需要安装一些额外的技能。
1. 技能插件 (Skills)
Skills 是让机器人拥有额外能力的插件(比如搜索网页、操作 GitHub 等)。
作为新手,这里可以直接按回车跳过 (Skip for now),等以后熟练了随时可以加。
⚠️ ⚠️ ⚠️
这里暂时跳过,不是说明skills没啥用,恰恰相反 skills 的作用极大!!!
OpenClaw 和普通的 AI 对话工具最大的区别,不是对话能力有多强,而是它有一个完整的 skills 生态。
说白了,不用 skills,你可能只发挥了 OpenClaw 20% 的能力。
这就像买了一部顶配的智能手机,但从来不装 APP,只用来打电话发短信,完全浪费了硬件性能,暴殄天物。
【进阶实战】别把 OpenClaw 当 ChatGPT 用!解锁 100% 潜力的 Top 20 必装 Skills 清单与环境配置
2. 附加功能 (Hooks)
Hooks 是针对高级开发者的钩子功能(比如记录日志等)
同样,直接按回车先跳过即可
3. 重启并应用配置
最后,系统会提示正在管理 Gateway(网关)服务
如果有提示,请选择 Restart (重启)
这会让刚才填写的配置全部生效!
第五步:设备安全授权与最终测试 (见证奇迹!)
配置全部走完后,我们要把底层的发动机彻底跑起来,并进行最后一步安全验证。
1. 启动核心引擎
如果终端回到了普通的输入状态,请输入以下命令:
openclaw gateway
这行命令非常重要!它是 OpenClaw 的核心服务器(你可以把它理解为机器人的心脏)。它负责监听本地端口、连接 Telegram 并调用刚才配置的大模型。注意:启动后,这个黑色的终端窗口千万不能关,否则机器人就掉线啦!
2. 去 Telegram 发起聊天
打开你的 Telegram,找到你刚才创建的那个机器人,随便给它发一条消息(比如发个 hi 或者点击底部的 Start)。
3. 进行安全配对 (极度重要)
你会发现机器人没有立刻回答你的问题,而是给你发了一段带有 Pairing code(配对码)的提示。
别慌,这是为了保护你电脑安全的机制! 它在问:“是你本人在试图控制这台电脑吗?”
操作方法:
- 复制机器人发给你的那行授权命令(例如:openclaw pairing approve telegram G8SKL9QK)。
- 回到你电脑上,重新开一个全新的终端黑窗口,把这行命令粘贴进去并回车!
这个动作相当于你作为“主人”,亲自给 Telegram 上的机器人发放了“进场许可证”。
4. 恭喜!大功告成!
配对成功后,回到 Telegram,你就可以正常和它聊天了!
试着对它说:“你好,请用中文介绍一下你自己,并告诉我当前我电脑操作系统的名称。”
它不仅能听懂你说话,还能直接读取你的系统信息返回给你!
列出我电脑桌面上所有的文件名:
10分钟后发消息提醒:
核心命令
🛠️ OpenClaw 核心命令全解析
这四个命令本质上都是围绕着 “OpenClaw 核心后台服务(Gateway)” 展开的。
| 命令 (Command) | 核心作用 (Role) | 前端开发类比 (前端视角) | 关联与依赖 (Connection) | 核心区别与特征 (Difference) |
|---|---|---|---|---|
openclaw gateway | 启动核心网关服务(前台模式) 启动本地服务器,监听端口,连接大模型与 Telegram。 | 相当于运行 npm run dev 或 umi dev | 是所有功能运行的基础引擎。如果不运行它,Telegram 机器人会瘫痪,Dashboard 网页也会打不开。 | 前台阻塞进程。终端窗口必须一直开着,一旦你按 Ctrl+C 或关闭黑窗口,服务立刻终止。主要用于排查报错日志(Debug)。 |
openclaw daemon start | 启动核心网关服务(后台守护模式) 将网关服务注册为系统后台任务静默运行。 | 相当于运行 pm2 start server.js | 作用完全等同于 openclaw gateway,但它是独立在后台存活的。 | 后台静默进程。执行后你可以直接关闭终端窗口,服务依然在后台偷偷运行,通常还会跟随电脑开机自启。 |
openclaw dashboard | 打开可视化控制面板 生成安全的本地免密登录链接,并自动唤起浏览器打开 127.0.0.1:18789。 | 相当于在浏览器输入 localhost:8000?token=xxx 预览项目 | 严重依赖 Gateway 引擎。只有当你通过 gateway 或 daemon start 把服务跑起来后,这个命令才有意义,否则网页直接报错“无法访问”。 | 它本身不是服务器,只是一个“快捷方式脚本”,用来帮你省去手动复制超长安全 Token 的麻烦。 |
openclaw status | 查看系统体检报告 输出当前网关的状态、Telegram 的连接情况、大模型的 Token 消耗量。 | 相当于运行 pm2 status 或查看服务端 Health Check 接口 | 用于侦测 Gateway 引擎的运行状况。当你发现 Telegram 机器人不回消息时,第一个就该敲这个命令。 | 它是只读操作,不会启动或关闭任何服务。只负责把当前后台的各项数据汇报给你。 |
🔄 它们之间的整体关联与逻辑链路
你可以把 OpenClaw 想象成一家 AI 餐厅:
openclaw gateway或openclaw daemon start(二选一):这就是在 “开门营业 / 启动后厨”。没有后厨,什么都做不了。(区别只是gateway是你亲自盯场子,daemon是雇了个经理在后台帮你管)。openclaw status:这就是在 “查房/看监控”。看看后厨(Gateway)还在不在运作,服务员(Telegram)有没有在接客。openclaw dashboard:这是餐厅的 “经理办公室”。后厨必须在营业状态,你才能走进办公室看账本(运行日志)、调配方(修改 API Key 配置)。
💡 日常标准工作流
建议按照以下顺序使用,获得最舒适的开发体验:
- 开机/日常启动:直接运行
openclaw daemon start(让它在后台跑,不碍事)。 - 使用期间排错:如果发消息给机器人没反应,运行
openclaw status看看是不是断网了或模型连不上。 - 修改高级配置:当你需要切换其它大模型时,运行
openclaw dashboard在网页里可视化修改。 - 彻底重启服务:遇到玄学 Bug 网页打不开,运行
openclaw daemon restart(等于重启 PM2 进程)。
🚀 进阶必知:OpenClaw 其它核心命令速查表
当你熟悉了基础的启动和运行后,下面这几个命令将是你日常维护、排错和进阶配置的得力助手:
| 命令 (Command) | 核心作用 (Role) | 前端开发类比 (前端视角) | 典型使用场景 (Usage Scenario) |
|---|---|---|---|
openclaw onboard | 初始化系统向导 引导式完成 API 密钥、白名单、基础插件的配置。 | 相当于 create-umi 或 npx create-react-app | 只有在第一次安装,或者你想彻底推翻重来(重新配置所有核心设置)时才会用到。 |
openclaw logs | 查看实时运行日志 打印出后台 Gateway 接收指令、调用大模型、执行本地脚本的完整流水。 | 相当于 pm2 logs 或浏览器的 Network / Console 面板 | 排错神器!当机器人胡言乱语、或者让你执行某个动作却没反应时,输入 openclaw logs --follow 就能实时看到底层的报错信息。 |
openclaw daemon stopopenclaw daemon restart | 停止/重启后台服务 对后台守护进程进行生命周期管理。 | 相当于 pm2 stop / pm2 restart | 当你觉得电脑变得卡顿,或者修改了底层环境需要让 OpenClaw 重新加载时使用。 |
openclaw config | 管理底层配置 直接增删改查系统配置项,跳过繁琐的 onboard 向导。 | 相当于直接修改 .env 环境变量文件或 config/config.ts | 高级配置。比如你想把默认对话模型切换为基于 3 Pro 的模型,或者在做前端设计时,专门为 UI 图片生成配置类似 Nano Banana Pro 这样的大模型参数,用这个命令可以直接写入,不用重启向导。 |
openclaw pairing | 设备/渠道安全配对 管理或清除已授权的客户端(如 Telegram 账号)。 | 相当于后台管理系统的“设备登录授权管理” | 当你换了一部手机上的 Telegram,或者不小心清理了缓存,需要重新进行安全授权(例如执行 pairing approve)时使用。 |
实际用例
OpenClaw 虽然在终端里跑着一堆看似硬核的代码,但它一旦运行起来,对于完全不懂代码的普通用户(甚至行政、财务、运营人员)来说,简直就是一个长了手脚的 钢铁侠贾维斯。
它最核心的实际用途,就是把用鼠标点来点去的繁琐体力活,变成在 Telegram 里发一条微信语音般的指令。
以下梳理了 10 个最常用、最好用的非开发者核心场景:
- 📁 随时随地的私人高保真云盘
场景:下班在地铁上,老板突然要一份你电脑桌面上的汇报文件。
用途:直接打开手机 Telegram 对机器人说:“把我电脑 D盘/工作/2026年度汇报.pdf 发给我。” OpenClaw 会立刻在本地找到文件并发送到你的手机上。完全不需要开启向日葵或 TeamViewer 这种卡顿的远程桌面。 - 🔒绝对隐私的机密文档阅读器
场景:手头有一份涉及公司财务、跨境税务或者未公开的商业计划书,想让 AI 帮你总结,但绝对不能上传到外部网页版的 AI 工具里(防止泄密)。
用途:对 OpenClaw 说:“帮我总结一下桌面上那个 100 页的《跨境物流成本分析》Word 文档。” 它在本地直接读取,数据不出你的电脑,安全级别拉满。 - 🧹拯救强迫症的桌面/文件夹自动整理
场景:电脑桌面堆满了截图、临时下载的参考图、各类文档,乱作一团。
用途:发一句:“帮我把桌面上的文件分类整理一下,图片放进‘参考图’文件夹,文档放进‘文档’文件夹,不要动快捷方式。” 几秒钟后,桌面瞬间清爽。 - 🏷️ 一句话搞定神级批量重命名
场景:你刚从网上下载了 50 张UI参考素材,名字全是乱码(比如 wx_camera_123.jpg)。
用途:发一句:“把我下载文件夹里的所有图片,按照‘物流后台参考_01, 02…’的顺序重新命名。” 这种以前需要专门下载第三方软件才能干的活,现在一句话搞定。 - 🔄 无广告的全能格式转换器
场景:收到了 WebP 格式的图片打不开,或者想把 Word 转成 PDF。平常去网页搜转换工具,全是广告和充值诱导。
用途:直接对机器人说:“把我桌面上的 logo.webp 转换成 PNG 格式并保存在旁边。” OpenClaw 会在后台默默调动系统能力帮你转好。 - 🔍 大海捞针般的内容级超级搜索
场景:你只记得半年前写过一段关于“巴西清关政策”的笔记,但忘了文件名,也忘了放在哪个盘里,Windows 自带的搜索根本搜不到。
用途:对 OpenClaw 说:“帮我找一下电脑里哪份文档提到了‘巴西清关’,把那一段摘录给我。” 它能深入文件内部去“阅读”并揪出目标。 - 🌐 超长外语资料的本地翻译官
场景:拿到一份全英文的行业报告(比如几十页的 PDF 或几十万字的 TXT 记录),自己啃太慢。
用途:指令:“读取 D:/资料/report.pdf,帮我把核心结论翻译成中文,并新建一个 Word 文档保存到桌面上。” - 📊 跨文件的数据提取与汇总
场景:有 10 个不同的 Excel 或文本文件,里面散落着各种客户的联系方式。
用途:指令:“帮我把 客户资料 文件夹里所有文件中的邮箱地址提取出来,汇总成一个新的 联系人.txt 文件给我。” 彻底告别复制粘贴到手软。 - 💻 无门槛的电脑系统级控制
场景:躺在床上用手机看剧,电脑放在远处下载大文件。
用途:拿起手机发 Telegram:“电脑静音”,或者“一个小时后帮我把电脑关机”。 - 📝 你的全天候私人速记员
场景:你在外面突然有了一个绝佳的界面布局灵感,或者想起了明天要买的东西。
用途:直接在 Telegram 里发给 OpenClaw:“帮我记下来:明天上午要查一下表格组件的交互规范。” OpenClaw 会自动把你随口说的话,分门别类地追加保存到你电脑本地的 备忘录.txt 里,等你明天打开电脑,一切都已经记录在案。
结语
对于非开发人员,OpenClaw 相当于一个懂人话的 Windows/Mac 高级管家。
你不需要知道文件在哪个绝对路径,也不需要学习复杂的软件操作,只要通过聊天表达你的意图,它就能帮你操纵本地文件和系统。
这些场景里,有没有哪个是你现在就想拿起手机在 Telegram 里让它替你跑一遍的?(比如试试自动整理一下你的桌面?)
如果安装过程中遇到任何问题,欢迎在评论区留言交流。