【AI】自动教学视频生成方案

优质文章学习记录

07 Apr 2026 — 8 min read

最终目标：从"生成代码"到"生成教程视频"的完整闭环。

整体思路：从"动手"到"动口"

目标分解为两大步，它们分别对应两个强大的工具：

用Claude Code “做出来”：利用它在终端里自动编写代码、运行测试、生成文档的能力，为你的教学视频准备素材（如一个自动编码的Demo脚本）。
用OpenClaw “录下来”：利用OpenClaw操控电脑的能力，让它像人一样，自动打开终端、运行Claude Code、录制屏幕、最后生成一个完整的教学视频。

下面这个流程图可以帮你建立更直观的认知：

第二阶段：自动化录制与生成

第一阶段：内容生产中枢

自动编写/调试

1. 调用2. 执行3. 整合

输出

作为脚本输入

用户输入最终目标
例如：制作一个
“用Claude Code自动编码”的教学视频

Claude Code Agent

生成教学示例代码
与操作脚本

OpenClaw 主控Agent

屏幕录制Skill

终端操作Skill
（运行Claude Code）

视频生成Skill
（如Agent Opus）

最终成品：
自动生成的教学视频

接下来，我们进入具体的操作环节。

🛠️ 第一部分：跑通Claude Code，实现"自动编码"

这是计划的第一步，也是整个流程的基础。目标是让Claude Code能够在你指定的项目中，自主完成编码任务。

1. 安装与认证

Claude Code是Anthropic官方推出的终端Agent工具，安装非常简单。

前置条件：确保你的系统安装了 Node.js 18.0 或更高版本，并且有一个Git仓库用于测试。
首次认证：在项目目录下输入claude，终端会弹出一个浏览器窗口，登录你的Claude账号完成授权。之后就可以在终端里和它对话了。

一键安装：打开终端，根据你的系统选择一条命令执行即可：

# macOS / Linux / WSLcurl-fsSL https://claude.ai/install.sh |bash# Windows PowerShell irm https://claude.ai/install.ps1 | iex

或者，如果你更喜欢用npm：

npminstall-g @anthropic-ai/claude-code

2. 核心实操：让Claude Code自动完成一个编码任务

为了制作教学视频，你需要一个"自动编码"的演示案例。下面是一个标准的安全工作流，你可以直接用来作为视频的素材。

启动会话并下达指令：在项目目录下运行claude，然后给它一个清晰、具体的任务。例如：“请在这个项目中，创建一个新的Python脚本data_cleaner.py，它能够读取当前目录下的raw_data.csv，删除空行，并将清洗后的数据保存为clean_data.csv。请先展示修改计划。”
审查并执行计划：Claude Code会先给出一个修改计划，并显示它将如何修改文件。你需要仔细审查这个计划。
- 确认无误后，告诉它：“好的，请执行。”
- 它会自动创建文件、写入代码，甚至可能提示你如何安装必要的依赖（如pandas）。

提交成果：验证成功后，让Claude Code帮你提交代码。

gitadd.&&git commit -m"feat: 添加数据清洗脚本"

运行和验证：代码生成后，立即在终端里运行它，看看是否符合预期。

python data_cleaner.py

如果遇到错误，直接把错误信息复制粘贴回Claude Code的会话中，让它帮你分析和修复。

创建安全分支：在项目中创建一个新分支，确保所有操作都是可逆的。

git checkout -b tutorial/claude-automation

💡 进阶技巧：

Plan模式：对于复杂任务，可以用claude --permission-mode plan启动，这样Claude只会生成计划而不会真的修改文件，更安全。
文件引用：在对话中，用@符号可以快速引用项目中的文件，例如帮我重构一下@src/utils.py这个文件，非常方便。
记忆项目规范：运行/init命令，Claude Code会创建一个CLAUDE.md文件，你可以把项目的编码规范写进去，以后它就会自动遵循。

🤖 第二部分：部署OpenClaw，为自动化"注入灵魂"

OpenClaw（或称Moltbot）是一个开源的智能体编排框架，可以把它理解为AI的"手和脚"，让它能像人一样操作电脑、调用各种工具。这里我们重点实现用OpenClaw来操控电脑，模拟人制作视频的过程。

1. 环境搭建（推荐新手方案）

部署OpenClaw有两种主要方式，建议新手从第一种开始。

方案A：阿里云一键部署（最简单）
这是目前最快捷的方式，特别适合不想折腾本地环境的朋友。
1. 访问阿里云OpenClaw一键部署专题页面，点击"一键购买并部署"。
2. 选购一台轻量应用服务器，镜像选择"OpenClaw(Moltbot)"，内存建议2GiB以上。
3. 部署完成后，按照控制台提示，放通端口、配置百炼API-Key，然后就可以得到一个Web控制台，直接在浏览器里和你的OpenClaw对话了。

方案B：本地环境安装（更灵活）
如果你想把OpenClaw跑在自己的主力机上，可以按以下步骤操作：

# 1. 全局安装npminstall-g openclaw@latest # 2. 初始化配置 openclaw setup # 3. Mac用户注意：需要在“系统设置-隐私与安全性-辅助功能”中，勾选你的终端App，授予OpenClaw操控电脑的权限。

2. 核心技能：让OpenClaw执行录制任务

OpenClaw的强大之处在于它的"Skills"（技能）。你可以通过编写简单的JavaScript代码或配置，让它掌握新的能力。这里我们构思两个核心技能：

终端操作Skill：让OpenClaw能够打开终端、进入指定目录、运行claude命令并与之交互。这可以通过OpenClaw内置的shell技能实现。
屏幕录制Skill：让OpenClaw能够启动系统的屏幕录制工具（如OBS Studio的命令行接口），开始录制和停止录制。

一个简单的任务链示例（概念）：

用户指令：“录制一个教学视频，主题是’用Claude Code自动清洗数据’。”
OpenClaw规划：
- 第一步：调用屏幕录制Skill，开始录制。
- 第二步：调用终端操作Skill，打开终端，进入项目目录。
- 第三步：在终端中运行claude，并自动输入指令：“请帮我创建一个清洗数据的Python脚本…”, 并记录下整个交互过程和最终运行结果。
- 第四步：调用屏幕录制Skill，停止录制。
整合输出：OpenClaw将录制的视频文件保存在指定位置，甚至可以通过集成的视频生成工具（如Agent Opus）进行自动剪辑和添加字幕。

👣 下一步：监督调整OpenClaw

在你成功部署OpenClaw后，下一步就是"监督调整"，让它复现你第一步中手动操作Claude Code的过程。这就像教一个新同事做事，你需要把操作步骤拆解成OpenClaw能理解的指令。

从简单命令开始：先试试让OpenClaw执行一条简单的shell命令，比如openclaw run "打开终端，并执行'git status'"，观察它是否能正确理解你的意图。
拆解复杂任务：把你手动操作Claude Code的过程（打开终端 -> 输入claude -> 输入指令 -> 审查计划 -> 确认执行 -> 运行脚本验证）拆解成一步步的指令，逐步教给OpenClaw。
利用现有案例：搜索结果中有一个非常有价值的案例：OpenClaw + Agent Opus 实现视频自动生成。虽然它生成的是AI数字人视频，但其中的"OpenClaw作为大脑，调用视频生成工具作为手"的架构，和你设想的"OpenClaw录制Claude Code操作视频"是完全一致的。你可以深入研究这个案例的"技能"（Skill）是如何编写的，这将为你提供巨大的参考价值。

最终，当你将Claude Code的代码生成能力，与OpenClaw的电脑操控和任务编排能力结合在一起时，你就能实现那个终极目标：AI根据用户的主题，自动完成代码编写、环境演示、屏幕录制，最终生成一个完整的教学视频。

ABB 机器人虚拟示教器基础操作教程

一、基础操作界面与模式 1. 操作模式切换 * 手动模式：用于编程、调试和手动操作自动模式：用于程序自动运行（需满足安全条件） 2. 动作模式选择（手动模式下） * 单轴模式：单独控制每个关节轴（1-6轴） * 优点：最直观，与坐标系无关 * 用途：调整机器人姿态，避免奇异点 * 线性模式：TCP沿直线运动 * 重定位模式：TCP位置不变，只改变工具姿态点击示教器左上角进入菜单栏 3. 坐标系选择（线性/重定位模式下）四个可选坐标系： * 大地坐标系：机器人安装的基础坐标系 * 基座坐标系：机器人底座中心为原点（多数基本选择） * 工件坐标系：用户自定义的工作平面 * 工具坐标系：以工具末端为原点二、三大核心数据设置 1. 工具数据（tooldata）定义：描述工具（

Retinaface+CurricularFace一文详解：RetinaFace检测+CurricularFace识别双模型协同原理

Retinaface+CurricularFace一文详解：RetinaFace检测+CurricularFace识别双模型协同原理人脸识别技术早已不是实验室里的概念，而是深入到考勤打卡、门禁通行、身份核验等日常场景中的实用工具。但真正落地时，很多人会发现：单靠一个“端到端”的黑盒模型，效果不稳定、调试无从下手、换张侧脸图就失效——问题往往不出在算法本身，而在于检测与识别两个环节的割裂。 RetinaFace + CurricularFace 这套组合，不是简单拼凑，而是一次有明确分工、深度协同的工程化设计：RetinaFace 负责“找得准”，CurricularFace 负责“认得牢”。它不追求参数量最大，而是把每一步都落在实处——人脸在哪、怎么对齐、特征怎么提、相似度怎么算，全都透明可查、可控可调。本文不讲论文公式，不堆架构图，只带你理清这套镜像背后的真实逻辑：为什么是 RetinaFace 而不是 YOLO？为什么选 CurricularFace 而非 ArcFace？两个模型之间到底发生了什么？

无人机 5.8G 模拟图传电路设计方案及性能分析

一、什么是 5.8G 模拟图传？简单说，5.8G 模拟图传就是无人机的 “千里眼”，能把天上拍的画面实时传到地面。你在遥控器上看到的无人机视角，全靠它来实现。为啥是 5.8G？因为这个频段干扰少，就像高速路上车少，信号跑起来更顺畅。而且模拟信号传输快，延迟低，特别适合 FPV 竞速这种需要快速反应的场景 —— 总不能无人机都撞墙了，你才在屏幕上看到障碍物吧？二、工作原理：信号的 “旅行记” 2.1 信号采集：无人机的 “眼睛” 无人机上的摄像头就像手机相机，能把看到的景象变成电信号。但这时候的信号很弱，还带着 “杂音”，就像说话含着口水，听不清。这时候会经过两步处理： * 过滤杂音：用低通滤波器 “过滤” 掉高频噪音，就像用滤网把水里的沙子去掉。 * 信号放大：放大器把信号变强，

【讨论】VR + 具身智能 + 人形机器人：通往现实世界的智能接口

摘要：本文探讨了“VR + 具身智能 + 人形机器人”作为通往现实世界的智能接口的前沿趋势。文章从技术融合、应用场景、商业潜力三个维度分析其价值，涵盖工业协作、教育培训、医疗康复、服务陪护等领域，并展望VR赋能下的人机共生未来，揭示具身智能如何推动机器人真正理解、感知并参与现实世界。 VR + 具身智能 + 人形机器人：通往现实世界的智能接口文章目录 * VR + 具身智能 + 人形机器人：通往现实世界的智能接口 * 一、引言：三股力量的融合，正在重塑现实世界 * 二、具身智能：让AI拥有“身体”的智慧 * 1. 什么是具身智能（Embodied Intelligence） * 2. 为什么VR是具身智能的“孵化器” * 三、VR + 具身智能 + 人形机器人：协同结构与原理 * 1. 系统组成 * 2. 人类的“