Video2Robot：从视频到机器人动作的端到端生成管道

Video2Robot：从视频到机器人动作的端到端生成管道 | 极客日志

# 递归克隆包含所有子模块
git clone --recursive https://github.com/AIM-Intelligence/video2robot.git
cd video2robot
# 如果已克隆但未初始化子模块
git submodule update --init --recursive

# 创建并激活 GMR 环境
conda create -n gmr python=3.10 -y
conda activate gmr
# 安装核心依赖
pip install -e .

conda create -n phmr python=3.11 -y
conda activate phmr
cd third_party/PromptHMR
bash scripts/install_blackwell.sh

conda create -n phmr python=3.10 -y
conda activate phmr
cd third_party/PromptHMR
pip install -e .

# 在 GMR 环境中测试
conda activate gmr
python -c "import video2robot; print('GMR 环境正常')"
# 在 PromptHMR 环境中测试
conda activate phmr
python -c "import prompt_hmr; print('PromptHMR 环境正常')"

# 复制环境变量模板
cp .env.example .env
# 编辑.env 文件，设置 API 密钥
# 支持 Veo、Sora 等服务的 API 密钥配置

# 构建包含两个环境的 Docker 镜像
docker build -t video2robot:latest .
# 运行容器
docker run -it --gpus all -p 8000:8000 video2robot:latest

docker pull aimintelligence/video2robot:latest

# 在.env 文件中设置代理
HTTP_PROXY=http://your-proxy:port
HTTPS_PROXY=http://your-proxy:port

# 完整管道示例
python scripts/run_pipeline.py --action "向前走四步"
# 使用 Sora 模型生成视频
python scripts/run_pipeline.py --action "跳舞动作" --provider sora
# 从现有视频开始处理
python scripts/run_pipeline.py --video /path/to/dance.mp4

# 查看完整处理结果
python scripts/visualize.py --project data/video_001
# 仅查看提取的姿态
python scripts/visualize.py --project data/video_001 --pose
# 仅查看机器人动作
python scripts/visualize.py --project data/video_001 --robot

# 从项目根目录启动
uvicorn web.app:app --host 0.0.0.0 --port 8000

video2robot/
├── video2robot/ # 主包目录
│   ├── config.py # 配置管理
│   ├── pipeline.py # Python API 管道
│   ├── cli.py # 命令行入口点
│   ├── video/ # 视频生成处理模块
│   │   └── veo_client.py # Google Veo API 客户端
│   ├── pose/ # 姿态提取模块
│   │   └── extractor.py # PromptHMR 包装器
│   └── robot/ # 机器人转换模块
│       └── retargeter.py # GMR 包装器
├── scripts/ # CLI 脚本目录
│   ├── run_pipeline.py # 完整管道脚本
│   ├── generate_video.py # 视频生成脚本
│   ├── extract_pose.py # 姿态提取脚本
│   ├── convert_to_robot.py # 机器人转换脚本
│   └── visualize.py # 结果可视化脚本
├── configs/ # 配置文件目录
├── data/ # 数据目录（git 忽略）
├── third_party/ # 外部依赖（子模块）
│   ├── PromptHMR/ # 姿态提取模型
│   └── GMR/ # 运动重定向框架
├── web/ # Web 界面
├── .env.example # 环境变量示例
├── pyproject.toml # Python 项目配置
├── requirements.txt # 依赖列表
├── setup.py # 安装脚本
└── README.md # 项目主文档

# 完整克隆（包含子模块）
git clone --recursive https://github.com/AIM-Intelligence/video2robot.git
cd video2robot
# 设置 GMR 环境
conda create -n gmr python=3.10 -y
conda activate gmr
pip install -e .
# 设置 PromptHMR 环境（根据 GPU 架构选择）
conda create -n phmr python=3.10 -y
# 或 3.11 for Blackwell
conda activate phmr
cd third_party/PromptHMR
pip install -e .
# 或 bash scripts/install_blackwell.sh

Video2Robot：从视频到机器人动作的端到端生成管道

简介

主要功能

1. 端到端自动化管道

2. 多模态输入支持

3. 多机器人平台兼容

4. 先进视频生成集成

5. 交互式 Web 界面

6. 智能环境管理

7. 模块化可扩展架构

8. 完整可视化工具链

9. 项目状态管理

10. 生产就绪输出格式

安装与配置

环境要求与兼容性

基础安装流程

高级配置选项

Docker 部署（可选）

故障排除指南

如何使用

快速开始：从文本到机器人动作

核心工作流详解

Web 界面使用流程

最佳实践建议

应用场景实例

实例 1：娱乐机器人舞蹈编排

实例 2：工业机器人技能培训

实例 3：医疗康复机器人辅助治疗

实例 4：影视特效中的机器人角色动画

实例 5：教育机器人互动内容开发

GitHub 地址

更多推荐文章

相关免费在线工具

Video2Robot：从视频到机器人动作的端到端生成管道

简介

主要功能

1. 端到端自动化管道

2. 多模态输入支持

3. 多机器人平台兼容

4. 先进视频生成集成

5. 交互式 Web 界面

6. 智能环境管理

7. 模块化可扩展架构

8. 完整可视化工具链

9. 项目状态管理

10. 生产就绪输出格式

安装与配置

环境要求与兼容性

基础安装流程

高级配置选项

Docker 部署（可选）

故障排除指南

如何使用

快速开始：从文本到机器人动作

核心工作流详解

Web 界面使用流程

最佳实践建议

应用场景实例

实例 1：娱乐机器人舞蹈编排

实例 2：工业机器人技能培训

实例 3：医疗康复机器人辅助治疗

实例 4：影视特效中的机器人角色动画

实例 5：教育机器人互动内容开发

GitHub 地址

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具