宇树 Qmini 双足机器人训练个人经验总结

宇树 Qmini 双足机器人训练个人经验总结
github:https://github.com/vsislab/RoboTamer4Qmini

本篇内容基于我在 AutoDL 云服务器 上对 Qmini 做完整训练与测试的实践总结,涵盖训练、可视化、策略测试、模型导出、URDF 调试等环节,并重点说明 headless(无显示)环境下的各种坑与解决方案。希望能帮到后来者少走弯路。

前提说明:为什么不建议在云端直接跑渲染?

我最开始的目标是:训练、渲染、视频录制全部在 AutoDL 上完成,不经过本地运行。

然而现实是:

  • 即使用 Xvfb 等虚拟显示器启动 Isaac Gym,也会发生视频保存全黑的情况。
  • VNC 远程桌面也无法正常显示 Isaac Gym 的渲染窗口。
  • 根本原因来自 驱动版本过高与 Isaac Gym 对驱动的强依赖
因此更推荐:在云服务器训练模型 → 本地 Ubuntu 加载策略进行测试与演示。
可以在云服务器中进行训练然后在本地进行测试,这是我目前发现的比较好的方式,本地使用的是ubuntu系统,最后算是可以正常演示。

当前的问题都是基于我完全使用autodl上进行的尝试,希望可以对大家有所帮助,少踩坑。
训练阶段

python train.py --config BIRL --name <name>

–name

​ 存放路径experiments/<name>/

–config

​ 选择配置文件,默认:BIRL

–resume

​ 恢复训练

​ eg:python train.py --name stand --resume --path experiments/stand/checkpoints/policy_40000.pt

–render

​ 开启画面显示(isaac gym窗口)

–fix_cam

​ 视角固定在机器人上方

–horovod

​ 多gpu训练

–r l_device

​ 训练设备设置

​ 默认cudo0,可以改为cpu等

–num_envs

​ 环境数量

–seed

​ 随机种子,利于复现

–max_iterations

​ 最大训练迭代次数
查看结果

云端可能出现 6006 端口占用 的情况,需要手动释放。

1. 安装 lsof

apt-get update

apt-get install lsof -y

2. 查看端口占用

lsof -i :6006

3. 杀掉进程

kill -9 <PID>

4. 重新启动 TensorBoard

tensorboard --logdir experiments/<name>/log --port 6006

运行训练好的策略 play.py

python play.py --render --name <name> 加载训练好的策略,开始跑模拟器

–render 显示画面

–fix_cam 相机固定跟随机器人

–cmp_real 与真实机器人采集的数据对比绘图

–plt_sim 显示仿真数据的曲线图(如关节角、速度等)

–num_envs 改变并行环境数量

–video 开启视频录制,保存到 videos/ 文件夹,必须配合 --render

–time 玩多少秒

–iter 指定用哪一轮的模型,默认加载目录下最后一个 policy

–epochs 重复评估多少次,用来统计平均性能

–debug 保存仿真数据到 Excel
导出ONNX模型

python export_pt2onnx.py --name <name>

.pt 权重导出为 .onnx,便于部署到嵌入式设备、Jetson、Unity 等。

加载(调试)urdf模型

python tune_urdf.py

测试你的机器人 URDF 是否正常加载,检查质量参数、碰撞体、关节限位,也可微调模型参数

自动调参PID(tun_pid.py)

python tune_pid.py --mode <mode>

–model

错误

Headless 环境无法渲染
云服务器默认无显示设备。

临时方案:使用虚拟显示:Xvfb(首先进行pip下载)

Xvfb :1-screen 0 1024x768x24 &#启动 X Server export DISPLAY=:1#设置环境变量
注意:但这只能让程序“以为”自己有显示,无法保证正常渲染!
使用autodl远程连接,play.py 视频录制仍为黑屏
image-20251121211032490
原因分析:原因:云端 GPU 驱动版本过高(如 570 系列),超过了 Isaac Gym 的兼容范围。

Isaac Gym 对渲染器依赖的驱动版本非常敏感,驱动过新 → 渲染器初始化失败 → 视频录制为纯黑。

目前找到比较好的方案是:云端只做训练,本地 Ubuntu 运行 play.py。

最后的最后再次说明,目前我认为比较稳妥、推荐的流程是:云端训练(AutoDL)→ 本地 Ubuntu Play 与可视化。云端的 headless 环境与高版本驱动目前无法可靠支持 Isaac Gym 的图形渲染与视频录制,本地则能完美解决所有渲染相关问题。

如有不对,希望各位大佬可以积极指出,谢谢各位。

Read more

DAMO-YOLO开发者案例:为教育机器人集成实时物体识别模块

DAMO-YOLO开发者案例:为教育机器人集成实时物体识别模块 基于阿里达摩院 TinyNAS 架构的高性能实时目标检测系统。结合自研赛博朋克美学界面,实现工业级识别能力与未来主义视觉体验的完美融合。 1. 项目背景与需求 教育机器人正在成为智慧教育的重要工具,但很多机器人缺乏真正的"视觉智能"。传统的物体识别方案要么速度太慢,要么准确率不够,无法满足实时交互的需求。 我们最近为一个教育机器人项目集成了DAMO-YOLO视觉系统,让机器人能够实时识别教室环境中的各种物体:从书本、文具到电子设备,甚至能识别学生的手势动作。这个案例展示了如何将先进的视觉AI技术落地到实际教育场景中。 2. DAMO-YOLO技术优势 2.1 高性能实时检测 DAMO-YOLO基于阿里达摩院的TinyNAS架构,这个设计让它在保持高精度的同时实现了极快的推理速度。在教育机器人场景中,这意味着: * 实时响应:处理一帧图像只需10毫秒左右,机器人可以流畅地与环境互动 * 高准确率:支持80种常见物体的识别,覆盖教室中的绝大多数物品 * 资源高效:即使在嵌入式设备上也能稳定运行,适合教

目标检测数据集——无人机视觉VisDrone数据集

目标检测数据集——无人机视觉VisDrone数据集

随着无人机技术的飞速发展,无人机在航拍、监控、农业、物流等领域的应用日益广泛。与此同时,无人机视角下的视觉任务,如目标检测、目标跟踪和场景理解,也成为了计算机视觉研究的热点。然而,相比传统的地面视角数据集,无人机视角下的图像具有高度变化、小目标密集、复杂背景等独特挑战,这对现有算法提出了更高的要求。 为了应对这些挑战并推动无人机视觉技术的发展,天津大学机器学习与数据挖掘实验室推出了 VisDrone数据集。作为一个大规模、标注精细的无人机视觉数据集,VisDrone 不仅涵盖了丰富的场景和多样化的目标类别,还为研究人员提供了一个极具挑战性的测试平台。无论是小目标检测的精度提升,还是密集场景下的鲁棒性优化,VisDrone 都成为了学术界和工业界不可或缺的资源。该数据集采集自中国14个不同城市,覆盖复杂城市场景、交通枢纽、密集人群等多种环境。 VisDrone官方Github下载渠道可点击访问: https://github.com/VisDrone/VisDrone-Dataset?tab=readme-ov-file 下载的数据集为VisDrone2019-DET-train

从黑盒到白盒:基于GB28181/RTSP全栈源码交付的AI视频平台OEM与低代码集成实战

引言:掌握核心代码,重塑交付价值链 对于系统集成商(SI)和独立软件开发商(ISV)而言,依赖厂商的“黑盒”产品无异于将命运交予他人。功能定制周期长、接口开放受限、Logo无法替换、私有协议无法打通……这些痛点往往导致项目交付延期,利润微薄。据统计,在传统模式下,企业需投入大量人力重复开发基础视频能力,约95%的成本并未转化为业务价值。 如何破局?全源码交付是关键。今天,我将深度解析一款支持OEM贴牌、纯自研代码的企业级AI视频管理平台。它不仅提供了丰富的RESTful API,更开放了从流媒体内核到算法商城的完整工程代码,让开发者能像搭积木一样构建专属的安防应用。 一、源码交付的核心价值:从“使用者”到“拥有者” 该平台坚持“纯自研代码,任意形式合作”的理念,为合作伙伴提供极致的定制化能力。 * OEM贴牌自由:支持一键替换系统Logo、名称、版权信息,甚至深度修改UI风格,帮助ISV快速打造自有品牌产品,无需等待厂商排期。 * 算法自主可控:

AI小白也能快速用五分钟复现的ERNIE-4.5系列模型单卡部署与心理健康机器人实战案例

AI小白也能快速用五分钟复现的ERNIE-4.5系列模型单卡部署与心理健康机器人实战案例

* 本文重点在于文心大模型的微调 * 一起来轻松玩转文心大模型吧👉一文心大模型免费下载地址: https://ai.gitcode.com/theme/1939325484087291906 计算机配置 * 在国内部署选个自带CUDA的会快一点,不自带还得去NVIDIA下载,而其提供的CUDA依赖需要科学上网才能下载快。换阿里清华源也没用。 * 文心模型汇总 环境配置与部署 1. 更换镜像源(使用阿里云镜像源): sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak sudo sed -i 's|http://archive.ubuntu.com/ubuntu|http://mirrors.aliyun.com/ubuntu|g' /etc/apt/sources.