宇树 Qmini 双足机器人训练个人经验总结

宇树 Qmini 双足机器人训练个人经验总结
github:https://github.com/vsislab/RoboTamer4Qmini

本篇内容基于我在 AutoDL 云服务器 上对 Qmini 做完整训练与测试的实践总结,涵盖训练、可视化、策略测试、模型导出、URDF 调试等环节,并重点说明 headless(无显示)环境下的各种坑与解决方案。希望能帮到后来者少走弯路。

前提说明:为什么不建议在云端直接跑渲染?

我最开始的目标是:训练、渲染、视频录制全部在 AutoDL 上完成,不经过本地运行。

然而现实是:

  • 即使用 Xvfb 等虚拟显示器启动 Isaac Gym,也会发生视频保存全黑的情况。
  • VNC 远程桌面也无法正常显示 Isaac Gym 的渲染窗口。
  • 根本原因来自 驱动版本过高与 Isaac Gym 对驱动的强依赖
因此更推荐:在云服务器训练模型 → 本地 Ubuntu 加载策略进行测试与演示。
可以在云服务器中进行训练然后在本地进行测试,这是我目前发现的比较好的方式,本地使用的是ubuntu系统,最后算是可以正常演示。

当前的问题都是基于我完全使用autodl上进行的尝试,希望可以对大家有所帮助,少踩坑。
训练阶段

python train.py --config BIRL --name <name>

–name

​ 存放路径experiments/<name>/

–config

​ 选择配置文件,默认:BIRL

–resume

​ 恢复训练

​ eg:python train.py --name stand --resume --path experiments/stand/checkpoints/policy_40000.pt

–render

​ 开启画面显示(isaac gym窗口)

–fix_cam

​ 视角固定在机器人上方

–horovod

​ 多gpu训练

–r l_device

​ 训练设备设置

​ 默认cudo0,可以改为cpu等

–num_envs

​ 环境数量

–seed

​ 随机种子,利于复现

–max_iterations

​ 最大训练迭代次数
查看结果

云端可能出现 6006 端口占用 的情况,需要手动释放。

1. 安装 lsof

apt-get update

apt-get install lsof -y

2. 查看端口占用

lsof -i :6006

3. 杀掉进程

kill -9 <PID>

4. 重新启动 TensorBoard

tensorboard --logdir experiments/<name>/log --port 6006

运行训练好的策略 play.py

python play.py --render --name <name> 加载训练好的策略,开始跑模拟器

–render 显示画面

–fix_cam 相机固定跟随机器人

–cmp_real 与真实机器人采集的数据对比绘图

–plt_sim 显示仿真数据的曲线图(如关节角、速度等)

–num_envs 改变并行环境数量

–video 开启视频录制,保存到 videos/ 文件夹,必须配合 --render

–time 玩多少秒

–iter 指定用哪一轮的模型,默认加载目录下最后一个 policy

–epochs 重复评估多少次,用来统计平均性能

–debug 保存仿真数据到 Excel
导出ONNX模型

python export_pt2onnx.py --name <name>

.pt 权重导出为 .onnx,便于部署到嵌入式设备、Jetson、Unity 等。

加载(调试)urdf模型

python tune_urdf.py

测试你的机器人 URDF 是否正常加载,检查质量参数、碰撞体、关节限位,也可微调模型参数

自动调参PID(tun_pid.py)

python tune_pid.py --mode <mode>

–model

错误

Headless 环境无法渲染
云服务器默认无显示设备。

临时方案:使用虚拟显示:Xvfb(首先进行pip下载)

Xvfb :1-screen 0 1024x768x24 &#启动 X Server export DISPLAY=:1#设置环境变量
注意:但这只能让程序“以为”自己有显示,无法保证正常渲染!
使用autodl远程连接,play.py 视频录制仍为黑屏
image-20251121211032490
原因分析:原因:云端 GPU 驱动版本过高(如 570 系列),超过了 Isaac Gym 的兼容范围。

Isaac Gym 对渲染器依赖的驱动版本非常敏感,驱动过新 → 渲染器初始化失败 → 视频录制为纯黑。

目前找到比较好的方案是:云端只做训练,本地 Ubuntu 运行 play.py。

最后的最后再次说明,目前我认为比较稳妥、推荐的流程是:云端训练(AutoDL)→ 本地 Ubuntu Play 与可视化。云端的 headless 环境与高版本驱动目前无法可靠支持 Isaac Gym 的图形渲染与视频录制,本地则能完美解决所有渲染相关问题。

如有不对,希望各位大佬可以积极指出,谢谢各位。

Read more

近五年体内微/纳米机器人赋能肿瘤精准治疗综述:以 GBM 为重点

近五年体内微/纳米机器人赋能肿瘤精准治疗综述:以 GBM 为重点

摘要 实体瘤治疗长期受制于递送效率低、肿瘤组织渗透不足以及免疫抑制与耐药等问题。传统纳米药物多依赖被动累积与扩散,难以在肿瘤内部形成均匀有效的药物浓度分布。2021–2025 年,体内微/纳米机器人(包括外场驱动微型机器人、自驱动纳米马达以及生物混合机器人)围绕“运动能力”形成了三条相互收敛的技术路线: 其一,通过磁驱、声驱、光/化学自驱等方式实现运动增强递药与深层渗透,将治疗从“被动到达”推进到“主动进入”; 其二,与免疫治疗深度融合,实现原位免疫唤醒与肿瘤微环境重塑; 其三,针对胶质母细胞瘤(glioblastoma, GBM)等难治肿瘤,研究趋势转向“跨屏障递送(BBB/BBTB)+ 成像/外场闭环操控 + 时空可控释放”的系统工程。 本文围绕“运动—分布—疗效”的因果链条,总结 2021–2025 年代表性研究与关键评价指标,讨论临床转化所需的安全性、

Telegram搜索机器人推荐——查找海量资源,提升信息检索效率

大家好,本文首发于 ZEEKLOG 博客,主要面向需要在 Telegram 中高效检索资源的同学。我结合自己的实测体验,总结了几款实用的搜索机器人与完整操作流程,帮助大家解决“怎么快速找到频道、群组、文件”的痛点。如果你也在为信息筛选耗时头疼,建议耐心读完并亲手试试,收获会很大。觉得有帮助别忘了给个点赞、收藏和关注支持一下 🙂 📚 本文目录 * 使用准备 * 什么是Telegram搜索机器人? * Telegram搜索机器人的核心功能 * 推荐的Telegram搜索机器人 * 如何使用Telegram搜索机器人? * Telegram搜索机器人的应用场景 * 总结 在信息爆炸的时代,如何高效获取自己想要的资源?Telegram搜索机器人为你带来全新解决方案,无需翻找频道、群组,只需输入关键词,即可一键查找海量内容。无论是影视剧、电子书、图片还是优质群组,Telegram搜索机器人都能帮你轻松找到。推荐搜索机器人:@soso、@smss、@jisou 使用准备 1. 能访问外网,不会魔法的同学请参考:这里 2. 安装 Telegram

3分钟变身AI绘画大师:SDXL Prompt Styler如何让你的提示词拥有魔法?

3分钟变身AI绘画大师:SDXL Prompt Styler如何让你的提示词拥有魔法? 【免费下载链接】sdxl_prompt_styler 项目地址: https://gitcode.com/gh_mirrors/sd/sdxl_prompt_styler 在AI绘画的世界里,你是否也曾遇到这样的困境:明明脑海中已经有了清晰的画面,却无法用文字精准传达给AI?🤔 别担心!今天要介绍的SDXL Prompt Styler就像一位神奇的翻译官,能把你的创意灵感转化为AI能理解的艺术语言,让你的作品瞬间提升几个level! 为什么你的AI绘画总差一口气? 想象一下,你想画一个"森林中的未来帐篷",直接输入提示词可能得到一张普通图片。但如果给提示词加上"奥斯卡级视觉效果、专业摄影、超细节刻画"这样的魔法前缀,结果会怎样?✨ SDXL Prompt Styler就是这样一个给提示词"化妆"的神器,

FPGA:重构硬件逻辑的柔性算力核心,国产替代的破局关键

FPGA:重构硬件逻辑的柔性算力核心,国产替代的破局关键

哎呦喂研究院 抖音:377357378 小红书:108283296 Bilibili:1921508505 快手:4637476932 在通用算力领域被CPU、GPU主导的当下,芯片产业中存在一类特殊的可编程器件——现场可编程门阵列(FPGA, Field-Programmable Gate Array)。与CPU的通用指令流架构、GPU的固定并行计算架构不同,FPGA具备硬件级可重构特性,可根据应用需求动态定义芯片内部电路连接与逻辑功能,如同“硬件变色龙”般适配多元场景。 2025年,AI算力内卷进入白热化阶段,这款诞生近40年的器件再度成为产业焦点。它未像GPU那样陷入“抢购潮”,却在国产替代攻坚、金融低延迟交易、智算中心互联等关键赛道中承担起“定海神针”的角色。本文将从技术原理、国际产业格局、国产替代路径、未来趋势四大维度,深度拆解FPGA的核心价值与产业突破逻辑。 一、技术内核:可重构架构为何成为柔性算力基石? 要理解FPGA的独特性,需先明确其与CPU、GPU的架构本质差异——三者的核心区别在于“算力调度模式”与“硬件功能固化程度”,这直接决定了其在延迟、