Mujoco足式机器人强化学习训练02（URDF转XML)

优质文章学习记录

05 Apr 2026 — 4 min read

URDF文件转XML文件

在安装完成mujoco playground以后，设计到三维模型的导入，在sw转出的文件大多为URDF格式，但是mujoco仿真的时候大多支持xml文件

xml文件官方地提供了转换脚本，需要下载mujoco工程文件，注意和上节下载的mujoco playground不是一个工程文件

1. mujoco工程文件下载

https://mujoco.org/download/mujoco210-linux-x86_64.tar.gz exportLD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/.mujoco/mujoco210/bin

2. 在URDF文件中添加代码

<mujoco><compilermeshdir="../meshes/"balanceinertia="true"discardvisual="false"/></mujoco>

meshdir：stl网格文件存放地址
balanceinertia=“true” 启用惯量平衡（仿真更真）
discardvisual=“false” 保留视觉几何体（可视化好看）
此处需要注意，需要与link平级，直接写在最上面就行

3. 转化命令

cd ~/.mujoco/mujoco210/bin ./compile /path/to/model.urdf /path/to/model.xml

此处可以直接写urdf文件的绝对地址，以及保存xml文件存放的绝对地址

如果想要仿真验证xml文件的转化是否成功，可以执行

./simulate /path/to/model.xml

4. 在xml文件中添加执行器（actuator）

actuator可以理解为电机，个人认为mujoco比较严谨，每一个关节都需要制定actuator才能有动力，而不是像leggedgym封装的一样，直接输入活动关节数目进行自动对应

actuator有多种格式，即可以设置位置模式、力矩模式、速度模式、以及general通用格式等
此处只介绍position设置方法

<actuator><positionclass="hexapod"name="RF_HAA"joint="RF_HAA"/><positionclass="hexapod"name="RF_HFE"joint="RF_HFE"/><positionclass="hexapod"name="RF_KFE"joint="RF_KFE"/><positionclass="hexapod"name="RM_HAA"joint="RM_HAA"/><positionclass="hexapod"name="RM_HFE"joint="RM_HFE"/><positionclass="hexapod"name="RM_KFE"joint="RM_KFE"/><positionclass="hexapod"name="RB_HAA"joint="RB_HAA"/><positionclass="hexapod"name="RB_HFE"joint="RB_HFE"/><positionclass="hexapod"name="RB_KFE"joint="RB_KFE"/><positionclass="hexapod"name="LF_HAA"joint="LF_HAA"/><positionclass="hexapod"name="LF_HFE"joint="LF_HFE"/><positionclass="hexapod"name="LF_KFE"joint="LF_KFE"/><positionclass="hexapod"name="LM_HAA"joint="LM_HAA"/><positionclass="hexapod"name="LM_HFE"joint="LM_HFE"/><positionclass="hexapod"name="LM_KFE"joint="LM_KFE"/><positionclass="hexapod"name="LB_HAA"joint="LB_HAA"/><positionclass="hexapod"name="LB_HFE"joint="LB_HFE"/><positionclass="hexapod"name="LB_KFE"joint="LB_KFE"/></actuator>

笔者使用的是六足机器人，所以具有18个活动关节，所以此添加了18个位置模式的电机

注：由于这18个关节高度重复，此处运用了class的概念（用来设置kp和damping，以及forcerange等参数），class的具体用法可以参考mujoco官方的xml文档的说明

5. 在xml文件中添加传感器（sensor）

根据笔者这段时间对mujoco的使用，mujoco的传感器以及其他功能的添加，主要在xml文件中进行实现，（个人认为十分方便、主打一个什么都开放🐶）

目前笔者使用到的传感器，一般都是监控某一个点的数据
site的定义：

<sitename="imu"pos="0 0 0"group="5"/>

传感器定义：

<sensor><gyrosite="imu"name="gyro"/><velocimetersite="imu"name="local_linvel"/><accelerometersite="imu"name="accelerometer"/><framezaxisobjtype="site"objname="imu"name="upvector"/><framelinvelobjtype="site"objname="imu"name="global_linvel"/><frameangvelobjtype="site"objname="imu"name="global_angvel"/></sensor>

如果想替换进自己的xml文件，只需要在xml中创建这个点即可

5. 在xml文件中添加碰撞体

此处需要注意，虽然mujoco支持直接使用stl网格文件作为碰撞体，但是在强化学习训练的过程中，如果没有将mesh文件简化，在训练的过程中会一直报错，并且运算量会显著增大，所以此处建议简化碰撞体！！！

<geomcondim="1"contype="0"conaffinity="0"/>

如果你想添加碰撞体，只需要在后面设置contype和conaffinity即可，此处二者都写0代表不参与碰撞

参考文献
1.https://zhuanlan.zhihu.com/p/699075829
2.https://www.bilibili.com/video/BV1tDxAzTEFM/?spm_id_from=333.1391.0.0

利用 Claw Cloud Run 免费应用部署前端网页

一、注册 1. 使用注册180天的github账户注册Claw Cloud账户，可获得每月5$的免费配额 2. 官网链接 - https://run.claw.cloud/ （ps：直接github账号登录应该就不用写了吧）二、创建应用开启外部访问 CPU选0.1即可，当然大点也没问题，就是费用多点点击Create App 打开App Launchpad 三、查看Nginx信息，挂载空间部署 1. 确认update重启挂载空间关闭控制台点击update 最下方选择local Storage挂载空间（默认的就填上面查到的，改配置文件的就填你选择的路径） cd进入目录下通过配置文件查看Nginx默认路径（当然你也可以自己改，到时候换个地方挂载就好）输入nginx -t查询Nginx配置文件信息点进刚刚创建的App，拖到最下面打开控制台（旁边的文件夹是要挂载之后才有的）四、上传文件点击控制台旁边的文件图标，将打包后的文件上传即可

基于Qwen3-VL-WEBUI的视觉语言模型实战｜快速部署与微调指南

基于Qwen3-VL-WEBUI的视觉语言模型实战｜快速部署与微调指南 1. 引言：为什么选择 Qwen3-VL-WEBUI？随着多模态大模型在图像理解、视频分析和跨模态推理等领域的广泛应用，高效、易用且可定制化的视觉语言模型（VLM）部署方案成为开发者和研究者的迫切需求。阿里云推出的 Qwen3-VL-WEBUI 镜像，正是为此而生。该镜像内置了目前 Qwen 系列中最强大的视觉-语言模型 —— Qwen3-VL-4B-Instruct，集成了先进的视觉编码能力、长上下文处理机制以及代理式交互功能，支持从边缘设备到云端服务器的灵活部署。本文将带你： - ✅ 快速部署 Qwen3-VL-WEBUI 镜像 - ✅ 掌握基于 ms-swift 框架的微调全流程 - ✅ 实现自定义数据集下的指令微调与推理服务发布 - ✅ 提供避坑指南与性能优化建议无论你是 AI 工程师、科研人员还是技术爱好者，都能通过本指南实现“开箱即用 + 深度定制”的双重目标。 2. 环境准备与镜像部署 2.1 部署 Qwen3-VL-WEBUI

Qwen3-VL-WEBUI视频理解能力实测：256K上下文部署实战

Qwen3-VL-WEBUI视频理解能力实测：256K上下文部署实战 1. 背景与技术定位随着多模态大模型在视觉-语言任务中的广泛应用，对长上下文、高精度视频理解和复杂空间推理的需求日益增长。阿里云推出的 Qwen3-VL 系列模型，作为 Qwen 多模态家族的最新一代产品，标志着从“看懂图像”向“理解动态世界”的关键跃迁。该系列基于开源项目 Qwen3-VL-WEBUI 提供了便捷的本地化部署方案，内置 Qwen3-VL-4B-Instruct 模型版本，支持单卡（如 RTX 4090D）即可运行，并原生支持高达 256K token 的上下文长度，可扩展至 1M，适用于长时间视频分析、文档结构解析和复杂代理任务执行。本篇文章将围绕 Qwen3-VL-WEBUI 的实际部署流程、256K 长上下文处理能力、视频理解表现及工程优化建议展开深度实测，帮助开发者快速掌握其核心能力与落地路径。 2. 核心功能与技术升级详解 2.1 视觉-语言能力全面增强 Qwen3-VL

漫画脸描述生成实战手册：生成符合Stable Diffusion WebUI语法的Prompt结构

漫画脸描述生成实战手册：生成符合Stable Diffusion WebUI语法的Prompt结构你是不是也遇到过这种情况？脑子里有一个超棒的二次元角色形象，但打开Stable Diffusion WebUI，面对空白的提示词输入框，却不知道从何写起。写“一个可爱的女孩”？生成的图片太普通。想描述得详细点，又怕语法不对，AI根本理解不了。别担心，这正是“漫画脸描述生成”工具要帮你解决的痛点。它就像一个懂二次元、又精通AI绘画语法的“角色设计师”，你只需要用大白话描述想法，它就能帮你生成一套可以直接复制粘贴、让AI绘图工具“秒懂”的详细Prompt。今天，我们就来手把手教你，如何用这个工具，从零开始，生成一份专业、精准、符合Stable Diffusion WebUI语法的漫画角色描述。 1. 从零开始：快速上手漫画脸描述生成 1.1 环境准备：一键启动你的专属角色设计师使用“漫画脸描述生成”工具非常简单，它已经封装成了开箱即用的镜像。你不需要懂复杂的模型部署，