机器人笔记——轨迹规划

机器人笔记——轨迹规划

前言

之前的文章讲过到了关节是持续运动的,雅可比矩阵正是描述关节运动与机器人末端运动映射关系的有力工具。然而有了如何映射的工具仅仅是分析机器人运动的开始,要知道空间两点间的运动轨迹是多样的,因此就产生了轨迹规划的概念。这里讲的轨迹规划可以理解为寻求最优路径的过程,下文对其展开介绍。

 前序内容

1. 什么是机器人轨迹规划?

想要解答这个问题,我们先来看什么是轨迹。

轨迹:就是机器人手臂(末端点或操作点)的位置、速度、加速度对于时间的历程;

我们在意的其实是,机器人末端轨迹对于工件的状态或相对关系,就像下面右侧图一样,我们在意的是执行挂杯子的操作下,这两个空间点之间机械臂该怎样运动形成一个连续的轨迹,因此就引出来轨迹规划的概念。

轨迹规划:根据作业任务的要求,计算出预期的运动轨迹。轨迹规划的目的主要是机器人关节空间移动中使得机器人的运行时间尽可能短。

与轨迹规划不同的还有任务规划与路径规划:①任务规划:对机器人的操作顺序、行动步骤和作业进程的规划(也就是让机器人将杯子挂到墙上这一任务中,规划机器人先抓杯子再去挂到墙上);

路径规划:对作业任务中位置和姿态的规划(挂杯子任务中,想让其经过哪些确定的位置,在这一位置下是怎样的姿态,比如是竖直的还是水平挂上去的);这里路径规划的目标是使路径与障碍物的距离尽量远同时路径的长度尽量短,与速度无关。

举个例子,比如下图移动滑台上的一杯水,上面杯子无论如何移动水面都平稳,而下面的水面倾斜不平稳,这就是轨迹规划的奥妙所在了,一个好的轨迹规划算法能够使得工作任务更为顺利。所以可以看出来,轨迹规划其实就是包含时间变量的综合的规划,而不仅仅是位移的规划,也包括了对运动过程中速度、加速度的规划。

1.1 轨迹规划中的运动

其实对于不同种类的机器人,其轨迹规划的侧重点也有所不同。比如扫地机器人、VGA小车等,主要是对环境反馈或已有地图确定要按照什么样的路径来行走。对于工业机器人如焊接机械臂等,主要是对其末端行走的曲线轨迹、速度与加速度曲线进行规划。

所以可以对于机器人作业是否对路径有要求,可以将轨迹规划中的运动分为点到点运动与连续路径运动或轮廓运动,这样可以对应设计适应运动形式的轨迹规划。①点到点运动:只规定了机器人的起始点和目标点的运动;②连续路径运动或轮廓运动:不仅规定了机器人的起始点和目标点,且必须沿着特定的路径进行的运动。

1.2 轨迹规划中的空间

实际进行轨迹规划时,轨迹的描述是在关节空间或者笛卡尔空间(操作空间)中的。

①对于关节空间的轨迹规划:

  • 规划的是每个关节的角度(或位移)随时间如何变化(速度、加速度)。
  • 路径只关心起点和终点的关节角度,中间过程由插值(如直线、多项式)填充,不控制机械臂末端在空间中的具体路径形状
  • 优点:计算简单、不会遇到“奇异点”(即机械臂卡死的状态)。
  • 缺点:无法精确控制末端执行器在空间中的运动轨迹。

②笛卡尔空间中的轨迹规划:

  • 规划的是机器人末端(手部)在三维空间中的位置、姿态、速度和加速度随时间的变化
  • 要求末端沿一条特定的空间路径(比如直线或圆弧)运动。
  • 需通过逆运动学把末端轨迹转换成各个关节的运动指令。
  • 优点:能精确控制末端轨迹,适合需要高精度路径的任务(如焊接、装配)。
  • 缺点:计算复杂,可能遇到奇异点,且依赖机械臂的具体结构。

2. 轨迹规划常用方法有什么?

2.1 常用的两种方法

给出轨迹节点上的约束:在关节空间中,直接对每个关节的角度(或位移)、速度与加速度进行时间函数设计。

要首先给选定轨迹的节点上关节的位姿、速度与加速度一组显式的约束(比如初始点速度为0、加速度为0),然后从一类函数中参数化轨迹,再将约束条件代入函数进行插值。这一过程中,约束的设定与得到的轨迹函数都在关节空间中完成,最终的结果可以直接用于电机的驱动。

关节空间轨迹规划常用方法:

  • 多项式插值法
    • 三次多项式:适用于两点间给定位置和速度约束的情况(共4个条件)。
    • 五次多项式:可同时满足位置、速度和加速度的边界条件(共6个条件),轨迹更平滑,广泛用于工业机器人点到点运动。
  • 带抛物线过渡的线性插值(Linear with Parabolic Blends, LPB)
    在匀速线段两端加入加速度恒定的抛物线过渡段,避免速度突变,实现连续速度。
  • 样条函数插值
    • 三次样条(Cubic Spline):在多个路径点之间构造分段三次多项式,保证位置和速度连续(C¹连续),部分实现加速度连续。
    • B样条或自然样条:提供更高阶的光滑性(如C²连续),适用于对轨迹平滑性要求高的场景。

给出运动路径的解析式:在笛卡尔空间中,给出机器人末端的曲线路径。怎样得到这个路径呢?需要用到某种函数逼近的方法,将其转化为关节运动的约束,然后找到满足关节运动约束的参数化路径。

笛卡尔空间轨迹规划常用方法:

  • 直线/圆弧插补(Linear/Circular Interpolation)
    工业机器人中最常见的笛卡尔路径类型。通过在起点与终点之间均匀插值位置(和姿态),逐点求逆解生成关节指令。
  • 路径参数化 + 逆运动学求解
    将路径表示为参数函数 x(s) ,其中 s∈[0,1] 为路径参数,再对一系列 si​ 求解 qi​=IK(x(si​)) 。
  • 基于雅可比的微分运动规划(Jacobian-based Differential Kinematics)
    给定期望的末端速度 x˙ ,通过 q˙​=J−1(q)x˙ 实时计算关节速度,适用于实时跟踪或避障。
  • 数值迭代法求解逆运动学(如牛顿-拉夫森法、Damped Least Squares)
    当解析逆解不存在或有多解时,采用数值方法逐点求解,并结合关节限位、避奇异等优化目标。
  • 轨迹平滑与重采样
    对逆解得到的关节序列进行滤波、样条拟合或时间缩放(time scaling),以满足动力学约束并提升运动平滑性。

2.2 关节空间轨迹规划步骤

由于关节驱动在关节空间内是可控的,这样能够避免机构产生奇异问题;同时由于不用考虑末端路径形状,计算简单,因此在工程实践中广泛采用关节空间的轨迹规划。下面讲解关节空间轨迹规划常用方法。

规划步骤:

① 运动学反解实现路径点在关节空间内的描述;
② 对每个关节拟合光滑函数;(轨迹规划)
③ 一段路径各关节设定相同的运动时间,确保所有关节同时到达路径点和终点(虽然同时运动同时停止,但是规划的各个关节函数之间应是相互独立的)。

那么如何获得连续光滑且独立的关节拟合函数呢?

① 首先确定关节空间内机器人在起始点、终止点的形位;

② 各形位点的速度、加速度信息(约束);

③ 列出轨迹函数通式并求解;(这里轨迹函数一般常用的有:三次多项式插值函数、高次多项式插值函数与抛物线过渡插值函数)为什么和插值函数联系起来了呢?实际上轨迹规划就是将离散的作业点,通过插值的方式得到轨迹函数。

三次多项式插值

Eg:关节角度三次多项式插值:

构建的是三次,四个待定系数的函数。所以需结合至少四个约束来解出这几个未知的四个变量,这样即可得到这个关节的轨迹规划函数。对第一个式子进行一次求导和二次求导,得到关于速度和加速度的2)、3)通式,再代入下面的约束条件即可求得。(f下标代表结束位置处,0下标为开始位置处)

上面其实约束只给了初始点与终止点,那么如果也对中间某一点进行约束呢(也就是下面末端在A、B点速度为0,而中间点C、D的速度不为0)?

将约束条件修改为:

以上就可以得到轨迹规划函数了,那如何确定约束中的那个关节速度呢?

① 根据工具坐标系在直角坐标空间中的瞬时线速度和角速度来确定每个路径点的关节速度;

  • 这种方法要求在每一个路径点进行雅可比运算,若已知末端在某路径点的期望线速度 v 和角速度 ω ,可组成末端速度向量;利用当前关节空间构型 q 计算雅可比矩阵 J(q) ;

② 在直角坐标空间或关节空间中采用某种适当的启发式方法,由控制系统自动地选择路径点的速度;

  • 也可设为零(如停顿点),或按任务需求手动指定。

常用启发式:设中间点速度为相邻两段位移的“平均斜率”。例如,对关节角度序列 θ0​,θ1​,θ2​,…,θn​ ,在第 i 点(非端点)设:

\dot{\theta}_i = \frac{\theta_{i+1} - \theta_{i-1}}{t_{i+1} - t_{i-1}}

上式称为中心差分法,常用于三次样条的“自然”或“非节点”边界条件。

③ 为了保证每个路径点上的加速度连续,由控制系统按照此要求自动地选择路径点的速度。

具体可以假设路径点之间每段轨迹都为三次多项式,比如设两段多项式为

q_1(t) \ (t \in [t_0, t_1])

q_2(t) \ (t \in [t_1, t_2])

,在中间点

t_1

处:

加速度连续:

\ddot{q}_1(t_1) = \ddot{q}_2(t_1)

速度连续:

\dot{q}_1(t_1) = \dot{q}_2(t_1) = \dot{q}_1

(待求)

位置连续:

q_1(t_1) = q_2(t_1) = q_1

对三次多项式求二阶导后,代入加速度连续条件,可得到关于

\dot{q}_1

的方程,结合前后段的位置约束

\left ( q_0,q_1,q_2 \right )

和时间

(\Delta t_1 = t_1 - t_0, \Delta t_2 = t_2 - t_1)

,解得:

\dot{q}_1 = \frac{\Delta t_2^2 q_0 + (\Delta t_1^2 - \Delta t_2^2) q_1 - \Delta t_1^2 q_2}{\Delta t_1 \Delta t_2 (\Delta t_1 + \Delta t_2)}

该式可自动计算中间点速度,保证加速度连续。

以上仅列举分析了基础的三次多项式插值方法,实际在应用过程中,规划方法还有许多,也可能结合几种方法一起使用,总之轨迹规划的算法非常丰富。如何让工作任务更高效、平稳,如何更适用于自己的工作任务,就需要选择更为适用的轨迹规划方法。


本文用以互相交流学习,若有不足还望批评指正!

专栏《机器人学-学习笔记》系列文章会持续更新,如有兴趣麻烦点个关注~

Read more

黄仁勋力荐:OpenClaw不止是下一个ChatGPT,更是AI“动手时代”的破局者

黄仁勋力荐:OpenClaw不止是下一个ChatGPT,更是AI“动手时代”的破局者

在2026年GTC大会上,英伟达创始人兼CEO黄仁勋抛出了一个振聋发聩的判断:“OpenClaw绝对是下一个ChatGPT”。 这一评价并非夸大其词,而是精准点出了AI产业的核心演进方向——从“被动回答”的语言交互,转向“主动行动”的任务执行。ChatGPT开启了大语言模型(LLM)的普及时代,让AI具备了理解和生成人类语言的能力,但它始终停留在“军师”的角色,只能提供方案建议;而OpenClaw的出现,彻底打破了这一局限,将AI变成了能动手干活的“数字员工”,完成了AI从“认知”到“执行”的关键跃迁,成为连接AI能力与现实场景的核心桥梁。 下面我将从技术本质出发,拆解OpenClaw的核心架构、关键技术实现,结合代码示例、架构图与流程图,深入解析其如何实现“行动型AI”的突破,以及为何能被黄仁勋寄予厚望,成为AI产业的下一个里程碑。 一、认知跃迁:从“回答型AI”到“行动型AI”的本质区别 要理解OpenClaw的价值,首先需要明确它与ChatGPT这类“回答型AI”的核心差异。

5分钟部署Z-Image-Turbo,阿里开源文生图模型让AI绘画极速上手

5分钟部署Z-Image-Turbo,阿里开源文生图模型让AI绘画极速上手 你有没有过这样的体验:灵光一闪想生成一张“宋代茶室配青瓷茶具与窗外竹影”的图,结果等了23秒,画面出来却漏了竹影、茶具歪斜、连“宋”字都写成了错别字?更别说还要折腾CUDA版本、下载几个GB的模型权重、改八处配置文件……AI绘画不该是这样。 Z-Image-Turbo来了——它不讲参数玄学,不堆硬件门槛,就做一件事:让你在5分钟内,用16GB显存的RTX 4080,输入一句中文,0.8秒后看到一张照片级真实感的高清图,文字清晰、构图准确、风格稳定。 这不是Demo视频里的剪辑效果,而是你本地终端里敲几行命令就能跑起来的真实能力。它来自阿里巴巴通义实验室,是Z-Image系列中专为“开箱即用”而生的蒸馏版本,也是目前中文用户能接触到的、最省心、最快、最靠谱的开源文生图方案。 1. 为什么Z-Image-Turbo值得你立刻试试? 市面上的文生图工具不少,但真正落到日常使用,往往卡在三个地方:中文不认、生成太慢、部署太烦。Z-Image-Turbo不是在某一点上微调,而是系统性地把这三道坎全铲平了。

Whisper语音识别辅助HeyGem:自动生成字幕的可能性

Whisper语音识别辅助HeyGem:自动生成字幕的可能性 在短视频、在线教育和企业宣传内容爆炸式增长的今天,一个现实问题摆在内容创作者面前:如何以更低的成本、更高的效率生产出既“听得清”又“看得懂”的数字人播报视频?静音播放场景下用户流失、多语言受众覆盖困难、人工打轴耗时费力——这些痛点背后,其实指向同一个需求:我们需要的不只是会说话的数字人,更需要一个能自动“开口+出字”的智能内容生产线。 而这条产线的关键拼图,正是将语音识别与口型同步技术深度耦合。OpenAI 的 Whisper 和本地化数字人系统 HeyGem 的结合,恰好为这一目标提供了近乎完美的解决方案。 从声音到文字:Whisper 如何让机器“听懂”人类语音 想象一下,你上传了一段中文课程录音,几秒钟后,不仅得到了逐句对齐的文字稿,还自带精确到毫秒的时间戳。这听起来像是商业语音转写服务的功能,但 Whisper 的特别之处在于——它完全开源、可私有部署,并且无需微调就能处理99种语言。 其核心是一套基于 Transformer 的端到端模型架构。

告别复杂配置!Z-Image-Turbo镜像一键启动AI绘画

告别复杂配置!Z-Image-Turbo镜像一键启动AI绘画 你是不是也经历过—— 想试试最新的AI绘画工具,结果卡在第一步:下载模型要等两小时、装依赖报错十七次、配CUDA版本像解谜、最后连WebUI的端口都映射不成功? 别折腾了。今天介绍一个真正“开箱即用”的解决方案:Z-Image-Turbo镜像——阿里通义实验室开源的极速文生图模型,不用编译、不需联网、不改代码,三步启动,直接出图。 这不是概念演示,也不是简化版Demo,而是一个完整封装、生产级稳定的本地AI绘画服务。它把原本需要半天才能跑通的流程,压缩成不到两分钟的操作。下面我就带你从零开始,亲手点亮这个“即插即画”的AI画板。 1. 为什么Z-Image-Turbo值得你立刻试试? 1.1 它不是又一个“参数很大、速度很慢”的模型 Z-Image-Turbo是Z-Image的蒸馏版本,核心突破在于:用更少的计算,换更高的质量。 官方实测数据很直观: * 仅需8步采样(NFEs) 就能生成一张1024×1024高清图——主流SDXL模型通常需要30步以上; * 在H800上单图推理耗时低于0.8秒,