机器人算法、系统和架构十年演进

优质文章学习记录

05 Apr 2026 — 6 min read

2015 - 2025这十年，机器人领域因算力提升、深度学习与大模型的爆发，实现了算法、系统和架构的跨越式演进。从传统控制依赖规则到具身智能主导，从集中式控制到分布式协同，每一环的革新都推动机器人从结构化场景走向复杂未知环境，以下是详细梳理：

机器人算法：从模块化优化到多模态具身推理

这十年算法的核心演进是从传统控制论主导，历经深度学习重构，最终进入大模型驱动的具身智能阶段，决策逻辑更贴近类人思维。

2015 - 2020：深度学习打破传统控制框架
- 感知层：2012年ImageNet大赛后CNN兴起，2015年后深度视觉技术快速落地。比如Dex - Net提出物理仿真+深度网络的方案，通过仿真生成上万种3D物体点云训练CNN，让机器人面对未知异形物体也能输出高置信度抓取点，彻底改变了过去依赖几何建模和CAD的抓取方式。同时视觉SLAM技术成熟，解决了机器人在动态场景中的定位与地图构建问题。
- 控制层：强化学习开始从虚拟场景向现实渗透。早期四足机器人如波士顿动力SPOT仍用传统MPC策略，但这一阶段研究者已尝试将强化学习用于机器人动力学控制，虽受限于硬件成本和仿真与现实的差距，却为后续技术奠定了基础。
2020 - 2025：大模型驱动具身智能爆发
- 多模态融合推理：CLIP、GPT、RT等大模型的出现，让机器人实现视觉 - 语言 - 动作的闭环。例如RT - 1模型实现了机器人领域端到端的动作生成，输入“收拾盘子”这类自然语言指令，就能输出对应的机械臂动作序列，不再依赖人工编写的复杂规则。
- 仿真 - 现实迁移优化：RMA算法通过在仿真中大规模训练应对不同地形、载重的场景，再结合少量实机数据在线调节参数，大幅缓解了强化学习面临的仿真与现实差异问题，让四足机器人等复杂系统的控制泛化能力显著提升，可适应野外、工厂等多样化环境。

机器人系统：从刚性执行到柔性智能协同

系统层面实现了从单一任务执行到多任务自适应，从独立工作到协同交互的转变，核心控制逻辑和功能边界不断拓展。

控制逻辑革新
2015年前后的机器人系统多为“规则驱动”，工业机械臂等设备依赖预设的if - else规则和固定轨迹，只能在结构化流水线完成重复任务。而如今的系统转向“数据 + 推理驱动”，人形机器人等已能整合激光雷达、深度摄像头、力觉传感器等多源数据，通过AI模型实时调整动作以维持动态平衡，比如搬运重物时自动调整身体姿态，应对环境中的突发扰动。
任务范围拓展
系统从单一操作延伸到复杂任务链。早期仓储机器人仅能完成固定路线的搬运，现在通过系统协同，可实现“抓取 - 分类 - 搬运 - 放置”全流程自主操作。同时，多机器人协同系统成熟，多个机器人通过任务调度算法分配工作，避免碰撞和冗余，适配仓储、物流等大规模应用场景。
维护模式升级
借助机器学习的参数自整定和预测性维护技术，现代机器人系统能实时监控电机、关节等部件的运行数据，提前预判故障并发出预警，打破了过去“故障后维修”的被动模式，大幅提升了工业机器人、服务机器人的运行稳定性。

机器人架构：从集中式到“通用底座+分布式执行”

架构的演进围绕算力分配、模块化程度和兼容性展开，核心是适配AI算法的复杂需求，同时兼顾实时性和灵活性。

硬件架构：从单一CPU到异构计算
- 2015年左右的机器人多采用“CPU + 伺服驱动器”的简单架构，CPU主导所有控制和计算任务，算力有限，难以支撑复杂算法。
- 如今已升级为“CPU + AI芯片 + 分布式MCU”的异构架构。AI芯片专门处理多模态数据推理、复杂路径规划等算力密集型任务；分布式MCU部署在各关节，负责实时执行位置和扭矩控制，这种架构既满足了大模型的算力需求，又保障了机械动作的实时性，是人形机器人、高端工业机器人的主流硬件方案。
软件架构：Transformer成为通用底座
2017年Transformer架构诞生后，逐步成为机器人软件架构的核心支撑。早期机器人软件多为模块化拼接，视觉、控制、决策模块相互独立，兼容性差。现在基于Transformer的多模态架构，能统一处理文本指令、图像信息、传感器数据，通过预训练 - 微调范式，快速适配不同任务。例如ViT模型将Transformer用于图像处理，CLIP实现文本与图像的跨模态对齐，这些技术让机器人软件具备了更强的通用性和可扩展性。
整体架构：集中规划与分布式执行结合
目前主流架构为“集中式计算平台 + 分布式关节控制器”。中央平台运行大模型和全身运动规划算法，负责全局决策；关节处的微控制器执行具体动作指令。这种架构兼顾了全局统筹和局部灵活调整，既能让人形机器人完成复杂的全身协调动作，也能让工业机械臂在高精度作业中快速响应细微偏差，成为兼顾性能和灵活性的最优解。

Comfy-Photoshop-SD插件完整使用指南：在Photoshop中直接运行Stable Diffusion

Comfy-Photoshop-SD插件完整使用指南：在Photoshop中直接运行Stable Diffusion 【免费下载链接】Comfy-Photoshop-SDDownload this extension via the ComfyUI manager to establish a connection between ComfyUI and the Auto-Photoshop-SD plugin in Photoshop. https://github.com/AbdullahAlfaraj/Auto-Photoshop-StableDiffusion-Plugin 项目地址: https://gitcode.com/gh_mirrors/co/Comfy-Photoshop-SD 还在为AI绘画工具和Photoshop之间的频繁切换而烦恼吗？Comfy-Photoshop-SD插件为你带来了完美的解决方案。这个创新工具将ComfyUI的强大AI生成能力无缝集成到Photoshop中，让你在熟悉的创作环境中直接使用Stable Diffusion的各种功能。无论你是

云端微光，AI启航：低代码开发的智造未来

文章目录 * 前言 * 一、引言：技术浪潮中的个人视角 * 初次体验腾讯云开发 Copilot * 1.1 低代码的时代机遇 * 1.1.1 为什么低代码如此重要？ * 1.2 AI 的引入：革新的力量 * 1.1.2 Copilot 的亮点 * 1.3 初学者的视角 * 1.3.1 Copilot 带来的改变 * 二、体验记录：云开发 Copilot 的实际操作与感受 * 2.1 初步接触：云开发 Copilot 的界面和功能布局 * 2.2 操作过程详解：从需求输入到初步成果 * 2.2.1

Nature新刊Sensors：清华团队突破机器人触觉难题，多模态感知精度直逼人类指尖

首次让触觉数据从“数值”变成“可理解的信息” ——鸽眼的启发目录 01 传统触觉传感器的痛点电子皮肤（e-skin）：分辨率和模态难两全视觉触觉传感器：光谱范围被“卡脖子” 数据解读：多模态信息“各说各话” 02 仿生灵感导电层：既是“电极”也是“透光开关” 荧光层+反射层：多光谱“信息接收器” 可调节气压，适应不同物体 03 DOVE模型让触觉会“说话” 多模态数据“融合解读” 物体差异“对比推理” 联想判断 04 6大维度刷新触觉传感器纪录三指灵巧手平行夹爪 05 待解难题微型化：目前还无法装在机器人指尖耐用性：长期使用后性能会下降动态场景适应：无法处理快速运动的物体

基于陀螺仪航向反馈的轮式机器人PID直线控制

1. PID控制在轮式移动机器人直线运动中的工程实现轮式移动机器人在实际运行中常面临一个基础但关键的问题：即使对左右轮施加完全相同的PWM驱动信号，车辆仍会持续向某一侧偏转。这种现象并非由控制算法缺陷导致，而是源于机械系统固有的物理偏差——电机特性不一致、轮径微小差异、地面摩擦力分布不均、装配公差等因素共同作用，使得左右轮在相同输入下产生不同的实际输出转速。本方案摒弃传统依赖编码器反馈轮速的闭环方式，转而利用车载陀螺仪（MPU6050）测量的航向角作为系统状态反馈量，构建以航向角为被控量的PID控制器，直接调节右轮PWM输出，使车辆在无外部视觉或激光辅助条件下自主维持直线轨迹。该方法降低了传感器部署复杂度，避免了轮径标定、编码器安装偏心等额外误差源，特别适用于低成本教育平台与快速原型验证场景。 1.1 系统建模与控制架构设计在经典自动控制理论中，一个完整的闭环控制系统包含被控对象（Plant）、执行器（Actuator）、传感器（Sensor）、控制器（Controller）及设定值（Setpoint）。本系统中： * 被控对象：小车整体动力学模型，其输入为左右轮PWM