什么是 PX4?无人机开发的第一步

什么是 PX4?无人机开发的第一步

本文是《从零开始学 PX4:无人机开发全流程实战》系列第一篇,带你迈出无人机飞控开发的第一步。适合零基础、有嵌入式/C++背景的开发者。

✈️ 一、PX4 是什么?

PX4 是一套开源的飞控系统(Flight Control System),适用于多种类型的无人机与机器人。它不仅仅是一个固件,而是一个完整的无人系统开发生态,包括飞控软件、仿真平台、通信协议、地面站和开发工具链。

📌 PX4 的组成:

  • PX4-Autopilot:飞控固件主仓库(C++ 开发)
  • QGroundControl:图形化地面站,便于调参与监控
  • MAVLink:轻量级通信协议
  • Gazebo / jMAVSim:仿真模拟器
  • MAVSDK / MAVROS:无人机接口(支持 Python / C++ / ROS)

顶层软件架构

下面的架构图对 PX4 的各个积木模块以及各模块之间的联系进行了一个详细的概述。 图的上半部分包括了中间件模块,而下半部分展示的则是飞行控制栈的组件。

🧠 二、PX4 能做什么?

PX4 不只是“让无人机飞起来”,它支持多种控制任务,包括自动起降、路径规划、避障、返航、GPS 跟踪等。

能力说明
自动飞行自动起飞、巡航、返航、降落
多平台支持多旋翼、固定翼、VTOL、水下无人机等
传感器驱动支持 GPS、IMU、激光雷达、光流等
自主任务路径规划、任务队列、自主决策
数据通信与 QGC/MAVSDK/MAVROS 实时通信
模块拓展支持自定义飞行逻辑、传感器、算法模块开发

🆚 三、PX4 vs ArduPilot 区别

两者都是开源飞控,但 PX4 更偏向现代架构与科研开发,而 ArduPilot 更成熟,广泛用于商用系统。

对比项PX4ArduPilot
核心语言C++C
通信协议MAVLinkMAVLink
地面站QGroundControlMission Planner
编程架构模块化,uORB 发布订阅调度式循环框架
学术友好度一般
仿真支持Gazebo、jMAVSim、AirSimSITL、自研仿真器

🧩 四、PX4 架构全景图

PX4 拥有模块化、层次化的系统架构。核心通信机制是 uORB(一种发布/订阅系统),实现了模块间解耦。

[QGroundControl] ⇄ MAVLink ⇄ [PX4-Autopilot] ↑ ↓ MAVSDK / MAVROS 飞控模块(Commander / Navigator) ↓ 传感器驱动 / 电机控制 

📌 核心模块包括:

  • Commander:飞行模式状态机
  • Navigator:航线导航逻辑
  • Firmware:飞控主循环逻辑
  • WorkQueue:任务调度线程池

🎯 五、谁应该学习 PX4?

PX4 是开源、免费、现代化的飞控平台,非常适合以下人群:

类型场景
学生毕业设计、无人机竞赛、课程项目
嵌入式开发者希望参与飞控系统、自动驾驶控制等
ROS/AI 工程师用于整合路径规划、视觉算法等
飞控厂商需要二次开发、加装传感器、定制任务
爱好者DIY 飞行器、地面站、自动控制系统

🧰 六、入门准备清单

项目推荐
操作系统Ubuntu 22.04 LTS
开发语言C++(核心),Python(脚本),Bash
工具链Git、VSCode、QGroundControl、Gazebo
开发板Pixhawk 4 / 6C / Holybro / CUAV 等
网络资源国内网络建议配置镜像或 GitHub 加速

🔜 下一篇预告

下一篇我们将带你进入实战部分:

🛠️如何从零开始搭建 PX4 开发与仿真环境(Ubuntu 22.04)

👉 包括工具安装、PX4 编译、Gazebo 仿真运行、常见报错解决。

Read more

[科研实践] VS Code (Copilot) + Overleaf (使用 Overleaf Workshop 插件)

[科研实践] VS Code (Copilot) + Overleaf (使用 Overleaf Workshop 插件)

科研圈写文档常用 Latex 环境,尤其是 Overleaf 它自带的 AI 润色工具 Writefull 太难用了。如果能用本地的 CoPilot / Cursor 结合 Overleaf,那肯定超高效! 于是我们找到了 VS Code 里的 Overleaf Workshop 插件。这里已经安装好了,没装过的同学可以直接点击 “安装” 安装后左边会出现 Overleaf Workshop 的图标: 点击右边的“+”: Overleaf 官网需要登录,这里我们通过 cookie 调用已登录账号的 API: 回到主界面,右键点击 “检查”: 打开检查工具后,找到 “网络”(Network)窗口,搜索 “/project” /project 如果首次加载没内容,刷新页面就能看到

第二章-AIGC入门-AIGC工具全解析:技术控的效率神器,DeepSeek国产大模型的骄傲(8/36)

第二章-AIGC入门-AIGC工具全解析:技术控的效率神器,DeepSeek国产大模型的骄傲(8/36)

一、引言:AIGC 时代的浪潮 在数字化时代的浪潮中,人工智能生成内容(AIGC)技术正以迅猛之势席卷而来,深刻地改变着我们的生活和工作方式。从日常的社交媒体互动,到专业的内容创作、设计、教育、医疗等领域,AIGC 工具无处不在,展现出强大的影响力和无限的潜力。 AIGC 技术的核心在于利用人工智能算法,通过对海量数据的学习和分析,自动生成各种形式的内容,包括文本、图像、音频、视频等 。这一技术的突破,打破了传统内容创作的边界,使得内容生产变得更加高效、智能和多样化。无论是创作一篇新闻报道、设计一幅精美的海报,还是制作一段引人入胜的视频,AIGC 工具都能提供有力的支持,帮助创作者节省时间和精力,激发更多的创意灵感。 如今,AIGC 工具已经广泛应用于各个行业。在新闻媒体领域,自动化新闻写作工具能够快速生成体育赛事、财经新闻等报道,大大提高了新闻的时效性;在广告营销行业,AIGC 可以根据产品特点和目标受众,生成极具吸引力的广告文案和创意设计,提升营销效果;在影视游戏制作中,AIGC

一文通透OpenVLA——在Prismatic VLM(SigLIP、DinoV2、Llama 2)的架构上:基于“下一个token预测技术”预测离散化动作

一文通透OpenVLA——在Prismatic VLM(SigLIP、DinoV2、Llama 2)的架构上:基于“下一个token预测技术”预测离散化动作

前言 当对机器人动作策略的预测越来越成熟稳定之后(比如ACT、比如扩散策略diffusion policy),为了让机器人可以拥有更好的泛化能力,比较典型的途径之一便是基于预训练过的大语言模型中的广泛知识,然后加一个policy head(当然,一开始背后的模型比较简单,比如有用LSTM或MLP——RoboFlamingo) 再之后,便出来了越来越多成熟稳定的专门的VLA模型,比如OpenVLA,再比如近期介绍过过的π0——用于通用机器人控制的VLA模型:一套框架控制7种机械臂(基于PaliGemma和流匹配的3B模型) 1. π0的意义在于,首次用同一套策略/算法操作不同机器人/机械臂,这种基于机器人大模型的「预训练-微调」模式,很快会越来越多(犹如此前大模型革命NLP 其次CV等各模态,目前到了robot领域),算是代表了通用机器人的核心发展方向 2. 且π0 比英伟达的HOVER早一点,当然,同时期的RDT GR2也有这个潜力的,期待这两 后续的更新 一个多月前(本文首发于25年1月),有朋友曾说,一个月内,π0 会开源来着,当时虽然觉得不太可能,但还是抱着期待,可还

Qwen3-TTS-VoiceDesign实战案例:为AR导览眼镜生成空间音频定位语音提示(3D Audio Ready)

Qwen3-TTS-VoiceDesign实战案例:为AR导览眼镜生成空间音频定位语音提示(3D Audio Ready) 1. 项目背景与需求 想象一下,你戴着一副AR导览眼镜在博物馆参观。当你走近一幅名画时,耳边传来清晰的解说声:"您现在观看的是《蒙娜丽莎》,创作于1503年..."。更神奇的是,这个声音仿佛就是从画作方向传来的,让你感觉解说员就站在画作旁边。 这就是空间音频定位技术的魅力。传统的语音导览往往是单声道播放,所有声音都从同一个方向传来,缺乏真实感和方位感。而基于Qwen3-TTS-VoiceDesign的空间音频技术,可以让语音提示具有明确的方向性,大幅提升AR体验的沉浸感。 技术需求分析: * 需要生成高质量、自然流畅的语音内容 * 语音需要具备方向感和空间定位能力 * 支持多语言,满足国际游客需求 * 能够根据场景快速调整语音风格和情感表达 2. Qwen3-TTS-VoiceDesign技术优势 Qwen3-TTS-12Hz-1.7B-VoiceDesign是一个端到端的语音合成模型,专门为声音设计场景优化。相比传统TTS系统,它在以下