什么是 PX4？无人机开发的第一步

优质文章学习记录

09 Apr 2026 — 4 min read

本文是《从零开始学 PX4：无人机开发全流程实战》系列第一篇，带你迈出无人机飞控开发的第一步。适合零基础、有嵌入式/C++背景的开发者。

✈️ 一、PX4 是什么？

PX4 是一套开源的飞控系统（Flight Control System），适用于多种类型的无人机与机器人。它不仅仅是一个固件，而是一个完整的无人系统开发生态，包括飞控软件、仿真平台、通信协议、地面站和开发工具链。

📌 PX4 的组成：

✅ PX4-Autopilot：飞控固件主仓库（C++ 开发）
✅ QGroundControl：图形化地面站，便于调参与监控
✅ MAVLink：轻量级通信协议
✅ Gazebo / jMAVSim：仿真模拟器
✅ MAVSDK / MAVROS：无人机接口（支持 Python / C++ / ROS）

顶层软件架构

下面的架构图对 PX4 的各个积木模块以及各模块之间的联系进行了一个详细的概述。图的上半部分包括了中间件模块，而下半部分展示的则是飞行控制栈的组件。

🧠 二、PX4 能做什么？

PX4 不只是“让无人机飞起来”，它支持多种控制任务，包括自动起降、路径规划、避障、返航、GPS 跟踪等。

能力	说明
自动飞行	自动起飞、巡航、返航、降落
多平台支持	多旋翼、固定翼、VTOL、水下无人机等
传感器驱动	支持 GPS、IMU、激光雷达、光流等
自主任务	路径规划、任务队列、自主决策
数据通信	与 QGC/MAVSDK/MAVROS 实时通信
模块拓展	支持自定义飞行逻辑、传感器、算法模块开发

🆚 三、PX4 vs ArduPilot 区别

两者都是开源飞控，但 PX4 更偏向现代架构与科研开发，而 ArduPilot 更成熟，广泛用于商用系统。

对比项	PX4	ArduPilot
核心语言	C++	C
通信协议	MAVLink	MAVLink
地面站	QGroundControl	Mission Planner
编程架构	模块化，uORB 发布订阅	调度式循环框架
学术友好度	高	一般
仿真支持	Gazebo、jMAVSim、AirSim	SITL、自研仿真器

🧩 四、PX4 架构全景图

PX4 拥有模块化、层次化的系统架构。核心通信机制是 uORB（一种发布/订阅系统），实现了模块间解耦。

[QGroundControl] ⇄ MAVLink ⇄ [PX4-Autopilot] ↑ ↓ MAVSDK / MAVROS 飞控模块（Commander / Navigator） ↓ 传感器驱动 / 电机控制

📌 核心模块包括：

Commander：飞行模式状态机
Navigator：航线导航逻辑
Firmware：飞控主循环逻辑
WorkQueue：任务调度线程池

🎯 五、谁应该学习 PX4？

PX4 是开源、免费、现代化的飞控平台，非常适合以下人群：

类型	场景
学生	毕业设计、无人机竞赛、课程项目
嵌入式开发者	希望参与飞控系统、自动驾驶控制等
ROS/AI 工程师	用于整合路径规划、视觉算法等
飞控厂商	需要二次开发、加装传感器、定制任务
爱好者	DIY 飞行器、地面站、自动控制系统

🧰 六、入门准备清单

项目	推荐
操作系统	Ubuntu 22.04 LTS
开发语言	C++（核心），Python（脚本），Bash
工具链	Git、VSCode、QGroundControl、Gazebo
开发板	Pixhawk 4 / 6C / Holybro / CUAV 等
网络资源	国内网络建议配置镜像或 GitHub 加速

🔜 下一篇预告

下一篇我们将带你进入实战部分：

🛠️如何从零开始搭建 PX4 开发与仿真环境（Ubuntu 22.04）

👉 包括工具安装、PX4 编译、Gazebo 仿真运行、常见报错解决。

[科研实践] VS Code (Copilot) + Overleaf (使用 Overleaf Workshop 插件)

科研圈写文档常用 Latex 环境，尤其是 Overleaf 它自带的 AI 润色工具 Writefull 太难用了。如果能用本地的 CoPilot / Cursor 结合 Overleaf，那肯定超高效！于是我们找到了 VS Code 里的 Overleaf Workshop 插件。这里已经安装好了，没装过的同学可以直接点击 “安装” 安装后左边会出现 Overleaf Workshop 的图标：点击右边的“+”： Overleaf 官网需要登录，这里我们通过 cookie 调用已登录账号的 API：回到主界面，右键点击 “检查”：打开检查工具后，找到 “网络”（Network）窗口，搜索 “/project” /project 如果首次加载没内容，刷新页面就能看到

第二章-AIGC入门-AIGC工具全解析：技术控的效率神器，DeepSeek国产大模型的骄傲（8/36）

一、引言：AIGC 时代的浪潮在数字化时代的浪潮中，人工智能生成内容（AIGC）技术正以迅猛之势席卷而来，深刻地改变着我们的生活和工作方式。从日常的社交媒体互动，到专业的内容创作、设计、教育、医疗等领域，AIGC 工具无处不在，展现出强大的影响力和无限的潜力。 AIGC 技术的核心在于利用人工智能算法，通过对海量数据的学习和分析，自动生成各种形式的内容，包括文本、图像、音频、视频等。这一技术的突破，打破了传统内容创作的边界，使得内容生产变得更加高效、智能和多样化。无论是创作一篇新闻报道、设计一幅精美的海报，还是制作一段引人入胜的视频，AIGC 工具都能提供有力的支持，帮助创作者节省时间和精力，激发更多的创意灵感。如今，AIGC 工具已经广泛应用于各个行业。在新闻媒体领域，自动化新闻写作工具能够快速生成体育赛事、财经新闻等报道，大大提高了新闻的时效性；在广告营销行业，AIGC 可以根据产品特点和目标受众，生成极具吸引力的广告文案和创意设计，提升营销效果；在影视游戏制作中，AIGC

一文通透OpenVLA——在Prismatic VLM(SigLIP、DinoV2、Llama 2)的架构上：基于“下一个token预测技术”预测离散化动作

前言当对机器人动作策略的预测越来越成熟稳定之后(比如ACT、比如扩散策略diffusion policy)，为了让机器人可以拥有更好的泛化能力，比较典型的途径之一便是基于预训练过的大语言模型中的广泛知识，然后加一个policy head(当然，一开始背后的模型比较简单，比如有用LSTM或MLP——RoboFlamingo) 再之后，便出来了越来越多成熟稳定的专门的VLA模型，比如OpenVLA，再比如近期介绍过过的π0——用于通用机器人控制的VLA模型：一套框架控制7种机械臂(基于PaliGemma和流匹配的3B模型) 1. π0的意义在于，首次用同一套策略/算法操作不同机器人/机械臂，这种基于机器人大模型的「预训练-微调」模式，很快会越来越多(犹如此前大模型革命NLP 其次CV等各模态，目前到了robot领域)，算是代表了通用机器人的核心发展方向 2. 且π0 比英伟达的HOVER早一点，当然，同时期的RDT GR2也有这个潜力的，期待这两后续的更新一个多月前(本文首发于25年1月)，有朋友曾说，一个月内，π0 会开源来着，当时虽然觉得不太可能，但还是抱着期待，可还

Qwen3-TTS-VoiceDesign实战案例：为AR导览眼镜生成空间音频定位语音提示（3D Audio Ready）

Qwen3-TTS-VoiceDesign实战案例：为AR导览眼镜生成空间音频定位语音提示（3D Audio Ready） 1. 项目背景与需求想象一下，你戴着一副AR导览眼镜在博物馆参观。当你走近一幅名画时，耳边传来清晰的解说声："您现在观看的是《蒙娜丽莎》，创作于1503年..."。更神奇的是，这个声音仿佛就是从画作方向传来的，让你感觉解说员就站在画作旁边。这就是空间音频定位技术的魅力。传统的语音导览往往是单声道播放，所有声音都从同一个方向传来，缺乏真实感和方位感。而基于Qwen3-TTS-VoiceDesign的空间音频技术，可以让语音提示具有明确的方向性，大幅提升AR体验的沉浸感。技术需求分析： * 需要生成高质量、自然流畅的语音内容 * 语音需要具备方向感和空间定位能力 * 支持多语言，满足国际游客需求 * 能够根据场景快速调整语音风格和情感表达 2. Qwen3-TTS-VoiceDesign技术优势 Qwen3-TTS-12Hz-1.7B-VoiceDesign是一个端到端的语音合成模型，专门为声音设计场景优化。相比传统TTS系统，它在以下