目标检测数据集——无人机视觉VisDrone数据集

优质文章学习记录

08 Apr 2026 — 4 min read

随着无人机技术的飞速发展，无人机在航拍、监控、农业、物流等领域的应用日益广泛。与此同时，无人机视角下的视觉任务，如目标检测、目标跟踪和场景理解，也成为了计算机视觉研究的热点。然而，相比传统的地面视角数据集，无人机视角下的图像具有高度变化、小目标密集、复杂背景等独特挑战，这对现有算法提出了更高的要求。

为了应对这些挑战并推动无人机视觉技术的发展，天津大学机器学习与数据挖掘实验室推出了 VisDrone数据集。作为一个大规模、标注精细的无人机视觉数据集，VisDrone 不仅涵盖了丰富的场景和多样化的目标类别，还为研究人员提供了一个极具挑战性的测试平台。无论是小目标检测的精度提升，还是密集场景下的鲁棒性优化，VisDrone 都成为了学术界和工业界不可或缺的资源。该数据集采集自中国14个不同城市，覆盖复杂城市场景、交通枢纽、密集人群等多种环境。

VisDrone官方Github下载渠道可点击访问：

https://github.com/VisDrone/VisDrone-Dataset?tab=readme-ov-file

下载的数据集为VisDrone2019-DET-train，VisDrone2019-DET-val，VisDrone2019-DET-test-dev均含有标注，VisDrone2019-DET-test-challenge不含标注因此不在本文处理好的数据集中。

训练集：6,471张图像
验证集：548张图像
测试集：1610张图像

下载下来的原始数据集为jpg+txt文件，这里的txt不是yolo训练可用的txt文件，需要对数据处理后才能使用。这里我提供一个处理好的可直接用于目标检测训练的jpg+xml+txt文件。图片有两个文件夹，分别为原图和覆盖白色方块的图，可自行选择使用。

官方共有12个分类，分别为：

其中ignored regions为忽略的区域，有些区域包含了密集的很小的目标，无法进行标注的，所以我们要把这个区域忽视掉。因此对于这部分内容我们将这个区域从图片中覆盖白色方块进行遮挡。效果如下图。

带有白色方块及标注框的效果如下图

同样我提供了覆盖白色方块的图片和未覆盖白色方块的图片，需要用哪个可自行选择使用。

others忽略掉，因此转换后的类别共有10类，分别为：

["pedestrian", "people", "bicycle", "car", "van", "truck", "tricycle", "awning-tricycle", "bus", "motor"]

即获取的YOLO格式的类别顺序为上述顺序。

下图为训练过程中部分图像

下图为验证过程中部分图像

训练使用原图进行训练，整体精度在0.4左右。覆盖了白色方块的精度可自行测试精度。

下载数据集可以访问官网获取原始数据集：Github

需要处理后的数据集可通过 V🔍：笑脸惹桃花获取。

Read more

Magic API：低代码接口开发平台完全指南

Magic API：低代码接口开发平台完全指南

Magic API：低代码接口开发平台完全指南 🌟 你好，我是励志成为糕手！ 🌌 在代码的宇宙中，我是那个追逐优雅与性能的星际旅人。 ✨ 每一行代码都是我种下的星光，在逻辑的土壤里生长成璀璨的银河； 🛠️ 每一个算法都是我绘制的星图，指引着数据流动的最短路径； 🔍 每一次调试都是星际对话，用耐心和智慧解开宇宙的谜题。 🚀 准备好开始我们的星际编码之旅了吗？目录 * Magic API：低代码接口开发平台完全指南 * 摘要 * 1. Magic API概述与核心概念 * 1.1 什么是Magic API * 1.2 Magic API的核心特性 * 1.3 Magic API的设计理念 * 2. Magic API架构设计与组件分析 * 2.1 整体架构概览 * 2.2 API引擎工作原理 * 2.3 脚本引擎与SQL执行机制 * 3. Magic API核心功能实现

CosyVoice2-0.5B实战案例：智能家居语音控制系统集成

CosyVoice2-0.5B实战案例：智能家居语音控制系统集成 1. 为什么选CosyVoice2-0.5B做智能家居语音控制？你有没有想过，家里的空调、灯光、窗帘，不用按遥控器，也不用点手机App，只要对着空气说一句“把客厅温度调到26度”，它就真的动了？而且声音还是你熟悉的人声——可能是你自己的声音，也可能是家人温柔的语调。这不再是科幻电影里的桥段。阿里开源的CosyVoice2-0.5B，正让这件事变得轻而易举。它不是传统TTS（文本转语音）那种“机器腔”，而是真正能“听懂你、学像你、替你说”的语音合成系统。科哥基于原项目二次开发的WebUI版本，把原本需要写代码、调API、配环境的复杂流程，压缩成一个浏览器就能打开的界面。3秒录音，1秒生成，流式播放，方言切换，情绪调节——这些能力，恰恰是智能家居语音交互最需要的“临场感”和“个性化”。更重要的是，它小而精：0.5B参数量，

智能车竞赛实战：如何用地瓜机器人打造智慧医疗解决方案（附完整代码）

智能车竞赛实战：基于地瓜机器人的智慧医疗系统开发指南在当今技术驱动的医疗创新浪潮中，智能车竞赛为大学生创客提供了绝佳的实践平台。地瓜机器人作为一款开源硬件平台，其灵活的可扩展性和丰富的传感器生态，使其成为开发智慧医疗解决方案的理想选择。本文将深入探讨如何从零开始构建一套完整的智慧医疗系统，涵盖硬件选型、算法设计到实战优化的全流程。 1. 硬件架构设计与环境搭建构建智慧医疗系统的第一步是搭建可靠的硬件基础。地瓜机器人平台的核心优势在于其模块化设计，允许开发者根据具体需求灵活配置传感器和执行机构。 1.1 核心硬件选型建议对于医疗应用场景，我们需要特别关注数据的准确性和系统的稳定性。以下是经过实战验证的硬件配置方案： * 主控单元：推荐使用地瓜机器人V3.2开发板，其搭载的STM32H743芯片提供充足的算力资源 * 环境传感器： * 温湿度：SHT31高精度数字传感器（±1.5%RH精度） * 空气质量：SGP30 VOC传感器 * 医疗监测模块： * 红外测温：MLX90614非接触式传感器 * 心率血氧：MAX30102光电传感器

Neo4j 知识讲解与在线工具使用教程

图数据库领域的核心工具 ——Neo4j，同时详细拆解其在线预览控制台（https://console-preview.neo4j.io/）的使用方法，以及查询工具（https://console-preview.neo4j.io/tools/query）的模块功能。一、Neo4j 核心知识铺垫在使用工具前，我们需要先理解 Neo4j 的本质和核心概念，这是后续操作的基础。 1. 什么是 Neo4j？ Neo4j 是世界上最流行的原生图数据库（Native Graph Database），专门用于存储、查询和分析 “实体之间的关联关系”。它与我们熟悉的 MySQL 等关系型数据库的核心差异的是： * 关系型数据库（MySQL）：用 “表 + 行 + 外键” 间接表示关联，查询多表关联时需频繁 JOIN，效率低； * 图数据库（Neo4j）