目标检测数据集——无人机视觉VisDrone数据集

优质文章学习记录

05 Apr 2026 — 4 min read

随着无人机技术的飞速发展，无人机在航拍、监控、农业、物流等领域的应用日益广泛。与此同时，无人机视角下的视觉任务，如目标检测、目标跟踪和场景理解，也成为了计算机视觉研究的热点。然而，相比传统的地面视角数据集，无人机视角下的图像具有高度变化、小目标密集、复杂背景等独特挑战，这对现有算法提出了更高的要求。

为了应对这些挑战并推动无人机视觉技术的发展，天津大学机器学习与数据挖掘实验室推出了 VisDrone数据集。作为一个大规模、标注精细的无人机视觉数据集，VisDrone 不仅涵盖了丰富的场景和多样化的目标类别，还为研究人员提供了一个极具挑战性的测试平台。无论是小目标检测的精度提升，还是密集场景下的鲁棒性优化，VisDrone 都成为了学术界和工业界不可或缺的资源。该数据集采集自中国14个不同城市，覆盖复杂城市场景、交通枢纽、密集人群等多种环境。

VisDrone官方Github下载渠道可点击访问：

https://github.com/VisDrone/VisDrone-Dataset?tab=readme-ov-file

下载的数据集为VisDrone2019-DET-train，VisDrone2019-DET-val，VisDrone2019-DET-test-dev均含有标注，VisDrone2019-DET-test-challenge不含标注因此不在本文处理好的数据集中。

训练集：6,471张图像
验证集：548张图像
测试集：1610张图像

下载下来的原始数据集为jpg+txt文件，这里的txt不是yolo训练可用的txt文件，需要对数据处理后才能使用。这里我提供一个处理好的可直接用于目标检测训练的jpg+xml+txt文件。图片有两个文件夹，分别为原图和覆盖白色方块的图，可自行选择使用。

官方共有12个分类，分别为：

其中ignored regions为忽略的区域，有些区域包含了密集的很小的目标，无法进行标注的，所以我们要把这个区域忽视掉。因此对于这部分内容我们将这个区域从图片中覆盖白色方块进行遮挡。效果如下图。

带有白色方块及标注框的效果如下图

同样我提供了覆盖白色方块的图片和未覆盖白色方块的图片，需要用哪个可自行选择使用。

others忽略掉，因此转换后的类别共有10类，分别为：

["pedestrian", "people", "bicycle", "car", "van", "truck", "tricycle", "awning-tricycle", "bus", "motor"]

即获取的YOLO格式的类别顺序为上述顺序。

下图为训练过程中部分图像

下图为验证过程中部分图像

训练使用原图进行训练，整体精度在0.4左右。覆盖了白色方块的精度可自行测试精度。

下载数据集可以访问官网获取原始数据集：Github

需要处理后的数据集可通过 V🔍：笑脸惹桃花获取。

Read more

一分钟看完：深圳都有哪些机器人公司

1. 人形机器人与具身智能（当下最火，运控/LLM背景）序号公司名称核心业务（10字内）公司地址（补齐与精确化）1优必选 (UBTECH)商业化双足人形机器人南山区学苑大道1001号南山智园 C1 栋2乐聚机器人 (Leju)人形机器人本体与算法南山区学苑大道1068号南山智园 C2 栋3众擎机器人 (EngineAI)通用人形与外骨骼电机南山区学苑大道1001号南山智园 (具体栋数在C区)4逐际动力 (LimX)动态双足/四足运控算法南山区南头街道前海华润金融中心 (研发中心)5星尘智能 (Astribot)绳驱 AI 机器人与灵巧手南山区打石一路深圳国际创新谷 6 栋6帕西尼感知 (PaXini)触觉传感器与人形手南山区粤海街道深圳湾科技生态园7自变量机器人 (X Square)端到端具身智能大模型南山区西丽街道万科云城8数字华夏康养与文旅服务人形机器人南山区西丽街道留仙大道创智云城9跨维智能 (DexForce)三维视觉与具身操作大模型南山区粤海街道软件产业基地10腾讯 Robotics X实验室前沿轮足与灵巧手南山区粤海街道腾讯滨海大厦/朗科大厦11易择智擎VLA 具身

VRCT完整使用指南：5分钟掌握VRChat跨语言交流神器

在VRChat的全球化社区中，语言障碍常常成为国际交流的瓶颈。VRCT（VRChat Chatbox Translator & Transcription）作为一款专为VRChat设计的智能辅助工具，通过实时语音转录和多语言翻译功能，让来自世界各地的玩家能够无障碍沟通。这款免费开源工具让语言不再是VR社交的障碍！✨ 【免费下载链接】VRCTVRCT(VRChat Chatbox Translator & Transcription) 项目地址: https://gitcode.com/gh_mirrors/vr/VRCT 核心功能概览智能语音识别系统 VRCT采用先进的语音识别技术，能够准确捕捉并转换麦克风输入和扬声器输出的音频内容。无论是个人发言还是他人对话，系统都能实时转录为文字，特别适合记录重要对话或回顾交流内容。主要特性包括： * 实时音频流处理 * 多语言自动检测 * 智能噪音过滤 * 动态阈值调整多语言实时翻译引擎支持英语、中文、日语、韩语等多种语言间的即时互译。用户可以根据自己的语言习惯灵活设置源语言和目标语言，系统支持双向转换，确保对话

从0到1打造RISC-V智能家居中控：硬件+固件+通信全链路实战

从0到1打造RISC-V智能家居中控：硬件+固件+通信全链路实战

👋 大家好，欢迎来到我的技术博客！ 📚 在这里，我会分享学习笔记、实战经验与技术思考，力求用简单的方式讲清楚复杂的问题。 🌱 无论你是刚入门的新手，还是正在进阶的开发者，希望你都能有所收获！文章目录 * 从0到1打造RISC-V智能家居中控：硬件+固件+通信全链路实战 🏠💡 * 为什么选择RISC-V？🤔 * 系统整体架构概览 🧩 * 第一步：硬件选型与电路搭建 🔌 * 主控芯片选择 * 外设连接 * 第二步：开发环境搭建 🛠️ * 安装步骤（以Ubuntu为例） * 第三步：裸机驱动开发（Bare Metal）⚡ * 示例1：DHT11温湿度读取（Bit-banging） * 示例2：BH1750光照传感器（I2C） * 第四步：引入FreeRTOS实现多任务调度 🔄 * 第五步：Wi-Fi连接与MQTT通信 ☁️📡 * 连接Wi-Fi * MQTT客户端（使用esp-mqtt库） * 第六步：BLE本地控制（无需Wi-Fi）📱

Flutter 组件 upnp_client 的鸿蒙适配实战 - 实现跨设备服务发现、智能家居自动关联与多媒体投屏协议控制

Flutter 组件 upnp_client 的鸿蒙适配实战 - 实现跨设备服务发现、智能家居自动关联与多媒体投屏协议控制

欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.ZEEKLOG.net Flutter 组件 upnp_client 的鸿蒙适配实战 - 实现跨设备服务发现、智能家居自动关联与多媒体投屏协议控制前言在“万物互联”的愿景下，鸿蒙系统（OpenHarmony）最核心的武器就是跨设备协同能力。然而，如何让你的 Flutter 应用在复杂的家庭或办公内网中，自动发现并操控那些非鸿蒙生态但同样广泛分布的设备（如：DLNA 智能电视、家用路由器、网络打印机、甚至是 NAS 存储）？ UPnP（Universal Plug and Play）协议此时扮演了全局搜索的关键角色。作为一套基于 SSDP 和 HTTP 处理发现与控制的老牌协议，它依然是局域网互联互通的“基础设施”。 upnp_client 为 Flutter