OpenDroneMap (ODM) 无人机影像三维模型重建安装及使用快速上手

OpenDroneMap (ODM) 无人机影像三维模型重建安装及使用快速上手

1 文档概述

本文档是指导用户从零开始,使用 OpenDroneMap 对无人机采集的影像数据进行处理,生成三维点云、数字表面模型(DSM)、正射影像图(Orthomosaic)等成果。

本文档的预期读者为拥有无人机航拍影像(JPG/PNG格式)并希望进行三维建模的用户。

2.1 系统运行环境要求

- 操作系统:Windows 10/11, macOS, 或 Linux (推荐 Ubuntu)。

- CPU:多核心处理器(4核以上推荐,8核或更多更佳)(处理200张以上影像建议16GB+)。

- 内存 (RAM):至少 16GB,处理大面积区域建议 32GB 或以上。

- 硬盘空间:预留充足的存储空间。原始影像、中间文件和最终成果会占用大量空间。建议准备 影像大小的10-20倍 的可用空间(例如,1GB影像需要10-20GB空间)。

- 显卡 (GPU):虽然ODM主要依赖CPU,但拥有支持CUDA的NVIDIA GPU可以显著加速某些步骤(如深度图计算)。AMD/Intel集成显卡也可运行,但速度较慢

2.2 数据准备

· 将无人机采集的所有照片集中存放在一个文件夹中。

· 确保照片包含GPS信息(EXIF中的GPS Latitude, GPS Longitude, GPS Altitude)。这是自动定位的关键。检查方式:右键图片查看属性,图片需要带有位置信息,如下图所示:

· 建议使用一致的拍摄设置(分辨率、焦距、光圈),重叠率建议:航向重叠70%-80%,旁向重叠60%-70%。

· 清理掉模糊、过曝或完全遮挡的照片。· 如果没有数据,可以参考官方提供的数据示例:比如使用aukerman数据:

https://github.com/OpenDroneMap/ODMdata

3. OMD安装部署

3.1 系统安装说明

3.1.1 手动安装(推荐)

下载地址:https://github.com/OpenDroneMap/ODM/releases 

下载exe文件,双击安装运行,运行成功后出现ODM Console弹窗。

3.1.2 Docker安装指南

ODM推荐使用Docker容器化部署,避免复杂的依赖配置。以下是各操作系统的安装步骤(已安装Docker或者Dockerdesktop可以忽略安装部分,直接拉取镜像):

3.1.2.1 Windows系统

 1、访问Docker Desktop官网下载安装程序:

https://www.docker.com/products/docker-desktop/

2、双击安装文件,启用"使用WSL 2而不是Hyper-V"选项

3、安装完成后启动Docker,等待系统托盘图标显示"Docker Desktop running"

3.1.2.2 macOS系统

使用Homebrew安装:brew install --cask docker

从应用程序文件夹启动Docker

首次运行需在系统偏好设置→安全性与隐私中允许开发者权限。

3.1.2.3 Linux系统

# Ubuntu/Debian示例 sudo apt-get update sudo apt-get install docker-ce docker-ce-cli containerd.io sudo usermod -aG docker $USER  # 允许当前用户运行docker命令 newgrp docker  # 无需重启即可应用用户组变更

3.1.2.4 镜像包拉取

验证Docker是否安装成功:

docker --version  # 应显示Docker version 20.10+

拉取odm镜像

docker pull opendronemap/odm:latest

中国用户可使用镜像加速服务:

docker pull registry.docker-cn.com/opendronemap/odm

4. 系统使用说明

4.1 航拍照片处理

需要新建一个文件夹,并在里面建立一个images文件夹(存放要拼接的图片),图片需要自带GPS信息,(如果没有GPS信息,则需要用geo.txt文件存放图片的GPS信息)。

4.2 手动安装ODM执行(推荐)

在ODM Console弹窗中输入‘run --feature-type=sift --matcher-type=flann --skip-3dmodel D:\odm_test’ 运行,其中最后面‘D:\odm_tes’为存放照片的文件夹路径。

run --feature-type=sift --matcher-type=flann --skip-3dmodel D:\odm_test

等待执行,(24张照片,我大概跑了10分钟)出现ODM app finished以下页面,则表示运行完毕。

文件夹中,除了准备的images、geo.txt和test.py准备文件,剩下的都是生成的结果文件,按需选择相应的结果。使用meshlab软件查看ply文件,可以看到三维模型。

4.3 Docker版本ODM执行

4.3.1 基础重建命令详解

在终端中执行以下命令启动基础重建流程:

Linux/Mac示例

docker run -ti --rm -v ~/datasets:/datasets opendronemap/odm --project-path /datasets/my_project

Windows示例

docker run -ti --rm -v c:/datasets:/datasets opendronemap/odm --project-path /datasets/my_project

命令参数解析:

-ti:启用交互式终端

--rm:处理完成后自动删除容器

-v:挂载本地目录到容器内(格式:本地路径:容器路径)

--project-path:指定项目根目录

my_project:项目名称(对应datasets下的文件夹)

执行命令后,ODM将显示实时进度,典型输出如下:

[INFO]    Initializing ODM 3.1.9

[INFO]    Maximum photo dimensions: 5472px

[INFO]    Loading 120 images

[INFO]    Found GPS coordinates in EXIF data

[INFO]    Running OpenSfM reconstruction

[INFO]    Feature matching complete (12456 features matched)

4.3.2 高级参数调优

根据项目需求添加参数可显著提升输出质量。以下是最常用的优化参数:

4.3.2.1 提高重建精度

生成数字表面模型(DSM)并提高正射影像分辨率至2cm/像素

docker run -ti --rm -v ~/datasets:/datasets opendronemap/odm --project-path /datasets/my_project --dsm --orthophoto-resolution 2

4.3.2.2 处理大型数据集

启用分块处理,限制内存使用

docker run -ti --rm -v ~/datasets:/datasets opendronemap/odm --project-path /datasets/my_project --split 100 --max-concurrency 4

4.3.2.3 GPU加速(需NVIDIA显卡)

使用GPU加速特征提取,处理速度提升2-3倍

docker run -ti --rm -v ~/datasets:/datasets --gpus all opendronemap/odm:gpu --project-path /datasets/my_project --use-gpu

完整参数列表可通过docker run opendronemap/odm --help查看,常用参数速查表:

4.4 数据查看软件

4.4.1 正射影像与DEM查看(QGIS)

1. 下载安装

QGIS(国内用户建议使用OSGeo中国镜像)

2. 启动后点击"图层"→"添加图层"→"添加光栅图层"

3. 选择odm_orthophoto.tif文件,QGIS会自动识别地理坐标并定位

4.4.2 点云分析(CloudCompare)

1. 安装

CloudCompare

2. 打开软件后拖拽odm_georeferenced_model.laz文件到窗口

3. 使用快捷键:

4. W:切换线框/实体显示

5. E:调整点大小

6. Ctrl+F:启用颜色映射,按高程着色

4.4.3 三维模型查看(MeshLab)

 1. 安装

MeshLab

2. 打开odm_textured_model.obj文件

3. 右键点击模型→"渲染"→"纹理"启用纹理显示

5. 常见问题解决与性能优化

1. 影像重叠不足:确保前向重叠>70%,旁向>60%,解决方案:重新规划航线或使用--min-num-features 8000参数

2. 内存不足:处理200张以上影像需16GB+内存,临时解决方案:--downsample 0.5降低分辨率

3. GPS数据缺失:部分无人机未记录GPS,解决方案:添加--no-gps参数

4. 影像模糊:运动模糊会导致特征匹配失败,建议飞行速度

5. 光照变化大:拍摄时光照条件不一致,使用--use-3dmesh-texturing参数

6. 磁盘空间不足:单个项目需5-15GB空间,清理odm_texturing目录可释放临时文件

7. Docker权限问题:Linux用户需加入docker用户组,执行sudo usermod -aG docker $USER

8. 中文字符路径:所有文件夹和文件名不能包含中文

9. 相机参数异常:执行exiftool images/*.jpg检查焦距信息是否存在

10. 网络超时:首次运行需下载依赖,建议使用国内镜像或加速服务

6. 参考资料:

https://blog.ZEEKLOG.net/gitblog_00189/article/details/151913607

https://segmentfault.com/a/1190000010612098

https://blog.ZEEKLOG.net/V_V_V_V_V_V/article/details/148581770

https://blog.ZEEKLOG.net/Hugh_W/article/details/144175562

Read more

Stable Diffusion显存管理革命:彻底解决内存爆满问题

还在为Stable Diffusion显存不足而烦恼吗?每次生成图像都像在玩随机挑战,不知道什么时候就会弹出内存错误?别担心,这款专为Automatic1111 WebUI设计的显存释放扩展将彻底改变你的创作体验。 【免费下载链接】sd-webui-memory-releaseAn Extension for Automatic1111 Webui that releases the memory each generation 项目地址: https://gitcode.com/gh_mirrors/sd/sd-webui-memory-release 🎯 为什么你的显卡总是"闹脾气"? 显存问题的三大症状诊断: 💡 生成后显存不释放:完成一次生成后,内存占用依然居高不下 💡 连续操作速度变慢:批量生成时越到后面速度越慢 💡 多任务运行就崩溃:同时开浏览器或其他应用直接报错 新手必看:显存管理基础认知 * 模型加载需要占用大量显存空间 * 每次生成都会产生临时缓存数据 * 显存回收不及时会导致累积效应 🚀 快速上手:三步安装配置指南 第一步:获取扩

从零开发 AR 演讲提词器:基于 Rokid CXR-M SDK 的实战指南

从零开发 AR 演讲提词器:基于 Rokid CXR-M SDK 的实战指南

从零开发 AR 演讲提词器:基于 Rokid CXR-M SDK 的实战指南 站在讲台上,数百双眼睛注视着你。你开始演讲,却发现关键时刻想不起下一句要说什么——这种场景,每个演讲者都不陌生。 传统的解决方案是在讲台上放一张稿子,或者用 PPT 做备注。但低头看稿显得不专业,看 PPT 又要扭头,容易打断演讲节奏。如果能有一个只有自己能看到的"隐形提词器",演讲就能更加从容自信。 Rokid AR 眼镜恰好提供了这种可能:将提词内容无线传输到眼镜显示屏,演讲者只需自然平视,文字便清晰呈现,而台下观众毫无察觉。本文将完整记录如何利用 Rokid CXR-M SDK 从零开发这款演讲提词器应用。 一、技术方案设计 1.1 为什么选择 AR 眼镜 在确定技术方案前,我们先对比几种提词方案: 方案

无人机数据集汇总无人机航拍各个方面检测分割数据集合集

本数据集集合了面向无人机视觉任务的大规模、多场景、多目标标注数据资源,涵盖了地理环境、智慧城市、基础设施巡检、农业生产、公共安全与灾害监测等多个关键领域。数据主要以两种主流格式提供:适用于目标检测的VOC/YOLO格式与适用于像素级语义分割的LabelMe格式,为算法开发与模型训练提供了高度结构化的标注支持。 在地理与农业监测方面,包含田地、道路、森林、水体等地理要素的分割数据集,以及作物病害、杂草识别、农田农机、牛羊牲畜等农业目标的检测数据,支持精准农业与生态研究。智慧城市与交通领域提供了丰富的城市街道场景数据,涵盖行人、车辆、交通标志、占道经营、消防通道、广告牌等目标的检测与分割,助力城市智能化管理。基础设施巡检是另一重点,覆盖电力线、光伏板、桥梁、铁路、风力发电机等设备的缺陷与异常检测,以及工地车辆、施工人员、物料垃圾的识别,满足工业自动化巡检需求。在灾害与安全监控中,包含滑坡、洪水、火灾烟雾、河道垃圾、违规建筑等应急场景的检测与分割数据,同时提供了溺水人员、海上救援、军事目标等特殊任务的专项数据集。此外,

企业微信智能化办公机器人部署与大语言模型集成实操深度指南

企业微信智能化办公机器人部署与大语言模型集成实操深度指南

第一章 企业微信智能机器人生态架构与入口配置 在当前数字化协同办公的环境中,企业微信已不再仅仅是一个即时通讯工具,而是演变为企业内部流程自动化与智能化交互的核心终端。通过引入人工智能助手,企业能够实现从琐碎信息处理到复杂业务决策的支持。部署这一体系的第一步,在于正确配置企业微信端的机器人协议入口。 1.1 管理员视角下的系统级配置 对于拥有管理权限的人员,配置过程从全局管理后台开始。这涉及到对企业内部工具链的直接授权。 在企业微信管理后台的“管理工具”模块中,存在“智能机器人”这一核心功能入口。点击创建机器人后,系统会呈现多种对接方式。为了确保机器人具备实时双向通讯能力以及更强的指令执行权限,必须放弃基础的Webhook模式,转而选择“API模式创建”。这一选择决定了机器人将具备更深层次的API调用能力,能够参与到群组管理、文档读写等高级逻辑处理中。 在配置细节中,通过“长连接配置”是目前实现低延迟响应的最优路径。长连接技术能够保持服务器与企业微信网关之间的持续会话,避免了频繁握手带来的网络开销,确保了在复杂群聊环境中,AI助手能够秒级响应成员的指令。 1.2 企业成员视角