无人机 RGB+热红外融合检测建筑裂缝与渗漏,34 层高楼约 2 小时

无人机 RGB+热红外融合检测建筑裂缝与渗漏,34 层高楼约 2 小时

导读

住宅建筑的外立面检测传统上依赖人工——爬脚手架、挂绳索、拿检测仪逐面墙检查。一栋 34 层高楼,人工检测需要 2-3 天,覆盖率只有 40-60%,而且肉眼看不到墙体内部的渗漏。

深圳大学团队提出了一套无人机 RGB+热红外双模态检测方案:用 DJI Mavic 3 Thermal 无人机同时拍摄可见光和热红外图像,可见光用于检测裂缝,热红外用于检测渗漏(水分蒸发导致的温度异常)。在深圳三个住宅小区的实测中,裂缝检测 mIoU 达到 87.86%,渗漏检测 mIoU 达到 79.05%。一栋 34 层高楼的完整外立面检测约 2 小时完成,覆盖率  ≥95% 。


论文信息

  • 标题:UAV and Deep Learning for Automated Detection and Visualization of Façade Defects in Existing Residential Buildings
  • 作者:Yue Fan, Jinghua Mai, Fei Xue(通讯), Stephen Siu Yu Lau, San Jiang, Yiqi Tao(通讯), Xiaoxing Zhang, Wing Chi Tsang
  • 机构:深圳大学(亚热带建筑与城市科学国家重点实验室、广东省城市信息学重点实验室);香港大学建筑学院;香港都会大学;深圳物策地理信息技术有限公司

一、为什么需要两种模态?

建筑外立面有两类主要缺陷,单一模态各有盲区:

缺陷类型

可见光(RGB)

热红外

裂缝

✓ 几何特征清晰

✗ 空间分辨率不足(640×512)

渗漏

✗ 墙体内部水分肉眼不可见

✓ 水分蒸发造成温度异常

  • 可见光能看到裂缝的几何形状(宽度、走向、分支),但看不到墙体内部的渗漏——水分可能已经渗入保温层但表面无明显痕迹
  • 热红外能检测到渗漏区域的温度异常(蒸发冷却效应),但空间分辨率仅 640×512 像素,无法分辨细小裂缝

两种模态互补:RGB 负责裂缝,热红外负责渗漏。

图片

图片

图片来源于原论文

二、三阶段检测流水线

图片

图片来源于原论文

阶段一:墙体提取

用 SegFormer从无人机拍摄的图像中提取建筑墙体区域,排除天空、地面、植被等背景干扰。在 WHU 墙体数据集(900 张标注图像)上微调。

阶段二:裂缝检测(RGB)

对提取的墙体区域,用 K-Net + UPerNet做语义分割检测裂缝。采用滑动窗口策略——将高分辨率外立面图像切割为与训练分辨率匹配的小块,逐块检测后拼接。

训练数据:1,892 张公开裂缝数据集图像。

阶段三:渗漏检测(热红外)

同样用 K-Net + UPerNet对热红外图像做语义分割检测温度异常区域。标注数据经过可见光图像中的渗水痕迹/泛碱现象交叉验证。

训练数据:340 张自建热红外标注图像。

双模态配准与 3D 可视化

可见光和热红外图像通过单应性矩阵(手动选择 4 个以上匹配点)配准到统一坐标系。

论文的另一个重要环节是将检测结果映射到 3D 建筑模型上。整个数据采集分两步:第一步是粗略倾斜摄影(30m 高度拍摄,用于 SfM 三维重建获取建筑外轮廓和几何信息),第二步才是精细近距拍摄(5-25m,用于缺陷检测)。粗略阶段重建的 3D 模型作为载体,精细阶段检测到的缺陷通过坐标转换(WGS84 → UTM → ENU)映射到模型上,最终在 Grasshopper/Rhino 中实现参数化可视化——每处缺陷都有精确的三维坐标和面积。

三、硬件与飞行方案

无人机平台(规格来自 DJI 官方)

参数

规格

型号

DJI Mavic 3 Thermal(M3T)

广角相机

1/2" CMOS, 48MP, 24mm 等效焦距

长焦相机

1/2" CMOS, 12MP, 162mm 等效, 56× 混合变焦

热红外相机

非制冷 VOx 微测辐射热计, 640×512, NETD ≤50mK

续航

45 分钟

重量

920g

飞行参数建议

建筑类型

高度

拍摄距离

单栋耗时

低层(≤7 层)

~21m

5-10m

~45 分钟

中层(8-18 层)

15-20m

高层(≥19 层)

~100m

20-25m

~1.2-1.6 小时

关键约束:拍摄距离超过 30m后,裂缝检测和低温差渗漏检测性能明显下降。

四、实验结果:深圳三个住宅小区实测

训练配置

参数

规格

GPU

NVIDIA RTX 4090 (24GB)

训练迭代

墙体提取 40,000 / 裂缝 36,000 / 渗漏 9,500

学习率

0.0001, Poly 衰减

检测精度

任务

整体准确率

mIoU

mPrecision

mRecall

墙体提取

86.11%

64.04%

78.9%

76.33%

裂缝检测98.03%87.86%94.21%92.31%
渗漏检测98.41%79.05%87.54%86.44%

与传统方法对比

维度

传统人工检测

无人机 + 深度学习

单栋高楼耗时

2-3 天

~2 小时

覆盖率

40-60%

≥95%

裂缝宽度精度

±0.1mm

±1cm

人工参与度

90%

20%

无人机方案在效率、覆盖率和人工参与度上大幅领先,但裂缝宽度测量精度(±1cm)远低于传统裂缝计(±0.1mm)——适合大面积筛查,不替代精密测量。

实测案例

在深圳三个住宅小区部署:

小区

楼层

拍摄距离

图像对数

OCT 社区

7 层

5m

1,034

深南花园

34 层

22m

1,400

汇芳花园

33 层

25m

1,811

在深南花园识别出 4 处渗漏缺陷,面积分别为 0.16、0.25、0.47、0.92 m²,并在 3D 模型中定位了精确坐标。

图片

图片来源于原论文

五、总结与思考

这篇论文展示了一套完整的无人机双模态建筑外立面检测方案,从飞行规划到缺陷检测到 3D 可视化:

  • 双模态互补:RGB 检测裂缝(mIoU 87.86%),热红外检测渗漏(mIoU 79.05%)
  • 效率提升:单栋高楼从 2-3 天缩短到约 2 小时,覆盖率从 40-60% 提升到 ≥95%
  • 定位为筛查工具:论文明确将方案定位为"第一阶段筛查",识别重点区域后再做精密检测

值得注意的几点:

  1. 只覆盖两类缺陷:裂缝和渗漏。建筑外立面还有脱落、空鼓、保温层损坏等缺陷类型未涉及
  2. 热红外标注数据量有限:仅 340 张标注图像训练渗漏检测模型,泛化到更多建筑类型和场景需要更多数据验证
  3. 环境因素敏感:热红外检测受立面朝向、材质、天气影响大。论文实测在深圳(亚热带气候),在北方寒冷气候下的热对比度特性可能不同
  4. 双模态配准是手动的:需要人工选择 4 个以上匹配点做单应性配准,这限制了全自动化部署
  5. 精度 vs 效率的定位清晰:论文没有声称替代传统精密检测,而是定位为大面积筛查工具——这个定位务实且合理

Read more

RISC-V开源处理器实战:从Verilog RTL设计到FPGA原型验证

RISC-V开源处理器实战:从Verilog RTL设计到FPGA原型验证

引言:开源浪潮下的RISC-V处理器设计 在芯片设计领域,RISC-V架构正以其开源免授权、模块化扩展和极简指令集三大优势重塑行业格局。与传统闭源架构不同,RISC-V允许开发者自由定制处理器核,从嵌入式微控制器到高性能服务器芯片均可覆盖。本文以Xilinx Vivado 2025工具链和蜂鸟E203处理器为核心,完整呈现从Verilog RTL设计到FPGA原型验证的全流程,为嵌入式工程师和硬件爱好者提供一套可复现的实战指南。 项目目标与技术栈 * 核心目标:基于RISC-V RV32I指令集,设计支持五级流水线的32位处理器核,实现基础算术运算、逻辑操作及访存功能,并在Xilinx Artix-7 FPGA开发板验证。 * 工具链:Xilinx Vivado 2025(逻辑设计、综合实现)、ModelSim(功能仿真)、Xilinx Artix-7 XC7A35T FPGA开发板(硬件验证)。 * 参考案例:蜂鸟E203处理器(芯来科技开源RISC-V核,已在Xilinx FPGA上完成移植验证,最高运行频率50MHz)。 一、数字系统设计流程:从需求到架构 1.

FPGA仿真加速器——Matlab一键生成.mif/.txt/.coe文件(函数封装与实战应用)

1. 为什么需要Matlab一键生成FPGA配置文件 做FPGA开发的朋友们都知道,每次仿真测试都要手动准备各种初始化文件,这个流程真的太繁琐了。我记得刚开始接触FPGA的时候,每次都要重复写生成.mif、.txt、.coe文件的代码,不仅浪费时间,还容易出错。后来我就想,能不能把这些操作封装成一个函数,需要的时候直接调用就好了? .mif和.coe文件在FPGA设计中特别重要,它们是存储器的初始化文件。比如做DDS信号发生器时,需要把波形数据预先存储在ROM中;设计FIR滤波器时,要把滤波系数加载到RAM里。这些场景都离不开这两种文件。而.txt文件则是Matlab和FPGA联合仿真的桥梁,测试数据通过txt文件传递,方便我们做数据对比和性能分析。 手动创建这些文件不仅效率低,还容易出错。特别是当数据量很大时,人工核对几乎不可能。所以我花了些时间把这些功能封装成一个Matlab函数,现在只需要一行代码就能生成三种格式的文件,大大提升了开发效率。 2. 深入理解三种文件格式的特点与差异 2.1 MIF文件格式详解 MIF文件是Memory Initialization F

多旋翼无人机系统组成(七)(电源系统详解)

多旋翼无人机的动力来自电池,但真正让整机稳定工作的,并不只是“有电”这么简单 一架无人机在飞行过程中,电源系统同时承担着两类完全不同的任务: * 为电机提供大功率输出 * 为飞控和电子设备提供稳定低压供电 前者决定推力是否足够,后者决定控制系统是否可靠 实际工程里,很多飞行异常表面上看像控制问题,最后定位下来却发现是供电链路中的某一个环节已经不稳定 例如: * 大油门时飞控重启 * GPS 突然掉星 * 图传画面出现干扰 * 电压报警提前触发 这些问题往往都和电源系统直接相关 所以对于多旋翼来说: 电源系统不是附属部分,而是整个飞控系统正常工作的基础 一些读者可能会觉得,电源系统似乎并不复杂,无非就是把锂电池接上,让整机通电,似乎没有太多可讲的 但真正进入工程应用后会发现,电源问题远没有看起来那么简单 它和结构系统其实很像: 在小型多旋翼上,很多方案都已经高度标准化,直接按成熟配置使用,通常不会暴露太多问题。但随着无人机尺寸增大、载荷增加、功率提升,原本不起眼的电源细节会逐渐变成影响整机可靠性的关键因素 很多时候,一些飞行异常看起来像控制问题,最

Vivado完整license文件获取与配置指南

本文还有配套的精品资源,点击获取 简介:Vivado是由Xilinx开发的FPGA和SoC设计综合工具,支持Verilog、VHDL等硬件描述语言,提供高级综合、仿真、IP集成等功能。本资源包“Vivado_的license文件.zip”包含用于解锁Vivado完整功能的许可证文件。介绍了许可证服务器配置、.lic文件管理、浮动与固定许可证区别、激活流程、更新与诊断等核心内容。适用于FPGA开发者、嵌入式系统工程师及学习者,帮助其合法配置Vivado环境,提升开发效率和项目执行能力。 1. Vivado工具与FPGA开发环境概述 Xilinx Vivado设计套件是面向FPGA和SoC开发的集成化软件平台,广泛应用于通信、工业控制、人工智能、嵌入式视觉等多个高科技领域。其核心功能包括项目创建、综合、实现、仿真、调试及系统级集成,支持从设计输入到硬件验证的全流程开发。 Vivado不仅提供了图形化界面(GUI)便于初学者快速上手,还支持Tcl脚本自动化操作,满足高级用户的大规模工程管理需求。其模块化架构设计使得开发者可以灵活选择所需功能组件,如HLS(高层次综合)、IP In