UAV-Speed:基于 YOLO 目标跟踪与相机运动补偿的单目无人机车辆测速(二)——加权滑动平均速度优化

UAV-Speed:基于 YOLO 目标跟踪与相机运动补偿的单目无人机车辆测速(二)——加权滑动平均速度优化

文章目录


前言

在这里插入图片描述

在前期工作中,我们实现了一套基于单目无人机视频的车辆速度估计算法框架,结合目标检测、目标跟踪与单应性背景补偿,在复杂斜视场景下实现了连续的目标速度估计,并在多段真实无人机视频中完成了验证。(具体详情请看前文)欢迎大家给我们的项目点赞支持

相关代码与实验配置已开源于 GitHub:
👉 https://github.com/Thamkench/uav-speedlab

在进一步实验过程中发现,采用固定系数指数滑动平均(EMA)的速度平滑策略,在检测噪声、几何不稳定或目标接近图像边缘时,仍可能出现局部速度波动。为此,本文在原有框架基础上,引入了一种基于置信度加权的自适应速度平滑方法,将多种影响测速可靠性的因素统一纳入平滑权重设计中,以提升速度估计在真实场景下的稳定性与可解释性。


一、pandas是什么?

1. 背景与研究动机

在无人机测速模块的初始实现中,目标速度通常通过两次连续观测之间的空间位移与对应时间间隔直接计算得到。该方法虽然具有较高的瞬时响应性,但对检测噪声、目标框抖动、单应性估计不稳定以及目标在图像边缘处发生的部分截断现象高度敏感。因此,直接计算得到的瞬时速度在时间序列上往往呈现出明显的帧间波动,从而显著降低了测速结果的稳定性与物理可解释性。

为缓解上述问题,系统随后引入了固定系数的指数滑动平均(Exponential Moving Average, EMA)对速度进行平滑处理。在第 (k) 帧处,平滑速度被定义为

V s m o o t h ( k ) = α V r a w ( k ) + ( 1 − α ) V s m o o t h ( k − 1 ) , α = 0.6. V_{\mathrm{smooth}}^{(k)}= \alpha \, V_{\mathrm{raw}}^{(k)} + (1-\alpha)\, V_{\mathrm{smooth}}^{(k-1)}, \quad \alpha = 0.6 . Vsmooth(k)​=αVraw(k)​+(1−α)Vsmooth(k−1)​,α=0.6.

该方法在一定程度上改善了速度曲线的时间连续性。然而,固定的平滑系数隐含地假设所有瞬时速度观测具有相同的可信度。在真实的无人机应用场景中,速度观测的可靠性会随着检测质量、几何稳定性、目标空间位置以及运动连续性等因素发生显著变化。因此,在复杂场景下采用常数平滑因子仍然存在明显局限。


2. 置信度加权指数滑动平均方法

针对上述问题,本次更新将固定的平滑系数替换为随时间变化的置信度权重 (W_k \in [0,1]),从而得到自适应的速度更新形式:

V s m o o t h ( k ) = W k V r a w ( k ) + ( 1 − W k ) V s m o o t h ( k − 1 ) . V_{\mathrm{smooth}}^{(k)}= W_k \, V_{\mathrm{raw}}^{(k)} + (1 - W_k)\, V_{\mathrm{smooth}}^{(k-1)} . Vsmooth(k)​=Wk​Vraw(k)​+(1−Wk​)Vsmooth(k−1)​.

其中,当前帧速度观测对最终平滑结果的贡献由其置信度进行调制。当观测可信度较高时,(W_k) 取值较大,平滑速度能够快速响应瞬时测速结果;当观测可信度较低时,(W_k) 被抑制,系统将更多依赖历史速度信息,从而增强整体稳定性。


3. 组合置信度权重的定义

瞬时置信度权重由多个相互独立的子权重构成,每一项分别刻画一种潜在的不确定性来源。整体权重定义为

W r a w = w b b o x ⋅ w h o m o ⋅ w Δ v ⋅ w e d g e . W_{\mathrm{raw}}= w_{\mathrm{bbox}} \cdot w_{\mathrm{homo}} \cdot w_{\Delta v} \cdot w_{\mathrm{edge}} . Wraw​=wbbox​⋅whomo​⋅wΔv​⋅wedge​.

该乘性结构保证了当任意一个因素显著退化时,当前速度观测的整体可信度能够被有效抑制。

为避免权重在时间维度上发生剧烈变化,可对其进一步进行时间平滑处理:

W k = η w W r a w + ( 1 − η w ) W k − 1 . W_k= \eta_w \, W_{\mathrm{raw}} + (1 - \eta_w)\, W_{k-1} . Wk​=ηw​Wraw​+(1−ηw​)Wk−1​.


4. 目标框一致性权重(Bounding-Box Consistency Weight)

在第 (k) 帧处,目标检测框的特征尺度定义为

s k = w k h k , s_k = \sqrt{w_k \, h_k}, sk​=wk​hk​​,

其中 (w_k) 与 (h_k) 分别表示检测框的宽度和高度。为描述目标尺度的长期变化趋势,引入指数滑动平均形式的参考尺度:

s r e f ( k ) = ρ s i z e s k + ( 1 − ρ s i z e ) s r e f ( k − 1 ) . s_{\mathrm{ref}}^{(k)}=\rho_{\mathrm{size}} \, s_k + (1 - \rho_{\mathrm{size}})\, s_{\mathrm{ref}}^{(k-1)} . sref(k)​=ρsize​sk​+(1−ρsize​)sref(k−1)​.

当前尺度相对于参考尺度的偏差定义为

δ s = ∣ s k − s r e f ( k ) ∣ s r e f ( k ) + ε . \delta_s= \frac{\lvert s_k - s_{\mathrm{ref}}^{(k)} \rvert} {s_{\mathrm{ref}}^{(k)} + \varepsilon} . δs​=sref(k)​+ε∣sk​−sref(k)​∣​.

该偏差通过高斯衰减函数映射为目标框一致性权重:

w b b o x = max ⁡ ( w min ⁡ , b b o x , exp ⁡ ( − δ s 2 2 σ b b o x 2 ) ) . w_{\mathrm{bbox}}= \max \left( w_{\min,\mathrm{bbox}}, \; \exp \left( -\frac{\delta_s^2}{2\sigma_{\mathrm{bbox}}^2} \right) \right) . wbbox​=max(wmin,bbox​,exp(−2σbbox2​δs2​​)).

该权重用于抑制由遮挡、检测不稳定或目标关联错误引起的异常尺度变化对速度估计的影响。


5. 单应性质量权重(Homography Quality Weight)

设 (r) 表示单应性估计中的内点比例,(N) 表示内点数量,则二者分别归一化为

r n = c l i p ( r − r 0 1 − r 0 , 0 , 1 ) , N n = c l i p ( N N 0 , 0 , 1 ) . r_n= \mathrm{clip} \left( \frac{r - r_0}{1 - r_0}, \, 0, \, 1 \right), \qquad N_n= \mathrm{clip} \left( \frac{N}{N_0}, \, 0, \, 1 \right). rn​=clip(1−r0​r−r0​​,0,1),Nn​=clip(N0​N​,0,1).

基于上述归一化结果,单应性质量权重定义为

w h o m o = w min ⁡ , h + ( 1 − w min ⁡ , h ) r n N n . w_{\mathrm{homo}}= w_{\min,\mathrm{h}} + (1 - w_{\min,\mathrm{h}})\, r_n \, N_n . whomo​=wmin,h​+(1−wmin,h​)rn​Nn​.

该权重反映了用于将图像空间位移映射到真实世界尺度的几何关系的可靠程度。


6. 图像边缘邻近权重(Image Border Proximity Weight)

设目标中心在图像坐标系中的位置为 ((x, y)),图像分辨率为 (W \times H),则目标中心到图像边界的最小距离定义为

d = min ⁡ ( x , y , W − x , H − y ) . d = \min(x, y, W - x, H - y) . d=min(x,y,W−x,H−y).

定义边缘带宽为

d 0 = e d g e _ r a t i o ⋅ min ⁡ ( W , H ) . d_0 = \mathrm{edge\_ratio} \cdot \min(W, H) . d0​=edge_ratio⋅min(W,H).

对应的边缘邻近权重定义为

w e d g e = { w min ⁡ , e d g e + ( 1 − w min ⁡ , e d g e ) d d 0 , d < d 0 , 1 , d ≥ d 0 . w_{\mathrm{edge}}= \begin{cases} w_{\min,\mathrm{edge}} + \left(1 - w_{\min,\mathrm{edge}}\right)\dfrac{d}{d_0}, & d < d_0, \\[6pt] 1, & d \ge d_0 . \end{cases} wedge​=⎩⎨⎧​wmin,edge​+(1−wmin,edge​)d0​d​,1,​d<d0​,d≥d0​.​

该项用于降低目标靠近图像边缘时速度估计的权重,以缓解因目标截断和定位误差带来的不稳定性。


7. 速度突变门控权重(Speed Jump Gating Weight)

为抑制异常的速度突变,引入允许的最大速度变化阈值:

Δ V max ⁡ = d v a + d v b ⋅ V s m o o t h . \Delta V_{\max}= d v_a + d v_b \cdot V_{\mathrm{smooth}} . ΔVmax​=dva​+dvb​⋅Vsmooth​.

速度变化的归一化幅值定义为

x = ∣ Δ V ∣ Δ V max ⁡ + ε . x= \frac{\lvert \Delta V \rvert} {\Delta V_{\max} + \varepsilon} . x=ΔVmax​+ε∣ΔV∣​.

基于上述定义,速度突变门控权重表示为

w Δ v = max ⁡ ( w min ⁡ , Δ v , 1 1 + x p ) . w_{\Delta v}= \max \left( w_{\min,\Delta v}, \; \frac{1}{1 + x^p} \right) . wΔv​=max(wmin,Δv​,1+xp1​).

该机制能够有效抑制物理上不合理的速度跳变,同时在正常运动情况下保持足够的响应性。


8. 讨论与总结

在这里插入图片描述


在这里插入图片描述

本文提出的基于置信度加权的指数滑动平均方法,将多种与测速可靠性相关的因素统一纳入自适应平滑框架之中。与固定系数的 EMA 方法相比,该方法在高置信度条件下保持了良好的响应能力,同时在检测噪声、几何不稳定、图像边缘效应以及异常速度突变等情况下表现出更强的鲁棒性。最终得到的速度估计在时间维度上更加平滑、在物理意义上更加合理,并具备良好的可解释性,适用于实际无人机监测与交通分析等应用场景。

总结

本次更新在原有无人机目标测速框架的基础上,引入了基于置信度加权的自适应速度平滑机制,以替代传统固定系数的指数滑动平均方法。通过综合考虑检测尺度稳定性、单应几何可靠性、速度突变一致性以及目标在图像中的空间位置等因素,新方法在复杂真实场景下显著提升了速度估计结果的稳定性与物理合理性,同时保持了对真实速度变化的响应能力。

完整实现、实验配置与示例结果已同步更新至项目仓库:
👉 https://github.com/Thamkench/uav-speedlab
欢迎访问、交流与 ⭐ Star 支持。

Read more

新手避坑指南:使用Llama-Factory常见的十个错误及解决方案

新手避坑指南:使用 Llama-Factory 常见的十个错误及解决方案 在大模型时代,越来越多的研究者和开发者希望将预训练语言模型应用于垂直领域——比如客服问答、法律咨询或医疗辅助。然而,直接从零开始训练一个大模型既不现实也不经济。于是,微调(Fine-tuning) 成为最主流的方式。 但问题来了:传统微调需要写复杂的训练脚本、管理分布式环境、处理显存瓶颈……这对新手来说简直是“劝退三连”。直到 Llama-Factory 的出现。 这个开源项目像是一站式自助餐厅,把数据预处理、模型加载、LoRA/QLoRA 配置、训练监控、权重合并全都打包好了,甚至提供了可视化界面,点点鼠标就能启动训练。听起来很美好?没错,但它也有自己的“隐藏规则”——稍有不慎,就会遇到训练崩溃、显存溢出、权重无效等问题。 下面我们就来盘点一下,使用 Llama-Factory 时新手最容易踩的十个坑,并结合底层机制给出真正能落地的解决建议。 为什么你明明用了 LoRA 还是爆显存? 这是最常见的第一问:

极致压缩:Whisper.cpp 量化版本清单与 ggml 格式模型下载

Whisper.cpp 量化模型下载指南 Whisper.cpp 是 OpenAI Whisper 语音识别模型的高效 C++ 实现,支持量化技术来减小模型尺寸,实现“极致压缩”。量化通过降低模型参数的精度(如从 32 位浮点数到 4 位整数)来减少存储和计算需求,同时保持合理的准确性。ggml 格式是一种轻量级模型格式,专为资源受限设备优化。以下信息基于 Whisper.cpp 官方 GitHub 仓库(真实可靠),我将逐步引导您获取量化版本清单和下载链接。 1. 量化版本清单 Whisper.cpp 支持多种量化级别,每种对应不同的压缩率和精度权衡。以下是常见量化版本清单(基于最新官方数据): * q4_0:4 位量化,极致压缩,模型尺寸最小,适合内存受限设备(如嵌入式系统)。精度损失较高。

2025 嵌入式 AI IDE 全面对比:Trae、Copilot、Windsurf、Cursor 谁最值得个人开发者入手?

文章目录 * 2025 嵌入式 AI IDE 全面对比:Trae、Copilot、Windsurf、Cursor 谁最值得个人开发者入手? * 一、先给结论(个人开发者视角) * 二、2025 年 9 月最新价格与免费额度 * 三、横向体验对比(2025-11) * 1. 模型与响应 * 2. 项目理解力 * 3. 隐私与离线能力 * 四、怎么选?一句话总结 * 五、官方链接(清晰明了) * 六、结语:AI IDE 2025 的趋势 * 七、AI IDE 的底层工作原理:编辑器为什么突然变聪明了? * 1. 解析层:把你的项目拆得比你自己还清楚 * 2. 索引层:

Amazon SageMaker 部署 AIGC 应用:训练 - 优化 - 部署 - Web 前端集成应用实践

Amazon SageMaker 部署 AIGC 应用:训练 - 优化 - 部署 - Web 前端集成应用实践

Amazon SageMaker 部署 AIGC 应用:训练 - 优化 - 部署 - Web 前端集成应用实践 背景 Amazon SageMaker 汇集广泛采用的亚马逊云科技机器学习和分析功能,统一访问所有数据,为分析和人工智能提供一体式体验,使用亚马逊云科技机工具进行模型开发、生成式人工智能、数据处理和 SQL 分析,在融通式合作开发工作室中加快协作和构建,借助强大的生成式人工智能软件开发助手 Amazon Q 开发者版提升效率,无论数据存储在数据湖、数据仓库,还是第三方或联合数据来源中,均可访问所有数据,同时内置治理功能可满足企业安全需求。 前言 本文将通过 Amazon SageMaker Notebook 实例完成 AIGC 模型的测试与验证,再将模型部署至 Amazon SageMaker Inference Endpoint 实现服务化,最后利用 Amazon