Levenberg-Marquardt 非线性最小二乘优化算法 C++ 实战实现

Levenberg-Marquardt 非线性最小二乘优化算法 C++ 实战实现 | 极客日志

应用领域	残差定义
曲线拟合	$y_i - (ae^{-bx_i} + c)$
相机标定	$
SLAM 重投影	$(u_i^{\text{obs}} - u_i^{\text{proj}}, v_i^{\text{obs}} - v_i^{\text{proj}})$
化学反应动力学	$C_i^{\text{meas}} - C(t_i; k)$

// 简化版 LM 步长计算示意（依赖 Eigen 库）
Eigen::VectorXd ComputeLMStep(const Eigen::MatrixXd& J, const Eigen::VectorXd& r, double lambda) {
    Eigen::MatrixXd A = J.transpose() * J + lambda * Eigen::MatrixXd::Identity(J.cols(), J.cols());
    Eigen::VectorXd b = -J.transpose() * r;
    return A.ldlt().solve(b); // 使用 LDLT 分解求解对称正定系统
}

double lambda = 1e-3; 
double nu = 2.0; 
for (int iter = 0; iter < max_iters; ++iter) { 
    // 构造带阻尼的矩阵 
    MatrixXd jtj = jacobian.transpose() * jacobian; 
    VectorXd diag_jtj = jtj.diagonal(); 
    MatrixXd damping = lambda * diag_jtj.asDiagonal(); // 改进型：按主对角线缩放 
    MatrixXd A = jtj + damping; 
    VectorXd b = -jacobian.transpose() * residuals; 
    VectorXd delta = A.ldlt().solve(b); 
    
    // 尝试更新 
    VectorXd new_params = params + delta; 
    VectorXd new_residuals = ComputeResiduals(new_params); 
    double new_cost = new_residuals.squaredNorm(); 
    double old_cost = residuals.squaredNorm(); 
    
    // 计算预测下降量（来自二次模型） 
    double predicted_reduction = -(delta.dot(jtj * delta + b)); // 利用泰勒展开估算 
    
    // 计算实际下降与预测下降的比率 
    double rho = (old_cost - new_cost) / predicted_reduction; 
    if (rho > 1e-3) { 
        // 更新有效！接受新参数，并减小λ 
        params = new_params; 
        residuals = new_residuals; 
        // 动态缩减λ，加速收敛 
        lambda *= std::max(1.0/3.0, 1.0 - pow(2*rho - 1, 3)); 
        nu = 2.0; // 重置增长倍数 
    } else { 
        // 更新失败！拒绝更新，增大λ以增强稳定性 
        lambda *= nu; 
        nu *= 2.0; // 指数增长，快速逃离危险区域 
    } 
    // 检查收敛 
    if (Converged(delta, residuals, old_cost)) break; 
}

bool CheckParamConvergence(
    const VectorXd& delta, 
    const VectorXd& current, 
    double eps = 1e-8)
{
    double norm_delta = delta.norm();
    double norm_param = current.norm();
    return norm_delta < eps * (norm_param + eps);
}

bool HasConverged(
    double cost, 
    double prev_cost, 
    const VectorXd& grad, 
    const VectorXd& delta)
{
    double cost_diff = std::abs(cost - prev_cost);
    double rel_cost_change = cost_diff / (std::abs(prev_cost) + 1e-8);
    bool by_cost = rel_cost_change < 1e-6;
    bool by_grad = grad.norm() < 1e-5;
    bool by_step = delta.norm() < 1e-6 * (params.norm() + 1e-6);
    return by_cost || by_grad || by_step;
}

int iter = 0;
while (!HasConverged() && iter < max_iter) {
    // 主循环体
    iter++;
}
if (iter >= max_iter) {
    LOG(WARNING) << "LM terminated by max iterations";
}

class LevenbergMarquardt {
public:
    using ResidualFunc = std::function<void(const Eigen::VectorXd&, Eigen::VectorXd&)>;
    using JacobianFunc = std::function<void(const Eigen::VectorXd&, Eigen::MatrixXd&)>;
    
    LevenbergMarquardt(ResidualFunc res_func, JacobianFunc jac_func)
        : residual_func_(std::move(res_func)), jacobian_func_(std::move(jac_func)) {}
    
    bool solve(Eigen::VectorXd& parameters);
    void setMaxIterations(int max_iter) { max_iterations_ = max_iter; }
    void setTolerance(double tol) { tolerance_ = tol; }
    void setLambda(double lambda) { lambda_ = lambda; }

private:
    ResidualFunc residual_func_;
    JacobianFunc jacobian_func_;
    int max_iterations_ = 100;
    double tolerance_ = 1e-6;
    double lambda_ = 0.01;
    double lambda_factor_ = 10.0;
    Eigen::VectorXd current_params_;
    Eigen::VectorXd residuals_;
    Eigen::MatrixXd jacobian_;
};

bool LevenbergMarquardt::solve(Eigen::VectorXd& parameters) {
    current_params_ = parameters;
    double last_cost = 0.0;
    
    for (int iter = 0; iter < max_iterations_; ++iter) {
        // 计算残差和雅可比
        residual_func_(current_params_, residuals_);
        jacobian_func_(current_params_, jacobian_);
        
        // 构造矩阵
        Eigen::MatrixXd jtj = jacobian_.transpose() * jacobian_;
        Eigen::VectorXd b = -jacobian_.transpose() * residuals_;
        
        // 添加阻尼
        Eigen::MatrixXd A = jtj + lambda_ * Eigen::MatrixXd::Identity(jtj.rows(), jtj.cols());
        
        // 求解增量
        Eigen::VectorXd delta = A.ldlt().solve(b);
        
        // 尝试更新
        Eigen::VectorXd new_params = current_params_ + delta;
        Eigen::VectorXd new_residuals;
        residual_func_(new_params, new_residuals);
        
        double new_cost = new_residuals.squaredNorm();
        double old_cost = residuals_.squaredNorm();
        
        // 判断是否接受
        if (new_cost < old_cost) {
            current_params_ = new_params;
            residuals_ = new_residuals;
            last_cost = new_cost;
            lambda_ /= lambda_factor_; // 减小阻尼
        } else {
            lambda_ *= lambda_factor_; // 增加阻尼
        }
        
        // 检查收敛
        if (delta.norm() < tolerance_) break;
    }
    
    parameters = current_params_;
    return true;
}

Levenberg-Marquardt 非线性最小二乘优化算法 C++ 实战实现

Levenberg-Marquardt 算法的深度解析与工程实践

非线性最小二乘：不只是'拟合一条曲线'

残差函数：误差的语言

实际场景中的残差设计

LM 算法的灵魂：在'走直线'和'抄近路'之间做选择

数学上的'智能切换'

Hessian 近似与阻尼因子：LM 的两大支柱

为什么要用 $\mathbf{J}^T\mathbf{J}$ 作为 Hessian？

阻尼因子 $\lambda$ 的自适应调节策略

参数尺度问题：别让单位搞垮你的优化

解决方案一：参数归一化

解决方案二：使用对角矩阵替代单位阵

收敛判断：什么时候该停下来？

1. 参数变化量足够小

2. 残差下降率足够低

3. 梯度范数接近零

最佳实践：三者联合使用

C++ 实现：打造一个工业级 LM 优化器

更多推荐文章

相关免费在线工具

Levenberg-Marquardt 非线性最小二乘优化算法 C++ 实战实现

Levenberg-Marquardt 算法的深度解析与工程实践

非线性最小二乘：不只是'拟合一条曲线'

残差函数：误差的语言

实际场景中的残差设计

LM 算法的灵魂：在'走直线'和'抄近路'之间做选择

数学上的'智能切换'

Hessian 近似与阻尼因子：LM 的两大支柱

为什么要用 $\mathbf{J}^T\mathbf{J}$ 作为 Hessian？

阻尼因子 $\lambda$ 的自适应调节策略

参数尺度问题：别让单位搞垮你的优化

解决方案一：参数归一化

解决方案二：使用对角矩阵替代单位阵

收敛判断：什么时候该停下来？

1. 参数变化量足够小

2. 残差下降率足够低

3. 梯度范数接近零

最佳实践：三者联合使用

C++ 实现：打造一个工业级 LM 优化器

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具