逻辑回归算法详解与 Python 实现

前言

逻辑回归是机器学习中入门级且实用性极强的算法，虽名称含'回归'二字，实则是解决二分类问题的经典模型。其核心优势在于结构简单、可解释性强、计算效率高，广泛应用于信用评估、垃圾邮件识别、疾病诊断等场景。本文将从核心原理、实现步骤、Python 代码实现、实验结果分析及常见问题解决等方面，全面讲解逻辑回归算法，帮助初学者快速掌握并落地实践。

一、逻辑回归核心知识梳理

1. 算法定位与适用场景

逻辑回归是基于统计学习的二分类算法，通过 Sigmoid 函数将线性回归的连续输出映射到 0-1 区间，以此表示样本属于某一类别的概率。适用于：

优点	缺点
模型结构简单，易理解和实现	仅能建模线性关系，无法处理非线性数据
可解释性强，参数对应特征重要性	对异常值敏感，需提前处理
计算效率高，训练和预测速度快	原生不支持多分类（需通过 One-vs-Rest 等方式扩展）
无需复杂调参，泛化能力稳定	需对特征进行标准化/归一化处理

import numpy as np import matplotlib.pyplot as plt # 1. 加载数据集（构造二维特征的二分类数据，添加偏置项） def load_dataset(): """ 加载数据集，返回特征矩阵、标签矩阵、测试集 """ data_mat = [] # 特征矩阵（含偏置项） label_mat = [] # 标签矩阵 # 构造训练数据（模拟文章中的数据集分布） fr = [ "3.542485\t1.977398\t0", "3.018896\t2.556416\t0", "7.551510\t-1.580030\t1", "2.114999\t-0.004466\t0", "8.127113\t1.274372\t1", "7.108772\t-0.986906\t1", "2.326297\t0.265213\t0", "0.207971\t-0.438046\t0", "6.332009\t0.469543\t1", "6.172788\t-2.044329\t1", "3.645780\t3.410627\t0", "3.125951\t-0.160513\t0", "2.912122\t-0.206010\t0", "8.307974\t-0.422311\t1", "5.286862\t0.660109\t1" ] for line in fr: line_arr = line.strip().split('\t') # 特征：[偏置项 1, 特征 1, 特征 2] data_mat.append([1.0, float(line_arr[0]), float(line_arr[1])]) label_mat.append(int(line_arr[2])) # 构造测试集（4 个样本，模拟文章中的测试数据） test_set = [ [1.0, 7.635630, 0.215151], [1.0, 6.383078, -1.012999], [1.0, 7.192221, -0.130088], [1.0, 8.348103, 1.071160] ] return np.asmatrix(data_mat), np.asmatrix(label_mat).transpose(), np.asmatrix(test_set) # 2. Sigmoid 函数（将线性输出映射到 0-1 区间） def sigmoid(in_x): """ Sigmoid 激活函数 :param in_x: 输入（线性回归输出） :return: 0-1 之间的概率值 """ return 1.0 / (1 + np.exp(-in_x)) # 3. 批量梯度上升训练逻辑回归模型 def grad_ascent(data_mat_in, class_labels): """ 批量梯度上升法求解最优权重 :param data_mat_in: 特征矩阵（m×n） :param class_labels: 标签矩阵（m×1） :return: 最优权重矩阵（n×1） """ data_matrix = np.asmatrix(data_mat_in) label_mat = np.asmatrix(class_labels) m, n = np.shape(data_matrix) # m：样本数，n：特征数（含偏置） alpha = 0.001 # 学习率（与文章一致） max_cycles = 500 # 迭代次数（与文章一致） weights = np.ones((n, 1)) # 初始化权重为 1 for k in range(max_cycles): h = sigmoid(data_matrix * weights) # 预测概率（m×1） error = (label_mat - h) # 误差（m×1） # 梯度上升更新权重：weights = weights + alpha * X.T * (y - h) weights = weights + alpha * data_matrix.transpose() * error return weights # 4. 随机梯度上升（可选，用于对比） def stoc_grad_ascent0(data_mat_in, class_labels): """ 随机梯度上升法（单样本更新） """ m, n = np.shape(data_mat_in) alpha = 0.01 weights = np.ones(n) # 一维数组 for i in range(m): h = sigmoid(sum(data_mat_in[i] * weights)) error = class_labels[i] - h weights = weights + alpha * error * data_mat_in[i] return np.mat(weights).transpose() # 5. 预测函数 def classify_vector(in_x, weights): """ 根据权重预测类别，并输出概率 :param in_x: 单个样本特征（1×n） :param weights: 最优权重（n×1） :return: 预测概率、预测类别（0/1） """ prob = sigmoid(in_x * weights) label = 1.0 if prob > 0.5 else 0.0 return prob[0, 0], label # 6. 绘制决策边界 def plot_best_fit(weights, data_mat, label_mat): """ 绘制样本点和逻辑回归的决策边界 """ data_arr = np.array(data_mat) n = np.shape(data_arr)[0] xcord1 = []; ycord1 = [] # 类别 1 的样本 xcord2 = []; ycord2 = [] # 类别 0 的样本 # 区分两类样本 for i in range(n): if int(label_mat[i]) == 1: xcord1.append(data_arr[i, 1]) ycord1.append(data_arr[i, 2]) else: xcord2.append(data_arr[i, 1]) ycord2.append(data_arr[i, 2]) # 绘制散点图 fig = plt.figure() ax = fig.add_subplot(111) ax.scatter(xcord1, ycord1, s=30, c='blue', marker='o', label='Class 1') ax.scatter(xcord2, ycord2, s=30, c='red', marker='x', label='Class 0') # 计算决策边界（sigmoid(z)=0.5 → z=0 → w0 + w1x1 + w2x2 = 0 → x2 = (-w0 -w1x1)/w2） x = np.arange(-1.0, 10.0, 0.1) y = (-weights[0, 0] - weights[1, 0] * x) / weights[2, 0] ax.plot(x, y, c='green', label='Decision Boundary') # 设置坐标轴和图例 plt.xlabel('Feature 1') plt.ylabel('Feature 2') plt.legend(loc='upper left') plt.title('Logistic Regression Decision Boundary') plt.show() # 主函数：执行逻辑回归完整流程 if __name__ == "__main__": # 1. 加载数据 data_mat, label_mat, test_set = load_dataset() print("数据集加载完成，训练样本数：", np.shape(data_mat)[0]) print("测试样本数：", np.shape(test_set)[0]) # 2. 测试 Sigmoid 函数 print("\nSigmoid 函数测试：sigmoid(0) =", sigmoid(0)) print("sigmoid(2) =", sigmoid(2)) print("sigmoid(-2) =", sigmoid(-2)) # 3. 训练模型（批量梯度上升） weights = grad_ascent(data_mat, label_mat) print("\n批量梯度上升得到的最优权重：") print(weights) # 可选：随机梯度上升训练 # weights_stoc = stoc_grad_ascent0(np.array(data_mat), np.array(label_mat).flatten()) # print("\n随机梯度上升得到的最优权重：") # print(weights_stoc) # 4. 测试集预测 print("\n测试集预测结果：") for i in range(np.shape(test_set)[0]): prob, label = classify_vector(test_set[i], weights) print(f"测试样本{i+1}：预测概率={prob:.4f}，预测类别={int(label)}") # 5. 绘制决策边界 plot_best_fit(weights, data_mat, label_mat)

逻辑回归算法详解与 Python 实现

前言

一、逻辑回归核心知识梳理

1. 算法定位与适用场景

2. 核心优缺点

3. 核心原理

（1）Sigmoid 函数

（2）损失函数与优化目标

（3）参数求解方法

4. 算法执行步骤

二、Python 完整实现代码

1. 环境依赖

2. 完整代码（兼容 NumPy 2.0+）

三、关键代码说明

1. 数据加载模块

2. 模型训练模块

3. 预测与可视化模块

四、实验结果与分析

1. 输出结果

（1）最优权重

（2）测试集预测结果

（3）绘制决策边界

更多推荐文章

相关免费在线工具

逻辑回归算法详解与 Python 实现

前言

一、逻辑回归核心知识梳理

1. 算法定位与适用场景

2. 核心优缺点

3. 核心原理

（1）Sigmoid 函数

（2）损失函数与优化目标

（3）参数求解方法

4. 算法执行步骤

二、Python 完整实现代码

1. 环境依赖

2. 完整代码（兼容 NumPy 2.0+）

三、关键代码说明

1. 数据加载模块

2. 模型训练模块

3. 预测与可视化模块

四、实验结果与分析

1. 输出结果

（1）最优权重

（2）测试集预测结果

（3）绘制决策边界

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具