Python 常用库详解：数据处理、Web 开发与自动化 | 极客日志

PythonAI算法

Python 常用库详解：数据处理、Web 开发与自动化

系统梳理了 Python 常用第三方库，涵盖数据处理（NumPy、SciPy）、数据可视化（Seaborn、Plotly）、Web 开发（Flask、FastAPI）、网络爬虫（BeautifulSoup、Scrapy）及办公自动化（openpyxl、python-docx）等核心领域。文章提供了各库的安装命令与基础代码示例，旨在帮助开发者快速了解工具特性并根据实际业务场景选择合适的技术栈，提升开发效率。

月亮邮递员发布于 2026/3/27更新于 2026/4/186 浏览

一、数据处理与计算类

这类库是数据科学、数值计算的基础，补充 pandas 的能力边界。

1. NumPy（数值计算核心库）

核心用途：处理多维数组（矩阵）、数值运算（线性代数、傅里叶变换等），是 pandas、matplotlib 的底层依赖，比 Python 原生列表运算快数十倍。典型场景：数值模拟、矩阵运算、数据标准化。

import numpy as np

import numpy as np from scipy.optimize import curve_fit # 案例：数据拟合（拟合一条直线） # 1. 模拟数据 x = np.linspace(0, 10, 50) # 0 到 10 的 50 个均匀点 y = 2 * x + 3 + np.random.normal(0, 0.5, 50) # y=2x+3 + 随机噪声 # 2. 定义拟合函数（直线） def linear_func(x, a, b): return a * x + b # 3. 拟合数据，得到参数 a、b params, _ = curve_fit(linear_func, x, y) a, b = params print(f"拟合结果：y = {a:.2f}x + {b:.2f}") # 接近 y=2x+3

import seaborn as sns import matplotlib.pyplot as plt # 设置中文显示 plt.rcParams["font.sans-serif"] = ["SimHei"] plt.rcParams["axes.unicode_minus"] = False # 案例：绘制热力图（展示数据相关性） # 1. 加载内置数据集（鸢尾花数据） df = sns.load_dataset("iris") # 2. 计算数值列的相关性矩阵 corr = df.select_dtypes(include="float64").corr() # 3. 绘制热力图 sns.heatmap(corr, annot=True, cmap="coolwarm", fmt=".2f") plt.title("鸢尾花数据相关性热力图") plt.show()

import plotly.express as px # 案例：绘制交互式散点图 # 1. 加载内置数据集 df = px.data.iris() # 2. 绘制散点图（可交互，悬停显示详细信息） fig = px.scatter(df, x="sepal_length", y="sepal_width", color="species", size="petal_length", title="鸢尾花数据交互式散点图") # 3. 显示图表（自动打开浏览器） fig.show()

from flask import Flask, jsonify # 初始化 Flask 应用 app = Flask(__name__) # 定义路由（访问 http://127.0.0.1:5000/hello 触发） @app.route("/hello") def hello_world(): return "Hello, Flask!" # 定义 API 接口（返回 JSON 数据） @app.route("/api/data") def get_data(): data = {"name": "测试", "age": 20, "city": "北京"} return jsonify(data) # 运行应用 if __name__ == "__main__": app.run(debug=True) # debug=True 调试模式，修改代码自动重启

from fastapi import FastAPI import uvicorn # 初始化 FastAPI 应用 app = FastAPI() # 定义 GET 接口 @app.get("/items/{item_id}") def read_item(item_id: int, q: str = None): return {"item_id": item_id, "q": q} # 运行应用（需用 uvicorn） if __name__ == "__main__": uvicorn.run(app, host="127.0.0.1", port=8000)

import requests from bs4 import BeautifulSoup # 案例：爬取网页标题和链接 url = "https://www.example.com" response = requests.get(url) soup = BeautifulSoup(response.text, "html.parser") # 解析 HTML # 提取标题 title = soup.title.string print("网页标题：", title) # 提取所有链接 print("\n网页中的链接：") for a_tag in soup.find_all("a"): # 找到所有<a>标签 link = a_tag.get("href") text = a_tag.string print(f"文本：{text}，链接：{link}")

# 新建爬虫文件（spiders/example_spider.py） import scrapy class ExampleSpider(scrapy.Spider): name = "example" # 爬虫名 start_urls = ["https://www.example.com"] # 起始 URL def parse(self, response): # 提取标题 title = response.xpath("//title/text()").get() yield {"title": title} # 输出数据 # 提取所有链接并跟进爬取（可选） for href in response.xpath("//a/@href").getall(): yield response.follow(href, self.parse)

from openpyxl import Workbook # 案例：创建 Excel 并写入数据 wb = Workbook() ws = wb.active # 获取活动工作表 ws.title = "测试表" # 重命名工作表 # 写入数据 ws["A1"] = "姓名" ws["B1"] = "年龄" ws.append(["张三", 25]) ws.append(["李四", 30]) # 保存文件 wb.save("test.xlsx") print("Excel 文件已生成")

from docx import Document from docx.shared import Inches # 案例：创建 Word 文档 doc = Document() # 添加标题 doc.add_heading("测试文档", level=1) # 添加段落 p = doc.add_paragraph("这是第一段文本，") p.add_run("这部分文字加粗").bold = True p.add_run("，这部分正常。") # 添加表格（2 行 2 列） table = doc.add_table(rows=2, cols=2) table.cell(0, 0).text = "姓名" table.cell(0, 1).text = "年龄" table.cell(1, 0).text = "张三" table.cell(1, 1).text = "25" # 保存文档 doc.save("test.docx") print("Word 文档已生成")

库名	核心用途	典型场景
Pillow	图像处理（裁剪、缩放、加水印、格式转换）	图片批量处理、验证码识别
PyYAML	读写 YAML 配置文件	项目配置、数据序列化
logging	日志记录（内置库）	程序运行日志、错误排查
unittest/pytest	单元测试框架	代码测试、自动化测试
json/csv	读写 JSON/CSV 文件（内置库）	数据存储、接口数据交互

Python 常用库详解：数据处理、Web 开发与自动化

一、数据处理与计算类

1. NumPy（数值计算核心库）

2. SciPy（科学计算库）

二、数据可视化类

1. Seaborn（高级可视化库）

2. Plotly（交互式可视化库）

三、Web 开发类

1. Flask（轻量级 Web 框架）

2. FastAPI（高性能 API 框架）

四、爬虫类

1. BeautifulSoup4（网页解析库）

2. Scrapy（专业爬虫框架）

五、自动化与办公类

1. openpyxl/xlsxwriter（Excel 操作库）

2. python-docx（Word 操作库）

六、其他高频库

总结

更多推荐文章

相关免费在线工具

Python 常用库详解：数据处理、Web 开发与自动化

一、数据处理与计算类

1. NumPy（数值计算核心库）

2. SciPy（科学计算库）

二、数据可视化类

1. Seaborn（高级可视化库）

2. Plotly（交互式可视化库）

三、Web 开发类

1. Flask（轻量级 Web 框架）

2. FastAPI（高性能 API 框架）

四、爬虫类

1. BeautifulSoup4（网页解析库）

2. Scrapy（专业爬虫框架）

五、自动化与办公类

1. openpyxl/xlsxwriter（Excel 操作库）

2. python-docx（Word 操作库）

六、其他高频库

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具