前言
Python 的第三方 Pandas 库是数据处理和分析中的利器,其强大的功能可以帮助我们轻松地对 Excel 表格进行自动化操作。接下来,我们将介绍九个用 Pandas 库操作 Excel 的编程例子,并且每个例子都会涉及不同的知识点,确保全面掌握这个主题。
Python Pandas 库提供了丰富的功能用于 Excel 自动化操作。本文通过九个实例演示了核心用法,包括读取写入文件、选择行列数据、条件过滤、增删改列、合并表格及生成数据透视表。掌握这些方法可显著提升数据处理效率,适用于办公自动化场景。

Python 的第三方 Pandas 库是数据处理和分析中的利器,其强大的功能可以帮助我们轻松地对 Excel 表格进行自动化操作。接下来,我们将介绍九个用 Pandas 库操作 Excel 的编程例子,并且每个例子都会涉及不同的知识点,确保全面掌握这个主题。
首先,我们需要了解如何使用 Pandas 读取、写入 Excel 文件。这可以通过 pd.read_excel()、df.to_excel() 方法来实现。
import pandas as pd
# 通过字典形式构建 DataFrame
df = pd.DataFrame({
'工号': [1001, 1002, 1003],
'姓名': ['张三', '李四', '王五'],
'年龄': [28, 25, 30]
})
df = df.set_index('工号') # 自定义索引
df.to_excel('人事信息.xlsx') # 写入 excel
df = pd.read_excel('人事信息.xlsx') # 读取 excel
print(df)
# 输出结果:
# 工号 姓名 年龄
# 0 1001 张三 28
# 1 1002 李四 25
# 2 1003 王五 30
要选择 Excel 表格中的特定列数据,可以使用 DataFrame 的列索引进行选择。
# 选择 Name 列数据
names = df['姓名']
print(names)
# 输出结果:
# 0 张三
# 1 李四
# 2 王五
使用 df.loc[] 方法可以选择特定行数据。
# 选择第一行数据
first_row = df.loc[0]
print(first_row)
# 输出结果:
# 工号 1001
# 姓名 张三
# 年龄 28
Pandas 还可以根据条件过滤数据。
# 过滤年龄大于 25 的行
filtered_data = df[df['年龄'] > 25]
print(filtered_data)
# 输出结果:
# 工号 姓名 年龄
# 0 1001 张三 28
# 2 1003 王五 30
通过给 DataFrame 赋值,可以添加新列。
# 添加新列
df['籍贯'] = ['广东', '广西', '湖南']
print(df)
# 输出结果:
# 工号 姓名 年龄 籍贯
# 0 1001 张三 28 广东
# 1 1002 李四 25 广西
# 2 1003 王五 30 湖南
使用 df.drop() 方法可以删除行或列。
# 删除年龄列
df = df.drop('年龄', axis=1)
print(df)
# 输出结果:
# 工号 姓名 籍贯
# 0 1001 张三 广东
# 1 1002 李四 广西
# 2 1003 王五 湖南
可以通过索引直接修改数据。
# 修改第一行第一个元素为'陈六'
df.loc[0, '姓名'] = '陈六'
print(df)
# 输出结果:
# 工号 姓名 籍贯
# 0 1001 陈六 广东
# 1 1002 李四 广西
# 2 1003 王五 湖南
Pandas 可以合并多个 Excel 表格数据。
# 读取另一个 Excel 文件
df2 = pd.read_excel('example2.xlsx')
# 合并两个 DataFrame
merged_df = pd.concat([df, df2])
print(merged_df)
使用 Pandas 可以生成数据透视表。
# 生成数据透视表
import pandas as pd
# 创建销售数据集
data = {'日期': ['2024-04-01', '2024-04-02', '2024-04-02', '2024-04-02', '2024-04-03'],
'产品': ['苹果', '香蕉', '苹果', '香蕉', '苹果'],
'销售额': [1000, 1500, 800, 1200, 1500]}
df = pd.DataFrame(data)
# 显示数据集
print(df)
pivot_table = df.pivot_table(index='日期', columns='产品', values='销售额', aggfunc='sum')
# 显示数据透视表
print(pivot_table)
# 数据结果:
# 产品 苹果 香蕉
# 日期
# 2024-04-01 1000.0 NaN
# 2024-04-02 800.0 2700.0
# 2024-04-03 1500.0 NaN
通过以上九个例子,我们学会了如何使用 Python 的 Pandas 库对 Excel 表格进行自动化操作。从读取、写入到数据处理和分析,Pandas 提供了丰富的功能,为数据科学工作提供了便利。希望这些例子能帮助你更好地掌握 Pandas 库在 Excel 操作中的应用!

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online