PyAutoGUI:Python 桌面自动化框架详解

一、PyAutoGUI 核心介绍

PyAutoGUI 是一款跨平台(支持 Windows、macOS、Linux)的 Python 桌面自动化库,能够模拟用户的鼠标移动、点击、滚轮操作键盘输入,还支持屏幕截图、图像识别定位等功能,广泛用于重复性桌面操作自动化(如表单填写、软件操作、批量处理等)。

二、安装步骤

直接通过 pip 命令安装,命令简洁无复杂依赖:

pip install pyautogui

补充:若安装失败(如 macOS 需额外依赖),可参考官方文档适配系统环境,Windows 系统通常可直接安装成功。

三、核心功能详解

  自动获取当前鼠标位置:

import pyautogui import time try: while True: x, y = pyautogui.position() #获得鼠标所在位置 print(x,y) #打印当前鼠标所处位置 time.sleep(1) except KeyboardInterrupt: print('\nExit.') 

(一)鼠标操作:模拟用户鼠标行为

PyAutoGUI 提供了完整的鼠标模拟接口,核心包括移动、点击、拖拽等,所有操作均基于屏幕坐标系统(屏幕左上角为原点 (0, 0),向右为 x 轴正方向,向下为 y 轴正方向)。

1. 鼠标移动

  • 基础移动:将鼠标从当前位置移动到指定坐标 (x, y)
import pyautogui # duration:移动耗时(秒),可选参数,默认瞬间移动 pyautogui.moveTo(x=100, y=200, duration=0.5)
  • 相对移动:基于当前鼠标位置,偏移指定像素(dx 为 x 轴偏移,dy 为 y 轴偏移)
# 向右移动 50 像素,向下移动 30 像素,耗时 0.3 秒 pyautogui.moveRel(dx=50, dy=30, duration=0.3)

2. 鼠标点击

  • 基础点击:在指定坐标执行鼠标左键单击
# 在 (100, 200) 位置单击左键,duration 为移动到目标位置的耗时 pyautogui.click(x=100, y=200, duration=0.2)
  • 指定按键点击:支持左键(left)、右键(right)、中键(middle)
# 右键单击 pyautogui.click(x=100, y=200, button='right', duration=0.2) # 中键单击 pyautogui.click(x=100, y=200, button='middle', duration=0.2)
  • 双击/三击:快速执行多次点击
# 左键双击 pyautogui.doubleClick(x=100, y=200, duration=0.2) # 左键三击 pyautogui.tripleClick(x=100, y=200, duration=0.2)

3. 鼠标拖拽

模拟鼠标按住并拖动的行为,常用于文件拖拽、窗口调整等场景:

# 从 (x1, y1) 拖拽到 (x2, y2),按住左键拖拽 pyautogui.dragTo(x=300, y=400, duration=0.8, button='left') # 相对拖拽:基于当前位置偏移拖拽 pyautogui.dragRel(dx=100, dy=50, duration=0.5, button='left')

4. 鼠标滚轮

模拟滚轮滚动行为,clicks 参数指定滚动幅度(正数向上滚,负数向下滚):

# 向下滚动 5 格(负数表示向下) pyautogui.scroll(clicks=-5, x=100, y=200) # 向上滚动 3 格(正数表示向上) pyautogui.scroll(clicks=3, x=100, y=200)

(二)键盘操作:模拟输入与快捷键

1. 普通文本输入

使用 typewrite() 方法输入字符串,支持指定输入间隔(模拟人工输入速度):

# 直接输入文本 pyautogui.typewrite("Hello, PyAutoGUI!") # 带间隔输入(每个字符间隔 0.2 秒) pyautogui.typewrite("Hello, PyAutoGUI!", interval=0.2)

2. 特殊按键输入

对于回车键、空格键、快捷键等特殊按键,需使用按键名称(封装在 PyAutoGUI 中),核心方法:

  • press():单次按下并释放某个按键
  • keyDown():按住某个按键不释放
  • keyUp():释放按住的按键
# 单个特殊按键:按下并释放回车键 pyautogui.press('enter') # 组合快捷键:Ctrl + C(复制) pyautogui.keyDown('ctrl') pyautogui.press('c') pyautogui.keyUp('ctrl') # 简化组合快捷键:使用 hotkey() 方法(推荐) pyautogui.hotkey('ctrl', 'c')  # 复制 pyautogui.hotkey('ctrl', 'v')  # 粘贴 pyautogui.hotkey('ctrl', 'a')  # 全选

常用特殊按键名称:enter(回车)、space(空格)、backspace(删除)、tab(制表符)、shift、ctrl、alt 等。

(三)屏幕与图像识别:定位目标元素

1. 屏幕基础信息获取

获取屏幕分辨率(用于确定坐标范围):

# 获取屏幕宽度和高度 screen_width, screen_height = pyautogui.size() print(f"屏幕分辨率:{screen_width} × {screen_height}") # 获取当前鼠标位置坐标 mouse_x, mouse_y = pyautogui.position() print(f"当前鼠标位置:({mouse_x}, {mouse_y})")

2. 图像定位:查找屏幕上的目标图像

PyAutoGUI 支持通过目标图像(如按钮截图、图标截图),自动查找其在屏幕上的坐标,核心方法 locateOnScreen()。

步骤说明

  1. 先截取目标元素的截图(保存为 PNG 格式,推荐使用截图工具精准截取)
  2. 使用 locateOnScreen() 查找图像位置,返回目标区域的坐标和尺寸
  3. 通过 center() 方法获取目标区域的中心坐标(便于点击等操作)
import pyautogui import time # 等待 3 秒,预留时间切换到目标屏幕 time.sleep(3) try:     # 查找目标图像(image.png 为目标截图路径)     # confidence:匹配精度(0-1,默认 1,降低精度可提高查找成功率,需安装 opencv-python 支持)     target_location = pyautogui.locateOnScreen('image.png', confidence=0.8)     if target_location:         # 获取目标图像的中心坐标         target_center = pyautogui.center(target_location)         print(f"目标图像位置:{target_location},中心坐标:{target_center}")         # 点击目标中心         pyautogui.click(target_center.x, target_center.y, duration=0.2)     else:         print("未找到目标图像") except Exception as e:     print(f"查找失败:{e}")

注意:使用 confidence 参数时,需额外安装 opencv-python:pip install opencv-python

3. 屏幕截图

# 截取整个屏幕并保存为文件 pyautogui.screenshot('full_screen.png') # 截取指定区域屏幕(x1, y1, 宽度, 高度) pyautogui.screenshot('partial_screen.png', region=(100, 100, 300, 200))

(四)安全机制:防止自动化失控

PyAutoGUI 提供了关键的安全保护机制,避免自动化操作失控(如鼠标移到屏幕边缘无法找回、无限循环操作等):

1. 故障安全触发

默认开启:当鼠标移动到屏幕左上角(坐标 (0, 0))时,会立即抛出 FailSafeException 异常,终止所有自动化操作:

# 若操作失控,快速将鼠标移到屏幕左上角即可停止程序 try:     while True:         pyautogui.moveRel(10, 0, duration=0.1) except pyautogui.FailSafeException:     print("故障安全机制触发,程序终止")

2. 操作延迟

通过 PAUSE 属性设置所有 PyAutoGUI 操作的默认间隔时间(秒),便于观察操作过程,也可防止操作过快导致程序异常:

# 设置所有操作间隔 0.5 秒 pyautogui.PAUSE = 0.5

四、实战示例:简单自动化操作

import pyautogui import time # 安全设置 pyautogui.PAUSE = 0.5  # 操作间隔 0.5 秒 pyautogui.FAILSAFE = True  # 开启故障安全机制 # 1. 等待 5 秒,预留时间打开记事本 print("5 秒后开始操作,请打开记事本...") time.sleep(5) # 2. 输入文本 pyautogui.typewrite("Python 自动化 - PyAutoGUI 实战", interval=0.1) # 3. 换行 pyautogui.press('enter') # 4. 输入第二行文本 pyautogui.typewrite("这是一个简单的自动化演示", interval=0.1) # 5. 全选文本(Ctrl + A) pyautogui.hotkey('ctrl', 'a') # 6. 复制文本(Ctrl + C) pyautogui.hotkey('ctrl', 'c') # 7. 弹窗提示操作完成 pyautogui.alert("自动化操作完成!")

Read more

【Python】使用uv管理python虚拟环境

【Python】使用uv管理python虚拟环境

本文介绍了python虚拟环境管理工具uv,包括uv的作用、uv的常用命令等等。 参考:UV - 管理Python 版本、环境、第三方包 1. 介绍uv 官网:https://docs.astral.sh/uv/ uv是一个python虚拟环境管理工具,可以用来替代pip、pyenv、virtualenv等等工具。根据官网的介绍,使用uv来管理虚拟环境,相比于pip能得到至少10倍以上的性能提升。 uv工具有如下功能: * 管理python版本; * 管理第三方库(Python packages)的版本; * 拥有全局的第三方库的缓存,能减少磁盘空间占用; * 安装uv不需要python环境,可以通过curl或pip安装; * 多平台支持:macOS、Linux、Windows; 试用过后,感觉uv还是很不错的,于是编写本文,推荐给大家。 2. 安装uv 文档:https://docs.astral.sh/

By Ne0inhk
Python从0到100(九十九):基于空间注意力Spatial Attention Neural Network的网络设计与实现

Python从0到100(九十九):基于空间注意力Spatial Attention Neural Network的网络设计与实现

前言:零基础学Python:Python从0到100最新最全教程。 想做这件事情很久了,这次我更新了自己所写过的所有博客,汇集成了Python从0到100,共一百节课,帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、 计算机视觉、机器学习、神经网络以及人工智能相关知识,成为学业升学和工作就业的先行者! 【优惠信息】 • 新专栏订阅前500名享9.9元优惠 • 订阅量破500后价格上涨至19.9元 • 订阅本专栏可免费加入粉丝福利群,享受: - 所有问题解答 -专属福利领取 欢迎大家订阅专栏:零基础学Python:Python从0到100最新最全教程! 本文目录: * 一、SANN的理论基础与创新点 * 1. 传统卷积神经网络在时序数据处理中的局限性 * 2. SANN的核心创新 * 3. 技术优势分析 * 二、SANN架构设计详解 * 1. 整体架构概览 * 2. SpatialAttentionModule:空间注意力模块详解 * 2.1 通道维度特征聚合 * 2.2 注意力权重计

By Ne0inhk
Python(32)Python内置函数全解析:30个核心函数的语法、案例与最佳实践

Python(32)Python内置函数全解析:30个核心函数的语法、案例与最佳实践

目录 * 引言 * 基础数据类型操作 * 1. len() * 2. range() * 3. enumerate() * 4. zip() * 5. sorted() * 函数式编程工具 * 6. map() * 7. filter() * 8. reduce() * 9. any() * 10. all() * 输入输出与文件操作 * 11. open() * 12. print() * 13. input() * 14. exec() * 15. eval() * 元编程与高级功能 * 16. dir() * 17. help() * 18. type() * 19. isinstance() * 20. hasattr() * 21. getattr() * 22. setattr(

By Ne0inhk
华为OD机试双机位C卷:自动化维修流水线(C/C++/Java/Python/Go/JS)

华为OD机试双机位C卷:自动化维修流水线(C/C++/Java/Python/Go/JS)

自动化维修流水线 华为OD机试双机位C卷 - 华为OD上机考试双机位C卷 100分题型 华为OD机试双机位C卷真题目录点击查看: 华为OD机试双机位C卷真题题库目录|机考题库 + 算法考点详解 题目描述 小伙伴反馈题目大意:给定m条流水线,流水线可并行处理维修任务,给出n个任务,并给出每个任务的执行时间,要求完成所有任务的最短时间。 输入描述 第一行输入 任务数n和流水线数量m,用空格分割 第二行输入 每个任务完成所用时间 输出描述 输出最短执行完成所有任务数量 用例1 输入 10 1 10 20 30 5 5 5 5 10 5 10 输出 105 题解 思路:二分 + 递归回溯

By Ne0inhk