Python Selenium 模拟登录实战与自动化技巧

Python Selenium 模拟登录实战与自动化技巧 | 极客日志

from selenium import webdriver
from selenium.webdriver.common.by import By
import time

# 初始化浏览器实例
driver = webdriver.Chrome()

# 打开目标网站
driver.get("https://github.com/login")

# 定位用户名和密码输入框并填写信息
driver.find_element(By.ID, "login_field").send_keys("your_username")
driver.find_element(By.ID, "password").send_keys("your_password")

# 点击登录按钮
driver.find_element(By.NAME, "commit").click()

# 等待页面跳转完成
time.sleep(3)

# 验证是否登录成功（检查页面标题）
if "Dashboard" in driver.title:
    print("登录成功！")
else:
    print("登录失败，请检查账号信息或验证码")

# 关闭浏览器
driver.quit()

项目	说明
元素定位方式	优先使用 ID 或 Name，避免依赖 XPath 导致稳定性下降
等待机制	建议使用 WebDriverWait 配合 expected_conditions 提升健壮性
账号安全	切勿将明文密码提交至版本控制系统

graph TD
A[启动浏览器] --> B[打开登录页]
B --> C[填充用户名密码]
C --> D[点击登录按钮]
D --> E[等待响应]
E --> F{登录成功？}
F -->|是 | G[进入主页面]
F -->|否 | H[输出错误信息]

from selenium import webdriver

# 初始化 ChromeDriver 实例
driver = webdriver.Chrome()

# 访问指定 URL
driver.get("https://example.com")

# 查找 ID 为 login-btn 的元素后触发点击
element = driver.find_element(By.id("login-btn"))
element.click()

浏览器	驱动程序	通信协议
Google Chrome	chromedriver	W3C WebDriver
Mozilla Firefox	geckodriver	W3C WebDriver

from selenium import webdriver

options = webdriver.ChromeOptions()
options.add_argument("--headless") # 无头模式
driver = webdriver.Chrome(executable_path="/path/to/chromedriver", options=options)

element = driver.find_element(By.xpath("//div[@class='login']/input"))

driver.find_element(By.css_selector("form#login input[type='password']"))

策略	速度	稳定性
id	快	高
xpath	慢	中

维度	隐式等待	显式等待
作用范围	全局，对所有 findElement 生效	局部，仅对指定条件生效
超时机制	固定时长，无法动态判断	可组合 ExpectedConditions，支持轮询 + 自定义间隔

from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

wait = WebDriverWait(driver, 10, poll_frequency=0.5)
element = wait.until(EC.element_to_be_clickable((By.ID, "submit-btn")))
# 参数说明：driver（驱动实例）、10（最大等待秒数）、0.5（轮询间隔秒）

from selenium.webdriver.common.action_chains import ActionChains

actions = ActionChains(driver)
actions.move_to_element(element).perform()

Set-Cookie: sessionId=abc123; Path=/; HttpOnly; Secure

{
  "sub": "123456",
  "exp": 1735689600,
  "role": "user"
}

Authorization: Bearer <token>

机制	状态管理	可扩展性	安全性特点
Cookie + Session	服务器端	低	防 XSS（HttpOnly）、防 CSRF 需额外措施
Token (JWT)	客户端	高	易受 XSS 影响，需合理设置过期时间

import requests

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
}
response = requests.get('https://example.com', headers=headers)

from selenium import webdriver

options = webdriver.ChromeOptions()
options.add_argument('--headless')
options.add_argument('--disable-gpu')

driver = webdriver.Chrome(options=options)

指标	有头模式	无头模式
内存占用	高	低
执行速度	慢	快
被检测概率	低	较高

<form action="/login" method="POST">
  <input type="text" name="username">
  <input type="password" name="password">
  <input type="hidden" name="csrf_token" value="abc123">
  <button type="submit">Login</button>
</form>

def perform_login(username, password, base_url):
    driver = webdriver.Chrome()
    try:
        # 导航至登录页
        driver.get(f"{base_url}/login")
        
        # 输入凭证并提交
        driver.find_element(By.ID, "username").send_keys(username)
        driver.find_element(By.ID, "password").send_keys(password)
        driver.find_element(By.NAME, "commit").click()
        
        # 验证登录成功
        if "dashboard" in driver.current_url:
            return True
    finally:
        driver.quit()
    return False

import pyotp

# 密钥通常以 URI 形式提供
totp = pyotp.TOTP("JBSWY3DPEHPK3PXP")
one_time_code = totp.now()
print(one_time_code) # 输出当前 6 位验证码

try:
    target_button = driver.find_element(By.ID, "auto-enter-btn")
    if target_button.is_displayed():
        target_button.click() # 自动触发点击
        print("自动点击已执行")
except Exception:
    pass

Python Selenium 模拟登录实战与自动化技巧

Python Selenium 模拟登录实战与自动化技巧

环境准备与依赖安装

模拟登录代码实现

关键注意事项

Selenium 核心原理与环境搭建

Selenium 工作原理与浏览器驱动机制

通信架构与数据流

驱动匹配与兼容性

配置 ChromeDriver 实现自动化控制

下载与版本匹配

环境变量配置

常见问题排查

定位元素的八大策略及其适用场景

常用定位策略

高级定位方式

显式等待与隐式等待的实践应用

核心差异对比

显式等待典型用法

隐式等待慎用场景

模拟用户行为：点击、输入与滑动操作

常见操作类型

代码示例：鼠标悬停与滚动

登录流程分析与反爬应对策略

常见网站登录机制解析（Cookie、Session、Token）

基于 Cookie 与 Session 的传统认证

基于 Token 的无状态认证

三种机制对比

识别并绕过基础反爬虫检测机制

伪造请求头模拟浏览器行为

控制请求频率与 IP 轮换策略

使用无头模式平衡效率与隐蔽性

启动无头模式的典型配置

性能与检测规避对比

实战案例——模拟登录主流平台并自动点击

目标网站选择与登录页面结构分析

登录页面结构解析

关键元素定位策略

编写可复用的登录自动化脚本

封装通用登录函数

配置管理与数据分离

处理验证码与二次验证的应对方案

常见验证码类型及处理思路

自动化登录中的 2FA 处理

实现登录后页面元素自动点击功能

自动化点击的实现机制

适用场景与注意事项

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具