告别 Selenium：Playwright 现代 Web 自动化测试从入门到实战

优质文章学习记录

07 Apr 2026 — 6 min read

告别 Selenium：Playwright 现代 Web 自动化测试简明教程

前言：为什么选择 Playwright？

在 Web 自动化测试领域，Selenium 曾长期占据主流，但面对现代前端框架（React/Vue/Next.js）、复杂 SPA 应用和多端适配需求，其局限性逐渐凸显。Microsoft 推出的 Playwright 框架，凭借跨引擎、跨平台、智能化的特性，成为新一代自动化测试的优选方案。

相比于传统的 Selenium 或 Cypress，Playwright 具有以下优势：

极致性能：基于浏览器上下文（Browser Context）隔离测试环境，启动速度比 Selenium 快 30%+，无冗余进程开销；
智能等待：内置自适应等待机制，自动等待元素可交互，彻底告别sleep()硬编码；全场景覆盖：支持 Chromium/Firefox/WebKit 三大引擎，Windows/Linux/macOS
全平台，JavaScript/TypeScript/Python/Java/.NET 多语言；
强大工具链：Codegen（代码自动生成）、Trace Viewer（测试追踪分析）、UI Mode（交互式调试）一站式提效；
多端适配：原生支持移动端浏览器模拟，实验性支持安卓真机测试，覆盖 PC + 移动全场景。

安装

在已有 Node.js 环境的项目中，执行以下命令一键初始化 Playwright：

npm init playwright@latest

执行后，脚本会引导你完成以下配置：

选择使用 TypeScript 还是 JavaScript。
指定测试文件存放目录（默认 tests）。
是否添加 GitHub Actions 工作流。
是否安装 Playwright 浏览器（建议选择是，否则后续需要手动运行 npx playwright install）。

基础使用

编写第一个测试

Playwright 的 API 非常直观。在 tests/example.spec.ts 中：

import{ test, expect }from'@playwright/test';test('has title',async({ page })=>{await page.goto('https://playwright.dev/');// 期待标题包含 "Playwright"awaitexpect(page).toHaveTitle(/Playwright/);});test('get started link',async({ page })=>{await page.goto('https://playwright.dev/');// 点击 "Get started" 链接await page.getByRole('link',{ name:'Get started'}).click();// 期待 URL 包含 introawaitexpect(page).toHaveURL(/.*intro/);});

常见测试场景

1. 元素定位与交互

Playwright 推荐使用 page.getByRole 或 page.getByText 等面向用户的定位方式，这能使测试更具鲁棒性。

// 填写表单await page.getByLabel('用户名').fill('admin');await page.getByLabel('密码').fill('123456');// 点击按钮await page.getByRole('button',{ name:'登录'}).click();

2. 等待网络请求

在现代单页应用（SPA）中，等待特定的接口返回是非常常见的需求。

// 等待接口返回const[response]=awaitPromise.all([ page.waitForResponse(resp => resp.url().includes('/api/login')&& resp.status()===200), page.getByRole('button',{ name:'登录'}).click(),]);

3. 处理弹窗与 Iframe

Playwright 能够轻松处理 JavaScript 警告框（Dialog）和嵌套的 Iframe。

// 处理 Dialog page.on('dialog', dialog => dialog.accept());await page.getByRole('button',{ name:'删除'}).click();// 进入 Iframe 交互const frame = page.frameLocator('#my-iframe');await frame.getByText('确认提交').click();

4. 键盘输入与快捷键

Playwright 提供了非常精细的键盘模拟能力，不仅可以输入文本，还能模拟单个按键及组合键。

// 聚焦并输入文本await page.getByLabel('搜索').focus();await page.keyboard.type('Playwright',{ delay:100});// 模拟真实打字速度// 按下回车键await page.keyboard.press('Enter');// 组合键：全选并删除 (Windows/Linux 用 Control, macOS 用 Meta)await page.keyboard.press('Control+A');await page.keyboard.press('Backspace');

5. 移动端与权限模拟

Playwright 生态内置了大量的设备预设，可以轻松模拟特定的手机或平板环境，并支持精细控制地理位置、语言和系统权限。

import{ test, devices }from'@playwright/test';test('iPhone 14 移动端模拟测试',async({ browser })=>{// 使用内置设备预设const context =await browser.newContext({...devices['iPhone 14'], locale:'zh-CN', timezoneId:'Asia/Shanghai', geolocation:{ longitude:116.39, latitude:39.9}, permissions:['geolocation']// 授予地理位置权限});const page =await context.newPage();await page.goto('https://maps.google.com');// 验证页面是否根据模拟坐标显示await context.close();});

常用命令

运行所有测试：npx playwright test
运行指定浏览器：npx playwright test --project=chromium
有界面模式（Headed）：npx playwright test --headed
UI 模式（推荐交互式调试）：npx playwright test --ui
查看测试报告：npx playwright show-report

安卓平台测试 (实验性)

Playwright 提供了一项非常有趣的功能：直接对安卓设备上的 Chrome 或 WebView 进行自动化。

准备工作

确保已安装 ADB 并能够识别设备（adb devices）。
在安卓设备上开启“开发者模式”和“USB 调试”。
确保 Chrome (87+) 或对应的 WebView 已安装。

示例代码

const{_android: android }=require('playwright');(async()=>{// 连接到安卓设备const[device]=await android.devices(); console.log(`Model: ${device.model()}`);// 启动 Chromeawait device.shell('am force-stop com.android.chrome');const context =await device.launchBrowser();const page =await context.newPage();await page.goto('https://github.com/microsoft/playwright'); console.log(await page.title());await device.screenshot({path:'android-screenshot.png'});await context.close();await device.close();})();

注：此功能目前仍处于实验阶段。

CI 集成

Playwright 与 GitHub Actions 集成非常简单。如果你在安装时选择了添加 GitHub Actions 工作流，它会为你生成 .github/workflows/playwright.yml：

name: Playwright Tests on:push:branches:[ main, master ]pull_request:branches:[ main, master ]jobs:test:timeout-minutes:60runs-on: ubuntu-latest steps:-uses: actions/checkout@v4 -uses: actions/setup-node@v4 with:node-version: lts/* -name: Install dependencies run: npm ci -name: Install Playwright Browsers run: npx playwright install --with-deps -name: Run Playwright tests run: npx playwright test -uses: actions/upload-artifact@v4 if: always() with:name: playwright-report path: playwright-report/ retention-days:30

MCP 使用

在现代开发流程中，我们可以利用 Model Context Protocol (MCP) 将 Playwright 的自动化能力暴露给 AI Agent。

通过配置 Playwright MCP 服务，AI 可以：

自动化交互：根据自然语言描述，AI 可以在浏览器中点击、输入、导航。
错误诊断：当测试失败时，AI 可以读取追踪文件（Trace）并结合源码给出修复方案。
动态录制：让 AI 生成复杂的 Playwright 测试脚本。

要在 GitHub Copilot 或其他支持 MCP 的环境中使用，你可以：

安装插件：在 VS Code 的扩展市场中搜索 @mcp playwright 并下载安装相应的 MCP 服务器插件。
配置连接：在 GitHub Copilot 的设置中添加该 MCP 服务，授予其浏览器的控制权限。

一旦配置完成，你就可以直接在 Chat 窗口中命令 AI：“帮我打开 xxx 网站并截个图”，或者“在这个页面执行一个登录流程”。

总结

Playwright 凭借高性能、智能化、全场景覆盖的特性，完美适配现代 Web 应用的自动化测试需求。从基础的页面交互到复杂的移动端 / 真机测试，从本地调试到 CI 集成，再到 AI 协同提效，Playwright 构建了完整的自动化测试生态。相比 Selenium，它更简洁、更稳定、更贴合现代开发流程，是值得投入学习的下一代自动化测试框架。

作者：Smoothcloud润云

FASTLIVO2算法解析与实战（一）：SLAM领域的新标杆，如何让机器人“看得更清、跑得更稳”

FASTLIVO2系统概述 1. 背景介绍 1.1 传感器特性 FASTLIVO2 系统融合了三种互补的传感器：激光雷达（LiDAR）、相机（Camera）和惯性测量单元（IMU）。它们在感知方式、输出数据和环境适应性上各具特点，通过融合实现优势互补。特性激光雷达（LiDAR）相机（Camera）IMU工作方式主动发射激光，通过反射测量距离和方位被动接收环境光，捕捉 2D 图像信息主动测量自身运动感知内容环境几何结构（深度、形状、表面）环境纹理与颜色（语义、细节、动态物体）自身运动状态（姿态、速度、加速度）数据输出3D 点云（精确深度）2D 像素矩阵（RGB 或灰度）6 自由度运动参数优势- 直接深度测量，精度高- 不受光照影响- 在结构化环境中鲁棒-

把 AI 小助手接入企业微信：用一个回调接口做群聊机器人实战篇

你也许已经有了一个「看起来还挺像样」的 AI 小助手服务，比如： * 有 HTTP 接口 /v1/chat； * 能识别不同 Skill（待办、日报、FAQ 等）； * 甚至已经有网页版前端。但现实是：同事们每天真正打开的是企业微信，很少会专门去打开一个新网页跟机器人聊天。这篇文章就做一件很实用的小事：在不动你现有 AI 服务核心逻辑的前提下，用一个企业微信“回调接口”，把它变成「群聊里的 @ 机器人」。一、整体思路：后端不重写，只加一层「翻译器」假设你现在的 AI 服务长这样： * 接口：POST /v1/chat 返回： { "answer": "上午开会，下午写代码……"

（10-1）大模型时代的人形机器人感知：视觉-语言模型在机器人中的应用

本章内容聚焦大模型时代人形机器人的感知体系升级，系统介绍了视觉—语言模型、多模态Transformer与3D大模型在机器人中的核心作用，详细讲解了文本、视觉、点云与语音等信息的语义对齐与融合机制，介绍了从语言指令到视觉目标的Grounding、任务分解与意图理解方法，并通过闭环感知与决策联动，展示了大模型支撑机器人在复杂真实场景中的理解、规划与实时行动的用法。 10.1 视觉-语言模型在机器人中的应用视觉—语言模型（Vision-Language Model，VLM）通过统一建模视觉与自然语言，使机器人具备“看懂并理解语言”的能力，是大模型时代机器人感知与认知融合的核心技术。VLM不仅能够完成图像识别、目标检测等传统感知任务，还可以直接理解语言指令、进行语义推理，并将高层语义映射为可执行的感知与行动目标，在人形机器人中广泛应用于交互理解、场景认知和任务执行等环节。 10.1.1 CLIP/BLIP/Flamingo等模型简介随着大规模多模态数据与Transformer架构的发展，视觉—语言模型逐渐从“跨模态对齐”演进为“多模态理解与推理”。CLIP、BLIP与Flam

手把手教你用Coze搭建AI客服机器人：从零到上线的完整流程

从零构建企业级AI客服：基于Coze平台的可视化实战指南你是否曾为客服团队处理重复性问题而焦头烂额？或是面对客户咨询高峰时，响应速度跟不上，导致用户体验下滑？在AI技术日益成熟的今天，构建一个智能客服机器人已不再是大型企业的专属。对于中小型团队或个人开发者而言，借助像字节跳动推出的Coze这样的平台，完全可以在短时间内，以极低的成本打造出一个功能强大、响应迅速的AI客服助手。这篇文章，我将以一个实际项目为例，带你一步步走完从环境准备、流程设计、知识库搭建到最终部署上线的全过程。我们不会停留在理论层面，而是深入到每一个配置细节和可能遇到的坑，让你真正掌握这门实用技能。 1. 项目规划与环境准备在动手敲下第一行配置之前，清晰的规划是成功的一半。一个AI客服机器人不仅仅是回答问题的程序，它需要理解业务、融入流程、并具备持续学习的能力。我们首先要明确它的核心使命：是处理售前咨询，还是解决售后问题？是7x24小时在线接待，还是作为人工客服的辅助筛选工具？目标不同，设计的侧重点和复杂度也截然不同。对于大多数中小企业，一个典型的客服机器人需要覆盖以下几个核心场景： * 高频问题自