告别 Selenium：Playwright 现代 Web 自动化测试从入门到实战

优质文章学习记录

07 Apr 2026 — 6 min read

告别 Selenium：Playwright 现代 Web 自动化测试简明教程

前言：为什么选择 Playwright？

在 Web 自动化测试领域，Selenium 曾长期占据主流，但面对现代前端框架（React/Vue/Next.js）、复杂 SPA 应用和多端适配需求，其局限性逐渐凸显。Microsoft 推出的 Playwright 框架，凭借跨引擎、跨平台、智能化的特性，成为新一代自动化测试的优选方案。

相比于传统的 Selenium 或 Cypress，Playwright 具有以下优势：

极致性能：基于浏览器上下文（Browser Context）隔离测试环境，启动速度比 Selenium 快 30%+，无冗余进程开销；
智能等待：内置自适应等待机制，自动等待元素可交互，彻底告别sleep()硬编码；全场景覆盖：支持 Chromium/Firefox/WebKit 三大引擎，Windows/Linux/macOS
全平台，JavaScript/TypeScript/Python/Java/.NET 多语言；
强大工具链：Codegen（代码自动生成）、Trace Viewer（测试追踪分析）、UI Mode（交互式调试）一站式提效；
多端适配：原生支持移动端浏览器模拟，实验性支持安卓真机测试，覆盖 PC + 移动全场景。

安装

在已有 Node.js 环境的项目中，执行以下命令一键初始化 Playwright：

npm init playwright@latest

执行后，脚本会引导你完成以下配置：

选择使用 TypeScript 还是 JavaScript。
指定测试文件存放目录（默认 tests）。
是否添加 GitHub Actions 工作流。
是否安装 Playwright 浏览器（建议选择是，否则后续需要手动运行 npx playwright install）。

基础使用

编写第一个测试

Playwright 的 API 非常直观。在 tests/example.spec.ts 中：

import{ test, expect }from'@playwright/test';test('has title',async({ page })=>{await page.goto('https://playwright.dev/');// 期待标题包含 "Playwright"awaitexpect(page).toHaveTitle(/Playwright/);});test('get started link',async({ page })=>{await page.goto('https://playwright.dev/');// 点击 "Get started" 链接await page.getByRole('link',{ name:'Get started'}).click();// 期待 URL 包含 introawaitexpect(page).toHaveURL(/.*intro/);});

常见测试场景

1. 元素定位与交互

Playwright 推荐使用 page.getByRole 或 page.getByText 等面向用户的定位方式，这能使测试更具鲁棒性。

// 填写表单await page.getByLabel('用户名').fill('admin');await page.getByLabel('密码').fill('123456');// 点击按钮await page.getByRole('button',{ name:'登录'}).click();

2. 等待网络请求

在现代单页应用（SPA）中，等待特定的接口返回是非常常见的需求。

// 等待接口返回const[response]=awaitPromise.all([ page.waitForResponse(resp => resp.url().includes('/api/login')&& resp.status()===200), page.getByRole('button',{ name:'登录'}).click(),]);

3. 处理弹窗与 Iframe

Playwright 能够轻松处理 JavaScript 警告框（Dialog）和嵌套的 Iframe。

// 处理 Dialog page.on('dialog', dialog => dialog.accept());await page.getByRole('button',{ name:'删除'}).click();// 进入 Iframe 交互const frame = page.frameLocator('#my-iframe');await frame.getByText('确认提交').click();

4. 键盘输入与快捷键

Playwright 提供了非常精细的键盘模拟能力，不仅可以输入文本，还能模拟单个按键及组合键。

// 聚焦并输入文本await page.getByLabel('搜索').focus();await page.keyboard.type('Playwright',{ delay:100});// 模拟真实打字速度// 按下回车键await page.keyboard.press('Enter');// 组合键：全选并删除 (Windows/Linux 用 Control, macOS 用 Meta)await page.keyboard.press('Control+A');await page.keyboard.press('Backspace');

5. 移动端与权限模拟

Playwright 生态内置了大量的设备预设，可以轻松模拟特定的手机或平板环境，并支持精细控制地理位置、语言和系统权限。

import{ test, devices }from'@playwright/test';test('iPhone 14 移动端模拟测试',async({ browser })=>{// 使用内置设备预设const context =await browser.newContext({...devices['iPhone 14'], locale:'zh-CN', timezoneId:'Asia/Shanghai', geolocation:{ longitude:116.39, latitude:39.9}, permissions:['geolocation']// 授予地理位置权限});const page =await context.newPage();await page.goto('https://maps.google.com');// 验证页面是否根据模拟坐标显示await context.close();});

常用命令

运行所有测试：npx playwright test
运行指定浏览器：npx playwright test --project=chromium
有界面模式（Headed）：npx playwright test --headed
UI 模式（推荐交互式调试）：npx playwright test --ui
查看测试报告：npx playwright show-report

安卓平台测试 (实验性)

Playwright 提供了一项非常有趣的功能：直接对安卓设备上的 Chrome 或 WebView 进行自动化。

准备工作

确保已安装 ADB 并能够识别设备（adb devices）。
在安卓设备上开启“开发者模式”和“USB 调试”。
确保 Chrome (87+) 或对应的 WebView 已安装。

示例代码

const{_android: android }=require('playwright');(async()=>{// 连接到安卓设备const[device]=await android.devices(); console.log(`Model: ${device.model()}`);// 启动 Chromeawait device.shell('am force-stop com.android.chrome');const context =await device.launchBrowser();const page =await context.newPage();await page.goto('https://github.com/microsoft/playwright'); console.log(await page.title());await device.screenshot({path:'android-screenshot.png'});await context.close();await device.close();})();

注：此功能目前仍处于实验阶段。

CI 集成

Playwright 与 GitHub Actions 集成非常简单。如果你在安装时选择了添加 GitHub Actions 工作流，它会为你生成 .github/workflows/playwright.yml：

name: Playwright Tests on:push:branches:[ main, master ]pull_request:branches:[ main, master ]jobs:test:timeout-minutes:60runs-on: ubuntu-latest steps:-uses: actions/checkout@v4 -uses: actions/setup-node@v4 with:node-version: lts/* -name: Install dependencies run: npm ci -name: Install Playwright Browsers run: npx playwright install --with-deps -name: Run Playwright tests run: npx playwright test -uses: actions/upload-artifact@v4 if: always() with:name: playwright-report path: playwright-report/ retention-days:30

MCP 使用

在现代开发流程中，我们可以利用 Model Context Protocol (MCP) 将 Playwright 的自动化能力暴露给 AI Agent。

通过配置 Playwright MCP 服务，AI 可以：

自动化交互：根据自然语言描述，AI 可以在浏览器中点击、输入、导航。
错误诊断：当测试失败时，AI 可以读取追踪文件（Trace）并结合源码给出修复方案。
动态录制：让 AI 生成复杂的 Playwright 测试脚本。

要在 GitHub Copilot 或其他支持 MCP 的环境中使用，你可以：

安装插件：在 VS Code 的扩展市场中搜索 @mcp playwright 并下载安装相应的 MCP 服务器插件。
配置连接：在 GitHub Copilot 的设置中添加该 MCP 服务，授予其浏览器的控制权限。

一旦配置完成，你就可以直接在 Chat 窗口中命令 AI：“帮我打开 xxx 网站并截个图”，或者“在这个页面执行一个登录流程”。

总结

Playwright 凭借高性能、智能化、全场景覆盖的特性，完美适配现代 Web 应用的自动化测试需求。从基础的页面交互到复杂的移动端 / 真机测试，从本地调试到 CI 集成，再到 AI 协同提效，Playwright 构建了完整的自动化测试生态。相比 Selenium，它更简洁、更稳定、更贴合现代开发流程，是值得投入学习的下一代自动化测试框架。

作者：Smoothcloud润云

3步搞定通义千问3-14B部署：Ollama+WebUI双buff叠加教程

3步搞定通义千问3-14B部署：Ollama+WebUI双buff叠加教程 1. 为什么Qwen3-14B值得你花5分钟部署你有没有遇到过这样的困境：想用一个真正能干活的大模型，但发现30B级别的性能动辄要双卡A100，本地跑不动；而能单卡运行的模型，又常常在长文档理解、复杂推理或多语言任务上“掉链子”？ Qwen3-14B就是为这个痛点而生的——它不是“缩水版”，而是“精准裁剪版”。148亿参数全激活（非MoE稀疏结构），却在C-Eval、MMLU、GSM8K等权威榜单上交出接近30B模型的答卷。更关键的是，它原生支持128k上下文，实测轻松处理40万汉字的PDF报告、法律合同或技术白皮书，一次喂入，整篇理解。它不靠参数堆砌，而是靠架构优化和训练策略升级：FP8量化后仅14GB显存占用，在RTX 4090（24GB）上就能全速推理，每秒生成80个token；同时提供两种推理模式——你可以让它“慢思考”，显式输出<think>中的逻辑链，专攻数学证明、代码调试、多步推理；也可以一键切到“快回答”

Clawdbot整合Qwen3-32B保姆级教程：Web网关18789端口调试全记录

Clawdbot整合Qwen3-32B保姆级教程：Web网关18789端口调试全记录 1. 为什么需要这个整合方案你是不是也遇到过这样的问题：想用本地部署的大模型做聊天机器人，但发现直接调用Ollama的API在Web前端里跨域报错？或者Clawdbot配置完后一直连不上模型，控制台疯狂刷404？又或者好不容易跑起来了，发个消息却卡在“正在思考”半天没反应？这正是我们搭建这套环境时踩过的坑。Clawdbot本身不直接对接Ollama，它需要一个中间层来处理协议转换、请求转发和端口映射。而18789这个端口，就是整个链路里最关键的“通关密码”——它不是随便选的，而是Clawdbot默认监听的Web网关入口。整套方案的核心逻辑其实很朴素： * 你在浏览器里访问 http://localhost:18789，看到的是Clawdbot的聊天界面 * Clawdbot收到你的消息后，不自己去算答案，而是把请求转给内部代理 * 代理再把请求发到 http://localhost:8080（Ollama API地址） * Ollama调用本地的Qwen3-32B模型生成回复

企业级多模态应用落地｜基于Qwen3-VL-WEBUI的API集成方案

企业级多模态应用落地｜基于Qwen3-VL-WEBUI的API集成方案在某大型银行智能客服系统的后台，一张用户上传的手机银行界面截图刚被接收，系统仅用2.8秒就返回了结构化诊断建议：“检测到‘转账’按钮处于不可点击状态，可能因当日额度已用尽。建议引导用户查看‘账户限额’设置。”整个过程无需人工介入——这正是Qwen3-VL-WEBUI这类企业级多模态模型带来的真实生产力跃迁。传统图文混合任务需依赖OCR+CV+NLP多模块串联，链路长、误差累积严重。而Qwen3-VL-WEBUI通过统一架构实现了“感知-认知-行动”闭环，一个API即可完成从图像理解到操作决策的全流程。其内置的 Qwen3-VL-4B-Instruct 模型不仅支持256K超长上下文和32种语言OCR，更具备GUI元素识别与工具调用能力，真正实现“看图办事”。本文将聚焦企业级生产环境下的API集成路径，结合实际项目经验，系统性拆解从镜像部署、服务暴露、客户端封装到高可用设计的完整技术链路，并提供可直接复用的工程化代码模板。 1. Qwen3-VL-WEBUI核心能力解析：不只是视觉问答 1.1 多模态

【前端】Vue3+elementui+ts，给标签设置样式属性style时，提示type check failed for prop，再次请出DeepSeek来解答

🌹欢迎来到《小5讲堂》🌹 🌹这是《前端》系列文章，每篇文章将以博主理解的角度展开讲解。🌹 🌹温馨提示：博主能力有限，理解水平有限，若有不对之处望指正！🌹 目录 * 前言 * 警告信息 * DeepSeek解答 * 问题原因 * 解决方案 * 关于 !important * 最终建议写法 * Vue小技巧 * Vue 3 实用代码小技巧 * 1. 组合式 API 技巧 * 2. 组件通信技巧 * 3. 模板技巧 * 4. 性能优化技巧 * 5. 组合式函数技巧 * 6. 生命周期技巧 * 7. 路由技巧 (Vue Router) * 8. 状态管理 (Pinia) 技巧 * 9. 调试技巧 * 文章推荐前言翻看了下上一篇写前端文章还是一年前，