Selenium Web 自动化测试脚本总结

Selenium Web 自动化测试脚本总结

Selenium Web 自动化测试脚本总结

Web 自动化的本质,是模拟人在浏览器里的操作行为:打开浏览器、访问页面、定位元素、输入/点击、做断言验证。Selenium 之所以常用,是因为它把这些动作抽象成了一套稳定的 API,再配合浏览器驱动(WebDriver)就能把“测试步骤”变成“可重复执行的脚本”。

下面按“工程上最常遇到的问题链路”来讲:先跑通 → 再定位稳 → 再等待稳 → 再窗口/弹窗/上传/截图/参数全覆盖。测试概念相关内容会简要收束在文末。


1)先搞清三件套:Selenium + 浏览器驱动 + 浏览器怎么协作

来看 Web 自动化落地需要的三件套:

  • 浏览器:最终执行动作的地方
  • 浏览器驱动(WebDriver):把自动化指令翻译成浏览器能理解的操作
  • Selenium 脚本:你写的 Java 代码,负责发出“打开页面/找元素/点击/断言”的指令

再来看它们的交互流程(非常关键,理解了后面排错就简单):

  1. Selenium 脚本里会在 ChromeDriverService 创建一个服务
  2. 通过服务启动本地驱动(一般是 localhost:<port>),这是 Selenium 向 WebDriver 发送请求的地址
  3. Selenium 向驱动发 HTTP 请求,驱动解析请求,打开浏览器并返回 sessionId(后续操作需要携带)
  4. 访问地址、查找元素等动作都通过该服务连接到 WebDriver,再通过 execute 发送请求
  5. 驱动把请求翻译成浏览器可执行的脚本并发送给浏览器,浏览器执行后把结果再经驱动返回给脚本

验证“驱动服务真的存在”的方式也很直观:执行脚本时终端会打印出驱动服务地址和端口信息。


2)驱动管理:别手动下载驱动,交给 WebDriverManager

来看一个现实问题:Chrome/Edge/Firefox 驱动版本经常和浏览器版本“拧巴”,手动维护很痛。

解决办法:用 WebDriverManager 做驱动管理,它会自动下载、设置、维护驱动;并且从 v5 起还支持发现本机浏览器、构建 ChromeDriver/FirefoxDriver/EdgeDriver 等对象。

Maven 依赖(示例)

<dependency><groupId>io.github.bonigarcia</groupId><artifactId>webdrivermanager</artifactId><version>5.8.0</version><scope>test</scope></dependency>

3)Selenium 快速上手:一段“百度搜索”脚本跑通全链路

来看最小可运行例子:打开浏览器 → 访问百度 → 输入关键字 → 点击搜索 → 退出。

Selenium 依赖(示例)

<dependency><groupId>org.seleniumhq.selenium</groupId><artifactId>selenium-java</artifactId><version>4.0.0</version></dependency>

代码骨架(Java)

publicvoidexample_test(){// 驱动程序管理自动化WebDriverManager.chromedriver().setup();ChromeOptions options =newChromeOptions();// 允许访问所有链接 options.addArguments("--remote-allow-origins=*");// 1) 打开浏览器WebDriver driver =newChromeDriver(options);// 2) 访问百度 driver.get("https://www.baidu.com");// 3) 输入关键词 driver.findElement(By.xpath("//*[@id=\"kw\"]")).sendKeys("迪丽热巴");// 4) 点击“百度一下” driver.findElement(By.xpath("//*[@id=\"su\"]")).click();// 5) 关闭浏览器 driver.quit();}

4)元素定位:自动化的核心是“定位必须唯一”

Web 自动化测试的操作核心是:先找到元素,再对元素操作。常见定位方式很多(id/className/tagName/xpath/cssSelector),实际高频主要是 cssSelector 和 xpath

4.1 cssSelector:更贴近前端,写起来也短

在这里插入图片描述

来看 selector 的用途:选中页面指定标签元素。常见写法:

  • id 选择器#kw(百度搜索输入框)
  • 子类/层级选择器:例如热搜区域:#s-hotsearch-wrapper > div

4.2 XPath:路径语言,表达力强

来看 XPath 的常用语法点(能覆盖 80% 场景):

  • 获取所有节点://*
  • 获取指定标签节点://ul//input
  • 直接子节点:/(如 //span/input
  • 父节点:..(如 //input/..
  • 按属性匹配://*[@id='kw']
  • 按索引取第 N 个://div/ul/li[3](注意索引从 1 开始)

4.3 “复制 selector/xpath”很香,但要小心“不唯一”

浏览器右键 Copy selector/xpath 很便捷,但复制出来的表达式不一定满足唯一性,有时需要手动改。
来看提醒:元素定位方法必须唯一;不唯一会导致脚本点错对象、偶现失败、甚至误判通过。


5)操作元素:点击、输入、清空、取文本与取属性

定位到元素后,常见操作包括点击、提交、输入、清除、获取文本。

5.1 点击/提交

driver.findElement(By.cssSelector("#su")).click();

5.2 输入(模拟键盘)

driver.findElement(By.cssSelector("#kw")).sendKeys("输入文字");

5.3 清空再输入

driver.findElement(By.cssSelector("#kw")).sendKeys("我爱游戏"); driver.findElement(By.cssSelector("#kw")).clear(); driver.findElement(By.cssSelector("#kw")).sendKeys("我爱学习");

5.4 获取文本 vs 获取属性:别把“文本”和“属性值”混了

  • 获取文本:getText()
  • 获取属性值:getAttribute("属性名称")

另外两个经常要用的“页面级信息”:

  • 当前标题:getTitle()
  • 当前 URL:getCurrentUrl()

6)窗口与句柄:新窗口打开后,脚本并不知道“你眼睛看到的那个窗口”

手工测试靠眼睛判断当前窗口;脚本需要靠 窗口句柄(handle)

6.1 获取与切换窗口

  • 当前窗口句柄:driver.getWindowHandle()
  • 所有窗口句柄:driver.getWindowHandles()

切换到新窗口的常见写法:

String curWindow = driver.getWindowHandle();Set<String> allWindow = driver.getWindowHandles();for(String w : allWindow){if(w != curWindow){ driver.switchTo().window(w);}}

注意:执行 driver.close() 之前要先切到未被关闭的窗口。

6.2 窗口大小控制

driver.manage().window().maximize(); driver.manage().window().minimize(); driver.manage().window().fullscreen(); driver.manage().window().setSize(newDimension(1024,768));

7)等待:稳定性的分水岭(强制 / 隐式 / 显式)

代码执行速度通常比页面渲染快,不等待就容易出现“元素还没出来就去找”的误报。来看三种等待方式:

7.1 强制等待:Thread.sleep()

  • 优点:简单、调试时好用
  • 缺点:浪费时间、影响效率

7.2 隐式等待:全局智能等待

隐式等待会在查找元素时在指定时间内不断尝试,找到就继续,超时才报错。

driver.manage().timeouts().implicitlyWait(Duration.ofSeconds(5));

它的作用域是整个脚本(只要 driverquit() 就一直生效)。

7.3 显式等待:带条件的智能等待(更灵活)

显式等待在超时时间内只要满足条件就继续执行:

WebDriverWait wait =newWebDriverWait(driver,Duration.ofSeconds(3)); wait.until(ExpectedConditions.elementToBeClickable(By.cssSelector("#id")));

常见条件(ExpectedConditions)包括:

  • elementToBeClickable:元素可见且可点击
  • textToBe:文本符合预期
  • presenceOfElementLocated:DOM 上存在该元素
  • urlToBe:URL 符合预期

7.4 重要结论:不要混合隐式等待和显式等待

来看实验现象:隐式等待 5s + 显式等待 10s,最终等待时间并不稳定(会出现 10s、11s…),因此结论是:不要混用,等待时间可能不可预测


8)浏览器导航:前进、后退、刷新

打开网站两种写法:

driver.navigate().to("https://selenium.dev"); driver.get("https://selenium.dev");

前进/后退/刷新:

driver.navigate().back(); driver.navigate().forward(); driver.navigate().refresh();

9)弹窗处理:页面里找不到元素时,用 Alert

弹窗在页面 DOM 里通常找不到元素,需要切到 Alert:

在这里插入图片描述

9.1 警告/确认弹窗

Alert alert = driver.switchTo().alert(); alert.accept();// 确认 alert.dismiss();// 取消

9.2 提示弹窗(可输入)

Alert alert = driver.switchTo().alert(); alert.sendKeys("hello"); alert.accept();
在这里插入图片描述

10)文件上传:系统文件选择框不可控,但可以绕过去

点击“上传文件”会弹出系统窗口,这是非 Web 控件,Selenium 无法直接识别。
解决办法:对 <input type="file"> 直接 sendKeys(文件路径)

WebElement ele = driver.findElement(By.cssSelector("body > div > div > input[type=file]")); ele.sendKeys("D:\\selenium2html\\selenium2html\\upload.html");

11)截图:让“线上跑挂了但你看不见”的问题可追溯

自动化脚本往往跑在机器上,失败时你不一定能看到现场。截图可以记录当时的错误画面。

需要额外依赖(示例):

<dependency><groupId>commons-io</groupId><artifactId>commons-io</artifactId><version>2.6</version></dependency>

核心代码:

File file =((TakesScreenshot) driver).getScreenshotAs(OutputType.FILE);FileUtils.copyFile(file,newFile(filename));

并且可以做“简单版/带时间戳归档版”的路径管理。


12)浏览器参数:无头模式 + 页面加载策略

12.1 无头模式(Headless)

ChromeOptions options =newChromeOptions(); options.addArguments("--headless");ChromeDriver driver =newChromeDriver(options);

12.2 页面加载策略

options.setPageLoadStrategy(PageLoadStrategy.NONE);

13)测试概念(简要收束):自动化主要服务回归,但不能“神化”

来看几个关键结论:

  • 自动化的主要目的常用于回归测试:避免新增功能影响历史功能,需要整体回归。
  • 自动化不一定能取代人工:脚本也是人写的,功能变更后脚本需要维护与更新。
  • “自动化能大幅降低工作量”这种绝对化表达要小心,更准确的说法是:在一定程度上降低,但前期投入与维护成本真实存在。
  • 自动化类型很多:接口自动化、UI 自动化(Web、移动端)等;移动端常依赖模拟器,受环境影响更大,稳定性通常比接口与 Web 自动化更差。
  • 来看“自动化测试金字塔”:理想状态是更多精力放在单元层,UI 层更少;而实际企业里常出现“冰淇淋蛋筒反模式”,UI 自动化过重导致成本高、维护难。自动化需要找到“突破点”,当持续运行带来长期成本收益时,价值才会逐渐体现。

Selenium自动化脚本总结

定位要唯一、等待别混用、窗口要切对、失败要留证据(截图/日志)、能用配置别硬编码。

Read more

音乐播放器实现:前端HTML,CSS,JavaScript综合大项目

音乐播放器实现:前端HTML,CSS,JavaScript综合大项目

音乐播放器实现:前端HTML,CSS,JavaScript综合大项目 * 项目概述 * 项目视图效果 * 一、侧边栏相关代码 * (一)HTML代码 * (二)css代码 * 二、登录页面 * (一)HTML代码 * (二)css代码 * (三)js代码 * 三、剩余代码以及所有源代码Gitee地址 项目概述 在当今数字化时代,音乐已然成为人们生活中不可或缺的一部分。本次带来的音乐播放器 HTML 项目,旨在打造一个具备基础且实用功能的音乐播放平台。通过 HTML、CSS 和 JavaScript 等前端技术的巧妙融合,实现一个界面美观、操作便捷的音乐播放器,满足用户在本地浏览音乐库、播放音乐等多样化需求。 提示!!!! 由于项目代码太多,代码全部内容放置在我的Gitee码云中,需要的小伙伴们自取 我的码云链接https://gitee.com/srte-7719/project-experience/tree/master/

项目分享|LiveKit Agents Playground:快速搭建WebRTC服务端Agent原型的利器

项目分享|LiveKit Agents Playground:快速搭建WebRTC服务端Agent原型的利器

引言 在实时音视频(RTC)领域,LiveKit凭借完善的多端SDK生态和灵活的服务端能力成为行业热门选择。为降低开发者基于LiveKit Agents Framework构建服务端Agent的门槛,LiveKit推出Agents Playground项目——一款轻量化原型开发工具,能让开发者轻松接入LiveKit WebRTC会话,处理/生成音视频、数据流,大幅提升Agent开发与验证效率。 项目概览 LiveKit Agents Playground是面向LiveKit Agents Framework的服务端Agent原型开发工具,核心目标是帮助开发者快速验证Agent功能。该工具支持与任意LiveKit Agent完成视频、音频、聊天全维度交互;同时提供线上体验版本(KITT演示站、托管版Playground),也支持本地部署使用。无论是调试自定义Agent,还是体验官方示例Agent,都能通过该工具快速落地。 核心优势与创新点 1. 高效原型验证:无需复杂环境搭建,即可快速对接LiveKit Agents Framework,完成Agent功能原型的快速验证,

GLM-Image WebUI保姆级:模型加载进度监控与中断恢复机制

GLM-Image WebUI保姆级:模型加载进度监控与中断恢复机制 1. 为什么你需要关注模型加载过程 你有没有试过点击「加载模型」后,界面突然变灰、按钮失灵、控制台一片沉默,而你只能盯着空白进度条发呆?更糟的是,网络卡顿导致下载中断,34GB的模型文件得从头再来——这不仅浪费时间,还可能因重复下载触发Hugging Face限流。 这不是你的错。GLM-Image作为一款高性能文生图模型,其权重体积大(约34GB)、依赖组件多(Diffusers + Transformers + Torch),默认WebUI却未提供实时加载反馈和断点续传能力。很多用户在首次部署时卡在“加载中”环节超过20分钟,最终误判为程序崩溃而放弃。 本文不讲抽象原理,只聚焦一个工程师真正需要的功能:让模型加载过程变得可感知、可干预、可恢复。我们将手把手带你实现—— 实时显示已下载字节数与总大小 动态计算剩余时间(非静态“请稍候”) 网络中断后自动续传,无需重下全部 加载失败时精准定位问题模块(是HF镜像源?CUDA版本?还是缓存权限?) 一键暂停/继续加载,像视频播放一样可控

ollama 模型管理、删除模型 、open-webui 开启大模型交互

ollama 模型管理、删除模型 、open-webui 开启大模型交互

文章目录 * ollama 基本信息 * ollama 运行模型 * ollama 模型管理 * 🔧 **方法一:使用命令行删除单个模型** * ⚙️ **方法二:批量删除所有模型** * 🗑️ **方法三:彻底卸载 Ollama(含所有数据)** * ⚠️ **注意事项** * ✅ **验证是否删除成功** * open-webui 安装 开启大模型交互 * open-webui pip 安装 * open-webui 启动服务 * 浏览器访问 http://IP:8082/ : * ❤️ 时不我待,一起学AI ollama 基本信息 * https://ollama.com/ ollama 运行模型 命令行执行即可 0.6B parameter model ollama run qwen3:0.6b 1.7B