Agent-Browser: 适合ai的浏览器自动化 CLI 工具(以OpenCode为例)

Agent-Browser: 适合ai的浏览器自动化 CLI 工具(以OpenCode为例)

介绍

Agent-Browser是Vercel 专为AI Agent 设计的一个浏览器自动化 CLI 工具,能让 它们模拟人类操作浏览器(点击、滚动、截图和填表单等), 是对playwright作为封装和优化,默认是无头模式操作浏览器。

agent-browser 及关联 Skill vs  playwright-skill 综合信息表

Skill(技能 / 工具)来源(获取 / 运行方式)核心功能核心技术(底层实现)
agent-browsernpm install -g agent-browser通用浏览器自动化(CLI 版)Playwright + 自有 CLI 封装
dogfoodagent-browser 内置子 skillQA 测试、探索性测试基于 agent-browser 核心能力
electronagent-browser 内置子 skillElectron 桌面应用测试无额外标注(默认基于 agent-browser)
slackagent-browser 内置子 skillSlack 聊天工具自动化无额外标注(默认基于 agent-browser)
playwright-skill本地 skill(自定义 / 内置)浏览器自动化测试原生 Playwright(无额外封装)

agent-browser vs playwright-skill 功能特性对比表

特性agent-browserplaywright-skill
接口CLI 命令(如 agent-browser click @e1Playwright 多语言 API(Python/JS/Java 代码调用,如 page.click('#btn')
元素引用快照生成 @e1, @e2 简化引用CSS/XPath/ 文本选择器(如 //div[@id="e1"]),支持精准定位
会话管理内置 --session 参数一键管理自定义代码实现(通过 context 上下文对象手动管理)
状态保存内置 state save/load 命令手动调用 storage_state 方法序列化 / 反序列化状态
认证auth save/login 命令,加密存储凭证手动处理 Cookie/Token,需结合加密库 / 环境变量存储
iOS 模拟器原生支持无原生支持,需结合 BrowserStack/Appium 等工具
浏览器引擎Chrome, LightpandaChrome、Firefox、Safari、Edge 等全主流引擎
Diff 测试内置 diff 命令一键执行

原生支持 toHaveScreenshot() / toMatchSnapshot(),内置 pixelmatch 像素级比对

选择建议

  • 简单重复任务、QA 快速验证 → agent-browser(CLI 命令简洁,无需编写代码)
  • 复杂业务逻辑、自定义自动化流程 → playwright-skill(代码化控制,灵活性和扩展性更高)

安装与使用

执行npm install -g agent-browser安装(当然你可以让ai自动安装,只是耗一点token,下同)

创建符号链接,让OpenCode、OpenClaw和Codex都能发现 agent-browser,记得路径按自己的电脑实际情况改

# 1. Codex & Opencode 全局 skills 目录 ln -s /opt/homebrew/lib/node_modules/agent-browser/skills/agent-browser ~/.agents/skills/agent-browser ln -s /opt/homebrew/lib/node_modules/agent-browser/skills/dogfood ~/.agents/skills/dogfood ln -s /opt/homebrew/lib/node_modules/agent-browser/skills/slack ~/.agents/skills/slack ln -s /opt/homebrew/lib/node_modules/agent-browser/skills/electron ~/.agents/skills/electron # 2. Openclaw 项目目录 ln -s /opt/homebrew/lib/node_modules/agent-browser/skills/agent-browser ~/Desktop/work/openclaw/.agents/skills/agent-browser ln -s /opt/homebrew/lib/node_modules/agent-browser/skills/dogfood ~/Desktop/work/openclaw/.agents/skills/dogfood ln -s /opt/homebrew/lib/node_modules/agent-browser/skills/slack ~/Desktop/work/openclaw/.agents/skills/slack ln -s /opt/homebrew/lib/node_modules/agent-browser/skills/electron ~/Desktop/work/openclaw/.agents/skills/electron

执行opencode,让ai调查亚马逊平台的热门电器产品,可以发现ai执行了cli命令agent-browser open https://www.amazon.com && agent-browser wait --load networkidle && agent-browser screenshot amazon-home.png,这三个命令的作用分别是打开亚马逊平台链接、仅当页面成功打开后,等待页面的网络请求基本停止(动态内容完全加载)和对亚马逊首页截图为amazon-home.png

接下来ai自行操作,完成搜索、爬取数据、处理超时、模拟滚动、点击和截图等

最终结果

由于浏览器常规截图并非整个页面,不妨以ai打开电子产品链接(可以在ai的思考和执行过程看到那个链接)https://www.amazon.com/gp/bestsellers/electronics/ref=zg_bs_electronics_sm找另外几个产品进行验证,可以发现基本符合事实,只是部分评价最多的产品(很可能是ai只对提取前10个数据或当时页面没加载到更多商品,因为亚马逊平台的页面是动态的,不会一次性加载完全部产品)

创作不易,禁止抄袭,转载请附上原文链接及标题

Read more

2026 Python+AI 学习方向拆解:3 个高性价比赛道,新手优先学

2026 Python+AI 学习方向拆解:3 个高性价比赛道,新手优先学

欢迎文末添加好友交流,共同进步! “ 俺はモンキー・D・ルフィ。海贼王になる男だ!” * 前言 * 一、AI数据处理与分析赛道 * 1.1 为什么选择这个方向? * 1.2 核心技能树 * 1.3 实战代码示例 * 数据清洗与预处理 * 1.4 学习路线图 * 二、AI应用开发赛道(LLM + RAG) * 2.1 为什么选择这个方向? * 2.2 RAG技术架构流程 * 2.3 实战代码:构建RAG问答系统 * 2.4 学习路线图 * 三、AI自动化办公赛道 * 3.1 为什么选择这个方向? * 3.2 自动化办公应用场景 * 3.3 实战代码示例

2026最新免费白嫖全网最强AI大模型谷歌Gemini 3的6种方法,你值得体验

2026最新免费白嫖全网最强AI大模型谷歌Gemini 3的6种方法,你值得体验

免费白嫖全网最强AI大模型谷歌Gemini 3的6种方法,你值得体验 猫头虎AI开源技术分享 | AI工具实测 | 2025最新攻略 🚀 开篇:还在眼巴巴看着别人用Gemini 3? 哈喽,各位技术圈的小伙伴们,我是猫头虎!🐱🐯 最近后台被问爆了——“虎哥,Gemini 3到底怎么用上?有没有免费路子?” 看着别人拿着这个"全网最强AI大模型"各种秀操作,自己只能干瞪眼?别慌! 今天这篇文章,我扒遍了全网,亲测整理了6种真正免费的Gemini 3使用渠道!无论你是小白想尝鲜,还是开发者要接入API,总有一款适合你。 更重要的是——全部免费,即开即用! 💡 先收藏,再阅读,干货太满,怕你找不到! 文章目录 * 免费白嫖全网最强AI大模型谷歌Gemini 3的6种方法,你值得体验 * 🚀 开篇:还在眼巴巴看着别人用Gemini 3? * 🎯 6种免费使用Gemini 3的渠道详解 * 01. NiceAIGC.net

AI如何自动生成一线与二线产区标准图

快速体验 1. 打开 InsCode(快马)平台 https://www.inscode.net 2. 输入框内输入如下内容: 开发一个AI工具,能够根据输入的地理数据自动生成一线产区和二线产区的标准图。功能包括:1. 数据采集模块,支持导入行政区划、经济指标等数据;2. 分类算法,根据GDP、人口密度等指标自动划分一线和二线产区;3. 可视化模块,生成标准地图并支持交互式查看。使用Python和GeoPandas库实现数据分析和地图绘制,前端使用Leaflet.js展示。 1. 点击'项目生成'按钮,等待项目生成完整后预览效果 AI如何自动生成一线与二线产区标准图 最近在做一个地理信息相关的项目,需要根据经济指标自动划分一线和二线产区,并生成标准地图。经过一番摸索,发现用AI辅助开发可以大大提升效率。下面分享我的实现思路和具体步骤。 数据采集模块 1. 首先需要收集基础地理数据,包括行政区划边界、GDP总量、人均GDP、人口密度等关键指标。

“全结构化录入+牙位可视化标记”人工智能化python编程路径探析

“全结构化录入+牙位可视化标记”人工智能化python编程路径探析

1. 目标与使用场景 * 将所有关键信息结构化:主诉/现病史、龋/充/根管/牙周/修复/种植、影像读片所见、处置与术式、医嘱、收费关联等。 * 通过牙位图可视化标注与表单联动,做到“点哪颗牙、哪一面,就写哪一项”,杜绝游离文本。 * 用 AI 做三件事:①录入提效(自动补全/术语标准化/编码建议);②质控(规则与模型双验);③影像辅助(龋、残髓、根尖周、牙周骨丧失等初筛)。 * 与医院信息平台/医保/第三方影像顺畅对接(HL7/FHIR、DICOM)。 2. 标准与术语(建议落地用) * 牙位编码:FDI 两位码(11–48,51–