WebMCP:开启 Agentic Web 新时代——Chrome 新 API 的特性与前瞻

WebMCP:开启 Agentic Web 新时代——Chrome 新 API 的特性与前瞻

2026 年 2 月,Google Chrome 团队正式发布了 WebMCP(Web Model Context Protocol)的早期预览版。这是一个旨在重塑网页与 AI 代理(Agent)交互方式的新标准。它让网站不再只是“给人看”的静态页面,而是可以直接向 AI 代理暴露结构化工具,让 Agent 以更高效、更可靠的方式完成复杂任务。

过去,AI 代理操作网页主要依赖模拟人类行为:截屏、解析 DOM、点击按钮、填写表单。这种方式不仅慢、容易出错,还会消耗大量 token。随着 Agentic AI 的快速发展,这种低效交互已成为瓶颈。WebMCP 的出现,正是为了解决这个问题。它让网站主动声明“我能做什么”,Agent 直接调用结构化工具,像调用 API 一样精准高效。

WebMCP 是什么?

WebMCP 是由 Google 和 Microsoft 联合推动、正在 W3C 社区孵化的网页标准。它在浏览器层面引入了 navigator.modelContext 接口,让网站可以向 AI 代理暴露可调用的工具(tools)。这些工具带有明确的名称、描述、输入输出 schema,Agent 可以直接发现并执行,而无需通过视觉或 DOM 模拟。

核心目标:

  • 提升速度、可靠性和精确性
  • 让网页成为 Agent 的“原生接口”
  • 推动“Agentic Web”——网页主动参与 AI 代理工作流

两大核心 API:声明式与命令式

WebMCP 提供了两种互补的实现方式,满足从简单到复杂的不同场景。

Imperative API(命令式 API)
通过 JavaScript 动态注册,更灵活,适合复杂交互(如多步骤配置、实时计算)。示例:电商网站添加购物车工具

navigator.modelContext.registerTool({name:"add_to_cart",description:"将商品加入购物车",inputSchema:{type:"object",properties:{productId:{type:"string"},quantity:{type:"integer"}},required:["productId"]},execute:async(params)=>{// 实际业务逻辑awaitaddToCart(params.productId, params.quantity);return{success:true,cartCount:getCartCount()};}});

Agent 可以直接调用 add_to_cart,无需模拟点击、滚动、等待加载。

Declarative API(声明式 API)
最轻量的方式,直接在 HTML 标记中添加属性即可。适合已有表单的场景,几乎零额外成本。示例:一个航班搜索表单

<formtoolname="search_flights"tooldescription="搜索可用航班,支持出发地、目的地和日期筛选"><inputname="origin"placeholder="出发地"/><inputname="destination"placeholder="目的地"/><inputname="date"type="date"/><buttontype="submit">搜索</button></form>

Agent 看到这个表单后,就能直接调用 search_flights 工具,传入结构化参数,返回 JSON 格式的航班列表。

WebMCP 的核心优势

相比传统的 UI 模拟方式,WebMCP 带来了质的飞跃:

  • 速度更快:一次工具调用取代数十次截屏+推理+操作,延迟大幅降低。
  • 可靠性更高:明确工具契约,避免因页面布局变动导致的失败。
  • 成本更低:大幅减少 token 消耗,不再需要传输大量截图或无关 DOM。
  • 开发者友好:复用现有前端代码,无需额外后端 API 或重构。
  • 用户体验更好:支持“human-in-the-loop”,Agent 在用户可见的页面上操作,保持上下文共享。

典型应用场景:

  • 旅行预订:Agent 直接搜索、筛选、预订航班
  • 电商:精准搜索商品、配置选项、完成下单
  • 客户支持:自动填写技术细节、提交工单

前瞻性功能与影响

WebMCP 不仅是技术升级,更是 Agentic Web 的基础设施。它预示着几个重要趋势:

  1. 开发者红利期来临
    谁先实现高质量的 WebMCP 工具层,谁就能在 Agent 流量中占据先机。早期采用者可以吸引更多 AI 代理访问,提升网站在 Agent 生态中的曝光和转化。
  2. 标准化与跨浏览器支持
    目前仅在 Chrome 146 Canary 中通过 flag 启用,但 Microsoft 已参与孵化,Edge 很可能跟进。未来有望成为 W3C 正式标准,像 HTTP 一样成为网页与 Agent 交互的通用接口。
  3. 与其它协议互补
    WebMCP 专注于浏览器内、用户可见的交互场景,与 Google A2A(headless 自动化)、Anthropic MCP(服务端)形成互补,共同构建完整的 Agent 生态。
  4. 潜在挑战与演进
    发现机制(如何让 Agent 知道网站支持 WebMCP)、安全性(权限控制)、以及网站货币化模式仍需探索。但正如帖子中讨论的,一些平台可能选择封闭,而开放者将赢得未来。

结语

WebMCP 的出现,标志着网页从“被动展示”向“主动协作”转变。它让 AI 代理真正“理解”网站意图,而不是盲目模拟人类行为。对于开发者来说,现在就是最佳窗口期:打开 Chrome Canary,启用 flag,尝试 travel-demo,亲手注册几个工具。

Agentic Web 时代已经拉开序幕。你的网站准备好迎接 Agent 了吗?

Read more

ROS 2从入门到精通系列(十六):自主导航机器人 - 系统架构与SLAM

ROS 2从入门到精通系列(十六):自主导航机器人 - 系统架构与SLAM 构建完整的自主导航系统,从建图到导航的端到端实现。 引言 自主导航是机器人最经典的应用之一。它涉及: * 感知:LIDAR扫描、里程计 * 建图:SLAM建立环境地图 * 规划:生成无碰撞路径 * 控制:执行运动命令 本篇将从0到1构建一个完整的导航系统。 一、自主导航系统架构 1.1 完整的系统架构 硬件层 控制模块 运动控制 PID Control 安全监督 Emergency Stop 规划模块 全局规划 Dijkstra/A* 局部规划 DWA/TEB 可行性检查 Feasibility Check 感知模块 扫描匹配 Scan Matching 里程计 Odometry

SmolVLA高算力适配:TensorRT加速可行性分析与ONNX导出实操

SmolVLA高算力适配:TensorRT加速可行性分析与ONNX导出实操 1. 项目背景与核心价值 SmolVLA作为一款专为经济实惠机器人技术设计的紧凑型视觉-语言-动作模型,在资源受限环境下展现出了令人印象深刻的性能。这个约5亿参数的模型能够同时处理视觉输入、语言指令和动作输出,为机器人控制提供了端到端的解决方案。 在实际部署中,我们经常面临一个关键挑战:如何在保持模型精度的同时,进一步提升推理速度以满足实时控制需求?这就是TensorRT加速技术发挥作用的地方。通过将SmolVLA模型转换为TensorRT引擎,我们有望获得显著的性能提升,特别是在NVIDIA GPU硬件上。 本文将带你深入了解SmolVLA模型的TensorRT加速可行性,并提供详细的ONNX导出实操指南,帮助你在自己的机器人项目中实现更高效的推理性能。 2. TensorRT加速技术解析 2.1 TensorRT的核心优势 TensorRT是NVIDIA推出的高性能深度学习推理优化器和运行时库,它通过多种技术手段提升模型推理效率: * 图层融合:将多个连续的操作层合并为单个内核,减少内

【昇腾】单张96G Atlas 300I Duo推理卡MindIE+WebUI方式跑32B大语言模型_20250818

【昇腾】单张96G Atlas 300I Duo推理卡MindIE+WebUI方式跑32B大语言模型_20250818

一、Atlas 300I Duo推理卡相关安装步骤 由于显存的瓶颈,48G的Atlas 300I Duo推理卡是没办法跑得起来DeepSeek-R1-Distill-Qwen-32B大语言模型的,这里换了一张96G版本的Atlas 300I Duo推理卡来跑,32B大语言模组除了对显存有要求,对服务器本身的内存条也有要求,在加载的过程中需要较大的内存,这里服务器的内存条内存为128GB 1.1 服务器系统与内核说明 服务器系统版本内核版本内存条内存S5000CKylin V104.19.90-89.11.v2401.ky10.aarch64128GB P.S.服务器安装好系统后先不要执行yum update -y更新,否则内核版本会从4.19.90-89.11升级到4.19.90-89.21,Atlas 300I Duo推理卡的driver包会安装失败 1.2 系统环境说明 本服务器IP地址:192.168.2.71 登录用户:

双剑破天门:攻防世界Web题解之独孤九剑心法(七)

双剑破天门:攻防世界Web题解之独孤九剑心法(七)

免责声明:用户因使用公众号内容而产生的任何行为和后果,由用户自行承担责任。本公众号不承担因用户误解、不当使用等导致的法律责任 **本文以攻防世界部分题为例进行演示,后续会对攻防世界大部分的web题目进行演示,如果你感兴趣请关注** 目录 一:Newscenter 二:upload1 三:Xff_referer 四:Command_execution 五:总结 1. Newscenter(SQL注入) 2. upload1(文件上传漏洞) 3. Xff_referer(HTTP头伪造) 4. Command_execution(命令注入) 一:Newscenter 打开为如下所示 经过尝试,得知在输入框中输入数字可得到不同内容 输入23就没有新闻 所以我们得知这个输入框和数据库有交互,那这题考察的可能就是SQL注入 发现将数据库中所有的内容都查询了出来,那这个题考察的就是SQL注入 字段长度为3 23' order by