网络的新语言:Google 的 Web MCP 如何让每个网站都为智能体做好准备

多年来,网络是为人类的眼睛而构建的。点击这里,滚动那里,填写这个表单。每一个设计决策——颜色、布局、交互元素——都是为坐在屏幕前的人优化的。

但有些事情正在发生变化。智能体正在进入网络,而大多数网站还没有为它们做好准备。


问题:智能体在“盲目浏览”

想象一下,你拥有一个电商网站,并希望 AI 智能体能够使用它——搜索商品、添加到购物车、完成购买。在一个数百万智能体代表用户浏览网页并执行操作的未来,你的网站是否对这些智能体友好,可能决定你的业务成败。

今天,你有两个选择,但都不理想。

第一个是构建你自己的 MCP 服务器,并希望所有智能体都恰好安装了它。这几乎不可能发生。没有任何一个网站重要到可以被预加载进每个智能体的工具集中,成为永久组件。

第二个选择是依赖智能体的浏览器操作能力——让它截图、解析原始 HTML,然后自己判断该点击什么。这种方式正在变好,但从根本上说它是“非确定性的”。智能体需要在为人类设计的大量 HTML 代码中摸索:导航栏、广告位、Cookie 提示、动态内容。信息噪声大、速度慢,而且容易失败。智能体可能错过按钮、误读字段,或者直接放弃。

在 AI 智能体成为网页内容主要使用者的时代,一个难以被智能体导航的网站,终将被抛在后面。


解决方案:嵌入页面内部的 MCP

Google 的答案是 Web MCP —— 一种将 MCP 工具直接嵌入网站的方法,使得任何使用兼容浏览器的智能体在浏览页面时,都能自动发现当前页面可用的操作。

核心理念非常优雅。与其让智能体反向解析页面 HTML 来猜测能做什么,不如让页面主动告诉它。当智能体访问你的电商首页时,它会看到:search_productsget_categoriesapply_filters。当它进入商品详情页时,会看到:add_to_cartget_similar_products。不需要翻译层。不需要猜测。只有干净、结构化、确定性的操作——根据页面上下文逐页加载。

这正是 Web MCP 真正令人兴奋的关键点:工具不会预加载到智能体的全局上下文中,而是在智能体浏览时“当场发现”。正确的工具出现在正确的页面,当不再相关时自动消失。


两种构建方式

Web MCP 支持两种实现方式,取决于你的网站构建方式。

声明式:适用于静态 HTML

对于简单的静态页面,方法非常直接。你只需要在现有的表单元素上添加一些 HTML 属性——tool-nametool-description,以及每个输入字段的 tool-param-description。仅此而已。

当使用支持 Web MCP 的浏览器的智能体访问页面时,它会自动看到一个完整的 MCP 工具,包括名称、描述和输入结构——全部来自你添加的属性。不需要服务器,不需要 API,不需要额外基础设施。

你甚至可以监听智能体的操作。当智能体填写表单时,会触发一个特殊的 agent.invoked 事件,你可以返回结构化反馈——确认成功、返回错误,或者触发自定义 UI 元素,例如在提交前显示“请确认”的提示框。智能体获得标准的工具响应;人类用户也可以在最终提交前进行确认。

命令式:适用于动态应用

对于 React 或 Next.js 应用,命令式方式提供完全的编程控制。新版 Chrome 浏览器暴露了两个新的 navigator 函数——navigator.registerToolnavigator.unregisterTool,允许你将 MCP 工具绑定到特定组件。

模式很清晰:定义工具结构(名称、描述、输入结构、输出结构、处理函数),在组件挂载时注册工具,在组件卸载时取消注册。结果是一个实时、具备上下文感知能力的工具注册表,会随着用户或智能体的导航自动更新。

在一个演示的看板应用中,效果立刻显现。让智能体“为三个人准备晚餐制定所有任务计划,并将每一列作为一个类别”,它会实时创建列并填充卡片,自主完成,零错误。每个操作都通过类型化的 MCP 工具调用完成。没有猜测。没有幻觉。


一种新的上下文智能模式

Web MCP 不只是浏览器功能。它代表了一种新的架构模式,介于两种各有明显限制的方法之间。

传统 MCP 功能强大,但成本高:所有工具结构一开始就加载到智能体的上下文窗口中,无论是否需要。对于拥有数十个工具的智能体来说,这种开销非常大。

“技能”方法更轻量——初始只加载标题和描述,需要时再获取完整细节——但它牺牲了 MCP 在工具调用中提供的严格类型安全性。

Web MCP 在两者之间找到了平衡。工具根据上下文加载,由智能体所在位置触发,而不是预先配置。智能体在需要时拥有完整的结构保证,不需要时则不占用上下文成本。

这种“上下文驱动”的 MCP 模式——在正确时刻呈现正确工具,由任务和上下文驱动而非静态配置——很可能是更广泛智能体生态系统的发展方向。


开始使用

今天想要试验 Web MCP,你需要:

  1. Chrome Beta(需要最新版本)
  2. chrome://flags 中启用 Web MCP flag
  3. 安装 Model Context Protocol Tool Inspector Chrome 扩展

之后,无论是为静态页面添加声明式 HTML 属性,还是在动态应用中调用 navigator.registerTool,都可以轻松设置并在本地测试。

网络最初是为人类而建。Web MCP 正在开始让它也能被智能体理解。

Read more

【无人机路径规划】无人机三维路径规划中蚁群算法、A* 与 RRT* 算法对比(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭:行百里者,半于九十。 📋📋📋本文目录如下:🎁🎁🎁 💥1 概述 随着无人机技术的快速发展,其在军事侦察、物流配送、环境监测等众多领域的应用日益广泛。在实际应用场景中,无人机需要在复杂的三维空间内规划出一条安全、高效的飞行路径,以避开障碍物并满足任务需求。蚁群算法、A* 算法和 RRT* 算法是目前无人机三维路径规划中常用的算法,它们各自具有独特的原理和特点,对其进行详细对比有助于根据具体应用场景选择最合适的算法。 蚁群算法 蚁群算法是一种模拟蚂蚁觅食行为的启发式优化算法。蚂蚁在寻找食物的过程中,会在走过的路径上释放信息素,信息素浓度越高的路径对其他蚂蚁的吸引力越大。在无人机路径规划中,将三维空间划分为多个节点,每只“虚拟蚂蚁”从起点开始,根据信息素浓度和启发式信息选择下一个节点,不断迭代更新信息素浓度,最终找到一条从起点到终点的最优路径。 A* 算法 A*

打造你的家庭 AI 助手(三):QQ 机器人接入你的 OpenClaw

打造你的家庭 AI 助手(三):QQ 机器人接入你的 OpenClaw

不得不承认腾讯进步的速度太快了,几条命令就可以接入Openclaw,也不用设置IP白名单了,在 QQ开放平台还增加了专门的Openclaw入口: 没啥好说的,很简单,安装完Openclaw之后,执行如下命令(命令也是生成好的): openclaw plugins install @tencent-connect/openclaw-qqbot@latest openclaw channels add--channel qqbot --token"" openclaw gateway restart 以下内容已经过时了,留作纪念 以下内容已经过时了,留作纪念 以下内容已经过时了,留作纪念 ⚠️ 重要提示:如果是家用宽带,没有申请固定 IP 地址的话,大可以放弃这种方式。由于 QQ 开发平台的白名单限制,机器人会非常不稳定,频繁掉线。建议使用云服务器或有固定 IP 的环境部署。 前言 在完成 OpenClaw 安装后,

Flutter 三方库 wallet_connect 的鸿蒙化适配指南 - 实现 Web3 钱包协议连接、支持 DApp 授权登录与跨链交易签名实战

Flutter 三方库 wallet_connect 的鸿蒙化适配指南 - 实现 Web3 钱包协议连接、支持 DApp 授权登录与跨链交易签名实战

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 wallet_connect 的鸿蒙化适配指南 - 实现 Web3 钱包协议连接、支持 DApp 授权登录与跨链交易签名实战 前言 在进行 Flutter for OpenHarmony 的去中心化应用(DApp)或加密货币钱包开发时,支持标准的 WalletConnect 协议是链接用户钱包的关键。wallet_connect 是该协议的 Dart 实现,它能让你的鸿蒙 App 安全地与 MetaMask、Trust Wallet 等钱包建立双向加密连接。本文将探讨如何在鸿蒙系统下构建安全、稳定的 Web3 授权流程。 一、原理解析 / 概念介绍 1.1 基础原理

web3.0 开发实践

web3.0 开发实践

优质博文:IT-BLOG-CN 一、简介 Web3.0也称为去中心化网络,是对互联网未来演进的一种概念性描述。它代表着对现有互联网的下一代版本的设想和期望。Web3.0的目标是通过整合区块链技术、分布式系统和加密技术等新兴技术,构建一个更加去中心化、安全、隐私保护和用户的互联网。 Web 3.0具备四项主要功能 【1】去中心化: 去中心化的Web应用程序是Web 3.0的关键功能。其目的是在去中心化网络中分发和存储数据。在这些网络中,不同的实体拥有底层基础设施,用户直接向存储提供商付费以访问该空间。 去中心化的应用程序还将信息副本存储在多个位置,并确保整个过程中的数据一致性。每位用户可以控制其数据存放的位置,而不必将其移交给集中式基础设施。去中心化的互联网用户可根据需要出售自己的数据。 【2】去信任性: 在集中式Web应用程序和服务中,用户通常需要信任中央权威机构来管理其数据、交易和交互。这些中央权威机构可以控制用户数据,并且可以操纵系统的规则。数据可能存在安全风险或管理不善,从而导致用户信息丢失或滥用。 相比之下,Web3引入去信任性,因此用户可以在无需信任任何特定方