Cursor 3来了：内置Codex，前端福音Design Mode，WorkTree多开

优质文章学习记录

10 Apr 2026 — 6 min read

Cursor 3来了：内置Codex，前端福音Design Mode，WorkTree多开

用Cursor这种编辑器，经常遇到两个小痛点：一是他就一个聊天框，如果一个任务时间长一点，侧边栏就被占用，就没法干别的；二是害怕 Agent “一顿操作猛如虎”，直接把当前的主干分支改坏。

刚刚发布的 Cursor 3，重点就在解决这类工作流层面的问题。总体来看，它好像不太满足于做一个带对话窗的编辑器，而是在加强多任务并行和代码环境的安全隔离。

具体有三个最直接影响日常开发的新特性：

1. Agents Window：跑并行的任务控制台

快捷键：Cmd+Shift+P 输入 Agents Window

以前的对话基本是一个单向的线性流。Cursor 3 将 Agent 抽离出了独立的面板区，你可以跨仓库、跨环境（本地、云端或远程 SSH）同时运行多个任务。

配合新增的 Agent Tabs，你可以在并排或网格视图下查看多个对话。
功能背后的思路很直白：让 AI 编程从“一次等一件事”变成“同时派发几个需求”。遇到修改范围大、耗时长的场景，把它丢在 Agents Window 里跑，自己切回主编辑器继续写代码，两边不会互相打扰。

你可能会问，这和在编辑器里装一个 Codex Plugin（或其它第三方 AI 侧边栏）有什么区别？

区别在于原生环境的接管深度和底层任务编排能力。

像 Codex Plugin 重点是打包复用单个工作流（比如一套 GitHub Code Review 加发布流程）；而 Cursor 3 的 Agents Window 直接把自己变成了全局控制台。它不仅局限于“读写当前打开的文件”，还能直接接管 Git 底层机制（分配独立 Worktree、对比代码状态），并在多个并行的仓库（Multi-repo）间穿梭。如果你觉得过去的插件就像是装了个带对话框的侧边栏，那这次的 Agents Window 就是直接在编辑器里给你配了一个能跑多个项目的“带队经理”。

2. Git Worktree：物理隔离保护你的主干代码

触发方式：在对话区使用 /worktree 或 /best-of-n 命令

过去让 Agent 操作大范围重构，它直接在你的当前文件上动刀。一旦它中途跑偏或者中断，人工去恢复或清理中间报错的代码非常头疼。

新加入的 /worktree 指令利用了 Git 原生特性提供了一个物理隔离方案：强制让 Agent 的改动全在一个独立的 Git Worktree 里跑，且全面支持多个仓库（Multi-repo）联动。这意味着即使项目包含好几个微服务或者不同的包，Agent 也可以在一个干净的“平行宇宙”里大刀阔斧地改。在这个沙盒里，无论它怎么折腾怎么卡顿，都不会弄乱你当前工作区里正在写的半成品代码，验证靠谱后再一键 Merge 即可。

顺着这个逻辑，Cursor 3 顺势把 /best-of-n 也移进了新的 Agent 窗口。你可以直接让几个不同的大模型，在各自隔离的 Worktree 里并行处理同一个需求。跑完之后像裁判一样直观对比 outcomes 结果，哪个模型写的顺眼就合并哪个，相当于发起了多场并行的“代码竞标”。

3. Design Mode：用框选代替语言描述

快捷键：在 Agents 窗口里按 Cmd+Shift+D 切换，Shift + 拖拽 选中页面区域，Cmd+L 添加到对话。

如果你写过前端，会知道用语言描述 UI 问题费时费力。比如“让导航菜单右数第二个蓝色登录按钮向下对齐2像素”，这种描述给到 Agent，它还得去猜对应的 CSS Class 和 DOM 层级。

Design Mode 允许你直接在浏览器里像使用截图软件一样，框选并提取特定界面元素。选好区域后用 Cmd+L 直接“指”给 Agent 看就行，免去了无穷无尽的口舌。对于开发者而言，这也额外治好了一个顽疾：当系统通过脚本自动点击网页 DOM 元素经常失效跑偏时，直观的视觉框选比猜前端 class 结构要准太多了。

(注：不仅是 Design Mode 加了基于截图定位的备选方案，这次更新对底层浏览器 Agent 也做了一波减法。官方严格收窄了它的工具权限，强制它专注于纯粹的浏览器操作，这能大幅减少之前它在网页里乱点导致的跑偏和报错死循环。)

4. 生态与性能细节扫除盲点

除了上面这三个大件，还有几个值得普通开发者留意的细节提升：

• MCP 支持结构化输出（Structured Content）：当你让 Agent 调用外部 MCP 接口或者 App 时，它现在能接收和解析出更富媒体、结构更清晰的数据。
• 大文件 Diff 渲染变流畅了：以前只要 Agent 生成或比对几十上百行的长代码，编辑器必卡。这次更新重写了长文件比对，内存占用大幅缩减。
• 过往聊天记录直接参与搜索：现在用到 At-mention（@ 提及）时，你的历史对话也会出现在搜索结果里，用来捞以前解决过的老 Bug 非常省事。

总结

Cursor 3 并没有一味追求所谓“更强”的模型噱头，而是回归到了人机交互的工程细节。

开个自带隔离环境的 Worktree，哪怕把最复杂的脏活丢给它，也不怕它把你正在写的状态干碎。如果遇到不好形容的样式 Bug，直接用 Design Mode 框选出来也就完事了。

如果你曾经也被 Agent 一顿乱改搞炸过本地分支，光是冲着能放开手脚瞎折腾的 Worktree，就值得立刻去升个级试一把。

Flutter 三方库 shelf_web_socket 的鸿蒙化适配指南 - 实现具备高性能全双工长连接与协议协商能力的端侧服务端架构、支持分布式实时信令与多端协同实战

欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 shelf_web_socket 的鸿蒙化适配指南 - 实现具备高性能全双工长连接与协议协商能力的端侧服务端架构、支持分布式实时信令与多端协同实战前言在进行 Flutter for OpenHarmony 开发时，当我们的鸿蒙应用需要充当“控制中心”角色（如控制智能家居、开启本地调试服务或实现 P2P 实时对抗脚本时），如何在端侧直接拉起一个支持 WebSocket 协议的高性能微服务端？shelf_web_socket 是针对 shelf 后端框架封装的一款官方级 WebSocket 处理器。本文将探讨如何在鸿蒙端构建极致、透明的长连接交互引擎。一、原直观解析 / 概念介绍 1.1 基础原理该库本质上是一个 shelf 处理函数（Handler）

从Web到AI：多模态Agent图像识别Skills开发实战——JavaScript+Python全栈图像处理方案

图片来源网络，侵权联系删。文章目录 * 1. 当Web图像处理遇见多模态Agent * 2. Web图像处理与Agent Skills的基因同源性 * 2.1 能力映射表（Web→图像Skills） * 2.2 图像Skills架构全景图 * 3. 图像识别核心原理（Web开发者视角） * 3.1 三大核心机制映射表 * 3.2 预处理流水线实现（类比CSS滤镜） * 3.3 后端推理服务设计（类比Express中间件） * 4. 企业级实战：电商商品瑕疵检测系统 * 4.1 项目结构（全栈设计） * 4.2 核心缺陷检测组件（Vue3 + TensorFlow.js） * 4.3 后端资源调度优化（解决高并发问题） * 5. Web开发者转型图像Skills的痛点解决方案 * 5.

Claude Code Viewer: 打造 Web 端 Claude Code 会话管理利器

Claude Code Viewer: 打造 Web 端 Claude Code 会话管理利器当 Claude Code 成为日常开发标配，如何更高效地管理会话历史、分析对话流程就成了开发者的新需求。Claude Code Viewer 应运而生——一个功能完备的 Web 端 Claude Code 客户端。背景介绍 Claude Code 是 Anthropic 推出的 AI 编程助手，但其原生的会话管理能力相对基础。大多数开发者面临以下痛点： * 会话历史难以追溯和检索 * 无法在移动设备上方便地查看会话 * 多人协作时难以共享会话内容 * 缺乏对会话流程的全局视角 Claude Code Viewer 正是为解决这些问题而生的开源项目。它采用 Web 架构设计，专注于会话日志的完整分析，通过严格的数据校验和渐进式展示 UI，让每一个对话细节都清晰可见。

新手必看！Gemma-3-12B-IT WebUI 保姆级教程：从部署到对话全流程

新手必看！Gemma-3-12B-IT WebUI 保姆级教程：从部署到对话全流程你是不是也对大语言模型充满好奇，想亲手体验一下和AI对话的感觉，但又觉得技术门槛太高，不知道从何下手？别担心，今天这篇教程就是为你准备的。想象一下，你有一个随时待命的私人助手，能帮你写代码、解答问题、创作文案，甚至陪你聊天。现在，这个助手就摆在眼前——Google最新发布的Gemma-3-12B-IT模型，而且我们已经为你准备好了开箱即用的WebUI界面。这篇文章将带你从零开始，一步步完成Gemma-3-12B-IT WebUI的部署和使用。不需要你懂复杂的命令行，不需要你配置繁琐的环境，只需要跟着我的步骤走，10分钟内你就能开始和AI对话了。 1. 认识你的新助手：Gemma-3-12B-IT 在开始动手之前，我们先花几分钟了解一下你要部署的这个“助手”到底有什么本事。 1.1 什么是Gemma-3？ Gemma-3是Google在2026年发布的一系列轻量级开源语言模型。你可能听说过ChatGPT、Claude这些大模型，但它们的参数动辄上千亿，对普通用户来说部署成本太高。而Ge

Cursor 3来了：内置Codex，前端福音Design Mode，WorkTree多开

1. Agents Window：跑并行的任务控制台

2. Git Worktree：物理隔离保护你的主干代码

3. Design Mode：用框选代替语言描述

4. 生态与性能细节扫除盲点

总结

Read more

Flutter 三方库 shelf_web_socket 的鸿蒙化适配指南 - 实现具备高性能全双工长连接与协议协商能力的端侧服务端架构、支持分布式实时信令与多端协同实战

从Web到AI：多模态Agent图像识别Skills开发实战——JavaScript+Python全栈图像处理方案

Claude Code Viewer: 打造 Web 端 Claude Code 会话管理利器

新手必看！Gemma-3-12B-IT WebUI 保姆级教程：从部署到对话全流程