Cursor 3来了:内置Codex,前端福音Design Mode,WorkTree多开

Cursor 3来了:内置Codex,前端福音Design Mode,WorkTree多开

Cursor 3来了:内置Codex,前端福音Design Mode,WorkTree多开

用Cursor这种编辑器,经常遇到两个小痛点:一是他就一个聊天框,如果一个任务时间长一点,侧边栏就被占用,就没法干别的;二是害怕 Agent “一顿操作猛如虎”,直接把当前的主干分支改坏。

刚刚发布的 Cursor 3,重点就在解决这类工作流层面的问题。总体来看,它好像不太满足于做一个带对话窗的编辑器,而是在加强多任务并行和代码环境的安全隔离。

具体有三个最直接影响日常开发的新特性:

1. Agents Window:跑并行的任务控制台

快捷键Cmd+Shift+P 输入 Agents Window

以前的对话基本是一个单向的线性流。Cursor 3 将 Agent 抽离出了独立的面板区,你可以跨仓库、跨环境(本地、云端或远程 SSH)同时运行多个任务。

配合新增的 Agent Tabs,你可以在并排或网格视图下查看多个对话。
功能背后的思路很直白:让 AI 编程从“一次等一件事”变成“同时派发几个需求”。遇到修改范围大、耗时长的场景,把它丢在 Agents Window 里跑,自己切回主编辑器继续写代码,两边不会互相打扰。

你可能会问,这和在编辑器里装一个 Codex Plugin(或其它第三方 AI 侧边栏)有什么区别?

区别在于原生环境的接管深度底层任务编排能力

像 Codex Plugin 重点是打包复用单个工作流(比如一套 GitHub Code Review 加发布流程);而 Cursor 3 的 Agents Window 直接把自己变成了全局控制台。它不仅局限于“读写当前打开的文件”,还能直接接管 Git 底层机制(分配独立 Worktree、对比代码状态),并在多个并行的仓库(Multi-repo)间穿梭。如果你觉得过去的插件就像是装了个带对话框的侧边栏,那这次的 Agents Window 就是直接在编辑器里给你配了一个能跑多个项目的“带队经理”。

2. Git Worktree:物理隔离保护你的主干代码

触发方式:在对话区使用 /worktree/best-of-n 命令

过去让 Agent 操作大范围重构,它直接在你的当前文件上动刀。一旦它中途跑偏或者中断,人工去恢复或清理中间报错的代码非常头疼。

新加入的 /worktree 指令利用了 Git 原生特性提供了一个物理隔离方案:强制让 Agent 的改动全在一个独立的 Git Worktree 里跑,且全面支持多个仓库(Multi-repo)联动。这意味着即使项目包含好几个微服务或者不同的包,Agent 也可以在一个干净的“平行宇宙”里大刀阔斧地改。在这个沙盒里,无论它怎么折腾怎么卡顿,都不会弄乱你当前工作区里正在写的半成品代码,验证靠谱后再一键 Merge 即可。

顺着这个逻辑,Cursor 3 顺势把 /best-of-n 也移进了新的 Agent 窗口。你可以直接让几个不同的大模型,在各自隔离的 Worktree 里并行处理同一个需求。跑完之后像裁判一样直观对比 outcomes 结果,哪个模型写的顺眼就合并哪个,相当于发起了多场并行的“代码竞标”。

3. Design Mode:用框选代替语言描述

快捷键:在 Agents 窗口里按 Cmd+Shift+D 切换,Shift + 拖拽 选中页面区域,Cmd+L 添加到对话。

如果你写过前端,会知道用语言描述 UI 问题费时费力。比如“让导航菜单右数第二个蓝色登录按钮向下对齐2像素”,这种描述给到 Agent,它还得去猜对应的 CSS Class 和 DOM 层级。

Design Mode 允许你直接在浏览器里像使用截图软件一样,框选并提取特定界面元素。选好区域后用 Cmd+L 直接“指”给 Agent 看就行,免去了无穷无尽的口舌。对于开发者而言,这也额外治好了一个顽疾:当系统通过脚本自动点击网页 DOM 元素经常失效跑偏时,直观的视觉框选比猜前端 class 结构要准太多了。

(注:不仅是 Design Mode 加了基于截图定位的备选方案,这次更新对底层浏览器 Agent 也做了一波减法。官方严格收窄了它的工具权限,强制它专注于纯粹的浏览器操作,这能大幅减少之前它在网页里乱点导致的跑偏和报错死循环。)

4. 生态与性能细节扫除盲点

除了上面这三个大件,还有几个值得普通开发者留意的细节提升:

  • MCP 支持结构化输出(Structured Content):当你让 Agent 调用外部 MCP 接口或者 App 时,它现在能接收和解析出更富媒体、结构更清晰的数据。
  • 大文件 Diff 渲染变流畅了:以前只要 Agent 生成或比对几十上百行的长代码,编辑器必卡。这次更新重写了长文件比对,内存占用大幅缩减。
  • 过往聊天记录直接参与搜索:现在用到 At-mention(@ 提及)时,你的历史对话也会出现在搜索结果里,用来捞以前解决过的老 Bug 非常省事。

总结

Cursor 3 并没有一味追求所谓“更强”的模型噱头,而是回归到了人机交互的工程细节。

开个自带隔离环境的 Worktree,哪怕把最复杂的脏活丢给它,也不怕它把你正在写的状态干碎。如果遇到不好形容的样式 Bug,直接用 Design Mode 框选出来也就完事了。

如果你曾经也被 Agent 一顿乱改搞炸过本地分支,光是冲着能放开手脚瞎折腾的 Worktree,就值得立刻去升个级试一把。

Read more

Flutter 三方库 shelf_web_socket 的鸿蒙化适配指南 - 实现具备高性能全双工长连接与协议协商能力的端侧服务端架构、支持分布式实时信令与多端协同实战

Flutter 三方库 shelf_web_socket 的鸿蒙化适配指南 - 实现具备高性能全双工长连接与协议协商能力的端侧服务端架构、支持分布式实时信令与多端协同实战

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 shelf_web_socket 的鸿蒙化适配指南 - 实现具备高性能全双工长连接与协议协商能力的端侧服务端架构、支持分布式实时信令与多端协同实战 前言 在进行 Flutter for OpenHarmony 开发时,当我们的鸿蒙应用需要充当“控制中心”角色(如控制智能家居、开启本地调试服务或实现 P2P 实时对抗脚本时),如何在端侧直接拉起一个支持 WebSocket 协议的高性能微服务端?shelf_web_socket 是针对 shelf 后端框架封装的一款官方级 WebSocket 处理器。本文将探讨如何在鸿蒙端构建极致、透明的长连接交互引擎。 一、原直观解析 / 概念介绍 1.1 基础原理 该库本质上是一个 shelf 处理函数(Handler)

从Web到AI:多模态Agent图像识别Skills开发实战——JavaScript+Python全栈图像处理方案

从Web到AI:多模态Agent图像识别Skills开发实战——JavaScript+Python全栈图像处理方案

图片来源网络,侵权联系删。 文章目录 * 1. 当Web图像处理遇见多模态Agent * 2. Web图像处理与Agent Skills的基因同源性 * 2.1 能力映射表(Web→图像Skills) * 2.2 图像Skills架构全景图 * 3. 图像识别核心原理(Web开发者视角) * 3.1 三大核心机制映射表 * 3.2 预处理流水线实现(类比CSS滤镜) * 3.3 后端推理服务设计(类比Express中间件) * 4. 企业级实战:电商商品瑕疵检测系统 * 4.1 项目结构(全栈设计) * 4.2 核心缺陷检测组件(Vue3 + TensorFlow.js) * 4.3 后端资源调度优化(解决高并发问题) * 5. Web开发者转型图像Skills的痛点解决方案 * 5.

Claude Code Viewer: 打造 Web 端 Claude Code 会话管理利器

Claude Code Viewer: 打造 Web 端 Claude Code 会话管理利器 当 Claude Code 成为日常开发标配,如何更高效地管理会话历史、分析对话流程就成了开发者的新需求。Claude Code Viewer 应运而生——一个功能完备的 Web 端 Claude Code 客户端。 背景介绍 Claude Code 是 Anthropic 推出的 AI 编程助手,但其原生的会话管理能力相对基础。大多数开发者面临以下痛点: * 会话历史难以追溯和检索 * 无法在移动设备上方便地查看会话 * 多人协作时难以共享会话内容 * 缺乏对会话流程的全局视角 Claude Code Viewer 正是为解决这些问题而生的开源项目。它采用 Web 架构设计,专注于会话日志的完整分析,通过严格的数据校验和渐进式展示 UI,让每一个对话细节都清晰可见。

新手必看!Gemma-3-12B-IT WebUI 保姆级教程:从部署到对话全流程

新手必看!Gemma-3-12B-IT WebUI 保姆级教程:从部署到对话全流程 你是不是也对大语言模型充满好奇,想亲手体验一下和AI对话的感觉,但又觉得技术门槛太高,不知道从何下手?别担心,今天这篇教程就是为你准备的。 想象一下,你有一个随时待命的私人助手,能帮你写代码、解答问题、创作文案,甚至陪你聊天。现在,这个助手就摆在眼前——Google最新发布的Gemma-3-12B-IT模型,而且我们已经为你准备好了开箱即用的WebUI界面。 这篇文章将带你从零开始,一步步完成Gemma-3-12B-IT WebUI的部署和使用。不需要你懂复杂的命令行,不需要你配置繁琐的环境,只需要跟着我的步骤走,10分钟内你就能开始和AI对话了。 1. 认识你的新助手:Gemma-3-12B-IT 在开始动手之前,我们先花几分钟了解一下你要部署的这个“助手”到底有什么本事。 1.1 什么是Gemma-3? Gemma-3是Google在2026年发布的一系列轻量级开源语言模型。你可能听说过ChatGPT、Claude这些大模型,但它们的参数动辄上千亿,对普通用户来说部署成本太高。而Ge