Cursor 3来了:内置Codex,前端福音Design Mode,WorkTree多开

Cursor 3来了:内置Codex,前端福音Design Mode,WorkTree多开

Cursor 3来了:内置Codex,前端福音Design Mode,WorkTree多开

用Cursor这种编辑器,经常遇到两个小痛点:一是他就一个聊天框,如果一个任务时间长一点,侧边栏就被占用,就没法干别的;二是害怕 Agent “一顿操作猛如虎”,直接把当前的主干分支改坏。

刚刚发布的 Cursor 3,重点就在解决这类工作流层面的问题。总体来看,它好像不太满足于做一个带对话窗的编辑器,而是在加强多任务并行和代码环境的安全隔离。

具体有三个最直接影响日常开发的新特性:

1. Agents Window:跑并行的任务控制台

快捷键Cmd+Shift+P 输入 Agents Window

以前的对话基本是一个单向的线性流。Cursor 3 将 Agent 抽离出了独立的面板区,你可以跨仓库、跨环境(本地、云端或远程 SSH)同时运行多个任务。

配合新增的 Agent Tabs,你可以在并排或网格视图下查看多个对话。
功能背后的思路很直白:让 AI 编程从“一次等一件事”变成“同时派发几个需求”。遇到修改范围大、耗时长的场景,把它丢在 Agents Window 里跑,自己切回主编辑器继续写代码,两边不会互相打扰。

你可能会问,这和在编辑器里装一个 Codex Plugin(或其它第三方 AI 侧边栏)有什么区别?

区别在于原生环境的接管深度底层任务编排能力

像 Codex Plugin 重点是打包复用单个工作流(比如一套 GitHub Code Review 加发布流程);而 Cursor 3 的 Agents Window 直接把自己变成了全局控制台。它不仅局限于“读写当前打开的文件”,还能直接接管 Git 底层机制(分配独立 Worktree、对比代码状态),并在多个并行的仓库(Multi-repo)间穿梭。如果你觉得过去的插件就像是装了个带对话框的侧边栏,那这次的 Agents Window 就是直接在编辑器里给你配了一个能跑多个项目的“带队经理”。

2. Git Worktree:物理隔离保护你的主干代码

触发方式:在对话区使用 /worktree/best-of-n 命令

过去让 Agent 操作大范围重构,它直接在你的当前文件上动刀。一旦它中途跑偏或者中断,人工去恢复或清理中间报错的代码非常头疼。

新加入的 /worktree 指令利用了 Git 原生特性提供了一个物理隔离方案:强制让 Agent 的改动全在一个独立的 Git Worktree 里跑,且全面支持多个仓库(Multi-repo)联动。这意味着即使项目包含好几个微服务或者不同的包,Agent 也可以在一个干净的“平行宇宙”里大刀阔斧地改。在这个沙盒里,无论它怎么折腾怎么卡顿,都不会弄乱你当前工作区里正在写的半成品代码,验证靠谱后再一键 Merge 即可。

顺着这个逻辑,Cursor 3 顺势把 /best-of-n 也移进了新的 Agent 窗口。你可以直接让几个不同的大模型,在各自隔离的 Worktree 里并行处理同一个需求。跑完之后像裁判一样直观对比 outcomes 结果,哪个模型写的顺眼就合并哪个,相当于发起了多场并行的“代码竞标”。

3. Design Mode:用框选代替语言描述

快捷键:在 Agents 窗口里按 Cmd+Shift+D 切换,Shift + 拖拽 选中页面区域,Cmd+L 添加到对话。

如果你写过前端,会知道用语言描述 UI 问题费时费力。比如“让导航菜单右数第二个蓝色登录按钮向下对齐2像素”,这种描述给到 Agent,它还得去猜对应的 CSS Class 和 DOM 层级。

Design Mode 允许你直接在浏览器里像使用截图软件一样,框选并提取特定界面元素。选好区域后用 Cmd+L 直接“指”给 Agent 看就行,免去了无穷无尽的口舌。对于开发者而言,这也额外治好了一个顽疾:当系统通过脚本自动点击网页 DOM 元素经常失效跑偏时,直观的视觉框选比猜前端 class 结构要准太多了。

(注:不仅是 Design Mode 加了基于截图定位的备选方案,这次更新对底层浏览器 Agent 也做了一波减法。官方严格收窄了它的工具权限,强制它专注于纯粹的浏览器操作,这能大幅减少之前它在网页里乱点导致的跑偏和报错死循环。)

4. 生态与性能细节扫除盲点

除了上面这三个大件,还有几个值得普通开发者留意的细节提升:

  • MCP 支持结构化输出(Structured Content):当你让 Agent 调用外部 MCP 接口或者 App 时,它现在能接收和解析出更富媒体、结构更清晰的数据。
  • 大文件 Diff 渲染变流畅了:以前只要 Agent 生成或比对几十上百行的长代码,编辑器必卡。这次更新重写了长文件比对,内存占用大幅缩减。
  • 过往聊天记录直接参与搜索:现在用到 At-mention(@ 提及)时,你的历史对话也会出现在搜索结果里,用来捞以前解决过的老 Bug 非常省事。

总结

Cursor 3 并没有一味追求所谓“更强”的模型噱头,而是回归到了人机交互的工程细节。

开个自带隔离环境的 Worktree,哪怕把最复杂的脏活丢给它,也不怕它把你正在写的状态干碎。如果遇到不好形容的样式 Bug,直接用 Design Mode 框选出来也就完事了。

如果你曾经也被 Agent 一顿乱改搞炸过本地分支,光是冲着能放开手脚瞎折腾的 Worktree,就值得立刻去升个级试一把。

Read more

LLaMA Factory多模态微调实践

LLaMA Factory 多模态微调实践 一、前提准备:环境与数据深度适配 (一)运行环境技术规格 1. 硬件配置底层逻辑 * GPU 选型依据: * 推荐 24GB 显存的 A10(ecs.gn7i-c8g1.2xlarge)。 * 核心原因:Qwen2-VL-2B 模型加载后显存占用约 8-10GB,全参微调过程中梯度计算、优化器状态存储需额外 10-12GB 显存,24GB 可避免显存溢出(OOM)。 * 若使用 16GB 显存的 T4 等型号,需启用梯度检查点(gradient checkpointing),但会增加约 20% 训练时间。 * CPU 与内存配套: * 建议 8 核 CPU + 32GB 内存,避免数据加载(

Android Studio集成GitHub Copilot GPT-4o:AI辅助开发实战与避坑指南

快速体验 在开始今天关于 Android Studio集成GitHub Copilot GPT-4o:AI辅助开发实战与避坑指南 的探讨之前,我想先分享一个最近让我觉得很有意思的全栈技术挑战。 我们常说 AI 是未来,但作为开发者,如何将大模型(LLM)真正落地为一个低延迟、可交互的实时系统,而不仅仅是调个 API? 这里有一个非常硬核的动手实验:基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。 从0到1构建生产级别应用,脱离Demo,点击打开 从0打造个人豆包实时通话AI动手实验 Android Studio集成GitHub Copilot GPT-4o:AI辅助开发实战与避坑指南 传统Android开发的效率瓶颈 在传统Android开发过程中,开发者常常面临以下痛点: * 重复代码编写:

终极指南:如何快速上手高性能Whisper.cpp语音识别项目

终极指南:如何快速上手高性能Whisper.cpp语音识别项目 【免费下载链接】whisper.cppOpenAI 的 Whisper 模型在 C/C++ 中的移植版本。 项目地址: https://gitcode.com/GitHub_Trending/wh/whisper.cpp Whisper.cpp是OpenAI Whisper模型在C/C++中的高性能移植版本,为开发者提供轻量级、跨平台的自动语音识别解决方案。这个项目支持多种硬件优化,包括Apple Silicon、AVX指令集和Vulkan等,让语音识别技术更加普及和易用。 🔥 项目核心优势与特色功能 Whisper.cpp的最大亮点在于其卓越的性能表现和广泛的平台兼容性。通过GGML量化技术,模型体积大幅减小,同时保持高质量的识别效果。该项目支持从微型到大型的多种模型规格,满足不同场景下的需求。 多平台全面支持 项目覆盖了从桌面端到移动端的完整生态: * 桌面系统:macOS(Intel和Arm)、Linux、FreeBSD、Windows * 移动平台:

【AIGC】如何获取ChatGPT外部GPTs应用的提示词Prompt指令和知识库文件

【AIGC】如何获取ChatGPT外部GPTs应用的提示词Prompt指令和知识库文件

博客主页: [小ᶻ☡꙳ᵃⁱᵍᶜ꙳]本文专栏: AIGC |GPTs应用实例 文章目录 * 💯前言 * 💯获取GPTs的提示词Prompt指令 * 💯获取GPTs的知识库文件 * 💯小结 * 关于GPTs指令如何在ChatGPT上使用,请看这篇文章: 【AIGC】如何在ChatGPT中制作个性化GPTs应用详解     https://blog.ZEEKLOG.net/2201_75539691?type=blog * 关于如何使用国内AI工具复现类似GPTs效果,请看这篇文章: 【AIGC】国内AI工具复现GPTs效果详解     https://blog.ZEEKLOG.net/2201_75539691?type=blog 💯前言 随着 ChatGPT 和其他 AI 应用的不断发展,越来越多的外部 GPTs 被集成进来,以增强其功能和适应多样化的用户需求。这些外部 GPTs 并不仅仅是通用的 聊天助手,而是专为特定场景、