Cursor 3来了：内置Codex，前端福音Design Mode，WorkTree多开

优质文章学习记录

08 Apr 2026 — 6 min read

Cursor 3来了：内置Codex，前端福音Design Mode，WorkTree多开

用Cursor这种编辑器，经常遇到两个小痛点：一是他就一个聊天框，如果一个任务时间长一点，侧边栏就被占用，就没法干别的；二是害怕 Agent “一顿操作猛如虎”，直接把当前的主干分支改坏。

刚刚发布的 Cursor 3，重点就在解决这类工作流层面的问题。总体来看，它好像不太满足于做一个带对话窗的编辑器，而是在加强多任务并行和代码环境的安全隔离。

具体有三个最直接影响日常开发的新特性：

1. Agents Window：跑并行的任务控制台

快捷键：Cmd+Shift+P 输入 Agents Window

以前的对话基本是一个单向的线性流。Cursor 3 将 Agent 抽离出了独立的面板区，你可以跨仓库、跨环境（本地、云端或远程 SSH）同时运行多个任务。

配合新增的 Agent Tabs，你可以在并排或网格视图下查看多个对话。
功能背后的思路很直白：让 AI 编程从“一次等一件事”变成“同时派发几个需求”。遇到修改范围大、耗时长的场景，把它丢在 Agents Window 里跑，自己切回主编辑器继续写代码，两边不会互相打扰。

你可能会问，这和在编辑器里装一个 Codex Plugin（或其它第三方 AI 侧边栏）有什么区别？

区别在于原生环境的接管深度和底层任务编排能力。

像 Codex Plugin 重点是打包复用单个工作流（比如一套 GitHub Code Review 加发布流程）；而 Cursor 3 的 Agents Window 直接把自己变成了全局控制台。它不仅局限于“读写当前打开的文件”，还能直接接管 Git 底层机制（分配独立 Worktree、对比代码状态），并在多个并行的仓库（Multi-repo）间穿梭。如果你觉得过去的插件就像是装了个带对话框的侧边栏，那这次的 Agents Window 就是直接在编辑器里给你配了一个能跑多个项目的“带队经理”。

2. Git Worktree：物理隔离保护你的主干代码

触发方式：在对话区使用 /worktree 或 /best-of-n 命令

过去让 Agent 操作大范围重构，它直接在你的当前文件上动刀。一旦它中途跑偏或者中断，人工去恢复或清理中间报错的代码非常头疼。

新加入的 /worktree 指令利用了 Git 原生特性提供了一个物理隔离方案：强制让 Agent 的改动全在一个独立的 Git Worktree 里跑，且全面支持多个仓库（Multi-repo）联动。这意味着即使项目包含好几个微服务或者不同的包，Agent 也可以在一个干净的“平行宇宙”里大刀阔斧地改。在这个沙盒里，无论它怎么折腾怎么卡顿，都不会弄乱你当前工作区里正在写的半成品代码，验证靠谱后再一键 Merge 即可。

顺着这个逻辑，Cursor 3 顺势把 /best-of-n 也移进了新的 Agent 窗口。你可以直接让几个不同的大模型，在各自隔离的 Worktree 里并行处理同一个需求。跑完之后像裁判一样直观对比 outcomes 结果，哪个模型写的顺眼就合并哪个，相当于发起了多场并行的“代码竞标”。

3. Design Mode：用框选代替语言描述

快捷键：在 Agents 窗口里按 Cmd+Shift+D 切换，Shift + 拖拽 选中页面区域，Cmd+L 添加到对话。

如果你写过前端，会知道用语言描述 UI 问题费时费力。比如“让导航菜单右数第二个蓝色登录按钮向下对齐2像素”，这种描述给到 Agent，它还得去猜对应的 CSS Class 和 DOM 层级。

Design Mode 允许你直接在浏览器里像使用截图软件一样，框选并提取特定界面元素。选好区域后用 Cmd+L 直接“指”给 Agent 看就行，免去了无穷无尽的口舌。对于开发者而言，这也额外治好了一个顽疾：当系统通过脚本自动点击网页 DOM 元素经常失效跑偏时，直观的视觉框选比猜前端 class 结构要准太多了。

(注：不仅是 Design Mode 加了基于截图定位的备选方案，这次更新对底层浏览器 Agent 也做了一波减法。官方严格收窄了它的工具权限，强制它专注于纯粹的浏览器操作，这能大幅减少之前它在网页里乱点导致的跑偏和报错死循环。)

4. 生态与性能细节扫除盲点

除了上面这三个大件，还有几个值得普通开发者留意的细节提升：

• MCP 支持结构化输出（Structured Content）：当你让 Agent 调用外部 MCP 接口或者 App 时，它现在能接收和解析出更富媒体、结构更清晰的数据。
• 大文件 Diff 渲染变流畅了：以前只要 Agent 生成或比对几十上百行的长代码，编辑器必卡。这次更新重写了长文件比对，内存占用大幅缩减。
• 过往聊天记录直接参与搜索：现在用到 At-mention（@ 提及）时，你的历史对话也会出现在搜索结果里，用来捞以前解决过的老 Bug 非常省事。

总结

Cursor 3 并没有一味追求所谓“更强”的模型噱头，而是回归到了人机交互的工程细节。

开个自带隔离环境的 Worktree，哪怕把最复杂的脏活丢给它，也不怕它把你正在写的状态干碎。如果遇到不好形容的样式 Bug，直接用 Design Mode 框选出来也就完事了。

如果你曾经也被 Agent 一顿乱改搞炸过本地分支，光是冲着能放开手脚瞎折腾的 Worktree，就值得立刻去升个级试一把。

LLaMA Factory多模态微调实践

LLaMA Factory 多模态微调实践一、前提准备：环境与数据深度适配（一）运行环境技术规格 1. 硬件配置底层逻辑 * GPU 选型依据： * 推荐 24GB 显存的 A10（ecs.gn7i-c8g1.2xlarge）。 * 核心原因：Qwen2-VL-2B 模型加载后显存占用约 8-10GB，全参微调过程中梯度计算、优化器状态存储需额外 10-12GB 显存，24GB 可避免显存溢出（OOM）。 * 若使用 16GB 显存的 T4 等型号，需启用梯度检查点（gradient checkpointing），但会增加约 20% 训练时间。 * CPU 与内存配套： * 建议 8 核 CPU + 32GB 内存，避免数据加载（

Android Studio集成GitHub Copilot GPT-4o：AI辅助开发实战与避坑指南

快速体验在开始今天关于 Android Studio集成GitHub Copilot GPT-4o：AI辅助开发实战与避坑指南的探讨之前，我想先分享一个最近让我觉得很有意思的全栈技术挑战。我们常说 AI 是未来，但作为开发者，如何将大模型（LLM）真正落地为一个低延迟、可交互的实时系统，而不仅仅是调个 API？这里有一个非常硬核的动手实验：基于火山引擎豆包大模型，从零搭建一个实时语音通话应用。它不是简单的问答，而是需要你亲手打通 ASR（语音识别）→ LLM（大脑思考）→ TTS（语音合成）的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说，这是个绝佳的练手项目。从0到1构建生产级别应用，脱离Demo，点击打开从0打造个人豆包实时通话AI动手实验 Android Studio集成GitHub Copilot GPT-4o：AI辅助开发实战与避坑指南传统Android开发的效率瓶颈在传统Android开发过程中，开发者常常面临以下痛点： * 重复代码编写：

终极指南：如何快速上手高性能Whisper.cpp语音识别项目

终极指南：如何快速上手高性能Whisper.cpp语音识别项目【免费下载链接】whisper.cppOpenAI 的 Whisper 模型在 C/C++ 中的移植版本。项目地址: https://gitcode.com/GitHub_Trending/wh/whisper.cpp Whisper.cpp是OpenAI Whisper模型在C/C++中的高性能移植版本，为开发者提供轻量级、跨平台的自动语音识别解决方案。这个项目支持多种硬件优化，包括Apple Silicon、AVX指令集和Vulkan等，让语音识别技术更加普及和易用。 🔥 项目核心优势与特色功能 Whisper.cpp的最大亮点在于其卓越的性能表现和广泛的平台兼容性。通过GGML量化技术，模型体积大幅减小，同时保持高质量的识别效果。该项目支持从微型到大型的多种模型规格，满足不同场景下的需求。多平台全面支持项目覆盖了从桌面端到移动端的完整生态： * 桌面系统：macOS（Intel和Arm）、Linux、FreeBSD、Windows * 移动平台：

【AIGC】如何获取ChatGPT外部GPTs应用的提示词Prompt指令和知识库文件

博客主页： [小ᶻ☡꙳ᵃⁱᵍᶜ꙳]本文专栏: AIGC |GPTs应用实例文章目录 * 💯前言 * 💯获取GPTs的提示词Prompt指令 * 💯获取GPTs的知识库文件 * 💯小结 * 关于GPTs指令如何在ChatGPT上使用，请看这篇文章：【AIGC】如何在ChatGPT中制作个性化GPTs应用详解 https://blog.ZEEKLOG.net/2201_75539691?type=blog * 关于如何使用国内AI工具复现类似GPTs效果，请看这篇文章：【AIGC】国内AI工具复现GPTs效果详解 https://blog.ZEEKLOG.net/2201_75539691?type=blog 💯前言随着 ChatGPT 和其他 AI 应用的不断发展，越来越多的外部 GPTs 被集成进来，以增强其功能和适应多样化的用户需求。这些外部 GPTs 并不仅仅是通用的聊天助手，而是专为特定场景、

Cursor 3来了：内置Codex，前端福音Design Mode，WorkTree多开

1. Agents Window：跑并行的任务控制台

2. Git Worktree：物理隔离保护你的主干代码

3. Design Mode：用框选代替语言描述

4. 生态与性能细节扫除盲点

总结

Read more

LLaMA Factory多模态微调实践

Android Studio集成GitHub Copilot GPT-4o：AI辅助开发实战与避坑指南

终极指南：如何快速上手高性能Whisper.cpp语音识别项目

【AIGC】如何获取ChatGPT外部GPTs应用的提示词Prompt指令和知识库文件