【LLM】大模型vibe coding(cursor、copilot、comate)

【LLM】大模型vibe coding(cursor、copilot、comate)

note

2025年,Karpathy分享了自己的Vibe Coding指南1.0:

  • 把所有相关内容塞进上下文里(在大型项目中可能需要很久。如果项目够小,就直接把所有文件都塞进去。
  • 描述我们接下来要实现的那个具体的、增量式的小改动。不要直接要代码,而是要几种高层次的思路,并分析它们的优缺点。几乎总是会有多种做法,而大语言模型的判断并不总是可靠。然后(可选)再具体化。
  • 选择一种思路,请它写出第一版代码。
  • 进入复查/学习阶段:手动在浏览器里打开我不熟悉或没调用过的API文档,向模型提问解释、澄清、修改,必要时回退并尝试另一种思路。
  • 测试。
  • Git commit。
  • 询问可以接下来实现什么。然后重复这个循环。

文章目录

一、相关vibe coding工具

在这里插入图片描述

1、cursor

Cursor 是一款基于 VS Code 二次开发的 AI 编辑器,它深度融合了 AI 技术,提供了前所未有的用户体验
。它不仅借助 VS Code 强大的插件生态系统,还通过 AI 提升了整体使用感受。与 GitHub Copilot 等其他类似产品相比,Cursor 的最大优势在于其与编辑器本身的深度集成,这意味着它不仅仅是一个附加组件,而是成为编辑器不可分割的一部分,使用户在日常使用中能够更加自然、高效地利用这些智能功能。

2、copilot

GitHub Copilot 是一种 AI 编码助手,由大型语言模型 (LLM) 提供支持,可在整个 Microsoft 云中提供创新解决方案
。它旨在提高工作效率、创造力和数据可访问性,同时提供企业级数据安全和隐私功能。GitHub Copilot 集成在 GitHub 平台中,为开发人员提供了一个支持性环境,用于应对编程挑战并增强其编码工作流。此外,GitHub Copilot 可用于学习新的编程语言或框架,方法是根据开发人员输入提供实时代码建议。

3、comate

(1)支持的语言。目前文心快码支持全部主流编程语言,其中在以下语言/框架编码场景表现更优:

后端(Backend): C、C#、C++、Java、Python、Go、PHP、Rust
前端(Frontend): HTML、JavaScript、CSS、Less、swan、San、Vue、Scss、Sass、Stylus、pug、mermaid
App端(APP): ObjectC、Kotlin、Swift
其它(Others): Perl、Ruby、Shell、vhdl、GraphQL、Dockerfile

zulu使用文档:https://cloud.baidu.com/doc/COMATE/s/vm66asjm4

(2)Chat 和 Zulu 的区别
Chat:代码问答,需要用户主导问题解决过程。用户通过提问、理解答案、多轮追问的流程来解决问题。生成的代码经手动点击“采纳”后合入代码文件。
Zulu:智能体,支持从需求到代码的端到端生成。用户只需给出需求,智能体会自主规划工作,确定相关文件,编辑代码库,调用开发工具。还会自主验证结果、持续迭代、解决问题,直至达成用户的目标。

(3)端到端任务执行
Zulu 具备自助任务执行和反思能力,能够端到端从需求生成代码。

例如,当您要求 Zulu 为一个在线商城的项目的支付系统增加微信支付时。Zulu 会:

  • 了解项目的结构和现有支付逻辑,并找到支付宝的相关实现
  • 了解上游的订单服务如何调用支付服务
  • 实现微信支付的代码
  • 总结复盘,查漏补缺,发现遗漏的 pom.xml 修改
  • Zulu 会依据代码库的实际情况动态调整规划和执行的过程,确保生成效果。

(4)代码库的理解:介绍项目的业务目标,核心功能、整体架构、业务流程

在这里插入图片描述

二、vibe coding综述

1、code agent

综述:
https://arxiv.org/abs/2508.00083
A Survey on Code Generation with LLM-based Agents
https://github.com/JiaruQian/awesome-llm-based-agent4code

在这里插入图片描述

2、vibe coding

【代码编程进展】Vibe Coding 的一个综述,A Survey of Vibe Coding with Large Language Models,
https://arxiv.org/pdf/2510.12399,
https://github.com/YuyaoGe/Awesome-Vibe-Coding

在这里插入图片描述

三、斯坦福CS146S

《The Modern Software Developer》(现代软件开发者)
https://themodernsoftware.dev

前两周讲的是从提示词到 Agent,核心思想是:AI 已经是一个带工具的系统了,你得学会怎么搭这个系统。
第 1 周:先把 LLM 的工作原理、犯错的原因、怎么引导它稳定输出讲清楚,作业是做一个 Prompting Playground,把提示词从玄学变成可验证的实验。
第 2 周:直接进入 Agent 架构,讲 Tool Use、Function Calling,还有现在大火的 MCP(Model Context Protocol),作业是自己动手搭一个 MCP Server。

第 3 ~ 4 周讲 AI IDE 和上下文工程。
第 3 周:关键词是 Context Engineering,课上讨论了长上下文为什么会失败、Specs 和 PRD 为什么是新的源代码、怎么让 AI 理解复杂的代码库。这周的必读材料里有一篇叫《Specs Are the New Source Code》,我觉得是整门课最值得深思的一篇。
第 4 周:讲 Agent 的自治程度怎么管控、人机协作模式怎么设计,阅读材料包括 Anthropic 的 Claude Code 使用方式和最佳实践。作业就是直接上手用 Claude Code 写项目,训练你成为一个 Agent Manager。

第 5 周讲现代终端,介绍 Warp 这类 AI 终端怎么把命令行操作产品化。AI IDE 解决的是写代码的问题,AI 终端解决的是把代码跑起来、把系统管起来的问题。

第 6 ~ 7 周讲安全与质量,这两周是我觉得整门课最有含金量的部分。
第 6 周:讲 Secure Vibe Coding,直接上硬核案例:Prompt Injection 怎么导致远程代码执行?OWASP Top 10 在 Agent 时代有哪些新威胁?看得我脊背发凉……
第 7 周:讲 Code Review,核心问题是:AI 产出的代码,我们能信任到什么程度?

第 8 周:讲自动做应用,一句 Prompt 搞出一个端到端的完整应用,嘉宾是 Vercel 的 AI 研究负责人。这节课的实战价值很大,但课程真正想传达的是:快速原型只是起点,你得能把它纳入测试、安全、Code Review 这些工程规范中。

第 9 周:讲上线后的运维,包括监控、可观测性、事件响应、自动化排查。很多人学 AI 编程只学造,不学养。这门课把养系统也补上了,非常加分。

第 10 周:讲未来趋势,嘉宾是 a16z(全球最牛的风投之一)的合伙人 Martin Casado,帮你把前 9 周串起来,知道自己学的是一种新的工程范式。

作业代码:https://github.com/mihail911/modern-software-dev-assignments

四、vibe coding建议

1、YC建议

参考:YC合伙人深度实践:15个让你玩转Vibe Coding的秘诀

1、开局:选对工具,谋定而后动

  • 新手和老手选择不同:如果你是编程新手,可以从 Replit 或 Lovable 这类可视化工具入手,它们能让你快速搭建界面。但文章指出,当你需要更精细地控制后端逻辑时,这类工具可能力不从心。如果你有基础,那么像 Cursor 或 Claude Code 这类更专业的编码AI工具会是更好的选择,它们提供更精准的控制。
  • 别直接写代码,先做计划:这是最重要的建议之一。不要一上来就让AI直接生成代码,而是应该先和AI一起制定一份详细的开发计划,就像建筑蓝图一样。把这份计划保存在项目里,然后和AI一起,一部分一部分地去实现它,每完成一步就检查、测试,再继续下一步。

2、过程:用好“安全绳”,避免翻车

  • 把Git当作“后悔药”:严格使用Git进行版本控制。在开始新功能前,确保有一个干净的状态。一旦AI的修改把代码搞乱了,可以立刻用 git reset 命令回滚到上一个正常状态,推倒重来,而不是在错误的代码上越陷越深。
  • 让AI为你写“验收标准”:不要只让AI写细碎的单元测试,而是让它编写高级别的集成测试。这种测试模拟用户点击操作,能确保整个功能流程是通的。它能有效捕捉到AI“手滑”修改了不相干代码而引入的bug。
  • AI不止能写代码:充分利用AI处理各种周边任务,比如配置服务器、设置域名解析(DNS)、甚至设计图标。这让AI同时扮演你的运维(DevOps)和设计师角色,极大提升综合效率。

3、技巧:精准沟通,高效排错

  • 错误信息是最好的提示:遇到报错时,直接把完整的错误信息日志复制给AI,通常它自己就能看懂并给出修复方案,你甚至不需要多做解释。
  • 不行就换“脑袋”:不同的AI模型(如Claude、GPT、Gemini)各有擅长。如果一个模型总在一个问题上卡住,果断切换另一个模型,很可能就迎刃而解了。
  • 给它一份“岗位说明书”:你可以为AI编写详细的指导规则(Instructions),告诉它项目的背景、代码风格偏好、常用库等。这能极大提升AI输出代码的准确率和符合度。

4、架构:化整为零,降低复杂度

  • 复杂的活儿单独干:对于特别复杂的新功能,最好在独立的新项目里让AI先实现一个demo,成功后再整合进主项目。这能避免主项目复杂的代码干扰AI的判断。
  • 小即是美:无论是人还是AI,都更容易理解短小精悍、模块化的代码。保持文件小巧、功能独立,这被认为是Vibe Coding下的最佳实践。

2、对技术人的影响

  • AI 极大释放了研究者的决策空间,比方说Cursor 像“高效工程师”,负责处理琐碎的画图代码与实验分析;而Gemini 3 Pro 则堪比“科学家”,辅助进行逻辑推演与理论梳理。
  • 技术人正从“代码写作者”转变为“问题提问者”。写 Prompt 的本质,是“找真问题、解真问题”的过程。
  • 未来技术从业者将转型为“项目管理者”与“架构设计师”,核心能力包括三方面:
    • 架构设计:搭建系统整体框架,规划核心逻辑,把控技术路线。
    • 智能体调度:根据任务特性,精准选择 AI 工具组合,实现效率最大化。
    • 批判思维:AI 生成代码多处于平均水平,核心代码难达最优,需以高阶视角 Review 代码,避免破坏现有优质框架。
  • 沟通能力:
    • 跨领域沟通:工程师需理解商业逻辑,设计师需参与编程环节,打破专业壁垒才能形成高效协作。
    • 精准意图表达:项目推进速度从“按天算”变为“按分钟算”,短时间内让 AI 准确理解核心需求,是提升效率的核心前提。
  • 传统程序员会缩减为少数负责核心风险把控、架构设计的专家;更多人会利用 Vibe Coding 为原有行业赋能(如投资人写爬虫分析资讯、设计师自主开发工具),催生出更多多元化社会工种,拓宽行业边界。

Reference

[1] Cursor 完全使用教程
[2] 微软Copilot怎么用?如何使用微软Copilot AI的10个技巧!
[3] 程序员的SK-II神仙水:GitHub Copilot,让你时刻拥有巅峰战力!
[4] AI Coding工具怎么用? 看看滴滴人怎么说? | 技术桔有话说
[5] 技术思辨|AI Coding:经验壁垒正在失效,工具进化重塑编程.高德技术
[6] 构建可扩展的智能体系统:工程化方法与实践(一).bili
[7] 一篇Copilot、Cursor、Claude Code三代产品背后AI Code技术最新全面综述
[8] 阿里、百度、腾讯、美团齐聚的Vibe Coding 圆桌,却被12岁小孩姐“军训”
[9] Vibe Coding 中怎样避免屎山,ref:https://github.com/karminski/trae-meetup-materials
[10] 阿里妈妈效果广告引擎团队在 AI Coding 领域的探索与实践经验。依托历时三年打造的 CommonAds 研发体系,我们构建了智能研发助手「元芳」,并通过集成至 IFLOW-CLI 以多 Agent 协同的方式,探索出一套可胜任于「严肃的广告引擎场景的高质量代码生成解决方案」 让 AI 写出生产级代码:阿里妈妈效果广告引擎AI Coding实践
[11] 【干货】当代码下沉为“氛围”,程序员如何免于被 AI “断代”?
[12] Anthropic 黑客松获奖者的ClaudeCode 配置:github.com/affaan-m/everything-claude-code
[13] trae-研发场景十大热门 Skills 推荐
[14] https://themodernsoftware.dev
[15] 【Vibe Coding开源项目】Vibe Coding 指南,https://github.com/2025Emma/vibe-coding-cn
[16] Claude Code 完全新手指南(2026 版):从入门到精通

Read more

超越Tomcat的Spike (一):使用netty搭建Http服务器

超越Tomcat的Spike (一):使用netty搭建Http服务器

超越Tomcat的Spike (一):使用netty搭建Http服务器 * 🏆 引言 * 🚀 Netty的魅力所在 * 什么是Netty? * Netty vs 传统服务器 * 🏗️ Spike项目架构设计 * 项目结构 * 核心组件架构 * 💻 核心代码实现 * 服务器初始化与启动 * 请求处理逻辑 * ⚡ 性能测试与对比 * 并发处理能力测试 * 内存占用对比 * 📱 应用案例 * 案例一:高并发API网关 * 案例二:实时数据推送服务 * 🎯 核心优势分析 * 1. 非阻塞异步模型 * 2. 零拷贝技术 * 3. 可扩展性强 * 🔮 未来展望 * Spike 2.0 规划 * 应用场景扩展 * 📝 代码优化建议 * 1. 事件循环组优化 * 2. 内存管理优化 * 🏁 总结 🏆 引言 在现代Web应用开发中,HTTP服务器是构建任何网络服务的基础。传统的Tomcat、Jetty等服务器虽然功能强大,但在高性能场景下往往显得力不从

By Ne0inhk
MySQL CRUD 核心指南:查询、插入、更新、删除全实战

MySQL CRUD 核心指南:查询、插入、更新、删除全实战

🔥草莓熊Lotso:个人主页 ❄️个人专栏: 《C++知识分享》《Linux 入门到实践:零基础也能懂》 ✨生活是默默的坚持,毅力是永久的享受! 🎬 博主简介: 文章目录 * 前言: * 一. 基础准备:创建测试表与测试数据 * 1.1 学生表(students) * 1.2 考试成绩表(exam_result) * 二. Create(插入数据) * 2.1 单行全列插入 * 2.2 多行指定列插入 * 2.3 插入冲突处理(on duplicate key update) * 2.4 替换插入(replace into) * 2.5 插入查询结果 * 三.

By Ne0inhk
Flutter for OpenHarmony:Flutter 三方库 bloc_lint — 静态层给架构建立强硬代码纪律法规(架构治理引擎)

Flutter for OpenHarmony:Flutter 三方库 bloc_lint — 静态层给架构建立强硬代码纪律法规(架构治理引擎)

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net。 前言 在鸿蒙(OpenHarmony)商业应用构建体系中,BLoC (Business Logic Component) 作为极其受欢迎且久经沙场验证的主流状态管理选项之一,其能够很好的区隔 UI 层与深层次复杂多变业务层。但即便其设计优秀且完善,部分因为初学者对“事件源如何定义”、“状态应当如何闭环抛出和重建”理解错位而在团队项目中引发了诸如事件滥用乱扔的状态泄漏等大型坑底。 bloc_lint 作为一套完全专门为 flutter_bloc 体系打造的规则分析插件,在底层完全接入你最信任的老大哥 IDE 和 CLI 验证中心。它通过对你的源码状态类代码进行扫描,从而逼你建立符合该架构设计真正思想哲学初衷的写法。在想要于庞大极其需要高度共识的企业级鸿蒙项目中推动 BLoC 范式时,它是你的架构卫士。 一、原理展示 / 概念介绍 1.1 基础概念 本机制就像是在 Dart 分析服务器里面插入了由 BLoC 作者参与或者基于经验而设定好的硬性代码规范探针体

By Ne0inhk
Spring Cloud 实战攻坚:商品服务核心实现(库存管理 + 缓存设计 + 分布式锁)

Spring Cloud 实战攻坚:商品服务核心实现(库存管理 + 缓存设计 + 分布式锁)

引言         在微服务架构的电商体系中,商品服务是整个业务链路的核心枢纽 —— 它承接前端商品展示、支撑订单服务的库存扣减、联动促销服务的活动商品管控,而其中的库存管理、缓存设计、分布式锁更是决定系统稳定性与高并发能力的关键。很多开发者在落地时,往往会遭遇三大核心痛点:高并发下库存超卖、缓存穿透 / 击穿 / 雪崩导致服务雪崩、分布式环境下并发控制失效,最终导致系统无法支撑大促等高压场景。         本文将手把手带你实现一个企业级 Spring Cloud 商品服务,聚焦三大核心业务:精准库存管理(解决超卖)、高可用缓存设计(抵御缓存三大问题)、分布式锁(保障并发安全)。全文注重实战落地,所有代码示例均可直接复现,同时深入拆解底层原理与设计思路,兼顾深度与实用性,助力你快速搭建能支撑高并发场景的商品服务。 1. 前置认知:商品服务的核心价值与高并发痛点 1.1 核心价值 商品服务作为电商微服务体系的 “基础数据中心”,核心价值体现在三个维度: 1. 数据支撑:提供商品基础信息(名称、价格、规格)、库存数据,为订单、

By Ne0inhk