AI 编程新范式:一文彻底搞懂 LLM、Agent、MCP、Skill 是怎么协作的

AI 编程新范式:一文彻底搞懂 LLM、Agent、MCP、Skill 是怎么协作的

文章目录

如果你最近在使用 CursorWindsurfAntigravityKiroCopilotTrae,或者在关注「AI + IDE」的前沿进展,你大概率会被几个词反复轰炸:LLM、Agent、MCP、Skill

它们看起来都很“高大上”,但很多文章要么偏学术,要么堆砌概念,看完依然一头雾水。

这篇文章试图用 工程师能真正落地的方式,配合通俗易懂的“三国演义”比喻,带你彻底厘清这套正在重塑软件开发的 AI 编程新架构。


一、核心结论:AI 编程进入「分工时代」

传统的 LLM 交互模式非常简单:

  • 你问一句
  • 它回一句

而今天的 AI 编程(如 Cursor 的 Agent 模式),工作流已经变成了:

你下目标 → AI 拆任务 → 调工具 → 真正把事干完

这背后,靠的就是一套精密的“三件套”分工:

  1. Agent(智能体): 负责“想”
  2. MCP(协议): 负责“连”
  3. Skill(技能): 负责“做”

理解了它们的分工,你就理解了下一代 IDE 在干什么。下面我们将逐一拆解这些角色。


二、LLM 与 Agent 🔥

1. LLM(大语言模型)

定位:纯粹的推理引擎(大脑)
这是很多人的误区:LLM 不等于 Agent。

  • 本质:LLM 是一个静态的、无状态的函数。给它一段文本,它预测下一个字。
  • 局限:它本身是**“无手无脚”**的。它运行在云端的显卡上,无法直接触碰你的本地文件,无法联网,也没有记忆(除非你把历史记录发给它)。

2. Agent(智能体)

定位:会思考的工程经理
Agent 是在 LLM 身上包裹的一层“系统架构”。

  • 核心能力
    • Reasoning(推理):理解你的目标。
    • Planning(规划):将大目标拆解为 Step 1, Step 2, Step 3。
    • Tool Calling(工具调用):判断“现在该用什么工具”。

3. 对比

  • LLM 是 Agent 的一个核心组件,Agent ≠ LLM
  • LLM 是 Agent 的“认知内核”,Agent 是“能把事做完的系统”
  • LLM 是 Agent 的核心组成部分之一,但 Agent 远不止 LLM
  • Agent > LLM
Agent// 一个能自主完成任务的 AI 系统,协调各模块完成目标 ├── LLM(核心推理与生成能力) // 分析需求、理解代码、生成方案、给出决策建议 ├── Perception(多模态感知环境:Vision/Audio/Text) // 读取代码文件、Diff、日志、截图、用户输入 ├── Context(短期记忆 /Token 限制上下文窗口) // 当前对话内容、选中文件、即时指令 ├── Memory(长期记忆 / 跨会话知识存储) // 代码索引、项目历史记录、知识库召回 ├── Planner/Policy(决策与行动策略) // 决定下一步是改代码、查资料还是调用工具 ├── Executor/Verifier(多步执行与结果校验) // 执行代码修改、终端命令、脚本运行、结果验证 ├── Tools/Actions(外部工具调用与具体动作) // 编辑文件、提交代码、调用 API、终端操作 ├── Orchestration/Controller(模块调度与协作) //MCP 框架、Agent 调度、LLM

Read more

飞书 × OpenClaw 接入指南:不用服务器,用长连接把机器人跑起来

你想在飞书里用上一个能稳定对话、能发图/收文件、还能按规则在群里工作的 AI 机器人,最怕两件事:步骤多、出错后不知道查哪里。这个项目存在的意义,就是把“飞书接 OpenClaw”这件事,整理成一套对非技术也友好的配置入口,并把官方文档没覆盖到的坑集中写成排查清单。 先说清楚它的角色:OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu,功能更完整、维护也更及时。这是好事,说明飞书 + AI 的接入已经走通。这个仓库并不是要替代官方插件,而是继续为大家提供: * 新用户:从零开始的新手教程(15–20 分钟) * 老用户:从旧版(独立桥接或旧 npm 插件)迁移到官方插件的保姆级路线 * 常见问题答疑 & 排查清单(最常见的坑优先) * 进阶场景:独立桥接模式依然可用(需要隔离/定制时再用) 另外,仓库也推荐了一个新项目

Gemini 全能 QQ 机器人部署手册 (V1.0 Release)

Gemini 全能 QQ 机器人部署手册 (V1.0 Release) 核心架构:OneBot V11 (NapCat) + NoneBot2 + Gemini Flash 适用系统:Ubuntu 22.04 LTS (阿里云/腾讯云) 🟢 第一阶段:基础设施准备 SSH 连接服务器后,复制以下命令执行。 安装必要软件 (Docker + Python) # 更新软件源sudoapt update &&sudoapt upgrade -y# 安装 Dockercurl-fsSL https://get.docker.com |bash# 安装 Python3 及虚拟环境工具sudoaptinstall python3-pip python3-venv -y# 创建项目文件夹mkdir-p

WSL2 下启动 Webots 地址一直不对:`10.255.255.254` 的原因与修复

WSL2 下启动 Webots 地址一直不对:`10.255.255.254` 的原因与修复

最近在 WSL2 + ROS2 Humble + Webots 环境中运行 webots_ros2_universal_robot 示例时,发现 webots-controller 启动后立刻退出。日志显示它自动使用了一个明显不对的地址: [ERROR] [webots_controller_UR5e-3]: process has died [pid 2087, exit code 1, cmd '/opt/ros/humble/share/webots_ros2_driver/scripts/webots-controller --robot-name=UR5e --protocol=tcp --ip-address=10.255.255.254 --port=1234 ...'

【红黑树进阶】手撕STL源码:从零封装RB-tree实现map和set

【红黑树进阶】手撕STL源码:从零封装RB-tree实现map和set

👇点击进入作者专栏: 《算法画解》 ✅ 《linux系统编程》✅ 《C++》 ✅ 文章目录 * 一. 源码及框架分析 * 1.1 STL源码中的设计思想 * 1.2 STL源码框架分析 * 二. 模拟实现map和set(实现复用红黑树的框架) * 2.1 红黑树节点的定义 * 2.2 红黑树的基本框架 * 2.3 解决Key的比较问题:KeyOfT仿函数 * 2.4 支持insert插入 * 2.5 map和set的insert封装 * 三. 迭代器的实现 * 3.1 迭代器结构设计 * 3.2 迭代器的++操作 * 3.3 迭代器的--操作 * 3.4 RBTree中的迭代器接口 * 四. map和set对迭代器的封装 * 4.