从Agent、MCP、Skill到CLI:AI进化四部曲的代表作品与里程碑全盘点
从Agent、MCP、Skill到CLI:AI进化四部曲的代表作品与里程碑全盘点
作者:猫头虎AI | 发布时间:2026年3月 | 阅读时间:约12分钟
【开篇】
兄弟们,回顾2025年绝对是AI圈最魔幻的一年。从年初DeepSeek-R1的"核弹级"开源,到3月Manus一夜爆火邀请码炒到5位数,再到各大厂疯狂押注MCP协议——AI的战场已经从"谁模型参数更大"转向了"谁能真正帮你干活"。
今天这篇干货,咱们不聊虚的,直接盘一盘Agent、MCP、Skill、CLI这四大技术范式各自的代表作品和里程碑大事件。看完你就知道,为什么2025被称为"Agent元年",以及作为开发者该如何紧跟这波浪潮。

文章目录
一、Agent:从"聊天工具"到"数字员工"的质变
什么是Agent?
简单说,Agent就是能自主规划、调用工具、执行多步骤任务的AI系统。它不再是你问一句答一句的聊天机器人,而是能像实习生一样"边想边干"的智能体。
代表作品盘点
| 产品/项目 | 发布时间 | 核心亮点 | 代表意义 |
|---|---|---|---|
| Devin | 2024年12月 | 首个真正可用的编程Agent,能自主写代码、调试、部署 | AI Agent商业化的里程碑,标志着"Agent觉醒" |
| Manus | 2025年3月 | 中国团队Monica推出,GAIA基准测试86.5%准确率,支持深度研究+实际操作 | 国内首个现象级通用Agent,推动"Agent元年"概念爆发 |
| OpenAI Operator | 2025年1月 | OpenAI首款官方Agent,支持自动预订、购物、编码等复杂操作 | 大厂正式入场Agent赛道的标志性产品 |
| OpenAI Deep Research | 2025年2月 | 端到端强化学习训练,5-30分钟生成专业研究报告 | 深度研究型Agent的标杆 |
| Claude 3.7 Sonnet + Claude Code | 2025年2月 | 编码Agent代表,能写代码、执行代码、检查结果并持续迭代 | 编程Agent的"天花板" |
| AutoGLM沉思 | 2025年3月 | 智谱AI推出,实现"边想边干"的Agent能力闭环 | 国产大模型Agent化的重要突破 |
| Kimi-Researcher | 2025年6月 | 月之暗面首个Agent产品,HLE测试超越Claude 4 Opus | 国内长文本+Agent结合的代表 |
| Jules | 2024年12月 | 谷歌推出的编程助手,直接集成GitHub工作流 | 大厂异步编程Agent的代表 |
里程碑时间线
2024年10月:微软在Dynamics 365集成10个自主AI Agent,Lumen年省5000万美元成本 ↓ 2024年12月:谷歌发布Gemini 2.0及Project Astra、Project Mariner、Jules三大Agent原型 ↓ 2024年12月:Cognition Labs发布Devin,引爆"Agent觉醒"话题 ↓ 2025年1月:OpenAI发布Operator,正式定义"Agent之年" ↓ 2025年2月:OpenAI发布Deep Research功能 ↓ 2025年3月:Monica发布Manus,国内Agent概念破圈 ↓ 2025年3月:智谱发布AutoGLM沉思 ↓ 2025年6月:月之暗面发布Kimi-Researcher ↓ 2025年8月:中国人工智能学会主办AI Agent全球专项赛,标志Agent产业化正式成熟 二、MCP:AI与世界的"通用翻译器"
什么是MCP?
MCP(Model Context Protocol,模型上下文协议) 是Anthropic于2024年11月开源的开放标准,旨在解决AI Agent访问外部数据和工具时的"数据孤岛"问题。
通俗理解:以前每个AI模型调用工具的方式都不一样(OpenAI一种格式、Anthropic一种格式、Google又一种),开发者要为每个模型单独适配。MCP就像AI世界的"HTTP协议",统一了模型与外部工具的交互标准。
代表作品与生态
| 类型 | 代表项目 | 说明 |
|---|---|---|
| 协议规范 | MCP Protocol | Anthropic开源的协议标准,定义了AI与数据系统的连接方式 |
| 官方实现 | Claude Desktop MCP | Claude桌面版内置MCP本地服务器支持,保障数据隐私 |
| 开源服务器 | Google Drive MCP、GitHub MCP、Slack MCP、Postgres MCP | 开箱即用的数据源连接器 |
| 国内支持 | 阿里、腾讯、字节、百度MCP平台 | 国内大厂2025年密集跟进,聚焦MCP Server市场平台 |
里程碑时间线
2024年11月:Anthropic开源发布MCP协议 ↓ 2025年初:MCP热度飙升,OpenAI、Anthropic、Mistral在8天内相继推出API级MCP支持 ↓ 2025年春:国内大厂(阿里、腾讯、字节、百度)密集部署MCP ↓ 2025年:MCP生态爆发,成为AI Agent的"事实行业标准" 为什么说MCP是2025年的关键里程碑?
因为它解决了AI落地最大的痛点——连接。正如AIGCLINK发起人占冰强所说:“每个人都能通过MCP,DIY一个属于自己的Manus”。
三、Skill:AI的"专业能力封装"
什么是Skill?
Skill(技能)是将可重复的领域知识封装为可动态加载的指令包,让通用大模型具备专业化执行能力。它标志着AI应用从"对话交互"向"任务执行"的关键跃迁。
如果说MCP解决的是"AI如何连接外部世界",那么Skill解决的就是"AI如何获得专业能力"。
代表作品与分类
| 分类 | 代表Skill | 功能描述 |
|---|---|---|
| 浏览器自动化 | agent-browser | 模拟真实浏览器行为,支持多引擎搜索、网页解析、文件下载 |
| 可视化生成 | diagram-generator | 将复杂文本转化为时间轴、思维导图等可视化图表 |
| 文档处理 | pptx | 深度解析PPT,提取备注/评论/隐藏图文,转Markdown |
| 前端设计 | Frontend Design Skill | 创建生产级前端界面,支持React/HTML/CSS/JS代码生成 |
| 算法艺术 | Algorithmic Art Skill | 使用p5.js创建生成艺术、数据可视化 |
| 学习管理 | ship-learn-next | "交付-学习-下一步"循环拆解目标,用作品驱动学习 |
| 个人助理 | personal-assistant | 持久记忆学习进度,跨会话跟踪目标 |
里程碑时间线
2025年10月:Anthropic发布Agent Skills,限于开发者小范围关注 ↓ 2025年11-12月:技能规范开放,生态快速扩展 ↓ 2026年1月:Claude Skills产品更新叠加非编程场景落地,触发病毒式传播 ↓ 2026年:GitHub官方Skills库收获近5万星标,技能商店出现超4800人安装的爆款 Skill的关键转折点在于非技术用户的涌入——大量用户开始将Claude Skills用于度假研究、PPT制作、邮件清理等非编码场景,推动了技术出圈。
四、CLI:开发者的"AI副驾驶"
什么是CLI AI工具?
CLI(Command Line Interface)AI工具是将AI能力直接集成到命令行的编程助手。2025年,这类工具迎来了爆发式增长,成为开发者效率提升的"核武器"。
代表作品排行榜
| 排名 | 工具名称 | 发布方 | 核心特点 | 适用场景 |
|---|---|---|---|---|
| 1 | Claude Code | Anthropic | 代码质量最高(9.5/10),编码Agent标杆 | 复杂代码库开发、重构 |
| 2 | OpenAI Codex CLI | OpenAI | 生态集成最强(9.5/10),与OpenAI API深度绑定 | 全栈开发、API集成 |
| 3 | Gemini CLI | 响应速度最快(9.5/10),开源免费(Apache 2.0) | 脚本编写、命令辅助 | |
| 4 | Cursor CLI | Cursor | 易用性最佳(9.2/10),与IDE无缝衔接 | 日常编码、快速原型 |
| 5 | CodeBuddy Code | 腾讯 | 首个支持MCP协议的国产CLI工具,混元+DeepSeek双模型 | 本土化开发、微信小程序 |
| 6 | Qwen Code CLI | 阿里 | 开源免费,中文编程场景优化 | 中文开发环境、成本敏感场景 |
| 7 | Mistral Vibe | Mistral | 欧洲开源模型代表 | 多语言开发、隐私优先 |
里程碑时间线
2023年初:OpenAI ChatGPT代码解释器(Code Interpreter)首次展示编程智能体范式 ↓ 2024年:各类IDE(VS Code、Cursor、Zed)开始集成编程智能体 ↓ 2025年2月:Claude Code低调发布(与Claude 3.7 Sonnet一同发布),引爆编码Agent元年 ↓ 2025年:各大主流实验室密集推出CLI编码智能体(Codex CLI、Gemini CLI、Qwen Code等) ↓ 2025年6月:Google Gemini CLI正式发布,开源策略冲击市场 ↓ 2025年9月:国产CLI工具(腾讯CodeBuddy、阿里Qwen Code)崛起,支持MCP协议 五、四者关系:AI落地的"技术栈拼图"
聊到这里,可能有些兄弟还是有点晕。咱们用一张图理清这四者的关系:
┌─────────────────────────────────────────────────────────┐ │ AI Agent(智能体) │ │ 能自主规划、调用工具、执行多步骤任务的系统 │ └─────────────────────────────────────────────────────────┘ ↑ ┌───────────────┼───────────────┐ ↓ ↓ ↓ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ MCP │ │ Skill │ │ CLI │ │ 连接层 │ │ 能力层 │ │ 交互层 │ │(统一协议)│ │(专业封装)│ │(命令行) │ └─────────┘ └─────────┘ └─────────┘ 简单理解:
- Agent 是最终形态(能干的"数字员工")
- MCP 是它的"神经系统"(连接外部工具的标准协议)
- Skill 是它的"专业技能"(封装好的领域知识)
- CLI 是开发者的"操作台"(与Agent交互的命令行界面)
六、写在最后:2026,Agent cli元年的开发者机遇
回顾2024-2026年的AI发展,有几个确定性趋势已经很明显:
- Agent从概念走向落地:Devin、Manus、Operator等产品的出现,证明Agent不再是PPT概念,而是真正能替代人类完成复杂任务的工具。
- MCP成为事实标准:虽然有人质疑MCP可能只是"昙花一现",但短期内它确实解决了AI与外部世界连接的最大痛点,生态已经形成。
- Skill工程化:AI应用开发正从"提示词工程"→"上下文工程"→"Skill工程"演进,封装可复用的领域知识将成为核心竞争力。
- CLI工具普及:编程Agent正在重塑开发工作流,未来"不会用AI写代码"可能就像"不会用IDE"一样难以生存。
给开发者的建议:
- 如果你还没试过Claude Code或Gemini CLI,现在就去装一个,体验AI编程的效率提升
- 关注MCP生态,学会为自己的业务场景定制MCP Server
- 开始思考如何将你的业务知识封装为Skill,这将是AI时代的"护城河"
2026年,Agent元年的大幕已经拉开。作为技术人,我们要做的不是观望,而是躬身入局。
【评论区互动】
你用过哪些AI Agent或CLI工具?体验如何?欢迎在评论区分享你的"真香"或"踩坑"经历!
如果这篇文章对你有帮助,别忘了点赞、收藏、转发三连!关注老K,持续输出硬核AI技术干货。