从Agent、MCP、Skill到CLI:AI进化四部曲的代表作品与里程碑全盘点

从Agent、MCP、Skill到CLI:AI进化四部曲的代表作品与里程碑全盘点

从Agent、MCP、Skill到CLI:AI进化四部曲的代表作品与里程碑全盘点

作者:猫头虎AI | 发布时间:2026年3月 | 阅读时间:约12分钟

【开篇】

兄弟们,回顾2025年绝对是AI圈最魔幻的一年。从年初DeepSeek-R1的"核弹级"开源,到3月Manus一夜爆火邀请码炒到5位数,再到各大厂疯狂押注MCP协议——AI的战场已经从"谁模型参数更大"转向了"谁能真正帮你干活"。

今天这篇干货,咱们不聊虚的,直接盘一盘Agent、MCP、Skill、CLI这四大技术范式各自的代表作品里程碑大事件。看完你就知道,为什么2025被称为"Agent元年",以及作为开发者该如何紧跟这波浪潮。

从Agent、MCP、Skill到CLI:AI进化四部曲的代表作品与里程碑全盘点

文章目录


一、Agent:从"聊天工具"到"数字员工"的质变

什么是Agent?

简单说,Agent就是能自主规划、调用工具、执行多步骤任务的AI系统。它不再是你问一句答一句的聊天机器人,而是能像实习生一样"边想边干"的智能体。

代表作品盘点

产品/项目发布时间核心亮点代表意义
Devin2024年12月首个真正可用的编程Agent,能自主写代码、调试、部署AI Agent商业化的里程碑,标志着"Agent觉醒"
Manus2025年3月中国团队Monica推出,GAIA基准测试86.5%准确率,支持深度研究+实际操作国内首个现象级通用Agent,推动"Agent元年"概念爆发
OpenAI Operator2025年1月OpenAI首款官方Agent,支持自动预订、购物、编码等复杂操作大厂正式入场Agent赛道的标志性产品
OpenAI Deep Research2025年2月端到端强化学习训练,5-30分钟生成专业研究报告深度研究型Agent的标杆
Claude 3.7 Sonnet + Claude Code2025年2月编码Agent代表,能写代码、执行代码、检查结果并持续迭代编程Agent的"天花板"
AutoGLM沉思2025年3月智谱AI推出,实现"边想边干"的Agent能力闭环国产大模型Agent化的重要突破
Kimi-Researcher2025年6月月之暗面首个Agent产品,HLE测试超越Claude 4 Opus国内长文本+Agent结合的代表
Jules2024年12月谷歌推出的编程助手,直接集成GitHub工作流大厂异步编程Agent的代表

里程碑时间线

2024年10月:微软在Dynamics 365集成10个自主AI Agent,Lumen年省5000万美元成本 ↓ 2024年12月:谷歌发布Gemini 2.0及Project Astra、Project Mariner、Jules三大Agent原型 ↓ 2024年12月:Cognition Labs发布Devin,引爆"Agent觉醒"话题 ↓ 2025年1月:OpenAI发布Operator,正式定义"Agent之年" ↓ 2025年2月:OpenAI发布Deep Research功能 ↓ 2025年3月:Monica发布Manus,国内Agent概念破圈 ↓ 2025年3月:智谱发布AutoGLM沉思 ↓ 2025年6月:月之暗面发布Kimi-Researcher ↓ 2025年8月:中国人工智能学会主办AI Agent全球专项赛,标志Agent产业化正式成熟 

二、MCP:AI与世界的"通用翻译器"

什么是MCP?

MCP(Model Context Protocol,模型上下文协议) 是Anthropic于2024年11月开源的开放标准,旨在解决AI Agent访问外部数据和工具时的"数据孤岛"问题。

通俗理解:以前每个AI模型调用工具的方式都不一样(OpenAI一种格式、Anthropic一种格式、Google又一种),开发者要为每个模型单独适配。MCP就像AI世界的"HTTP协议",统一了模型与外部工具的交互标准。

代表作品与生态

类型代表项目说明
协议规范MCP ProtocolAnthropic开源的协议标准,定义了AI与数据系统的连接方式
官方实现Claude Desktop MCPClaude桌面版内置MCP本地服务器支持,保障数据隐私
开源服务器Google Drive MCP、GitHub MCP、Slack MCP、Postgres MCP开箱即用的数据源连接器
国内支持阿里、腾讯、字节、百度MCP平台国内大厂2025年密集跟进,聚焦MCP Server市场平台

里程碑时间线

2024年11月:Anthropic开源发布MCP协议 ↓ 2025年初:MCP热度飙升,OpenAI、Anthropic、Mistral在8天内相继推出API级MCP支持 ↓ 2025年春:国内大厂(阿里、腾讯、字节、百度)密集部署MCP ↓ 2025年:MCP生态爆发,成为AI Agent的"事实行业标准" 

为什么说MCP是2025年的关键里程碑?

因为它解决了AI落地最大的痛点——连接。正如AIGCLINK发起人占冰强所说:“每个人都能通过MCP,DIY一个属于自己的Manus”。


三、Skill:AI的"专业能力封装"

什么是Skill?

Skill(技能)是将可重复的领域知识封装为可动态加载的指令包,让通用大模型具备专业化执行能力。它标志着AI应用从"对话交互"向"任务执行"的关键跃迁。

如果说MCP解决的是"AI如何连接外部世界",那么Skill解决的就是"AI如何获得专业能力"。

代表作品与分类

分类代表Skill功能描述
浏览器自动化agent-browser模拟真实浏览器行为,支持多引擎搜索、网页解析、文件下载
可视化生成diagram-generator将复杂文本转化为时间轴、思维导图等可视化图表
文档处理pptx深度解析PPT,提取备注/评论/隐藏图文,转Markdown
前端设计Frontend Design Skill创建生产级前端界面,支持React/HTML/CSS/JS代码生成
算法艺术Algorithmic Art Skill使用p5.js创建生成艺术、数据可视化
学习管理ship-learn-next"交付-学习-下一步"循环拆解目标,用作品驱动学习
个人助理personal-assistant持久记忆学习进度,跨会话跟踪目标

里程碑时间线

2025年10月:Anthropic发布Agent Skills,限于开发者小范围关注 ↓ 2025年11-12月:技能规范开放,生态快速扩展 ↓ 2026年1月:Claude Skills产品更新叠加非编程场景落地,触发病毒式传播 ↓ 2026年:GitHub官方Skills库收获近5万星标,技能商店出现超4800人安装的爆款 

Skill的关键转折点在于非技术用户的涌入——大量用户开始将Claude Skills用于度假研究、PPT制作、邮件清理等非编码场景,推动了技术出圈。


四、CLI:开发者的"AI副驾驶"

什么是CLI AI工具?

CLI(Command Line Interface)AI工具是将AI能力直接集成到命令行的编程助手。2025年,这类工具迎来了爆发式增长,成为开发者效率提升的"核武器"。

代表作品排行榜

排名工具名称发布方核心特点适用场景
1Claude CodeAnthropic代码质量最高(9.5/10),编码Agent标杆复杂代码库开发、重构
2OpenAI Codex CLIOpenAI生态集成最强(9.5/10),与OpenAI API深度绑定全栈开发、API集成
3Gemini CLIGoogle响应速度最快(9.5/10),开源免费(Apache 2.0)脚本编写、命令辅助
4Cursor CLICursor易用性最佳(9.2/10),与IDE无缝衔接日常编码、快速原型
5CodeBuddy Code腾讯首个支持MCP协议的国产CLI工具,混元+DeepSeek双模型本土化开发、微信小程序
6Qwen Code CLI阿里开源免费,中文编程场景优化中文开发环境、成本敏感场景
7Mistral VibeMistral欧洲开源模型代表多语言开发、隐私优先

里程碑时间线

2023年初:OpenAI ChatGPT代码解释器(Code Interpreter)首次展示编程智能体范式 ↓ 2024年:各类IDE(VS Code、Cursor、Zed)开始集成编程智能体 ↓ 2025年2月:Claude Code低调发布(与Claude 3.7 Sonnet一同发布),引爆编码Agent元年 ↓ 2025年:各大主流实验室密集推出CLI编码智能体(Codex CLI、Gemini CLI、Qwen Code等) ↓ 2025年6月:Google Gemini CLI正式发布,开源策略冲击市场 ↓ 2025年9月:国产CLI工具(腾讯CodeBuddy、阿里Qwen Code)崛起,支持MCP协议 

五、四者关系:AI落地的"技术栈拼图"

聊到这里,可能有些兄弟还是有点晕。咱们用一张图理清这四者的关系:

┌─────────────────────────────────────────────────────────┐ │ AI Agent(智能体) │ │ 能自主规划、调用工具、执行多步骤任务的系统 │ └─────────────────────────────────────────────────────────┘ ↑ ┌───────────────┼───────────────┐ ↓ ↓ ↓ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ MCP │ │ Skill │ │ CLI │ │ 连接层 │ │ 能力层 │ │ 交互层 │ │(统一协议)│ │(专业封装)│ │(命令行) │ └─────────┘ └─────────┘ └─────────┘ 

简单理解:

  • Agent 是最终形态(能干的"数字员工")
  • MCP 是它的"神经系统"(连接外部工具的标准协议)
  • Skill 是它的"专业技能"(封装好的领域知识)
  • CLI 是开发者的"操作台"(与Agent交互的命令行界面)

六、写在最后:2026,Agent cli元年的开发者机遇

回顾2024-2026年的AI发展,有几个确定性趋势已经很明显:

  1. Agent从概念走向落地:Devin、Manus、Operator等产品的出现,证明Agent不再是PPT概念,而是真正能替代人类完成复杂任务的工具。
  2. MCP成为事实标准:虽然有人质疑MCP可能只是"昙花一现",但短期内它确实解决了AI与外部世界连接的最大痛点,生态已经形成。
  3. Skill工程化:AI应用开发正从"提示词工程"→"上下文工程"→"Skill工程"演进,封装可复用的领域知识将成为核心竞争力。
  4. CLI工具普及:编程Agent正在重塑开发工作流,未来"不会用AI写代码"可能就像"不会用IDE"一样难以生存。

给开发者的建议:

  • 如果你还没试过Claude Code或Gemini CLI,现在就去装一个,体验AI编程的效率提升
  • 关注MCP生态,学会为自己的业务场景定制MCP Server
  • 开始思考如何将你的业务知识封装为Skill,这将是AI时代的"护城河"

2026年,Agent元年的大幕已经拉开。作为技术人,我们要做的不是观望,而是躬身入局


【评论区互动】

你用过哪些AI Agent或CLI工具?体验如何?欢迎在评论区分享你的"真香"或"踩坑"经历!

如果这篇文章对你有帮助,别忘了点赞、收藏、转发三连!关注老K,持续输出硬核AI技术干货。


Read more

2026年医疗AI的可信革命全栈实现(下)

2026年医疗AI的可信革命全栈实现(下)

9.3 向量索引构建示例 文档进入向量库前,应先清洗、切分、打标签、嵌入,再写入索引。以下示例展示一种最简流程,真实环境中可替换为Milvus或Qdrant SDK。 代码清单 9-2 文档切分与索引写入 from dataclasses import dataclass from typing import Iterable import hashlib @dataclass class Chunk:     chunk_id: str     text: str     metadata: dict def chunk_document(doc_id: str, title: str, text: str, source_type: str) ->

AI中的Skills详解

AI中的Skills详解

在AI领域中,Skills指的是将特定任务的方法论、执行逻辑与资源封装成模块化单元,使AI能够像人类一样按流程稳定执行复杂任务。其核心在于将零散的工具(如函数调用)整合为完整的工作流,突破传统提示词(Prompt)的能力边界。以下是关于AI中Skills的详细解析: 一、Skills的定义与核心机制 1. 定义:Skills是将特定任务的方法论、执行逻辑与资源封装成模块化单元,使AI能够按照预设流程执行复杂任务。它类似于人类的“技能”,即执行某件事的方法论。 2. 核心机制:Skills采用“渐进式披露”(Progressive Disclosure)机制,通过分层加载信息,确保AI在需要时获取所需知识,同时最大化利用上下文效率。这种机制避免了信息过载,提高了AI的处理速度和准确性。 二、Skills的组成与特点 1. 组成: * 元数据(Metadata):包含对技能的简短描述,保存在全局上下文中,体积小,节省Tokens。 * 行动指南(Action Guide):规定AI每一步该怎么做,是真正的提示词部分。 * 资源文件(Resources)

Z-Image-Turbo LoRA教程:自定义负面提示词添加与后端策略优先级说明

Z-Image-Turbo LoRA教程:自定义负面提示词添加与后端策略优先级说明 1. 快速了解Z-Image-Turbo与LoRA技术 今天我们来聊聊一个很实用的AI图片生成工具——Z-Image-Turbo LoRA Web服务。这个工具最大的特点是能够生成高质量的亚洲风格人物图片,而且操作简单,不需要复杂的设置就能得到不错的效果。 简单来说,Z-Image-Turbo是一个专门优化过的图片生成模型,而LoRA(Low-Rank Adaptation)技术则是在这个基础上添加特定风格的小型适配器。就像给相机加了个滤镜一样,LoRA能让生成的图片保持一致的风格特点。 这个Web服务最实用的地方在于: * 内置了亚洲美女风格的LoRA模型,一键就能使用 * 提供了直观的网页界面,输入文字描述就能生成图片 * 支持调整各种参数,满足不同需求 * 自动管理历史记录,方便查看和复用 2. 环境准备与快速部署 2.1 系统要求 在开始之前,先确认你的电脑环境: * Python 3.11或更高版本 * 如果有NVIDIA显卡,建议安装CUDA驱动来加速 *

【AIGC】ChatGPT保护指令:高效提升GPTs提示词与知识库文件的安全性

【AIGC】ChatGPT保护指令:高效提升GPTs提示词与知识库文件的安全性

博客主页: [小ᶻ☡꙳ᵃⁱᵍᶜ꙳]本文专栏: AIGC |GPTs应用实例 文章目录 * 💯前言 * 💯新建未加保护指令的GPTs * 测试获取GPTs的提示词Prompt指令与知识库文件 * 💯给GPTs添加保护指令 * 方法一 * 方法二 * 方法三 * 方法四 * 💯增强GPTs安全性的其他建议 * 💯小结 * 关于GPTs指令如何在ChatGPT上使用,请看这篇文章: 【AIGC】如何在ChatGPT中制作个性化GPTs应用详解     https://blog.ZEEKLOG.net/2201_75539691?type=blog * 关于如何使用国内AI工具复现类似GPTs效果,请看这篇文章: 【AIGC】国内AI工具复现GPTs效果详解     https://blog.ZEEKLOG.net/2201_75539691?type=blog 💯前言 在 人工智能技术快速发展 的今天,ChatGPT 以其强大的对话能力和广泛的应用场景深受关注。然而,随着其功能的广泛使用,安全性问题也逐渐浮