AI 中的skill、mcp和 Function Call

优质文章学习记录

08 Apr 2026 — 8 min read

Skill（技能）、MCP（模型上下文协议） 和 Function Call（函数调用） 这三个概念。

简单来说，你可以这样理解：

Function Call 是基础的、标准的“能力调用机制”。
Skill 是面向用户的、打包好的“功能产品”。
MCP 是连接 AI 与外部资源和工具的“新一代通信协议”。

1. Function Call（函数调用）

这是最基础、最广泛使用的概念，主要由 OpenAI 在 2023 年 6 月引入并普及。

是什么：一种让大语言模型（如 GPT-4）能够智能地决定在何时、以何种参数调用开发者预先定义好的函数（或工具） 的机制。它不是直接执行代码，而是输出一个结构化的调用请求。
如何工作：
1. 定义：开发者向模型描述一系列可用的函数（包括函数名、描述、参数列表及参数类型）。
2. 决策：用户提问后，模型根据对话上下文判断是否需要调用函数，以及调用哪个函数、参数是什么。
3. 响应：模型返回一个结构化的 JSON 对象（如 {“name”: “get_weather”, “arguments”: {“location”: “Beijing”}}），而不是自然语言。
4. 执行：应用程序收到这个 JSON 后，在本地或服务器端实际执行对应的代码，获取结果（如调用天气 API）。
5. 回复：将执行结果返回给模型，模型再组织成自然语言回复给用户。
特点：
- 标准化：已成为众多模型（OpenAI， Anthropic，国内大模型等）支持的标准特性。
- 核心机制：是实现 AI 与外部世界交互的基石。
- 开发层：主要面向开发者，用户感知不强。

示例：你问“北京天气怎么样？”，模型不是瞎猜，而是“调用”了你定义的 get_weather(location) 函数，并将 API 返回的真实数据告诉你。

2. Skill（技能）

这是一个更高层、更产品化的概念，常见于 AI 智能体（AI Agent）和 AI 应用平台（如扣子/Coze, GPTs, Dify）。

是什么：一个封装好的、可重复使用的功能模块或 AI 能力。一个 Skill 内部可能包含提示词、知识库、一个或多个 Function Call、工作流等。
如何工作：
1. 构建：在平台上通过可视化或配置化的方式，将一个完整的能力打包。例如，一个“订机票”Skill 可能包含：查询航班、获取价格、填写订单等多个步骤或函数。
2. 调用：用户通过自然语言触发（如“我想去上海”），AI 智能体自动识别并调用最匹配的 Skill。
3. 执行： Skill 作为一个整体在后台运行，可能串联多个动作，最终返回结果。
特点：
- 产品化：是终端用户可以直接理解和使用的东西（如“翻译技能”、“画图技能”）。
- 可组合性：可以在智能体中安装多个 Skills，让它具备多种能力。
- 封装性：隐藏了底层复杂的函数调用和逻辑，提供端到端的体验。

示例：在 Coze 平台上，你安装了一个“全网搜索” Skill。当用户问“最近有什么科技新闻？”时，你的 Bot 会自动使用这个 Skill 去搜索并返回结果。这个 Skill 底层就是通过 Function Call 来调用搜索 API。

3. MCP（Model Context Protocol，模型上下文协议）

这是一个由 Anthropic 提出并主导的开放协议，旨在标准化 AI 模型与外部资源（服务器、数据库、API 等）的交互方式。可以看作是 Function Call 的“进化版”或“标准化版本”。

是什么：一个客户端-服务器协议。它定义了一套标准，让任何兼容 MCP 的“服务器”（提供资源的工具）都能轻松地被任何兼容 MCP 的“客户端”（AI 应用或 IDE）使用。
如何工作：
1. 服务器：任何工具（如文件系统、数据库、日历 API）都可以实现为 MCP 服务器，它向客户端宣告自己提供哪些“资源”和“工具”。
2. 客户端： AI 应用（如 Claude Desktop， Cursor IDE）作为 MCP 客户端，启动时可以连接一个或多个 MCP 服务器。
3. 通信：客户端和服务器通过标准的 JSON-RPC 消息进行通信。当用户需要时，客户端会从服务器获取资源列表或调用工具，并将结果提供给 AI 模型。
特点：
- 协议化与标准化：解决了不同 AI 模型和工具之间“各自为政”的问题。工具开发者只需实现一次 MCP 接口，就能被所有支持 MCP 的 AI 使用。
- 动态发现：客户端可以动态地发现服务器提供的工具，无需在提示词中硬编码。
- 资源概念：不仅限于“工具/函数”，还引入了“资源”（如文件、数据库条目）的概念，AI 可以读取资源内容作为上下文。
- 安全性：连接通常本地化，资源访问可控，比传统的将 API 密钥暴露给模型更安全。

示例：你在本地运行了一个 sqlite MCP 服务器和一个 filesystem MCP 服务器。当你使用 Claude Desktop 时，你可以直接说：“请查询我/projects目录下的schema.sql文件，然后根据它告诉我数据库中有哪些表。” Claude 会通过 MCP 协议读取文件内容，并调用 SQLite 工具执行查询，整个过程无需你手动配置复杂的 Function Call。

总结对比

特性	Function Call	Skill	MCP
层级	基础机制（原子操作）	产品模块（功能集合）	通信协议（基础设施）
目标	让模型能调用单个外部函数	为用户提供完整的、可复用的能力	标准化模型与外部工具的交互方式
面向对象	开发者	终端用户 / 低代码开发者	工具开发者 & AI 应用开发者
关键优势	直接、灵活、广泛支持	易用、可组合、端到端	标准化、可发现、安全、资源感知
类比	单个“积木”	打包好的“乐高套装”	统一的“积木连接接口标准”

维度	Function Call	Skill	MCP
抽象层级	模型原生接口	应用功能模块	通信协议标准
厂商绑定	是（OpenAI/Anthropic 等）	否（框架无关）	否（开放标准）
互操作性	低（各厂格式不同）	中（依赖框架）	高（统一协议）
开发复杂度	低（直接用 API）	中（需封装逻辑）	中（需实现 server）
适用场景	快速集成简单工具	构建复杂 Agent	企业级多模型/多工具集成

Function Call 是"脑"：决定做什么
MCP 是"神经系统"：传递信号到手脚
Skill 是"职业技能"：知道如何专业地做事

关系与趋势

Skill 建立在 Function Call 之上：一个复杂的 Skill 内部会利用多次 Function Call 来完成工作。
MCP 可以视为 Function Call 的标准化演进：它提供了更丰富、更安全、更动态的工具调用和资源访问方式。未来，AI 应用的“Function Call”能力很可能通过 MCP 协议来实现。
MCP 赋能 Skill 开发：在支持 MCP 的平台上，开发 Skill 可以更简单，直接接入丰富的 MCP 服务器资源，而无需从零编写每一个函数。

演进趋势（截至 2026 年）

短期：Function Call + Skill 是主流（如 LangChain + OpenAI）。
中期：MCP 逐渐被 IDE（如 Cursor）、AI 平台（如 Databricks）采用，成为“AI 操作系统”的一部分。
长期：MCP 可能成为类似 HTTP 的基础协议——任何 AI 都能通过 MCP 访问世界上的服务。

💡 类比：Function Call ≈ 浏览器原生的 fetch()Skill ≈ 封装好的 Axios 或 SDKMCP ≈ RESTful API 标准 + OpenAPI 规范

总结

Function Call 是能力基础：没有它，LLM 无法与外部世界交互
MCP 是连接标准：没有它，每个工具都需要定制开发集成（N×M 问题）
Skill 是价值封装：没有它，AI 只是工具的执行者，而非业务专家

基于ROS的视觉导航系统实战：黑线循迹+激光笔跟随双模态实现（冰达机器人Nano改造）

本篇内容是对另一篇文章《双轮智能平衡车基于图像识别技术探究道路自动驾驶理论模型与应用》的补充，有兴趣的同学可以先去那篇文章补一下课，再来看本篇文章效果更佳哦！！！同时本次分享内容资源均同步上传至github与ZEEKLOG，想要深入学习的同学可以去下载学习！！（资源名称：基于ROS的视觉导航系统实战）话不多说让我们进入正题吧！在机器人室内导航场景中，视觉导航凭借低成本、高灵活性的优势成为教育机器人与服务机器人的主流方案。本文基于冰达机器人Nano系列进行硬件改造与软件开发，搭建了一套基于ROS的轻量级视觉导航系统，实现黑线循迹与红外激光笔动态跟随双模态功能。系统兼容ROS Melodic/Noetic版本，针对冰达机器人Nano的算力与底盘特性进行深度优化，低算力依赖、实时性强，非常适合入门级机器人开发者学习与二次拓展。本文将从项目设计、硬件改造、环境配置、代码实现、运行调试到扩展方向进行全流程精细讲解，并附上完整可运行代码与问题排查指南。目录 1. 项目概述与核心亮点 2. 硬件配置与冰达机器人Nano改造方案 3. 软件环境配置（含版本适

【GitHub项目推荐--Video2Robot：从视频到机器人动作的端到端生成管道】⭐

简介 Video2Robot 是由AIM-Intelligence开发的开源项目，是一个端到端的管道系统，能够将视频或文本提示转换为机器人可执行的运动序列。在机器人技术、动画制作和虚拟现实快速发展的今天，如何让机器人执行自然、流畅的人类动作成为关键挑战。传统方法需要专业动画师手动设计动作，或通过复杂的运动捕捉系统，过程耗时耗力且成本高昂。Video2Robot应运而生，通过整合先进的视频生成、人体姿态提取和运动重定向技术，实现了从简单描述到机器人动作的自动化转换。核心价值： * 自动化流程：将复杂的手动设计过程自动化，显著提高效率 * 自然动作生成：基于真实人类动作生成自然流畅的机器人运动 * 多模态输入：支持文本提示、现有视频、图像参考等多种输入方式 * 广泛兼容性：支持多种主流机器人平台，包括Unitree、Booster等项目定位：Video2Robot填补了自然语言/视频到机器人动作转换的技术空白。与需要专业设备和复杂流程的传统运动捕捉系统不同，该项目通过软件管道实现了低成本、高效率的动作生成。项目特别注重易用性和可扩展性，通过模块化设计支持不同组件的替换和

*ARINC 825，一种航电通信总线标准

1. 它是什么 ARINC 825 是一个航空电子领域的技术标准，主要规范了在航空器内部如何使用一种名为“控制器局域网”（CAN）的数据总线进行通信。可以把它理解为航空界为CAN总线制定的一套精细的“交通规则”和“车辆制造标准”。在生活中，CAN总线类似于小区或办公楼里的内部电话网络，各个房间（设备）可以通过这个网络互相通话。而ARINC 825 则详细规定了在这个高端、高安全要求的“航空大厦”里，这个内部电话应该用什么线路、怎么拨号、说什么语言、通话的优先级如何安排，以确保沟通绝对可靠、有序。 2. 它能做什么它的核心作用是实现航空器上不同电子设备之间稳定、高效、可预测的数据交换。这些设备包括飞行控制系统、发动机指示系统、舱内压力控制系统等。例如，想象一架飞机的机翼上有多个传感器，监测结冰情况。这些传感器需要将“探测到冰”这个消息快速、可靠地告知除冰系统和飞行员显示面板。ARINC 825 确保了这条关键消息能在复杂的电子环境中，像消防通道一样，拥有最高优先级，

无人机地面站QGC的安装（ubuntu20.04）

无人机地面站QGC的安装（ubuntu20.04） 1.安装依赖使用以下命令： sudo usermod -a -G dialout $USER sudo apt-get remove modemmanager -y sudo apt install gstreamer1.0-plugins-bad gstreamer1.0-libav gstreamer1.0-gl -y sudo apt install libfuse2 -y sudo apt install libxcb-xinerama0 libxkbcommon-x11-0 libxcb-cursor0 -y 2.下载安装包可以直接去官网下载，链接地址:https://docs.qgroundcontrol.com/master/en/qgc-user-guide/