AI Agent 入门与 Coze 零代码搭建实战指南
一、前言
AI Agent 的发展历程虽然短暂,但其成长速度却让人瞠目结舌。去年,AutoGPT 的问世,不仅在 Github 上迅速获得了极高的评价,更以其惊人的自我完成能力,让世人对 AI Agent 有了全新的认识。它不仅能够读写文件、浏览网页,还能自我审查和学习,这无疑为 AI Agent 的普及奠定了坚实的基础。

紧接着,Cognosys 的融资成功,标志着 AI Agent 在商业领域的应用已经得到了市场的认可。而 GPT-4 的发布,更是将 AI Agent 的潜力推向了一个新的高度。OpenAI 的 GPTs 和 GPT Builder,让定制化 AI 变得触手可及,无论是日常生活还是专业领域,AI Agent 都能提供更加精准和个性化的服务。然而,这仅仅是开始。随着 AI Agent 的不断进化,我们正目睹着一场前所未有的变革。从零售到房地产,从旅游到金融,各行各业都在被 AI 重构。

这不仅是技术的革新,更是对传统商业模式的一次颠覆。科技巨头们,如 OpenAI、微软、谷歌,凭借其在 AI 领域的深厚积累,已经占据了先发优势。而国内的创投圈,也在密切关注着 AI Agent 的动向,准备在这场变革中抢占先机。这是一个充满机遇的时代,也是一个充满挑战的时代。AI Agent 的浪潮已经来临,它将如何改变我们的世界?我们又该如何在这个浪潮中找到自己的位置?
二、AI Agent 介绍
什么是 Agent
在日常生活中,代理人是指以某种方式行事,在某物的生产中发挥作用的人。在当前爆火的 AI 领域,AI Agent(人工智能代理)是一种能够感知环境、进行决策和执行动作的智能体。不同于传统的人工智能,AI Agent 具备通过独立思考、调用工具去逐步完成给定目标的能力。比如,告诉 AI Agent 帮忙获取一份最新的 AI 新闻,它就可以直接调用各类新闻 APP 自动进行 AI 新闻搜索收集,再进行整理输出,无需人类去指定每一步的操作。
Agent 的概念由 Minsky 在其 1986 年出版的《思维的社会》一书中提出,Minsky 认为社会中的某些个体经过协商之后可求得问题的解,这些个体就是 Agent。他还认为 Agent 应具有社会交互性和智能性。Agent 的概念由此被引入人工智能和计算机领域,并迅速成为研究热点。AI Agent(或 LLM 智能代理)是一种可以通过以自主方式执行操作来实现预定义目标来执行更复杂任务的代理。

AI Agent 概览及组件
AI Agent 的核心底层是由机器学习算法或 LLM 等 AI 解决方案提供支持的代理,能够比常规代理完成更完整的任务。例如,对于恒温器,我们可以选择一种更复杂、更完整的解决方案,而不是基本的解决方案,它会根据我们的习惯来适应我们的供暖情况。

AI Agent 可以预测、与环境交互、具有记忆、进行推理、访问工具以及从数据集中学习的能力。他们还可以在动态环境中与用户或其他代理进行交互。
AI Agent 组件
-
传感器(Sensor):该组件负责收集来自环境的输入。其范围可以从简单的数据收集设备(例如温度传感器或摄像机)到更复杂的数据形式(例如音频输入、人类文本输入、来自互联网的文本数据,甚至实时数据)。

-
执行器(Actuator):该组件根据传感器和代理逻辑收集的数据执行代理决定采取的操作。这可能是发送电子邮件、显示信息或任何其他形式的操作。

-
数据处理(Data Processing):不同代理之间存在很大差异。它重新组合了从数据清理和规范化到更复杂的操作(例如数据提取和转换)以及做出决策所需的一切。

如 AI Agent 概览图所示,数据处理组件由很多子组件组成,例如:
- 工具/功能:用于数据处理和决策,包括软件、库、机器学习框架、NLP 库以及多媒体处理工具。
- 记忆:使 agent 能够从经验中学习并随着时间的推移而改进。
- 决策算法(或推理):允许代理根据其处理的数据、其拥有的知识和学习经验做出决策。
- 知识:agent 用来做出决策的信息、规则、事实和数据的集合。
AI Agent 应用场景
目前 AI Agent 应用场景非常多,以下是部分举例:
-
虚拟个人助理:例如 iPhone 上的 Siri 或 Android 设备上的 Google Assistant。传感器接收文本和语音,可以使用操作系统和设备提供的数据,具有搜索用户联系人列表、在互联网上执行搜索等功能。

-
导航系统:被认为是 AI Agent,因为它通过传感器处理数据(例如地图、实时交通信息),并使用这些数据来做出决策(计算最佳路线)。

-
Chatbot 聊天机器人:模拟与人类用户对话的人工智能代理。它们旨在提供相关的、上下文的和个性化的响应,使它们成为计算机和人类之间交互的智能界面。

-
警报系统:结合了运动传感器、摄像头和其他收集环境数据的传感器。使用算法来区分正常活动和可疑活动。

-
欺诈检测代理:分析交易模式以识别可能表明欺诈行为的异常情况。保护客户免受潜在欺诈。

AI Agent 类型
-
简单反射代理 (Simple Reflex Agent):最简单的代理。它根据他们对环境的感知以及预定义的规则和条件列表做出决策。适用于环境稳定的场景。
- 举例:垃圾邮件过滤器、简单的恒温器。

- 举例:垃圾邮件过滤器、简单的恒温器。
-
基于模型的反射代理 (Model-based Reflex Agent):有一个内部'记忆'。除了规则、条件和对环境的感知之外,它还可以利用之前事件和行动的历史来决定要做什么。
- 举例:自动驾驶汽车、自动消息回复系统。

- 举例:自动驾驶汽车、自动消息回复系统。
-
基于目标的代理 (Goal-based Agent):由预定义的目标驱动。为了实现其目标,它可以访问各种工具和数据。它还评估其行动的潜在影响以及采取行动的后果。
- 举例:自动驾驶汽车(目标是到达 B 点)、自动消息回复系统。

- 举例:自动驾驶汽车(目标是到达 B 点)、自动消息回复系统。
-
基于实用程序的代理 (Utility-based Agent):评估目标结果的可取性。这种评估有助于它根据最有益的结果在多个目标或行动之间进行选择。
- 举例:路线优化系统、智能恒温器。

- 举例:路线优化系统、智能恒温器。
-
基于学习代理 (Learning Agent):站在 AI Agent 的顶端。这种 agent 由于其经验而随着时间的推移提高其性能,并且无需显式编程即可适应新情况。
- 举例:垃圾邮件过滤器(使用机器学习算法)、客户促销系统。

- 举例:垃圾邮件过滤器(使用机器学习算法)、客户促销系统。
三、国内主流 Agent 平台
国内 Agent 自去年至今,尤其是今年,如雨后春笋般爆发,目前整体使用和了解下来,Coze 最得我心。

四、AI Agent 实战:Coze 从零搭建
Coze 是目前比较受欢迎的零代码创建 AI Agent 的平台之一。
4.1 从 0 到 1,快速入门 Coze
扣子 Coze 最早的是海外版 coze.com,今年才有了 coze.cn,这两个扣子最大的不同就是底层所支持的模型是不同的。coze.com 底层是 GPT4,而 coze.cn 底层是国内的云雀大模型,目前也支持月之暗面 Kimi。目前字节官方对扣子的定义为,是新一代 AI 原生应用开发服务平台。无论你是否有编程基础,都可以在扣子平台上快速搭建基于 AI 模型的各类问答 Bot,从解决简单的问答到处理复杂逻辑的对话。而且你可以将搭建的 Bot 发布到各类社交平台和通讯软件上,让更多的用户与你搭建的 Bot 聊天。
简而言之,就是一个零代码就可以玩起来的 AI 智能体创建平台。

4.1.1 扣子上面有什么
可无限拓展的插件
不仅有官方的插件、还有个人写的插件,如果你没有代码能力那么就用别人上传插件吧!如果你有代码能力,可以自己开发插件,甚至提供给别人用。

丰富的数据源 前面我们说到,agent 有一个组件是知识,对应目前很多人提到的 RAG,外挂知识库,尤其是大模型不知道的垂直领域数据,我们可以让大模型通过知识库的知识来进行回答。 所以目前扣子提供了简单易用的知识库功能来管理和存储数据,支持 Bot 与你自己的数据进行交互。无论是内容量巨大的本地文件还是某个网站的实时信息,都可以上传到知识库中。这样,Bot 就可以使用知识库中的内容回答问题了。
- 内容格式:知识库支持添加文本格式、表格格式的数据。
- 内容上传:你可以将本地 TXT、PDF、DOCX、Excel、CSV 格式的文档上传至知识库,也可以基于 URL 获取在线网页内容和 API JSON 数据。同时支持直接在知识库内添加自定义数据。

持久化的记忆能力 扣子提供了方便 AI 交互的数据库记忆能力,可持久记住用户对话的重要参数或内容。 例如,创建一个数据库来记录阅读笔记,包括书名、阅读进度和个人注释。有了数据库,Bot 就可以通过查询数据库中的数据来提供更准确的答案。
灵活的工作流设计 工作流可以简单理解为编排,即可视化的拖拖拽拽,形成一个符合自己业务 agent 的数据流转图。 扣子的工作流功能可以用来处理逻辑复杂,且有较高稳定性要求的任务流。扣子提供了大量灵活可组合的节点包括大语言模型 LLM、自定义代码、判断逻辑等,无论你是否有编程基础,都可以通过拖拉拽的方式快速搭建一个工作流。
- 创建一个搜集电影评论的工作流,快速查看一部最新电影的评论与评分。
- 创建一个撰写行业研究报告的工作流,让 Bot 写一份 20 页的报告。

有输入有输出,中间是用于处理各种逻辑的,目前是人为去编排,所以一定意义上 agent 还是在人为去创建,而不是真正完全意义上的 agent。目前字节给出用户这样的一个 agent 创建产品,一定程度上是在培养用户的同时,也在深挖底层真正能够商业化落地的 agent。

4.1.2 扣子上面可以做什么
扣子的核心就是构建 AI Bot,即 AI 机器人。但是在实际使用过程中,很多人会困惑平台上的 AI Bot 与 agent 的关系,其实 AI bot 的底层就是 agent,这个 AI bot 可能是一个 agent 构成的,也可能是多个 agent 构成的,核心是最终能够构建符合业务需求的 AI Bot。

基于前面提到的功能,那么就可以做什么。例如开发插件分享出来,或者创建 AI bot 分享出来放在 AI bot 商店等等。也可以创建含有不同个数 agent 的 AI bot。
4.1.3 快速创建 AI bot
一句话创建 AI bot
打开链接,什么都不用调整,直接在右侧调试,好像效果也不错!
点击发布。

私有配置:不论是私有配置还是公有配置都不影响自己的使用,主要是否希望别人看到你的配置,仅此区别。

AI bot 分类:

发布成功:
点击立即对话:

同时也可以分享给其他人使用你的 AI bot:

第一个 AI bot(单 Agent)创建完成了!

五、总结
本文详细介绍了 AI Agent 的基本概念、核心组件、应用场景及五种主要类型,并重点演示了如何使用 Coze 平台零代码构建 AI Bot。通过简单的配置和发布流程,用户可以快速体验 AI Agent 的强大能力。未来,随着 AI 技术的进一步发展,AI Agent 将在更多领域发挥重要作用,建议开发者关注相关技术动态,积极尝试新的工具和方法。

