后端开发者快速上手AI Agent:基于Astron的极简概念、架构与部署教程

后端开发者快速上手AI Agent:基于Astron的极简概念、架构与部署教程
文章目录1、先搞清楚一个问题:什么是 Agent?2、LLM 和 Agent3、Agent(智能体)核心概念3.1 Agent 定义3.2 Agent 能力4、Agent 原理5、Astron Agent(星辰 Agent)是什么6、Astron Agent 核心组件与架构设计6.1 企业级云服务的`基础设置`6.2 Agent的大脑 -- `模型底座`6.3 Agent为什么能干活 -- `企业级核心能力`6.4 Agent 的创建 -- `智能体开发`6.5 Agent 的优化 -- `智能体调优`6.6 `企业级开发与管控`6.7 Astron 开放生态 -- `开放的生态平台`7、Astron 产品功能特性7.1 产品功能特性7.2 关键技术特性8、Astron 服务架构8.1 外部集成服务8.2 控制层后端层8.3 核心微服务层8.4 插件系统9、Docker Desktop 容器化部署效果

1、先搞清楚一个问题:什么是 Agent?

    话不多说,咱们直接开始~

    在开始讲 Astron Agent 智能体之前,我们先统一一个认知。

  • LLM(大语言模型)
    更像一个“聪明的问答系统”,负责思考和回答问题
  • Agent(智能体)
    不只是回答问题,而是可以:
    拆解任务
    调用工具
    执行动作
    记住上下文
    不断优化结果

一句话区别:LLM 负责“想”,Agent 负责“把事情做完”。

2、LLM 和 Agent

    LLM 是接收输入、理解语义、生成内容、输出文本的被动响应式语言模型

    Agent 是能够感知环境、理解指令、制定步骤并执行任务的智能体

    我们熟悉并常常使用 LLM 大模型,但可能很少用到 Agent。

    我们都知道 LLM 是大语言模型,市场上最好的大语言模型有GPT(OpenAI)、Gemini(Google)、ChatGLM(智谱清言)、通义千问(阿里巴巴)、讯飞星火(科大讯飞)等。

    我们常打开网页版对话窗口,将大模型作为技术顾问,主动问一些问题,大模型在很短的思考时间后给出我们解决问题的建议。我们采纳这些建议就按照建议去处理问题,认为回答内容没有解决问题,可以继续追问大模型。

在这里插入图片描述

    假设你下班后很累,想吃一顿外卖,但你不知道该怎么点、点什么。


(1)你去问 LLM(大语言模型)

    LLM 的角色更像一个顾问,它只负责告诉你应该怎么做,真正的操作(打开 App、下单、支付)全部需要你自己完成

    LLM 会思考、会回答,但不行动

    你对 LLM 说:

“我想点一份外卖,不知道该怎么点、点什么。”

    LLM 会回答你类似这样的话:

打开外卖 App注册或登录账号搜索你想吃的菜品选择商家并下单支付并等待配送

(2)你去问 Agent(智能体)

    Agent 不只是告诉你怎么做,而是直接帮你把事情做完。

    Agent 会思考、会规划、还能调用工具并真正执行行动

    你对 Agent 说:

“我想点一份外卖。”

    Agent 会这样做:

理解你的目标:解决吃饭问题主动思考方案:是点外卖、做饭还是去附近吃调用工具:打开外卖平台执行步骤:搜索你常点的餐厅选择合适的套餐下单并支付完成任务:把外卖点好,并告诉你“已下单,预计 30 分钟送达”

3、Agent(智能体)核心概念

3.1 Agent 定义

    Agent 是能够感知环境、理解指令、指定步骤、执行任务的自主"执行人",不依靠固定流程,能在不确定场景中,自主选择步骤,调整策略。

3.2 Agent 能力

    具备感知环境、认知能力、行动、闭环的能力。

  • 感知环境
    感知环境指Agent具备读取外部数据的能力
    支持多模态输入,比如文本、文档、图片、音频、视频等数据可以作为Agent的外部输入,Agent接收输入后,对输入内容进行意图识别并输出符合预期的结果。
  • 认知能力
    指 Agent 能够理解用户的指令,分析用户的意图,并制定合适的目标,形成执行步骤
  • 行动
    Agent 能够用接口、工具或直接生成内容来完成既定的执行步骤。观察结果再调整下一步
  • 闭环
    Agent 能够形成自我闭环。
    比如某个API调用失效,Agent会切换策略,切换执行计划;某个采集的数据集是不齐全的,会再次从网络抓取;如果执行结果有问题,会尝试其他策略来达成计划目标。

4、Agent 原理

在这里插入图片描述

    Agent 基本框架大概分为记忆、规划、工具、行动4个模块。

(1)记忆模块

    短期记忆:
    维持对话的连贯性,用于临时保存当前对话的上下文

    长期记忆:
    类似于知识库,用于存储智能体学到的经验,重要事实,用户偏好等持久化信息。
    记忆模块使Agent 能够拥有连续性和个性化

(2)规划

    这是智能体思考的过程,面对复杂目标时,智能体会将目标分解为可执行的子任务序列。

    反思与自我反思:这是Agent的关键,指智能体能够评估自身行动结果,修正错误,优化后续计划,实现持续改进。

(3)工具

    智能体扩展工具,自身能力外的插件,可以调用这些工具,突破纯文本处理的瓶颈,与现实世界(比如获取实时信息、操作外部系统)进行交互

(4)行动

    智能体执行步骤的执行环节。

    智能体根据规划,综合运用记忆和工具,执行具体的操作(比如生成回答,调用API,修改文件等)。

5、Astron Agent(星辰 Agent)是什么

在这里插入图片描述

    讯飞星辰Agent平台是科大讯飞自研,面向国内的企业级Agent开发平台。Astron 是科大讯飞推出的一款开源共建智能体平台。

    Astron Agent 平台搭建了一套从基础设置、模型底座开始,具备AI能力、RAG知识库、RPA、记忆能力、测评工具、MCP、代码解释器等核心组件的智能体开发平台。并且能规模化管控,支持企业级高可用部署。

    Astron 能帮助你不用从零写 AI 系统,就能搭建高可用、企业级的商用 AI Agent。

6、Astron Agent 核心组件与架构设计

在这里插入图片描述

    从整体上看,Astron Agent 平台可以拆成 7 个层次:

  • 企业级云服务基础设施
  • 模型底座
  • 核心能力组件
  • 智能体开发
  • 智能体调优
  • 企业级开发与管控
  • 开放的生态平台

6.1 企业级云服务的基础设置

    基础设置提供了算力、存储、网络、安全、稳定性等服务。

    比如阿里云、华为云等公有云服务。我们可以把服务部署到这些云服务器,当然也可以本地部署。Astron 提供了 Docker Compose、Helm两种部署方式,满足不同的场景需求。

6.2 Agent的大脑 – 模型底座

    支持本地部署的模型、支持OpenAI Link API、支持讯飞星辰Maas

    这里 Astron 不限制单一模型,支持私有化模型,支持国内/海外模型灵活切换。企业或个人完全可以基于实际场景选择不同的大模型底座。

6.3 Agent为什么能干活 – 企业级核心能力

    Agent 不只能回答用户的问题(传统的聊天机器人),还能查资料、算数据、操作系统、执行流程。

    核心能力包括插拔式知识库、AI能力、RPA、记忆、MCP、测评工具、代码解释器。

6.4 Agent 的创建 – 智能体开发

    支持多种交互形态,文本、图片、语音、虚拟人、实时语音通话

    支持多种智能体形态,单智能体、多智能体、工作流驱动

    这里的智能体形态可以理解为,1个智能体单独干活,多个智能体组合干活,工作流驱动指的是可按照流程自动的执行任务。

6.5 Agent 的优化 – 智能体调优

    实际场景中搭建的智能体,不会是一次搭建就能解决业务中的问题,往往会遇到各种现实问题,使得企业很难落地。

    搭建智能体后,需要持续调优,具体措施包括Prompt开发、多维度评测、全链路观测、效果优化。

    需要开发者看清 Agent 每一步在想什么、做什么,然后不断调优。

6.6 企业级开发与管控

    Astron 提供的企业级开发管控能力是 Agent 从个人Demo到企业化生产力工具的关键。

    Astron 提供了低代码开发、场景模板、组织架构、权限管控、授权管理、安全审核、监控运营、团队空间等能力,使得企业级开发管控得以实现。

6.7 Astron 开放生态 – 开放的生态平台

    Astron 不是封闭的开发平台,允许对接讯飞开放平台 AI 能力、Astron RPA 平台、虚拟人平台、AIUI 超拟人交互平台、Zapier等,来和外部进行交互。

    Agent 可以真正进入企业系统、第三方工具和真实业务流程。

7、Astron 产品功能特性

7.1 产品功能特性

  • 多类型智能体开发
    简易版 – 提示词驱动的智能体
    进阶版 – 工作流驱动的智能体
    专业版 – 集成RPA、语音交互虚拟人智能体
  • 多类型模型接入
    提供云API接入、本地部署、企业级私有化部署方案
    满足企业私有化、高并发,高可用的业务场景
  • 全流程智能体优化
    提供开发、调试、评测、优化全流程闭环能力。支持实时干预、变量追踪、多维性能分析
  • 企业级开发管控
    支持灵活的权限管控,内置数据看板实时呈现关键指标,助理敏捷优化Agent构建策略

7.2 关键技术特性

  • 流式多模态引擎
    支持多模态输入,包括文本、文档、图像、音频、视频
    支持多模态输出,包括文本、文档、图像、音频、视频
    使用了复杂流程编排引擎,上下文管理机制,丰富的能力节点来驱动工作流Agent。
  • Astron RPA “最强双手”
    支持Windows桌面软件与浏览器,实现跨应用,端到端的自动化。
    内置300+原子能力,支持图形化编排,自定义扩展
    深度集成Astron Agent。支持RPA与AI的双向调用。
  • 企业级评测能力
    功规驱动的端到端效果评测体系
    丰富的评测能力Agent
    全维度复刻人工评测

8、Astron 服务架构

在这里插入图片描述


    Astron 采用微服务架构,由十个核心服务组成,每个服务专注于特定的业务领域,并通过容器化方式独立部署。

    Astron 还集成了Casdoor、Ragflow、RPA开源框架来实现单点登录、知识增强检索、流程自动化能力。

8.1 外部集成服务

  • Casdoor
    Casdoor 是一个基于OAuth 2.0的开源的身份认证平台。Astron 基于Casdoor实现的单点登录。
  • Ragflow
    Ragflow 是一款开源的知识库平台,将RAG技术和Workflow深度融合,提供了一个精准可控的自动化的企业级知识管理解决方案。
  • RPA
    AstronRPA 是一款企业级机器人流程自动化桌面应用。通过可视化设计器支持低代码开发,快速构建工作流,实现桌面软件与浏览器页面自动化。
    用户可以在 Astron Agent 中直接调用RPA流程节点,实现RPA与Agent的高效协同。

8.2 控制层后端层

    用户认证和权限管理

    模型管理和配置接口

    文件上传下载服务

    数据统计分析

    core服务接口

8.3 核心微服务层

  • Agent Service 智能体服务
    Agent 核心执行引擎
    Agent 生命周期管理
    工具调用和插件集成
    会话管理和上下文持久化
  • Workflow Service 工作流服务
    工作流编排和执行引擎
    多步骤流程自动化
    工作流版本管理
    事件驱动的异步处理
    工作流可视化运行时调试
  • Knowledge Service 知识库服务
    知识库管理
    多种文档格式解析
    RAG支持星火知识库和Ragflow
  • Memory DB Service 内存数据库服务
    对话历史存储和检索
    上下文管理,调用长期记忆和短期记忆
    会话数据持久化
  • Tenant Service 租户服务
    多租户管理
    空间隔离与权限控制
    组织结构管理
    资源配额管理
  • Common Service 公共模块
    提供公共服务和工具类
    认证和审计服务
    可观测性支持
    基础设置组件数据库(MySQL、PGSQL)、缓存(Redis)、消息队列(kafka)
    统一的日志系统
    OSS(MinIO)对象存储集成

8.4 插件系统

  • AI Tools
    集成讯飞AI工具,通过iFLYTEK API集成
    第三方AI工具集成
    工具调用管理和结果缓存
  • RPA
    RPA流程自动化
    流程录制和回放
    自动化脚本执行
    与外部RPA执行器集成
  • LINK
    外部链接资源集成
    URL内容抓取处理
    链接验证和元数据提取

9、Docker Desktop 容器化部署效果

    部署过程可以参考下一篇博客:企业级AI Agent本地化部署实战:基于讯飞星辰与Astron的实战详解(附避坑清单)

在这里插入图片描述


在这里插入图片描述


在这里插入图片描述
Powered By niaonao
https://github.com/iflytek/astron-agent
企业级AI Agent本地化部署实战:基于讯飞星辰与Astron的实战详解(附避坑清单)

Read more

安装 启动 使用 Neo4j的超详细教程

安装 启动 使用 Neo4j的超详细教程

最近在做一个基于知识图谱的智能生成项目。需要用到Neo4j图数据库。写这篇文章记录一下Neo4j的安装及其使用。 一.Neo4j的安装 1.首先安装JDK,配环境变量。(参照网上教程,很多) Neo4j是基于Java的图形数据库,运行Neo4j需要启动JVM进程,因此必须安装JAVA SE的JDK。从Oracle官方网站下载 Java SE JDK。我使用的版本是JDK1.8 2.官网上安装neo4j。 官方网址:https://neo4j.com/deployment-center/  在官网上下载对应版本。Neo4j应用程序有如下主要的目录结构: bin目录:用于存储Neo4j的可执行程序; conf目录:用于控制Neo4j启动的配置文件; data目录:用于存储核心数据库文件; plugins目录:用于存储Neo4j的插件; 3.配置环境变量 创建主目录环境变量NEO4J_HOME,并把主目录设置为变量值。复制具体的neo4j文件地址作为变量值。 配置文档存储在conf目录下,Neo4j通过配置文件neo4j.conf控制服务器的工作。默认情况下,不需

企业微信群机器人Webhook配置全攻略:从创建到发送消息的完整流程

企业微信群机器人Webhook配置全攻略:从创建到发送消息的完整流程 在数字化办公日益普及的今天,企业微信作为国内领先的企业级通讯工具,其群机器人功能为团队协作带来了极大的便利。本文将手把手教你如何从零开始配置企业微信群机器人Webhook,实现自动化消息推送,提升团队沟通效率。 1. 准备工作与环境配置 在开始创建机器人之前,需要确保满足以下基本条件: * 企业微信账号:拥有有效的企业微信管理员或成员账号 * 群聊条件:至少包含3名成员的群聊(这是创建机器人的最低人数要求) * 网络环境:能够正常访问企业微信服务器 提示:如果是企业管理员,建议先在"企业微信管理后台"确认机器人功能是否已对企业开放。某些企业可能出于安全考虑会限制此功能。 2. 创建群机器人 2.1 添加机器人到群聊 1. 打开企业微信客户端,进入目标群聊 2. 点击右上角的群菜单按钮(通常显示为"..."或"⋮") 3. 选择"添加群机器人"选项 4.

Flowise物联网融合:与智能家居设备联动的应用设想

Flowise物联网融合:与智能家居设备联动的应用设想 1. Flowise:让AI工作流变得像搭积木一样简单 Flowise 是一个真正把“AI平民化”落地的工具。它不像传统开发那样需要写几十行 LangChain 代码、配置向量库、调试提示词模板,而是把所有这些能力打包成一个个可拖拽的节点——就像小时候玩乐高,你不需要懂塑料怎么合成,只要知道哪块该拼在哪,就能搭出一座城堡。 它诞生于2023年,短短一年就收获了45.6k GitHub Stars,MIT协议开源,意味着你可以放心把它用在公司内部系统里,甚至嵌入到客户交付的产品中,完全不用担心授权问题。最打动人的不是它的技术多炫酷,而是它真的“不挑人”:产品经理能搭出知识库问答机器人,运营同学能配出自动抓取竞品文案的Agent,连刚学Python两周的实习生,也能在5分钟内跑通一个本地大模型的RAG流程。 它的核心逻辑很朴素:把LangChain里那些抽象概念——比如LLM调用、文档切分、向量检索、工具调用——变成画布上看得见、摸得着的方块。你拖一个“Ollama LLM”节点,再拖一个“Chroma Vector

OpenClaw配置Bot接入飞书机器人+Kimi2.5

OpenClaw配置Bot接入飞书机器人+Kimi2.5

上一篇文章写了Ubuntu_24.04下安装OpenClaw的过程,这篇文档记录一下接入飞书机器+Kimi2.5。 准备工作 飞书 创建飞书机器人 访问飞书开放平台:https://open.feishu.cn/app,点击创建应用: 填写应用名称和描述后就直接创建: 复制App ID 和 App Secret 创建成功后,在“凭证与基础信息”中找到 App ID 和 App Secret,把这2个信息复制记录下来,后面需要配置到openclaw中 配置权限 点击【权限管理】→【开通权限】 或使用【批量导入/导出权限】,选择导入,输入以下内容,如下图 点击【下一步,确认新增权限】即可开通所需要的权限。 配置事件与回调 说明:这一步的配置需要先讲AppId和AppSecret配置到openclaw成功之后再设置订阅方式,