别再只会CRUD了！Java程序员用Spring AI转型AI Agent开发，薪资翻倍不是梦！

Ne0inhk

26 Mar 2026 — 11 min read

1 概述

随着AI大模型底层技术的不断突破，大模型解决实际问题的能力也在千行百业展现。在此，我们听到最多的一个词就是“AI Agent”，那什么是AI Agent，什么是Agent开发，以及与Agent开发相关的一些技术栈，本文将以一个JAVA应用开发工程师的视角来一探究竟。

1.1 什么是AI Agent

根据百度翻译，Agent 的中文意思是“代理人”，因此从字面意义来讲，AI Agent就是 AI代理人的意思。结合目前AI主要指大模型技术，尤其是大语言模型技术（Large Language Model，LLM），因此，AI Agent又可进一步理解为大语言模型的代理。具体的，AI Agent是指基于人工智能大模型，如DeepSeek-R1，开发的软件应用，它作为大模型的代理，接收用户的自然语言指令，配合大模型来完成特定的业务场景功能。

1.2 AI Agent开发现状

目前，AI Agent的主流开发语言是Python，这到不是说其它开发语言无法进行基于大模型的应用研发，而是Python语言在前期以模型和算法研发为主的AI领域，积累了大量生态，这样用Python来开发相对更方便一点。比如，目前AI Agent开发的主流框架是LangChain，它就是一个面向Python的开发框架。

而在JAVA领域，Spring官方也借鉴LangChain相应推出了一个大模型应用开发框架Spring AI，同时，国内阿里进一步对该框架作升级，推出了Spring AI Alibaba框架，以更符合国内的Agent开发生态。由于自互联网发展以来，JAVA技术栈积累了最大的应用开发生态系统（不管是人员规模，还是技术生态），相信在不久的将来，AI Agent的研发人员中，JAVA开发人员会占据重要的席位。

再说就业市场，Agent的研发，是目前最热门的方向（没有之一），类似于早年的移动互联网，而且整个行业处于较早期阶段。虽说现在经济大环境不好，企业人力资源在收缩，但Agent研发方向的岗位，还是很多的，而且普遍薪资偏高，如下是从猎聘网搜到的Agent研发岗位。

1.3 AI Agent开发概述

Agent与大模型之间的交互，主要围绕着一个对话接口（以下称chat接口）展开，如下为DeepSeek类模型提供的chat接口，且各大模型厂家的chat接口格式都大同小异，都是参照的openai接口格式。

因此，对于Agent开发者来说，其一个核心工作就是如何调用chat接口，以让大模型来作正确的回答。但大模型并不总是能正确回答用户的提问，这是由大模型本身的局限性决定的：

（1）没有记忆

大模型的chat接口是无状态的，因此与大模型的每次交互都是独立的，大模型本身不会在两次对话间保存上下文信息。

（2）知识有限

大模型本身的知识储备，只代表了它在训练期间的知识输入。一旦提问范围超出了它的知识储备，它无法正确回答用户的提问。

（3）无法调用外部资源

大模型本身，只能回答用户的提问，而无法直接调用外部的资源，去增强模型的知识储备或执行用户特定的指令。

对于以上大模型在回答问题时的局限性，在Agent端各有相应的解决方案来增强模型的能力。

对于大模型没有记忆的问题，可以在Agent端做session处理，且保存对话历史记录。每次与大模型交互时，把当前对话session内合适的对话记录，连同当次提问一起发送给大模型，这样在当次对话中，大模型在作回答时，就能和历史的记录关联起来。

对于大模型知识有限的问题，有专门的RAG技术（Retrieval-Augmented Generation，检索增强生成），该技术简单来说，就是在Agent端构建一个知识库，在每次Agent向大模型发起提问时，会先去这个知识库中搜索出相关性较高的知识，并把这些知识与原始的用户提问一起发送给大模型，大模型会结合所发送的额外知识来回答用户的提问。

RAG技术典型的技术架构如上图所示，它包含两个过程：（1）知识的向量化，（2）提问的相似性检索。首先，在知识库构建阶段，把知识向量化成一个多维数组，存储到向量库中（也会存储向量化前的知识信息）。接着，在用户提问时，将用户的提问以同样的规则进行向量化，向量化后的提问，发给向量库去作相似性检索（其实就是向量间的距离计算和排序），搜索出相似性较高的知识。这些相似的知识信息，会连同原始用户提问一起发送给大模型作处理，以得到合适的回答。

对于无法调用外部资源的问题，可以让Agent来执行真正的资源调用，并把调用的结果通过chat接口反馈给大模型，这样就相当于大模型间接拥有了调用外部资源的能力。但前提是，Agent要告诉大模型，它所能调用的外部资源有哪些，以及调用方式。告知的方式，也是通过chat接口把资源信息连同原始提问发送给大模型，大模型若需要调用外部资源来回答用户的提问，则会在返回中通过特定的协议，指示Agent去作外部资源的调用。基于该原理，有专门的Function Call、MCP（Model Context Protocol）等技术来支撑大模型对外部资源的调用能力。

2 JAVA开发AI Agent

如前文所述，目前与大模型对接的Agent开发，主要还是基于Python技术栈。但由于JAVA在互联网时代积累了大量的用户规模和技术生态，以及大模型的对接本身与语言无关，随着开源社区和互联网巨头（如阿里）的引领，用JAVA来开发Agent会逐渐增多。

2.1 JAVA开发框架

Spring AI是JAVA开发AI Agent的基础代码框架，由Spring官方负责维护。国内阿里，在此基础上，结合自身AI生态，又发展了Spring AI Alibaba，极大方便了国内JAVA开发人员。两者分别于2025年5月和6月发布了首个GA版本，即正式版本。

Spring AI定位为AI Agent开发的底层框架能力，提供了Agent开发所需的底层抽象，如模型通信、提示词、检索增强生成、对话记忆、工具调用、模型上下文协议等。Spring AI Alibaba依赖于Spring AI框架，在实际应用层面作了更高层级的封装，同时深度集成了阿里内部的一些产品和服务，如阿里云百炼平台。在实际项目中，推荐用Spring AI Alibaba，它对国内用户更为友好，提供了详尽的中文学习文档，中文讨论社区，以及国内的AI生态支持。

2.2 典型开发案例

本文基于Spring AI Alibaba对Agent开发作简单探索，代码见：https://gitee.com/gbs-blog/llm-app-sample

那么，如何系统的去学习大模型LLM？

作为一名深耕行业的资深大模型算法工程师，我经常会收到一些评论和私信，我是小白，学习大模型该从哪里入手呢？我自学没有方向怎么办？这个地方我不会啊。如果你也有类似的经历，一定要继续看下去！这些问题啊，也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点，给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢，我就曾放空大脑，以一个大模型小白的角度去重新解析它，采用基础知识和实战项目相结合的教学方式，历时3个月，终于完成了这样的课程，让你真正体会到什么是每一秒都在疯狂输出知识点。

由于篇幅有限，⚡️ 朋友们如果有需要全套《2025全新制作的大模型全套资料》，扫码获取~

👉大模型学习指南+路线汇总👈

我们这套大模型资料呢，会从基础篇、进阶篇和项目实战篇等三大方面来讲解。

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程，带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念，用最易懂的方式带你入门大模型。

👉②.进阶篇👈

接下来是进阶篇，你将掌握RAG、Agent、Langchain、大模型微调和私有化部署，学习如何构建外挂知识库并和自己的企业相结合，学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目（已脱敏），比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等，从而帮助大家更好的应对大模型时代的挑战。

👉④.福利篇👈

最后呢，会给大家一个小福利，课程视频中的所有素材，有搭建AI开发环境资料包，还有学习计划表，几十上百G素材、电子书和课件等等，只要你能想到的素材，我这里几乎都有。我已经全部上传到ZEEKLOG，朋友们如果需要可以微信扫描下方ZEEKLOG官方认证二维码免费领取【保证100%免费】

相信我，这套大模型系统教程将会是全网最齐全最易懂的小白专用课！！

FARS全自动科研系统技术深度解析：从多智能体架构到工业化科研范式

前言 2026年2月12日至2月22日，一场持续228小时33分钟的直播在全球AI社区引发了持续震荡。屏幕另一端，一个名为FARS（Fully Automated Research System）的全自动研究系统，在没有人类干预的情况下，自主完成了从文献调研到论文撰写的完整科研流程，最终产出100篇学术论文，总消耗114亿Token，成本10.4万美元。这场实验的意义远不止于“AI写论文”的简单升级。它向世界展示了科学发现的根本范式正在发生转移——从依赖人类灵感的“手工作坊”，转向由AI驱动的“工业化流水线”。本文将从最底层的技术细节出发，逐层拆解FARS的系统架构、智能体协作机制、资源调度策略、成本控制模型，以及与竞品的技术对比，为读者呈现一个完整的全自动科研系统技术图谱。第一章系统总体架构：四智能体流水线设计 1.1 核心设计理念：研究系统的第一性原理 FARS的设计并非简单地模仿人类科研流程，而是基于团队对“研究系统”本质的重新思考。创始团队提出，一个理想的研究系统应遵循两条基本原则： 1. 高效拓展知识边界：系统的吞吐量应成为核心评估指标，而非单篇论文的完

SkyWalking - 支持的中间件清单：Spring Cloud、Dubbo、RocketMQ、ShardingSphere 等

👋 大家好，欢迎来到我的技术博客！ 📚 在这里，我会分享学习笔记、实战经验与技术思考，力求用简单的方式讲清楚复杂的问题。 🎯 本文将围绕SkyWalking这个话题展开，希望能为你带来一些启发或实用的参考。 🌱 无论你是刚入门的新手，还是正在进阶的开发者，希望你都能有所收获！文章目录 * 🌐 SkyWalking —— 全链路监控利器，支持 Spring Cloud、Dubbo、RocketMQ、ShardingSphere 等主流中间件 * 🚀 为什么选择 SkyWalking？ * 🧩 SkyWalking 架构概览 * 📦 环境准备 * 1. 下载 SkyWalking * 2. 启动 OAP 和 UI * ☁️ Spring Cloud 集成示例 * Maven 依赖（非必须，Agent 自动注入） * 启动参数配置 * 示例代码：Feign 调用链追踪 * 🔗 Dubbo 集成示例 * 启动参数（同

Flutter 组件 markup_analyzer 适配鸿蒙 HarmonyOS 实战：文本标签解析引擎，构建高性能动态排版与语义化渲染架构

欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.ZEEKLOG.net Flutter 组件 markup_analyzer 适配鸿蒙 HarmonyOS 实战：文本标签解析引擎，构建高性能动态排版与语义化渲染架构前言在鸿蒙（OpenHarmony）生态迈向深度内容分发、涉及富文本混排展示、自定义模板引擎或端侧跨端协议解析的背景下，如何将杂乱的标签数据高效转化为具备语义逻辑的 AST（抽象语法树），已成为决定应用排版性能与安全性的“逻辑枢纽”。在鸿蒙设备这类强调 AOT 极致执行速度与多维视窗适配的环境下，如果应用依然依赖基础的正则切割来处理动态标记，由于由于嵌套标签的递归复杂度，极易由于由于计算开销过大导致复杂长文阅读时的显著卡顿。我们需要一种能够实现语法级扫描、支持自定义标签扩展且具备错误容错能力的解析引擎。 markup_analyzer 为 Flutter 开发者引入了轻量级且工业标准的标签分析方案。它通过词法扫描（Lexer）与语法构造，将零散的 Markup 字符串重组为具有层级关系的节点树。在适配到鸿蒙 H

从“多库并存”到“一库多能”：聊聊金仓KingbaseES的融合架构实践

干数据库这行快十年了，亲眼见证了企业数据架构的变迁。早年做项目，最头疼的就是“数据竖井”——交易系统用Oracle，用户行为日志扔到MongoDB，时序监控数据塞进InfluxDB，图谱关系又得搞个Neo4j。每个库都有自己的语法、管理工具和运维体系，开发团队整天在不同数据库之间做数据同步和格式转换，数据一致性难保证，系统复杂度却直线上升。这几年“融合数据库”的概念越来越热，但很多厂商的理解还停留在“多模接口”层面。直到去年深度参与了某城商行的核心系统分布式改造项目，用金仓数据库KingbaseES 完整跑了一轮，才算真正体会到什么是“一库多能”的设计哲学。今天就跟大家聊聊我们的实践心得，特别是金仓在这方面的独特思考。一、为什么是“一库多能”，不是“多库拼装”？先看个真实场景。我们那个银行客户要做实时反欺诈，需要在一个查询里关联：用户账户信息（结构化）、近期交易流水（带时序特征）、设备指纹（JSON文档）、社交关系图谱（判断是否团伙），以及地理位置信息（空间数据）。如果按传统思路，至少要跨5个不同数据库做联合查询，光数据同步延迟就够受的，更别说保证事务一致性了。

1 概 述