SpringBoot + LangChain4j 打造企业级 RAG 智能知识库,多工具集成方案

SpringBoot + LangChain4j 打造企业级 RAG 智能知识库,多工具集成方案

基于 Spring Boot 4 + LangChain4j 1.11 + Ollama + Qdrant +MCP 的一体化 多Agentic 智能体,RAG 系统

本文结合笔者企业级项目,重新抽象,开发,一个真正“开箱即用”的企业级智能知识库系统。它不仅支持标准 RAG 问答,更融合了 Agentic 智能体架构MCP 文件沙盒金融专用算子混合模型路由,提供从文档上传到复杂推理的完整闭环体验。


1. 总览:技术栈与核心能力 ✨

维度技术选型能力说明
后端框架Spring Boot 4 + SQLite轻量级持久化,无需额外数据库,生产可切换为其他数据,如mysql,pgsql
AI 引擎LangChain4j 1.11支持 Agentic 工具调用、流式响应、上下文记忆
语言模型Ollama(qwen2.5:7b) + 可选 DashScope(qwen-plus本地私有部署 + 云端高性能混合
嵌入模型Ollama(qwen3-embedding:0.6b固定使用本地,保障数据不出域,高性能,降低成本
向量库Qdrant(1024 维)自动建集、高效检索(minScore=0.5)
前端界面纯静态 HTML/JS毛玻璃效果 + 渐变设计,5 大功能页面,少依赖,轻量化。
特色能力🎯 10+ 领域文档管理
🧠 Agentic 多工具协作
📊 金融计算(IRR/债券/期权)
📎 MCP 文件分析
🌤️ 天气/时间查询
企业场景全覆盖

2. 端到端架构 🚀

💡 关键设计:嵌入模型始终走本地 Ollama,确保敏感文档向量化过程完全私有;仅生成模型可动态路由。


3. 模块深度解析

3.1 RAG 检索增强生成 📄

  • 入口RagService
  • 流程
    1. 用户提问 → 本地 qwen3-embedding 生成向量;
    2. Qdrant 检索 top5 相似段落(min-score: 0.5);
    3. 拼接上下文 → 路由至 LLM(本地/云端)→ 流式返回带引用的回答。
  • 文档支持:PDF/TXT 自动分块(chunk-size: 500, overlap: 50),元数据含文件名便于溯源。

3.2 Agentic 智能体对话 ⭐

基于 LangChain4j Agentic 架构,实现自主决策与工具协作:

  • 记忆机制MessageWindowChatMemory,滑动窗口管理最近 2 × context-window-size 条消息(默认 20 条)。
  • 内置工具集(Agent 自主调用):
    • searchKnowledge():向量知识库检索
    • readFile() / listDirectory() / searchFiles():MCP 文件系统操作
    • calculate():数学表达式求值(exp4j)
    • calculateAmortization():贷款摊销计划
    • getIRR() / getBondPrice() / getOptionPrice():金融专用计算
    • getCurrentTime() / getWeather():实时信息查询
  • 执行追踪AgentExecutionInfo 记录完整思考链,前端可展示“Agent 正在读取文件...调用 Black-Scholes...”。

3.3 混合模型路由策略 🔀

通过 ModelRouterService 实现智能分流:

策略配置示例适用场景
PERCENTAGEaliyun: 30, local: 70测试环境、负载均衡
BUSINESS_TYPEaliyun-types: [COMPLEX_QUERY, LONG_CONTEXT]
local-types: [TOOL_CALLING, SIMPLE_QA]
生产推荐:复杂任务上云,工具调用走本地
安全兜底:若未配置 DashScope API Key,自动 100% 路由至本地 Ollama。

3.4 MCP 风格文件沙盒 📎

Model Context Protocol (MCP) 启发,实现安全文件交互:

  • 路径隔离:所有文件存于 uploads/{conversationId}/,按会话隔离。
  • 安全防护
    • 限制根目录(mcp-allowed-directory
    • 防目录遍历(.. 被规范化)
    • 大文件(>5KB)自动截断预览

典型场景

用户上传《信访政策.pdf》 → Agent 调用 readFile() 读取 → 结合 searchKnowledge() 检索知识库 → 对比分析合规性。

3.5 现代化前端界面 🎨

5 个功能页面,统一采用渐变设计 + 毛玻璃效果

页面功能亮点截图预览
📁 文件上传
/upload.html
- 支持 PDF / TXT 上传
- 自动分块 + 向量化入库 Qdrant
- 可指定领域标签(如 FINANCE
💬 智能问答
/chat.html
- 标准 RAG 流式对话
- 回答自动标注引用来源(文件名 + 片段)
- 响应速度快,体验流畅
🤖 Agentic 对话
/agent-chat.html
- 智能体自主调用工具(文件/计算/检索等)
- 实时展示执行轨迹:模型选择 → 工具调用 → 结果整合
- 支持复杂多步推理
📚 领域文档管理
/domain.html

- 管理 10+ 领域知识库(如 TECH, FINANCE, POLICY
- 查看各领域文档数量与状态
- 支持异步处理进度反馈

也可以改造为mq等方式作为ai服务,接受数据存储知识库。

🗃️ Qdrant 管理
/qdrant.html
- 查看现有向量集合(Collections)
- 创建新集合(自动配置 1024 维)
- 调试向量存储状态

4. 快速启动与配置 ⚙️

4.1 本地全栈运行

# 1. 启动 Ollama 并拉取模型 ollama serve ollama pull qwen2.5:7b ollama pull qwen3-embedding:0.6b # 2. 启动 Qdrant docker run -d -p 6333:6333 -p 6334:6334 qdrant/qdrant # 3. 运行应用 mvn spring-boot:run # 4. 访问系统 open http://localhost:8080 

4.2 关键配置 (application.yaml)

# 模型路由(生产建议 BUSINESS_TYPE) model-router: strategy: BUSINESS_TYPE business-type: aliyun-types: [COMPLEX_QUERY, LONG_CONTEXT] local-types: [SIMPLE_QA, TOOL_CALLING] # RAG 参数 rag: chunk-size: 500 chunk-overlap: 50 max-results: 5 min-score: 0.5 # Agent 安全沙盒 agent: context-window-size: 10 mcp-allowed-directory: ./uploads # 严格限制! mcp-file-enabled: true 
🔑 DashScope 配置:设置环境变量 DASHSCOPE_API_KEY 即可启用云端模型。

5. 企业级细节与扩展点 💡

  • 金融计算深度支持
    • 投资分析:IRR(牛顿法)、NPV、摊销计划
    • 债券:定价、到期收益率(YTM)、久期、凸度
    • 期权:Black-Scholes 模型 + Greeks(Delta/Gamma/Vega)
    • 📚 详见 Financial-Calculation-Guide.md
  • 领域知识管理:支持 TECHNOLOGYFINANCE 等 10+ 领域,异步处理入库。
  • 可扩展建议
    • 安全:反向代理层增加上传大小限制,收紧 mcp-allowed-directory
    • 可观测性:将 AgentExecutionInfo 接入日志系统,构建完整审计链
    • 前端:当前静态页可无缝替换为 React/Vue SPA,后端 SSE 接口已就绪

6. 结语:为什么这个项目值得尝试? ✅

“不是 Demo,而是基于已有企业级实现剥离出来的可落地的企业级知识底座。”
  • 全栈私有化:Ollama + Qdrant + SQLite,无外部依赖;
  • Agentic Ready:不止问答,更能自主调用工具、分析文件、执行计算
  • 场景覆盖广:从通用 RAG 到金融/政务等垂直领域;
  • 开箱即用:5 分钟启动,5 个页面覆盖核心需求;
  • 灵活扩展:模型、工具、路由策略均可插拔。

无论是搭建内部知识库、智能客服,还是探索 Agentic AI 应用,这个项目都提供了生产级参考实现。立即克隆,开启您的企业智能之旅!

🔗 项目地址:https://github.com/IdeasForLife/knowledge
⭐ 如果对你有帮助,欢迎 Star 支持!

🚀 最近计划:MCP 智能体 × 企业运维生态

项目目标提供各种ai实际能力,目前正在开发 MCP(Model Context Protocol)智能体在自动化运维场景的深度集成,目标是构建一个具备自主感知、诊断与操作能力的 AI 运维助手。目前已规划对接以下核心系统,实现可插拔的ai能力:

  • 代码与协作:GitLab(PR 分析、CI 状态查询)、飞书文档(故障复盘知识检索)
  • 日志与监控:阿里云日志服务(SLS)、ClickHouse(高性能日志分析)、SkyWalking(分布式链路追踪),CAT(美团开源的监控平台)
  • 基础设施:Kubernetes(Pod 状态、事件查询、资源扩缩容建议)
  • 命令执行:安全沙盒化的 cat / grep / kubectl 等类 CLI 工具调用
  • arthas 线上pod jvm等数据收集

通过统一的 MCP 工具接口,智能体可跨系统关联上下文——例如:

“用户反馈服务变慢” → 自动查询 SkyWalking 链路 → 定位慢接口 → 拉取 Kubernetes Pod 日志 → 分析 ClickHouse 中的错误日志聚合 → 生成根因假设。

🔍 智能归因引擎 正在开发中,未来将支持基于多源数据的自动根因定位与修复建议,真正实现 “观测即行动” 的 AIOps 闭环。敬请期待!

Read more

机器人避障算法实战指南(从仿真到部署的9个关键步骤)

第一章:机器人避障算法概述 在移动机器人系统中,避障能力是实现自主导航的核心功能之一。机器人需要实时感知周围环境,识别障碍物,并动态规划安全路径以避免碰撞。避障算法的设计直接影响机器人的智能水平和运行效率。 基本原理与分类 避障算法通常基于传感器数据(如激光雷达、超声波、深度相机)构建环境模型,并结合运动学约束进行决策。常见的方法包括: * 人工势场法:将目标点视为引力源,障碍物视为斥力源,通过合力引导机器人移动 * 动态窗口法(DWA):在速度空间中评估可行轨迹,选择最优速度组合 * 栅格地图法:将环境划分为网格,利用A*或Dijkstra等搜索算法寻找无碰路径 * 基于学习的方法:使用强化学习或神经网络训练避障策略 典型算法对比 算法类型实时性路径质量适用场景人工势场法高中结构化环境DWA高高动态障碍物环境A*中高静态地图导航 代码示例:简单距离判断避障逻辑 def avoid_obstacle(distance_left, distance_right, threshold=0.5): """ 基于左右传感器距离的简单避障 :param

By Ne0inhk
安卓手机安装Termux+AstrBot+NapCat搭建QQ个人机器人【非官方】(简易版)

安卓手机安装Termux+AstrBot+NapCat搭建QQ个人机器人【非官方】(简易版)

前言        好久不见,亲爱的友友们,这次我来了!这次我学会了用旧安卓手机安装termux软件搭建了一个AstrBotQQ机器人(大模型可能跑不了),我使用的旧安卓手机是vivoY31s标准版,手机型号有点久,到时能用就行了。其实方法都通用差不多。 目录 目录 前言 目录 一、简介 1.Termux 2.AstrBot 3.NapCat  二、步骤 1. 安装Termux 2. 更新系统包打开 Termux,依次执行以下命令,更新软件源并安装基础工具。 换源 (可选) 3. 申请存储权限 正式部署 安装 proot-distro 及 其他必须组件 登录 Ubuntu环境 添加第三方PPA 安装 Python 克隆 AstrBot 仓库 运行 AstrBot

By Ne0inhk
FPGA内部资源详解:LUT、FF、BRAM、DSP、PLL是什么?综合报告怎么看

FPGA内部资源详解:LUT、FF、BRAM、DSP、PLL是什么?综合报告怎么看

本文是《FPGA入门到实战》专栏第8篇。上一篇完成了第一个下板项目,本篇从芯片内部视角出发,深入讲解 FPGA 的五大核心硬件资源:LUT、FF、BRAM、DSP 和 PLL。理解这些资源的工作原理和使用限制,是写出高质量 FPGA 代码、读懂综合报告的基础。 FPGA内部资源详解:LUT、FF、BRAM、DSP、PLL是什么?综合报告怎么看 * 1. 为什么要了解内部资源 * 1.1 Artix-7 资源概览 * 2. LUT 查找表 * 2.1 LUT 是什么 * 2.2 LUT 实现任意 6 输入函数 * 2.3 LUT 的双输出模式(O5/

By Ne0inhk
【OpenHarmony】鸿蒙Flutter智能家居应用开发实战指南

【OpenHarmony】鸿蒙Flutter智能家居应用开发实战指南

鸿蒙Flutter智能家居应用开发实战指南 概述 智能家居是鸿蒙全场景生态的重要应用场景。本文讲解如何基于鸿蒙Flutter框架,开发一套完整的智能家居应用,实现设备发现、控制、场景联动、语音交互等核心功能。 欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net 系统架构设计 整体架构图 ┌────────────────────────────────────────────────────────────┐ │ 用户交互层 (Flutter) │ │ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │ │ │ 设备控制面板 │ │ 场景编排 │ │ 语音交互 │ │ │ └─────────────┘ └─────────────┘ └─────────────┘ │ └───────────────────────┬────────────────────────────────────┘ │ RPC/事件总线 ┌────────────────────

By Ne0inhk