Spring AI Alibaba 集成 Redis 向量数据库实现 RAG 与记忆功能

Spring AI Alibaba 集成 Redis 向量数据库实现 RAG 与记忆功能 | 极客日志

<properties>
    <spring-ai.version>1.0.0</spring-ai.version>
    <spring-ai-alibaba.version>1.0.0.2</spring-ai-alibaba.version>
    <spring-boot.version>3.4.5</spring-boot.version>
    <java.version>17</java.version>
</properties>
<dependencies>
    <!-- Spring AI Alibaba BOM -->
    <dependency>
        <groupId>com.alibaba.cloud.ai</groupId>
        <artifactId>spring-ai-alibaba-bom</artifactId>
        <version>${spring-ai-alibaba.version}</version>
        <type>pom</type>
        <scope>import</scope>
    </dependency>
    <!-- DashScope 模型支持 -->
    <dependency>
        <groupId>com.alibaba.cloud.ai</groupId>
        <artifactId>spring-ai-alibaba-starter-dashscope</artifactId>
        <version>${spring-ai-alibaba.version}</version>
    </dependency>
    <!-- Redis 记忆存储 -->
    <dependency>
        <groupId>com.alibaba.cloud.ai</groupId>
        <artifactId>spring-ai-alibaba-starter-memory-redis</artifactId>
        <version>${spring-ai-alibaba.version}</version>
    </dependency>
    <!-- 向量存储核心 -->
    <dependency>
        <groupId>org.springframework.ai</groupId>
        <artifactId>spring-ai-vector-store</artifactId>
        <version>${spring-ai.version}</version>
    </dependency>
    <!-- Redis 客户端 -->
    <dependency>
        <groupId>redis.clients</groupId>
        <artifactId>jedis</artifactId>
    </dependency>
    <!-- 其他基础依赖 -->
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-web</artifactId>
    </dependency>
    <dependency>
        <groupId>org.projectlombok</groupId>
        <artifactId>lombok</artifactId>
        <optional>true</optional>
    </dependency>
</dependencies>

spring:
  data:
    redis:
      host: localhost
      port: 6379
      password: 123456
  lettuce:
    pool:
      max-active: 16
      max-idle: 8
      min-idle: 4
      timeout: 2000ms
  servlet:
    multipart:
      max-file-size: 100MB
      max-request-size: 100MB
application:
  name: Roadnetworktraffic
ai:
  vectorstore:
    redis:
      initialize-schema: true
      index-name: custom-index
      prefix: custom-prefix
  dashscope:
    embedding:
      baseUrl: https://dashscope.aliyuncs.com # 向量模型
      api-key: your-api-key-here
      options:
        model: text-embedding-v4
    api-key: your-api-key-here
    base-url: https://dashscope.aliyuncs.com/compatible-mode/v1
    chat:
      options:
        model: qwen-flash

@Configuration
public class RedisMemoryConfig {
    @Value("${spring.data.redis.host}")
    private String host;

    @Value("${spring.data.redis.port}")
    private int port;

    @Value("${spring.data.redis.password}")
    private String password;

    @Bean
    public RedisChatMemoryRepository redisChatMemoryRepository() {
        return RedisChatMemoryRepository.builder()
                .host(host)
                .password(password)
                .port(port)
                .build();
    }
}

@Configuration
public class SaaLLMConfig {
    @Value("${spring.ai.dashscope.api-key}")
    private String apiKey;

    // 模型名称常量
    private final String DEEPSEEK_MODEL = "deepseek-v3.2";
    private final String QWEN_MODEL = "qwen-flash";

    @Bean(name = "deepseek")
    public ChatClient deepSeek(RedisChatMemoryRepository redisChatMemoryRepository) {
        DashScopeChatModel dashScopeChatModel = DashScopeChatModel.builder()
                .dashScopeApi(DashScopeApi.builder().apiKey(apiKey).build())
                .defaultOptions(DashScopeChatOptions.builder().withModel(DEEPSEEK_MODEL).build())
                .build();
        return ChatClient.builder(dashScopeChatModel)
                .defaultAdvisors(MessageChatMemoryAdvisor.builder(
                        MessageWindowChatMemory.builder()
                                .chatMemoryRepository(redisChatMemoryRepository)
                                .maxMessages(10)
                                .build()).build())
                .defaultOptions(ChatOptions.builder().model(DEEPSEEK_MODEL).build())
                .build();
    }

    @Bean(name = "qwen")
    public ChatClient qwen(RedisChatMemoryRepository redisChatMemoryRepository) {
        DashScopeChatModel dashScopeChatModel = DashScopeChatModel.builder()
                .dashScopeApi(DashScopeApi.builder().apiKey(apiKey).build())
                .defaultOptions(DashScopeChatOptions.builder().withModel(QWEN_MODEL).build())
                .build();
        return ChatClient.builder(dashScopeChatModel)
                .defaultAdvisors(MessageChatMemoryAdvisor.builder(
                        MessageWindowChatMemory.builder()
                                .chatMemoryRepository(redisChatMemoryRepository)
                                .maxMessages(10)
                                .build()).build())
                .defaultOptions(ChatOptions.builder().model(QWEN_MODEL).build())
                .build();
    }
}

@Slf4j
@Component
public class AppDocumentLoader {
    @Value("classpath:/prompt/Gompt.txt")
    private Resource opsFile;

    public List<Document> loadMarkdowns() {
        TextReader textReader = new TextReader(opsFile);
        textReader.setCharset(Charset.defaultCharset());
        // 使用 TokenTextSplitter 进行文本分割
        List<Document> list = new TokenTextSplitter().transform(textReader.read());
        return list;
    }
}

@Configuration
public class VectorStoreBean {
    @Resource
    private AppDocumentLoader appDocumentLoader;

    @Resource
    private EmbeddingModel embeddingModel;

    @Bean
    public VectorStore vectorStore() {
        // 创建 SimpleVectorStore（底层使用 Redis）
        VectorStore build = SimpleVectorStore.builder(embeddingModel).build();
        // 加载文档并添加到向量库
        List<Document> documents = appDocumentLoader.loadMarkdowns();
        build.add(documents);
        return build;
    }
}

@RestController
@RequestMapping("/aichat/stream")
@Slf4j
public class AiController {
    @Qualifier("deepseek")
    @Autowired
    private ChatClient deepseekModel;

    @Qualifier("qwen")
    @Autowired
    private ChatClient qwenModel;

    @Autowired
    private VectorStore vectorStore;

    @Value("classpath:/prompt/story-prompt.txt")
    private Resource storyPrompt;

    @GetMapping(value = "/deepseek")
    public Flux<String> chatDeepseek(@RequestParam String sessionId, @RequestParam String userContent) {
        return deepseekModel.prompt()
                .system(storyPrompt) // 系统提示词
                .user(userContent) // 用户输入
                .advisors(message -> {
                    // 设置会话 ID，用于记忆隔离
                    if (message != null) {
                        message.param(CONVERSATION_ID, sessionId);
                    }
                })
                .advisors(RetrievalAugmentationAdvisor.builder()
                        .documentRetriever(VectorStoreDocumentRetriever.builder()
                                .vectorStore(vectorStore)
                                .build())
                        .build())
                .stream() // 流式输出
                .content()
                .doOnError(e -> log.error("Stream error: " + e.getMessage()));
    }

    @GetMapping("/qwen")
    public Flux<String> chatQwen(@RequestParam String sessionId, @RequestParam String userContent) {
        return qwenModel.prompt()
                .system(storyPrompt)
                .user(userContent)
                .advisors(message -> {
                    if (message != null) {
                        message.param(CONVERSATION_ID, sessionId);
                    }
                })
                .stream()
                .content()
                .doOnError(e -> log.error("Stream error: " + e.getMessage()));
    }
}

接口路径	方法	参数	功能
`/aichat/stream/deepseek`	GET	sessionId, userContent	DeepSeek 模型流式对话（带 RAG）
`/aichat/stream/qwen`	GET	sessionId, userContent	Qwen 模型流式对话

用户提问 → 向量化查询 → Redis 向量库相似度检索 → 获取 top-k 相关文档 ↓ 构建提示词（系统提示 + 检索文档 + 历史对话 + 用户问题） ↓ 调用 AI 模型生成 → 返回响应

// 记忆存储接口
public interface ChatMemory {
    void add(ChatMessage message);
    List<ChatMessage> getMessages();
    void clear();
}

// Redis 实现
public class RedisChatMemory implements ChatMemory {
    // 使用 Redis 存储，key 格式：memory:sessionId
}

public class RedisVectorStore implements VectorStore {
    // 使用 RedisSearch 模块创建向量索引
    public void createIndex(String indexName, VectorFieldSchema fieldSchema) {
        // 创建 HNSW 索引 FT.CREATE indexName ...
    }

    public void add(List<Document> documents) {
        // 调用 embeddingModel 生成向量
        List<Float> vector = embeddingModel.embed(document.getContent());
        // 存储到 Redis Hash
        redis.hset(key, "vector", vector, "content", content);
    }
}

redis-server --loadmodule /path/to/redisearch.so

docker run -p 6379:6379 redislabs/redisearch:latest

mvn clean package java -jar target/your-app.jar

# 测试 DeepSeek 模型（带 RAG）
curl "http://localhost:8080/aichat/stream/deepseek?sessionId=test123&userContent=什么是 GIS？"
# 测试 Qwen 模型（不带 RAG）
curl "http://localhost:8080/aichat/stream/qwen?sessionId=test123&userContent=你好"

# 第一次对话
curl "http://localhost:8080/aichat/stream/deepseek?sessionId=user1&userContent=我叫张三"
# 第二次对话（会记住上下文）
curl "http://localhost:8080/aichat/stream/deepseek?sessionId=user1&userContent=我的名字是什么？"

@Bean(name = "vectorStoreA")
public VectorStore vectorStoreA() {
    ...
}

@Bean(name = "vectorStoreB")
public VectorStore vectorStoreB() {
    ...
}
// 根据业务场景选择不同的向量库

Spring AI Alibaba 集成 Redis 向量数据库实现 RAG 与记忆功能

Spring AI Alibaba 集成 Redis 向量数据库实现 RAG 与记忆功能

概述

项目架构概览

一、环境准备与依赖配置

1.1 Maven 依赖配置

1.2 配置文件（application.yml）

二、核心组件实现

2.1 Redis 记忆存储配置

2.2 多模型配置（DeepSeek + Qwen）

2.3 文档加载与向量存储

2.3.1 文档加载器

2.3.2 向量存储 Bean

三、RESTful API 实现

3.1 控制器层

四、RAG 与记忆功能原理解析

4.1 检索增强生成（RAG）工作流程

4.2 对话记忆实现机制

4.3 向量存储底层实现

五、部署与测试

5.1 环境要求

5.2 Redis 配置

5.3 应用启动

5.4 API 测试

六、常见问题与优化建议

6.1 性能优化

6.2 功能扩展

6.3 监控与日志

七、总结

更多推荐文章

相关免费在线工具

Spring AI Alibaba 集成 Redis 向量数据库实现 RAG 与记忆功能

Spring AI Alibaba 集成 Redis 向量数据库实现 RAG 与记忆功能

概述

项目架构概览

一、环境准备与依赖配置

1.1 Maven 依赖配置

1.2 配置文件（application.yml）

二、核心组件实现

2.1 Redis 记忆存储配置

2.2 多模型配置（DeepSeek + Qwen）

2.3 文档加载与向量存储

2.3.1 文档加载器

2.3.2 向量存储 Bean

三、RESTful API 实现

3.1 控制器层

四、RAG 与记忆功能原理解析

4.1 检索增强生成（RAG）工作流程

4.2 对话记忆实现机制

4.3 向量存储底层实现

五、部署与测试

5.1 环境要求

5.2 Redis 配置

5.3 应用启动

5.4 API 测试

六、常见问题与优化建议

6.1 性能优化

6.2 功能扩展

6.3 监控与日志

七、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具