PGvector 在 Spring AI 中实现向量数据库存储与相似性搜索

PGvector 作为 PostgreSQL 向量扩展的核心特性及其与 Spring AI 的集成方案。内容包括环境准备、自动与手动配置方式、文档存储与检索操作（含元数据过滤）、高级搜索示例以及性能优化与安全实践。通过合理配置索引类型和距离度量，可实现高效的 RAG 应用开发。

BigDataPan发布于 2026/3/29更新于 2026/4/189 浏览

PGvector 在 Spring AI 中实现向量数据库存储与相似性搜索

一、PGvector 概述与核心价值

1.1 什么是 PGvector

PGvector 是 PostgreSQL 的开源扩展，专为向量相似性搜索而设计。它允许开发者在 PostgreSQL 数据库中存储和搜索机器学习生成的嵌入（embeddings），支持精确和近似最近邻搜索。

💡 为什么选择 PGvector？

无缝集成：作为 PostgreSQL 扩展，与现有数据库生态系统无缝协作

ACID 合规：保持 PostgreSQL 的事务完整性

功能丰富：支持多种距离度量和索引类型

高性能：针对大规模向量搜索进行优化

易用性：提供标准 SQL 接口，无需学习新查询语言

1.2 PGvector 的关键特性

特性	描述	优势
向量存储	支持多种向量类型（`vector`, `halfvec`, `bit`, `sparsevec`）	适应不同精度和内存需求
距离度量	L2、内积、余弦距离、L1、汉明距离、杰卡德距离	适用于不同场景的相似性度量
索引类型	HNSW、IVFFlat	平衡查询速度和召回率
元数据过滤	基于 JSON 的元数据过滤	精确控制检索结果
混合搜索	结合向量搜索和文本搜索	提高检索相关性

1.3 PGvector 与 Spring AI 的集成

Spring AI 通过 spring-ai-starter-vector-store-pgvector 提供了 PGvector 的开箱即用支持，使开发者能够轻松地将向量数据库集成到 RAG（检索增强生成）应用中。

<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-starter-vector-store-pgvector</artifactId>
</dependency>

二、PGvector 安装与配置

2.1 环境准备

2.1.1 前提条件

在使用 PGvector 之前，需要确保 PostgreSQL 实例已启用以下扩展：

属性	描述	默认值	适用场景
`index-type`	最近邻搜索索引类型	HNSW	需要高性能检索时
`distance-type`	搜索距离类型	COSINE_DISTANCE	向量已归一化时
`dimensions`	嵌入维度	从 EmbeddingModel 获取	与嵌入模型一致
`remove-existing-vector-store-table`	启动时删除现有表	false	重置数据库时
`initialize-schema`	是否初始化 schema	false	首次使用时
`schema-name`	向量存储 schema 名称	public	多 schema 环境
`table-name`	向量存储表名称	vector_store	自定义表名
`schema-validation`	启用 schema 和表名验证	false	安全敏感环境
`max-document-batch-size`	单批处理的最大文档数	10000	大批量数据导入

索引类型	构建时间	查询性能	内存使用	适用场景
HNSW	较慢	优秀	较高	高性能要求，数据量大
IVFFlat	快	一般	较低	数据量小，内存有限
NONE	无	一般	低	测试环境，小数据量

距离类型	适用场景	性能	说明
COSINE_DISTANCE	向量已归一化	优秀	适用于大多数嵌入模型
EUCLIDEAN_DISTANCE	向量未归一化	一般	需要精确距离
NEGATIVE_INNER_PRODUCT	向量已归一化	优秀	与 COSINE_DISTANCE 等效

PGvector 在 Spring AI 中实现向量数据库存储与相似性搜索

PGvector 在 Spring AI 中实现向量数据库存储与相似性搜索

一、PGvector 概述与核心价值

1.1 什么是 PGvector

1.2 PGvector 的关键特性

1.3 PGvector 与 Spring AI 的集成

二、PGvector 安装与配置

2.1 环境准备

2.1.1 前提条件

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.2 手动创建向量存储表

三、Spring AI 集成 PGvector

3.1 依赖配置

3.2 自动配置

3.3 手动配置（高级用法）

3.4 依赖项要求

四、向量存储操作实践

4.1 存储文档

4.2 基本相似性搜索

4.3 使用元数据过滤 - 文本表达式

4.4 使用元数据过滤 - Filter.Expression DSL

4.5 高级搜索示例：组合查询和过滤

4.6 删除特定文档（根据元数据）

五、PGvector 配置参数详解

5.1 关键配置属性

5.2 索引类型对比

5.3 距离类型选择

六、高级用法与最佳实践

6.1 性能优化技巧

6.1.1 索引优化

6.1.2 查询优化

6.1.3 批量处理优化

6.2 安全最佳实践

6.2.1 数据库权限管理

6.2.2 元数据过滤安全

6.2.3 启用 schema 验证

6.3 与 RAG 流程集成

6.3.1 使用 QuestionAnswerAdvisor

6.3.2 使用 RetrievalAugmentationAdvisor

6.3.3 RAG 流程工作流程

七、常见问题与解决方案

7.1 问题：查询性能差

7.2 问题：向量维度不匹配

7.3 问题：元数据过滤无效

7.4 问题：内存不足