基于Milvus与混合检索的云厂商文档智能问答系统：Java SpringBoot全栈实现

Ne0inhk

15 Mar 2026 — 12 min read

基于Milvus与混合检索的云厂商文档智能问答系统：Java SpringBoot全栈实现

面对阿里云、腾讯云等厂商海量的产品文档、规格参数与价格清单，如何构建一个精准、高效的智能问答系统？本文将为你揭秘从技术选型到生产部署的完整方案。

云服务商的产品生态系统日益庞大，相关的技术文档、规格参数、定价清单等文档数量急剧增长。传统的文档查找方式已无法满足开发者和运维人员快速获取准确信息的需求。

基于检索增强生成（RAG）的智能问答系统成为解决这一难题的有效方案。本文将详细介绍如何使用 Java SpringBoot 和 Milvus 向量数据库，构建一个面向云厂商文档的高效混合检索问答系统。

一、核心挑战与架构选型

云厂商文档具有鲜明的技术特点，这些特点直接影响了我们的技术选择：

高度结构化：包含大量技术规格表、价格矩阵和配置参数
专业术语密集：如“ECS.g6.2xlarge”、“对象存储每秒请求数”等精确术语
多格式混合：Markdown、PDF、Word、TXT等格式并存
版本频繁更新：产品迭代快，文档需要及时同步

针对这些挑战，我们选择了混合检索架构（Hybrid Search），结合稠密向量检索（语义理解）和稀疏向量检索（关键词匹配），以达到最佳效果。

系统整体架构分为三个核心层次：

数据预处理层：负责多格式文档解析和智能分块
向量存储与检索层：基于 Milvus 的混合检索实现
应用服务层：SpringBoot 驱动的 REST API 和流式输出

二、数据预处理：多格式文档的智能分块策略

文档分块的质量直接决定了后续检索的精度，特别是在处理结构化云文档时，我们需要比普通文本更精细的策略。

2.1 统一文档解析接口

云厂商文档格式多样，我们使用 Apache Tika 作为统一解析入口，同时针对不同格式进行增强处理：

@ServicepublicclassUnifiedDocumentParser{publicParsedDocumentparseDocument(MultipartFile file)throwsException{String contentType = file.getContentType();String filename = file.getOriginalFilename();if(filename.endsWith(".pdf")){// 使用PDFBox增强PDF解析，保留书签和表格结构returnparsePdfWithStructure(file);}elseif(filename.endsWith(".md")|| filename.endsWith(".markdown")){// Markdown按标题层级解析returnparseMarkdownWithHeadings(file);}elseif(filename.endsWith(".docx")|| filename.endsWith(".doc")){// 使用POI解析Word，保留样式信息returnparseWordDocument(file);}else{// TXT和其他格式使用Tika标准解析returnparseWithTika(file);}}privateParsedDocumentparsePdfWithStructure(MultipartFile file){// 提取PDF书签结构作为文档大纲// 识别表格区域并保持其完整性// 将视觉层次转换为逻辑层次}}

2.2 文档类型识别与分块策略路由

不同类型的云文档需要不同的分块策略，我们设计了基于内容分析的智能路由：

文档类型	识别特征	分块策略	块大小建议
规格参数文档	包含参数表、技术指标	表格保持完整，参数组为单位	300-600字符
价格文档	价格表、计费规则	按计费项分块，保持表格完整	400-800字符
产品使用文档	操作步骤、示例代码	按章节标题分块，代码块保持完整	600-1200字符
API参考文档	端点说明、请求响应示例	按API端点分块	500-1000字符

@ComponentpublicclassSmartChunkingRouter{publicList<DocumentChunk>chunkByContentAnalysis(ParsedDocument doc){DocumentType docType =analyzeDocumentType(doc);switch(docType){case SPECIFICATION:// 规格文档：检测参数表，保持表格完整性returnchunkSpecificationDocument(doc);case PRICING:// 价格文档：检测价格矩阵，按服务项分块returnchunkPricingDocument(doc);case TUTORIAL:// 教程文档：按操作步骤和示例分块returnchunkTutorialDocument(doc);case API_REFERENCE:// API文档：按端点和参数说明分块returnchunkApiDocument(doc);default:// 默认策略：递归字符分块returnrecursiveTextSplit(doc,800,120);}}privateDocumentTypeanalyzeDocumentType(ParsedDocument doc){// 基于关键词、结构特征和元数据识别文档类型String content = doc.getContent();if(containsPricingTable(content)){returnDocumentType.PRICING;}elseif(containsApiEndpoints(content)){returnDocumentType.API_REFERENCE;}elseif(containsSpecParameters(content)){returnDocumentType.SPECIFICATION;}elseif(containsTutorialMarkers(content)){returnDocumentType.TUTORIAL;}returnDocumentType.GENERAL;}}

2.3 结构化元数据提取

为每个文档块提取丰富的元数据，为后续检索过滤奠定基础：

publicclassDocumentChunk{privateString id;privateString content;privateMap<String,String> metadata;// 核心元数据字段privateString documentSource;// 文档来源：aliyun/tencent/huaweiprivateString productCategory;// 产品类别：compute/storage/networkprivateString chunkType;// 块类型：concept/parameter/price/exampleprivateString sectionTitle;// 章节标题privateString productName;// 产品名称：ECS/RDS/VPCprivateString documentVersion;// 文档版本privateDate updateTime;// 更新时间}

三、Milvus向量存储与混合检索实现

Milvus 2.3+ 版本原生支持混合检索（Hybrid Search），为我们提供了完美的技术基础。

3.1 集合Schema设计与优化

针对云文档的特点，我们设计了专门的集合结构：

@Data@MilvusEntity(collectionName ="cloud_docs_chunks")publicclassDocumentChunkEntity{// 主键字段@MilvusField(name ="chunk_id", isPrimaryKey =true)privateString chunkId;// 内容字段（用于稀疏检索）@MilvusField(name ="content", dataType =DataType.VarChar, maxLength =65535)privateString content;// 稠密向量字段（768维BGE-M3向量）@MilvusField(name ="dense_vector", dataType =DataType.FloatVector, dim =768)privateList<Float> denseVector;// 稀疏向量字段（BM25权重表示）@MilvusField(name ="sparse_vector", dataType =DataType.SparseFloatVector)privateMap<Long,Float> sparseVector;// 元数据字段（用于过滤和增强检索）@MilvusField(name ="doc_source", dataType =DataType.VarChar, maxLength =50)privateString docSource;@MilvusField(name ="product_name", dataType =DataType.VarChar, maxLength =100)privateString productName;@MilvusField(name ="chunk_type", dataType =DataType.VarChar, maxLength =50)privateString chunkType;@MilvusField(name ="tags", dataType =DataType.Array, elementType =DataType.VarChar)privateList<String> tags;}

3.2 混合检索的核心实现

混合检索的关键在于同时执行向量相似度搜索和关键词权重搜索，并将结果智能融合：

@ServicepublicclassHybridSearchEngine{@AutowiredprivateMilvusServiceClient milvusClient;publicSearchResultshybridSearch(SearchRequest request){// 1. 查询分析与路由QueryAnalysisResult analysis =analyzeQuery(request.getQuery());// 2. 并行执行两种检索CompletableFuture<List<SearchResult>> denseFuture =executeDenseVectorSearch(request, analysis);CompletableFuture<List<SearchResult>> sparseFuture =executeSparseVectorSearch(request, analysis);// 3. 结果融合与重排returnCompletableFuture.allOf(denseFuture, sparseFuture).thenApply(v ->{List<SearchResult> denseResults = denseFuture.join();List<SearchResult> sparseResults = sparseFuture.join();// 基于查询类型动态调整权重float denseWeight = analysis.isSemanticQuery()?0.7f:0.3f;float sparseWeight =1.0f- denseWeight;// 加权分数融合List<SearchResult> fusedResults =fuseResults(denseResults, sparseResults, denseWeight, sparseWeight);// 重排提升精度returnrerankResults(request.getQuery(), fusedResults);}).join();}privateQueryAnalysisResultanalyzeQuery(String query){// 分析查询类型：概念性查询 vs 精确查询QueryAnalysisResult result =newQueryAnalysisResult();// 检测精确查询模式（产品型号、规格代码、价格查询）Pattern specPattern =Pattern.compile("[A-Z]{2,}\\.[a-z0-9]+\\.[a-z0-9]+");Pattern pricePattern =Pattern.compile("价格|费用|计费|成本");boolean isExactQuery = specPattern.matcher(query).find()|| pricePattern.matcher(query).find()||containsExactProductCodes(query); result.setSemanticQuery(!isExactQuery); result.setExactQuery(isExactQuery);// 提取查询中的产品名称和关键词 result.setProductNames(extractProductNames(query)); result.setKeywords(extractKeywords(query));return result;}}

3.3 查询权重动态调整算法

根据查询类型的分析结果，动态调整混合检索的权重分配：

publicclassWeightAdjustmentStrategy{publicstaticSearchWeightscalculateWeights(QueryAnalysisResult analysis){SearchWeights weights =newSearchWeights();if(analysis.isExactQuery()){// 精确查询：偏向关键词匹配 weights.setDenseWeight(0.2f);// 语义权重20% weights.setSparseWeight(0.8f);// 关键词权重80% weights.setMetadataBoost(1.5f);// 元数据匹配增强}elseif(analysis.isSemanticQuery()){// 语义查询：偏向向量匹配 weights.setDenseWeight(0.7f);// 语义权重70% weights.setSparseWeight(0.3f);// 关键词权重30% weights.setMetadataBoost(1.1f);// 元数据匹配轻微增强}else{// 混合查询：平衡权重 weights.setDenseWeight(0.5f); weights.setSparseWeight(0.5f); weights.setMetadataBoost(1.3f);}// 根据查询长度微调int queryLength = analysis.getQueryLength();if(queryLength <10){// 短查询更依赖关键词 weights.setSparseWeight(weights.getSparseWeight()+0.1f); weights.setDenseWeight(weights.getDenseWeight()-0.1f);}return weights;}}

四、SpringBoot微服务集成

4.1 异步文档处理管道

文档处理是计算密集型任务，我们采用全异步管道设计：

@Service@Slf4jpublicclassAsyncDocumentPipeline{@AutowiredprivateThreadPoolTaskExecutor documentProcessor;@Async("documentProcessor")publicCompletableFuture<ProcessResult>processDocumentAsync(MultipartFile file){returnCompletableFuture.supplyAsync(()->parseDocument(file), documentProcessor).thenApplyAsync(this::analyzeDocumentType, documentProcessor).thenApplyAsync(this::chunkDocument, documentProcessor).thenApplyAsync(chunks ->generateEmbeddings(chunks), documentProcessor).thenApplyAsync(chunks ->generateSparseVectors(chunks), documentProcessor).thenApplyAsync(chunks ->storeInMilvus(chunks), documentProcessor).exceptionally(ex ->{ log.error("文档处理失败: {}", ex.getMessage());returnProcessResult.failure(ex.getMessage());});}// 批量处理优化publicCompletableFuture<List<ProcessResult>>batchProcess(List<MultipartFile> files){List<CompletableFuture<ProcessResult>> futures = files.stream().map(this::processDocumentAsync).collect(Collectors.toList());returnCompletableFuture.allOf(futures.toArray(newCompletableFuture[0])).thenApply(v -> futures.stream().map(CompletableFuture::join).collect(Collectors.toList()));}}

4.2 REST API设计

提供简洁清晰的API接口：

@RestController@RequestMapping("/api/v1/rag")@Tag(name ="智能文档问答", description ="基于RAG的云文档智能问答接口")publicclassRagController{@PostMapping("/documents")@Operation(summary ="上传文档到知识库")publicResponseEntity<UploadResponse>uploadDocument(@RequestParam("file")MultipartFile file,@RequestParam(value ="docSource", required =false)String docSource){CompletableFuture<ProcessResult> future = documentPipeline.processDocumentAsync(file, docSource);returnResponseEntity.accepted().body(UploadResponse.accepted(future));}@PostMapping("/query")@Operation(summary ="查询知识库")publicFlux<String>queryKnowledgeBase(@RequestBodyQueryRequest request){// 流式返回结果returnFlux.create(sink ->{try{// 1. 检索相关文档块SearchResults results = searchEngine.hybridSearch(request);// 2. 构建LLM上下文String context =buildContext(results);// 3. 流式调用大模型streamLlmResponse(request.getQuestion(), context, sink);}catch(Exception e){ sink.error(e);}});}@GetMapping("/search/similar")@Operation(summary ="语义相似搜索")publicResponseEntity<List<SearchResult>>semanticSearch(@RequestParamString query,@RequestParam(defaultValue ="10")int topK){List<SearchResult> results = searchEngine.semanticSearch(query, topK);returnResponseEntity.ok(results);}}

五、性能优化与生产部署

5.1 向量检索性能调优

# application.yml Milvus配置部分milvus:host: ${MILVUS_HOST:localhost}port:19530# 连接池配置connection-pool:max-size:20min-size:5connect-timeout-ms:5000keep-alive-timeout-ms:180000# 索引优化配置index:dense-vector:type: HNSW params:M:16efConstruction:200sparse-vector:type: SPARSE_INVERTED_INDEX params:drop_ratio_build:0.2# 查询参数优化search:anns-field: dense_vector metric-type: IP params:nprobe:16top-k:50offset:0

5.2 缓存策略设计

针对云文档查询特点，设计多层缓存策略：

@Component@Slf4jpublicclassQueryCacheManager{@AutowiredprivateRedisTemplate<String,Object> redisTemplate;// 本地缓存（Caffeine）用于热点查询privateCache<String,CacheEntry> localCache =Caffeine.newBuilder().maximumSize(1000).expireAfterWrite(5,TimeUnit.MINUTES).build();publicSearchResultsgetCachedResults(String queryHash,String filtersHash){String cacheKey =buildCacheKey(queryHash, filtersHash);// 1. 检查本地缓存CacheEntry entry = localCache.getIfPresent(cacheKey);if(entry !=null&&!entry.isExpired()){ log.debug("本地缓存命中: {}", cacheKey);return entry.getResults();}// 2. 检查Redis分布式缓存SearchResults redisResults =(SearchResults) redisTemplate.opsForValue().get(cacheKey);if(redisResults !=null){ log.debug("Redis缓存命中: {}", cacheKey);// 回填本地缓存 localCache.put(cacheKey,newCacheEntry(redisResults));return redisResults;}returnnull;}publicvoidcacheResults(String queryHash,String filtersHash,SearchResults results,Duration ttl){String cacheKey =buildCacheKey(queryHash, filtersHash);// 1. 存入本地缓存 localCache.put(cacheKey,newCacheEntry(results));// 2. 存入Redis，设置TTL redisTemplate.opsForValue().set(cacheKey, results, ttl); log.debug("缓存已更新: {}, TTL: {}秒", cacheKey, ttl.getSeconds());}// 缓存键生成策略：结合查询语义和过滤条件privateStringbuildCacheKey(String queryHash,String filtersHash){returnString.format("rag:search:%s:%s", queryHash, filtersHash);}}

六、系统监控与评估

6.1 关键监控指标

构建完整的监控体系，跟踪系统健康状态：

@Component@Slf4jpublicclassSystemMetricsCollector{// 检索质量指标privateAtomicLong totalQueries =newAtomicLong(0);privateAtomicLong semanticQueries =newAtomicLong(0);privateAtomicLong exactQueries =newAtomicLong(0);privateAtomicLong hybridQueries =newAtomicLong(0);// 性能指标privateAtomicLong averageRetrievalTime =newAtomicLong(0);privateAtomicLong averageRerankTime =newAtomicLong(0);privateAtomicLong averageLlMTime =newAtomicLong(0);// 准确率指标privateMap<String,AtomicLong> chunkTypeHits =newConcurrentHashMap<>();privateMap<String,AtomicLong> productHits =newConcurrentHashMap<>();publicvoidrecordQuery(QueryAnalysisResult analysis,long retrievalTime,List<SearchResult> results){ totalQueries.incrementAndGet();if(analysis.isSemanticQuery()){ semanticQueries.incrementAndGet();}elseif(analysis.isExactQuery()){ exactQueries.incrementAndGet();}else{ hybridQueries.incrementAndGet();}// 更新平均检索时间（滑动平均）long currentAvg = averageRetrievalTime.get();long newAvg =(currentAvg *99+ retrievalTime)/100; averageRetrievalTime.set(newAvg);// 记录命中类型分布if(!results.isEmpty()){for(SearchResult result : results){String chunkType = result.getChunkType(); chunkTypeHits .computeIfAbsent(chunkType, k ->newAtomicLong(0)).incrementAndGet();String productName = result.getProductName();if(productName !=null){ productHits .computeIfAbsent(productName, k ->newAtomicLong(0)).incrementAndGet();}}}}publicMetricsReportgenerateReport(){MetricsReport report =newMetricsReport(); report.setTimestamp(Instant.now()); report.setTotalQueries(totalQueries.get()); report.setSemanticQueryRatio( totalQueries.get()>0?(double) semanticQueries.get()/ totalQueries.get():0); report.setAverageRetrievalTimeMs(averageRetrievalTime.get()); report.setChunkTypeDistribution(newHashMap<>(chunkTypeHits)); report.setProductDistribution(newHashMap<>(productHits));return report;}}

6.2 检索质量评估

设计自动化评估流程，持续优化系统：

@ServicepublicclassRetrievalEvaluator{// 评估检索系统在不同类型查询上的表现publicEvaluationResultevaluateOnTestSet(TestDataset testSet){EvaluationResult result =newEvaluationResult();for(TestCase testCase : testSet.getTestCases()){// 执行检索SearchResults searchResults = searchEngine.hybridSearch(SearchRequest.fromTestCase(testCase));// 计算精度指标double precision =calculatePrecision(testCase.getRelevantIds(), searchResults.getResultIds());double recall =calculateRecall(testCase.getRelevantIds(), searchResults.getResultIds());double ndcg =calculateNDCG(testCase.getRelevantIds(), searchResults.getScoredResults());// 按查询类型聚合统计String queryType =classifyQueryType(testCase.getQuery()); result.addMetric(queryType,"precision", precision); result.addMetric(queryType,"recall", recall); result.addMetric(queryType,"ndcg", ndcg);// 记录失败案例用于分析if(precision <0.5){ result.addFailureCase(testCase, searchResults);}}return result;}// A/B测试不同检索策略publicABTestResultcompareStrategies(SearchStrategy strategyA,SearchStrategy strategyB,TestDataset testSet){ABTestResult result =newABTestResult();for(TestCase testCase : testSet.getTestCases()){SearchResults resultsA =executeSearch(strategyA, testCase);SearchResults resultsB =executeSearch(strategyB, testCase);// 人工评估或自动评估double scoreA =evaluateResults(resultsA, testCase);double scoreB =evaluateResults(resultsB, testCase); result.recordComparison(testCase, scoreA, scoreB);}return result.calculateWinner();}}

七、总结与展望

本文详细介绍了基于 Milvus 和 Java SpringBoot 构建云厂商文档智能问答系统的完整方案。通过混合检索架构，系统能够同时处理语义查询和精确查询；通过结构化分块策略，保持了云文档的技术细节完整性；通过动态权重调整，优化了不同类型查询的检索效果。

未来，我们计划在以下方向进一步优化：

多模态检索扩展：支持云架构图、流程图等图像内容的检索
个性化推荐：基于用户角色和历史查询，提供个性化文档推荐
实时知识更新：建立文档变更监控，自动同步最新内容到知识库
跨厂商统一检索：构建统一的查询接口，跨云厂商比较产品特性

云文档智能问答系统的建设是一个持续迭代的过程，随着大模型技术和向量数据库技术的快速发展，我们相信这类系统将变得更加智能、高效，成为云原生时代不可或缺的基础设施。

实现提示：在实际部署时，建议从少量核心文档开始，逐步扩展知识库范围。密切监控系统指标，根据实际查询模式调整分块策略和检索权重，确保系统在实际使用中达到最佳效果。

基于Milvus与混合检索的云厂商文档智能问答系统：Java SpringBoot全栈实现

Ne0inhk

基于Milvus与混合检索的云厂商文档智能问答系统：Java SpringBoot全栈实现

一、核心挑战与架构选型

二、数据预处理：多格式文档的智能分块策略

2.1 统一文档解析接口

2.2 文档类型识别与分块策略路由

2.3 结构化元数据提取

三、Milvus向量存储与混合检索实现

3.1 集合Schema设计与优化

3.2 混合检索的核心实现

3.3 查询权重动态调整算法

四、SpringBoot微服务集成

4.1 异步文档处理管道

4.2 REST API设计

五、性能优化与生产部署

5.1 向量检索性能调优

5.2 缓存策略设计

六、系统监控与评估

6.1 关键监控指标

6.2 检索质量评估

七、总结与展望

Read more

Flutter 三方库 sparky 的鸿蒙化适配指南 - 实现极简 2D 游戏引擎功能、支持高效精灵图渲染与跨端游戏逻辑

Flutter 三方库 flutter_connectivity 的鸿蒙化适配指南 - 实现具备网络类型感知与连通性自愈的状态管理、支持端侧多网融合环境下的业务自适应实战

Flutter for OpenHarmony: Flutter 三方库 intl_utils 自动化管理鸿蒙应用国际化多语言资源（零样板代码的多端适配）

十五、中秋特别篇：深入理解 SELinux - 系统安全的“月饼”与“门禁”