【AIGC】大模型面试高频考点19：常见的17种RAG方案

优质文章学习记录

06 Apr 2026 — 2 min read

RAG技术全景解析：从基础分块到自适应多模态检索

一、基础分块与语义优化
二、检索优化与重排序
三、智能路由与自反思机制
四、结构化与多源融合
五、纠错与多模态扩展
- 1. CRAG（纠错型 RAG）
- 2. Multi-Model RAG（多模态检索增强生成）
六、总结与展望

近年来，随着大语言模型（LLM）的广泛应用，检索增强生成（Retrieval-Augmented Generation，RAG）系统逐渐成为连接私有知识库与智能问答的核心架构。RAG 不仅弥补了大模型在实时性与事实性上的不足，也通过多种技术路径不断演进，形成了丰富的方法体系。

本文基于一份内部技术评估表，系统梳理了当前主流的 RAG 技术路线，并对其核心思路、实现难度与应用场景进行解读。

一、基础分块与语义优化

1. Simple RAG（简单切块）

核心思路：将文档按固定长度切分为多个 chunk，直接用于检索。切分策略包括：按字数切块、按分句切块、按分段切块
优点：实现简单，适合小规模项目或初步验证。
局限：容易割裂语义，导致上下文丢失。

在这里插入图片描述

示例：

回答用户的问题：“北京有什么著名的景点？”

在这里插入图片描述

Read more

Llama-Factory是否支持增量训练？可通过加载检查点实现

Llama-Factory 是否支持增量训练？从检查点恢复的完整实践解析在大模型微调日益普及的今天，一个看似简单却极为关键的问题浮出水面：训练到一半断了，还能不能接着练？这不仅是实验室里的学术问题，更是生产环境中的生死命题。一次意外重启、一次资源调度中断，可能意味着几十小时的GPU算力付诸东流。尤其是在中小团队缺乏高可用训练集群的情况下，能否“续上”之前的进度，直接决定了项目是否可行。幸运的是，Llama-Factory 给出了肯定的答案——它不仅支持增量训练，而且实现得相当成熟。通过加载检查点（checkpoint），你可以像打开未保存的文档一样，无缝恢复训练状态。但这背后究竟如何运作？实际使用中又有哪些坑需要避开？我们来深入拆解。增量训练的本质：不只是“加载权重”那么简单很多人误以为“继续训练”就是把模型权重读回来再跑几个epoch。但真实的训练状态远比这复杂得多。想象一下你在跑步机上跑了5公里，突然停电。恢复供电后，机器如果只记得你跑了5公里，却不记得你的心率、配速和当前速度，那重新开始时只能从零加速——这不是“继续”，而是“重来”。同理，在深度学习

在 Mac Mini M4 上本地跑大模型（Ollama + Llama + ComfyUI + Stable Diffusion ｜ Flux）

在 Mac Mini M4 上本地跑大模型（Ollama + Llama + ComfyUI + Stable Diffusion ｜ Flux）

Mac Mini M4 配备了苹果自家研发的 M1/M2/M4 芯片，具有强大的处理能力，能够支持本地跑一些大模型，尤其是在使用如 Ollama、Llama、ComfyUI 和 Stable Diffusion 这类 AI 相关工具时，性能表现非常好。本教程将指导你如何在 Mac Mini M4 上本地部署并运行这些大模型，涵盖从环境搭建到使用的全流程。一、准备工作 1. 确保系统更新确保你的 macOS 版本已更新到最新的版本（例如 macOS 13.0 以上），这将确保兼容性和性能。安装 Homebrew（macOS 包管理工具） Homebrew 是 macOS 上非常流行的包管理工具，它帮助你方便地安装各种软件。在终端中输入以下命令来安装

基于Whisper-large-v3的多语言翻译系统开发

基于Whisper-large-v3的多语言翻译系统开发想象一下这样的场景：一场国际线上会议正在进行，参会者来自世界各地，说着不同的语言。一位德国同事用德语发言，一位日本伙伴用日语提问，而你作为会议组织者，需要实时理解所有人的发言，并确保沟通顺畅。传统做法是雇佣多名翻译，成本高昂且响应延迟。现在，有了基于Whisper-large-v3构建的多语言翻译系统，这一切都可以自动化完成，而且成本只是传统方案的零头。本文将带你一步步构建这样一个系统，从语音识别到文本翻译，形成一个完整的流水线。无论你是想为跨国团队开发内部工具，还是想为内容平台添加多语言字幕功能，这套方案都能为你提供一个坚实的起点。 1. 为什么选择Whisper-large-v3？在开始动手之前，我们先聊聊为什么Whisper-large-v3是构建多语言翻译系统的理想选择。 Whisper-large-v3是OpenAI开源的语音识别模型，它最大的特点就是“多语言”和“高精度”。这个模型在超过100万小时的音频数据上训练过，支持99种语言的识别，包括英语、中文、法语、德语、日语、韩语等主流语言，甚至还能识别

无需任何拓展Copilot接入第三方OpenAI接口教程

禁止搬运，转载需标明本文链接省流：修改"C:\Users\你的用户名称\.vscode\extensions\github.copilot-chat-0.35.0\package.json"中的"when": "productQualityType != 'stable'"为"when": "productQualityType == 'stable'"，即可在copilot添加支持openAI的第三方接口我在寻找怎么让copilot接入第三方接口的时候，通过别人的贴子（长期有效）接入第三方 OpenAI 兼容模型到 GitHub Copilot-ZEEKLOG博客发现了官方的讨论Add custom OpenAI endpoint configuration