kotaemon:一个开源的干净且可定制的 RAG UI,用于构建和定制自己的文档问答系统。既考虑了最终用户的需求,也考虑了开发者的需求。

kotaemon 为想要在他们的文档上进行问答(QA)的最终用户,以及想要构建自己的 RAG 流程的开发者提供了一个功能性的 RAG UI。
+----------------------------------------------------------------------------+
| 最终用户:使用 kotaemon 构建的应用程序的用户。
| (您使用的应用程序类似于上面的演示示例)
| +----------------------------------------------------------------+
| | 开发者:使用 kotaemon 构建应用程序的人。
| | (您的项目中某处有 import kotaemon)
| | +----------------------------------------------------+
| | | 贡献者:使 kotaemon 变得更好的人。
| | | (您向这个代码库提交了 PR)
| | +----------------------------------------------------+
| +----------------------------------------------------------------+
+----------------------------------------------------------------------------+
RAG UI 特点(GraphRAG、Agent、多模态等)

- 自托管文档问答(RAG)Web UI:允许用户自己托管文档问答界面。
- 支持多用户登录:可以组织私人或公共文件集合,支持协作和分享。
- 组织 LLM 和嵌入模型:支持本地 LLM 和流行的 API 提供商,如 OpenAI、Azure、Ollama、Groq 等。
- 混合 RAG 管道:提供混合(全文和向量)检索器和重新排名,以确保最佳的检索质量。
- 多模态问答支持:支持在包含图表和表格的多个文档上进行问答,并支持多模态文档解析。
- 高级引用与文档预览:系统默认提供详细的引用以确保 LLM 答案的正确性,可以在浏览器内的 PDF 查看器中查看引用(包括相关分数)并高亮显示。
- 支持复杂推理方法:使用问题分解来回答复杂或多跳问题,支持基于 Agent 的推理,如 ReAct、ReWOO 和其他代理。
- 可配置的设置 UI:可以在 UI 上调整检索和生成过程中的大多数重要方面(包括提示)。
- 可扩展性:基于 Gradio 构建,用户可以自由定制或添加任何 UI 元素。同时,旨在支持多种文档索引和检索策略,提供了 GraphRAG 索引管道作为示例。
RAG UI 操作指南(提供体验 Demo)
chat 部分

file 部分:file collection、GraphRAG collection

resources 部分:index(索引)、llm(大模型)、embedding(向量)

settings:retrieval(检索)、reasoning(推理)

项目代码:https://github.com/Cinnamon/kotaemon demo 体验:https://huggingface.co/spaces/taprosoft/kotaemon

