K-RagRec：基于知识图谱检索增强生成的 LLM 推荐系统

K-RagRec：基于知识图谱检索增强生成的 LLM 推荐系统 | 极客日志

一、仅推理类（Inference-only）：'拿来就用，完全不训练'

这类模型没有任何训练步骤，直接把知识图谱的信息丢给大模型生成推荐，属于'最基础的 RAG'。

KG-Text（Wu et al., 2023b）具体做法：① 从知识图谱里检索目标物品的子图；② 把这些结构化的子图（三元组）转成自然语言文本；③ 把文本直接喂给大模型。缺点：转文本时会引入冗余/噪声，而且子图的结构关系被文本化后丢了。

KAPING（Baek et al., 2023）具体做法：① 从知识图谱里直接检索目标物品的三元组列表；② 把三元组列表直接传给大模型。缺点：只拿零散的三元组，没有子图的关联信息。

二、提示词调优类（Frozen LLM w/ PT）：'训练提示词，不碰大模型参数'

这类模型冻结大模型的所有参数，只训练'软提示词'（一段可学习的向量），把提示词和知识图谱信息结合喂给大模型，比'仅推理'效果好，但还是有缺陷。

PT w/ KG-Text（Prompt Tuning with KG-Text）具体做法：① 流程和'KG-Text'一样；② 额外训练一个软提示词；③ 把'软提示词 + KG-Text 的文本'一起喂给大模型。缺点：检索还是用 KG-Text 那套，检索深度只有一阶。

GraphToken w/ RAG（Perozzi et al., 2024）具体做法：① 把知识图谱的'节点/边'转成特殊的图 Token；② RAG 检索目标物品的图 Token，把这些 Token 加到提示词里；③ 训练这些图 Token 作为'软提示词'的一部分。缺点：只检索'单个图 Token'，没有子图的结构关系。

G-retriever（He et al., 2024）具体做法：① 从多种图里检索目标物品的子图；② 把这些子图的信息整合到提示词中；③ 训练提示词。缺点：检索时没有'选择性'+ 子图不重排序，导致冗余信息多、效率低。

三、微调类（Fine-tuning）：'微调大模型的部分参数'

这类模型会动大模型的参数（但用 LoRA 降低成本），效果不错但成本更高。

Lora w/ KG-Text 具体做法：① 流程和'KG-Text'一样；② 用LoRA（低秩适配）微调大模型；③ 让大模型学习'结合 KG-Text 文本做推荐'。缺点：还是需要微调大模型，成本比'仅训提示词 + GNN'高。

Lora w/ K-RagRec 具体做法：把 K-RagRec 的组件和 LoRA 微调结合。为什么这是'最佳但没必要'：它效果最好，但 K-RagRec不微调大模型也能接近这个效果——突出 K-RagRec'低成本 + 高性能'的优势。

K-RagRec：基于知识图谱检索增强生成的 LLM 推荐系统

摘要

原文翻译

核心解读

1 引言

原文翻译

核心解读

原文翻译

核心解读

原文翻译

核心解读

原文翻译

核心解读

原文翻译

核心解读

原文翻译

核心解读

2 相关工作

原文翻译

核心解读

原文翻译

核心解读

原文翻译

核心解读

3 方法论

3.1 预备知识

原文翻译

核心解读

原文翻译

核心解读

3.2 所提方法概述

原文翻译

核心解读

3.3 用于语义索引的多跳领域知识子图

原文翻译

核心解读

原文翻译

核心解读

3.4 流行度选择性检索策略

原文翻译

核心解读

3.5 知识子图检索

原文翻译

核心解读

3.6 知识子图重排序

原文翻译

核心解读

3.7 知识增强推荐

原文翻译

核心解读

3.8 K-RagRec 的优化

原文翻译

核心解读

4 实验

4.1 实验设置

4.1.1 数据集

原文翻译

核心解读

4.1.2 基线模型

原文翻译

核心解读

4.1.3 评估指标

原文翻译

核心解读

4.1.4 参数设置

原文翻译

核心解读

4.2 整体性能对比

原文翻译

核心解读

4.3 消融实验

原文翻译

核心解读

4.4 效率评估

原文翻译

核心解读

4.5 参数分析

原文翻译

核心解读

5 结论