AI Agent 记忆系统技术综述:核心挑战与主流方案
综述了 AI Agent 记忆系统的核心挑战、分类体系及五大技术路线(上下文窗口、RAG、文件系统、知识图谱、多 Agent 推理)。对比了 Mem0、Zep、Letta、Cognee、OpenClaw、ASMR 等代表性系统,分析了向量检索与 Agent 推理的差异,并展望了混合架构与标准化趋势。

综述了 AI Agent 记忆系统的核心挑战、分类体系及五大技术路线(上下文窗口、RAG、文件系统、知识图谱、多 Agent 推理)。对比了 Mem0、Zep、Letta、Cognee、OpenClaw、ASMR 等代表性系统,分析了向量检索与 Agent 推理的差异,并展望了混合架构与标准化趋势。

近年来,大语言模型(LLM)驱动的 AI Agent 正在从单次对话工具向长期协作搭档进化。然而,一个根本性的短板始终制约着这一进化——记忆。每次对话结束,Agent 就像一个失忆症患者,忘记了所有交流过的内容。128K 的上下文窗口再大,重开对话就是陌生人。
本文旨在对 AI Agent 记忆系统进行系统性的技术综述,内容涵盖记忆的分类体系、核心技术路线、代表性系统详解、横向对比以及未来发展趋势。作为技术系列开篇,本文将为后续深入分析 OpenClaw 和 ASMR(Supermemory)两套记忆系统奠定基础。
当前的 LLM 本质上是无状态的函数:给定输入,返回输出,对话结束即遗忘一切。这在单次问答场景下没有问题,但当我们期望 AI 成为长期搭档时,问题就暴露了:
在 Agent 架构中,感知(Perception)、推理(Reasoning)、行动(Action)三大能力已经通过 LLM + Tool Use 基本实现。但记忆(Memory)——让 Agent 跨越时间边界保持连续性的能力——仍是一个待攻克的难题。
正如 Supermemory 团队所说:在未来几年,数十亿个 Agent 将会高度个性化,针对每位用户量身定制——持续学习、不断进化。这正是我们深入研究 AI 记忆的原因。
2025 年底,学术界发表的综述论文《Memory in the Age of AI Agents》系统性地梳理了这一领域的研究图景,标志着 Agent 记忆从附加功能正式升级为核心基础设施。
构建一个合格的 Agent 记忆系统,需要解决以下核心难题:
用户上个月说我住在北京,这个月说我刚搬到上海。系统必须识别出后者覆盖了前者,只返回上海——而不是把两条信息一股脑丢给 LLM 让它猜。
11.5 万 token 的对话历史中,可能只有 3 句话跟当前问题相关。检索噪声过高,LLM 同样无法有效利用信息。
我明天有考试——这条信息在明天过后就应该自动失效,不应变成永久噪声。自动遗忘机制是记忆系统区别于传统数据库的关键特性。
Agent 的记忆不仅来自对话,还可能来自邮件、文档、代码仓库、日历等多种来源。如何统一管理和检索这些异构信息?
记忆中包含大量个人敏感信息。本地部署 vs 云端托管、数据加密、访问控制、GDPR/EU AI Act 合规——这些都是必须考虑的工程问题。
借鉴认知科学中的人类记忆分类,Agent 记忆可以从多个维度进行划分。
| 类型 | 描述 | 人类类比 | Agent 实现 |
|---|---|---|---|
| 工作记忆 | 当前对话上下文 | 短期记忆 / 工作台 | LLM 上下文窗口 |
| 短期记忆 | 近期几轮对话 | 几小时~几天的回忆 | 会话历史缓存 |
| 长期记忆 | 跨越天、周、月的信息 | 长期记忆 | 持久化存储(DB/文件) |
| 情景记忆 | 特定事件的时间、地点、细节 | 上周三的会议 | 时间线重建 |
| 类型 | 描述 | 示例 |
|---|---|---|
| 语义记忆 | 关于用户的事实性知识 | 用户是资深工程师,用 Vim |
| 情景记忆 | 具体事件及其上下文 | 上周三讨论了认证模块迁移 |
| 程序记忆 | 如何执行某个任务 | 部署时需要先跑测试 |
| 元记忆 | 关于记忆本身的知识 | 这条信息是上周更新的 |
| 形式 | 代表系统 | 优势 | 劣势 |
|---|---|---|---|
| 向量数据库 | Mem0, Zep | 语义检索强 | 时序推理弱 |
| 知识图谱 | Cognee, Mem0 Graph | 关系推理强 | 构建成本高 |
| 文件系统 | OpenClaw, Letta FS | 透明可编辑 | 检索精度受限 |
| 关系数据库 | Zep (Postgres) | 结构化查询 | 语义理解弱 |
| 纯内存 | ASMR | 速度快,可嵌入 | 持久化待解决 |
核心思想:最朴素的方案——把所有历史信息塞进 LLM 的上下文窗口。
[System Prompt] + [历史对话] + [当前问题] → LLM →回答
优势:
劣势:
代表:ChatGPT 早期版本、大部分简单 Chatbot
核心思想:将历史信息切分为 chunks,通过 embedding 向量化后存入向量数据库。查询时,先检索最相关的 chunks,再注入 LLM 上下文。
用户问题 → Embedding → 向量检索 → Top-K chunks → 注入上下文 → LLM →回答
优势:
劣势:
代表:Mem0、Zep、OpenClaw 的核心检索层
核心思想:直接用 Markdown 文件存储记忆,Agent 像人一样读写文件。
MEMORY.md(长期记忆) memory/2026-03-23.md(每日笔记) USER.md(用户画像)
优势:
劣势:
代表:OpenClaw(文件 + 向量混合)、Letta Filesystem
核心思想:将记忆建模为实体 - 关系图谱,捕获事实之间的结构化关系。
[用户:张三] --居住在--> [城市:上海] [用户:张三] --使用工具--> [编辑器:Vim] [事件:认证迁移] --时间--> [2026-03-15] [事件:认证迁移] --参与者--> [用户:张三]
优势:
劣势:
代表:Cognee、Mem0 Graph Memory、Microsoft GraphRAG
核心思想:完全抛弃向量数据库和 Embedding,用多个专业化 Agent 并行阅读和推理已存储的信息,以认知理解替代数学相似度。
用户问题 → 编排器 → [搜索 Agent1: 直接事实] + [搜索 Agent2: 上下文线索] + [搜索 Agent3: 时间线重建] → 汇总验证 → [8-12 个专家 Agent 并行回答] → 投票/裁判 → 最终答案
优势:
劣势:
代表:ASMR(Supermemory)
开发者:Mem0.ai
架构:
核心特性:
适用场景:需要快速集成记忆能力的 SaaS 产品、客服 Agent、个性化推荐系统
开发者:Zep AI
架构:
核心特性:
适用场景:企业级 Agent 应用、需要合规保障的场景
开发者:UC Berkeley 研究团队 → Letta 公司
架构:
memory_insert、memory_search 等工具函数自主操作记忆核心特性:
适用场景:需要 Agent 高度自主的场景、研究探索
开发者:Cognee AI
架构:
核心特性:
适用场景:知识密集型 Agent、需要复杂关系推理的场景
开发者:学术研究团队(2025 年论文,被引 40 次)
架构:
核心特性:
适用场景:学术研究、需要精细记忆管理的复杂 Agent 系统
开发者:OpenClaw 开源社区
架构:
核心技术栈:
Markdown 文件 ↓ 文件监听 (watch) 分块 (400 tokens, 重叠 80) ↓ Embedding (text-embedding-3-small 等) ↓ SQLite 存储 (chunks 表 + FTS5 虚拟表) ↓ Hybrid Search (向量 + 全文混合) ↓ 后处理 MMR 去重 + 时序衰减 + 引用溯源 ↓ 注入 LLM 上下文
核心特性:
Source: path#L12-L20,可追溯来源劣势:
适用场景:个人 AI 助手、隐私敏感场景、开发者工作流
系列预告:后续将发布 OpenClaw 记忆系统源码深度解析 专题博客,从
memory-search.ts到hybrid.ts,逐模块拆解其实现。
开发者:Supermemory 团队(@DhravyaShah)
全称:Agentic Search and Memory Retrieval(智能体搜索与记忆检索)
发布时间:2026 年 3 月 22 日,X 平台曝光量 199.6 万次
架构:
原始对话 ↓ 3 个观察者 Agent 并行读取 (Gemini 2.0 Flash) ↓ 提取六维结构化知识 [个人信息 | 偏好 | 事件 | 时序数据 | 信息更新 | 助手信息] ↓ 存储 + 源映射 用户问题到来 ↓ 3 个搜索 Agent 并行推理 [Agent1: 直接事实] [Agent2: 上下文线索] [Agent3: 时间线重建] ↓ 汇总 + 逐字验证 8-12 个专家 Agent 并行回答 ↓ 多数投票 / 聚合裁判 最终答案
核心技术突破:
三大工程洞察:
劣势:
后续计划:
适用场景:对记忆精度要求极苛刻的复杂长期 Agent、研究探索
系列预告:后续将发布 ASMR 多 Agent 记忆架构深度解析 专题博客,详细拆解其 3+3 Agent 流水线和投票裁判机制。
| 维度 | Mem0 | Zep | Letta | Cognee | MemOS | OpenClaw | ASMR |
|---|---|---|---|---|---|---|---|
| 存储后端 | 向量 DB+ 图谱 | PostgreSQL | 分层内存 | 图数据库 | 分层架构 | SQLite | 纯内存 |
| 需要 Embedding | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ |
| 检索方式 | 向量 + 图谱 | 向量 + 事实 | Agent 自主 | 图查询 | 统一 API | 混合检索 | Agent 推理 |
| 信息矛盾处理 | ✅ 自动更新 | ✅ 冲突解决 | 部分 | ✅ 图更新 | ✅ | ❌ | ✅ Agent 推理 |
| 自动遗忘 | ✅ | ✅ | ❌ | ❌ | ✅ | ❌ | ✅ |
| 部署模式 | 云 + 自部署 | 云 + 自部署 | 自部署 | 自部署 | 自部署 | 本地 | 未明确 |
| 开源 | ✅ | 部分 | ✅ | ✅ | ✅ | ✅ | 4 月开源 |
| 多语言支持 | 依赖 Embedding | 依赖 Embedding | 依赖 LLM | 依赖 LLM | 依赖 Embedding | ✅ 8 种语言 FTS | 依赖 LLM |
| 隐私友好 | ⚠️ 云端 | ⚠️ 云端 | ✅ 本地 | ✅ 本地 | ✅ 本地 | ✅✅ 全本地 | 未明确 |
| 系统 | LongMemEval-s | LoCoMo | 备注 |
|---|---|---|---|
| ASMR 8 变体 | ~98.6% | - | 实验性,非生产 |
| ASMR 12 变体 | ~97.2% | - | 单一共识答案 |
| MemOS-0630 | - | 排名第一 | 超越所有对手 |
| Supermemory v1 | ~85% | - | 2025 年首版 |
| Letta Filesystem | - | 74.0% | 纯文件系统! |
| OpenClaw | 未公开 | 未公开 | 生产系统 |
| Mem0 | 未公开 | 未公开 | 商业系统 |
| Zep | 未公开 | 未公开 | 商业系统 |
⚠️ 注意:各系统在基准测试上的评估标准和条件可能不完全一致,横向比较需谨慎。部分商业系统各自声称优于竞争对手,但目前尚无独立的、全面的第三方对比评测。
这是当前记忆系统最核心的路线分歧。
向量检索派(OpenClaw、Mem0、Zep)认为:
Agent 推理派(ASMR)认为:
分析认为:两种路线并非完全对立,未来可能走向混合架构——向量检索做初筛(快速缩小范围),Agent 推理做精排(处理矛盾和时序推理),这样可以兼顾效率和准确率。
主动提取更智能,但也更容易引入错误(错误提取、过度提取)。被动存储更可控,但依赖 Agent 的自律性。
OpenClaw 的 Hybrid Search(70% 向量 + 30% FTS)正是试图在两者之间取得平衡。
| 模式 | 代表 | 隐私性 | 便利性 |
|---|---|---|---|
| 全本地 | OpenClaw | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ |
| 自部署云 | Letta, Cognee | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
| 托管 SaaS | Mem0 Cloud, Zep Cloud | ⭐⭐ | ⭐⭐⭐⭐⭐ |
由 Supermemory 团队重点使用的基准测试,专注于长期记忆能力评估:
另一个广泛使用的记忆基准:
| 维度 | 描述 |
|---|---|
| 准确率 | 检索到的信息是否正确 |
| 召回率 | 是否找到了所有相关信息 |
| 时效性 | 是否返回了最新版本的信息 |
| 抗矛盾 | 面对矛盾信息是否能给出正确答案 |
| 延迟 | 检索到回答的端到端延迟 |
| 成本 | 每次查询的 API / 计算成本 |
向量检索做粗筛 + Agent 推理做精排 + 知识图谱做关系推理,三者融合的混合架构可能是最终答案。
正如 Supermemory 团队所预见的:过去几年,大模型的竞争集中在参数规模、推理速度、上下文窗口长度。但记忆才是让 AI 从工具变成搭档的最后一块拼图。
目前各记忆系统各自为政,缺乏统一的接口标准。MemOS 提出的记忆操作系统概念,以及行业对统一评估基准的需求,都在推动标准化进程。
当前大多数记忆系统只处理文本。随着多模态 Agent 的普及(语音、图像、视频),记忆系统也需要支持多模态信息的存储和检索。OpenClaw 已经开始支持图片 Embedding,但仍处于早期阶段。
在企业场景下,多个 Agent 可能需要共享部分记忆但保护敏感信息。联邦学习 + 差分隐私的技术路线可能被引入记忆系统。
本文作为 Agent Memory 技术系列开篇综述,后续将推出两篇深度解析:
memory-search.ts 到 hybrid.ts 逐模块拆解敬请期待。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online