记忆系统
数字分身
技术深度
AI Agent

记不住的 AI 是假的:我们为什么给数字分身换了个「脑子」

老潘 · 2026-05-23 · 第002篇

一个尴尬的事

前段时间做了一个数字分身。功能看着挺好——能写方案、能搜资料、能分析市场。但用了一个月,发现一个问题:

聊得越多,它越记不住。

你跟它说过的事,过两天换个问法,它就忘了。不是它傻,是它的记忆机制有问题。


之前的方案:所有记忆硬塞进大脑

大多数 AI Agent 的记忆机制是同一个套路:

每次对话开始时,把之前存的所有记忆文本,一股脑塞进 system prompt。就像考试前把所有笔记抄在手心——抄得了多少就有多少记忆。

问题是你手心只有那么大。

大模型单次能处理的信息是有限的(上下文窗口)。记忆多了就塞不下,后面的把前面的挤掉。你今天跟它说了 A,明天聊 B 的时候它已经把 A 忘了。

更坑的是:重启就丢。 WSL 一重启,所有记忆清空。从头再来。


新的方案:给 Agent 装一个搜索引擎

我们接入了一个叫 Mem0 的系统(GitHub 56k Stars,MIT 开源协议)。它不是存更多记忆,而是换了一种存和取的方式。

理解它的原理,可以类比三个东西:

1. 它不是记事本,是图书馆

之前是把所有记忆写在一个记事本上,手写满了就涂掉老的。

现在是图书馆。1条记忆和10000条记忆一样用,因为每次只取出最相关的那几本

2. 它不靠关键词,靠意思搜

你搜"写方案",它能找出"帮客户做提案"——不是字一样,是意思相关。这是向量搜索和关键词搜索的区别。

3. 它会自己提炼

以前我需要手动说"记住这个"它才存。现在每次对话回合,它后台自动分析、提取关键事实入库。不需要刻意操作。


变化在哪里

最直观的体感三条:

第一条:聊得越多,它越懂你。

不是靠越来越长的 prompt,而是靠越来越准的搜索。存一万条和存一百条,召回精度一样。

第二条:电脑关机也不怕。

记忆存在云端,WSL 重启、电脑关机都不丢。昨天聊的事今天接着聊,不用从头再来。

第三条:多个分身共享记忆。

我本地 WSL 一个分身,云端服务器还有一个。以前两个分身的信息不互通,现在接同一套记忆系统,它们共享记忆库。


一个小思考

AI Agent 的能力一直在大幅提升——更长的上下文、更强的推理、更大的知识库。但所有这些能力都建立在同一个前提上:它得记得你是谁。

以前的记忆方案是"把更多信息塞进去",现在是"在无限的信息里找回你需要的那一条"。

方向反了。

塞进去是有上限的,搜出来是没有上限的。这不只是技术选择,是对 AI Agent 记忆这件事的认知差别。


本文对应的知识卡片:卡/观点/记不住的AI是假的-为什么给数字分身换了个脑子.md
技术参考:mem0ai/mem0 — 56.4k Stars · MIT协议