记不住的 AI 是假的:我们为什么给数字分身换了个「脑子」
一个尴尬的事
前段时间做了一个数字分身。功能看着挺好——能写方案、能搜资料、能分析市场。但用了一个月,发现一个问题:
聊得越多,它越记不住。
你跟它说过的事,过两天换个问法,它就忘了。不是它傻,是它的记忆机制有问题。
之前的方案:所有记忆硬塞进大脑
大多数 AI Agent 的记忆机制是同一个套路:
每次对话开始时,把之前存的所有记忆文本,一股脑塞进 system prompt。就像考试前把所有笔记抄在手心——抄得了多少就有多少记忆。
问题是你手心只有那么大。
大模型单次能处理的信息是有限的(上下文窗口)。记忆多了就塞不下,后面的把前面的挤掉。你今天跟它说了 A,明天聊 B 的时候它已经把 A 忘了。
更坑的是:重启就丢。 WSL 一重启,所有记忆清空。从头再来。
新的方案:给 Agent 装一个搜索引擎
我们接入了一个叫 Mem0 的系统(GitHub 56k Stars,MIT 开源协议)。它不是存更多记忆,而是换了一种存和取的方式。
理解它的原理,可以类比三个东西:
1. 它不是记事本,是图书馆
之前是把所有记忆写在一个记事本上,手写满了就涂掉老的。
现在是图书馆。1条记忆和10000条记忆一样用,因为每次只取出最相关的那几本。
2. 它不靠关键词,靠意思搜
你搜"写方案",它能找出"帮客户做提案"——不是字一样,是意思相关。这是向量搜索和关键词搜索的区别。
3. 它会自己提炼
以前我需要手动说"记住这个"它才存。现在每次对话回合,它后台自动分析、提取关键事实入库。不需要刻意操作。
变化在哪里
最直观的体感三条:
第一条:聊得越多,它越懂你。
不是靠越来越长的 prompt,而是靠越来越准的搜索。存一万条和存一百条,召回精度一样。
第二条:电脑关机也不怕。
记忆存在云端,WSL 重启、电脑关机都不丢。昨天聊的事今天接着聊,不用从头再来。
第三条:多个分身共享记忆。
我本地 WSL 一个分身,云端服务器还有一个。以前两个分身的信息不互通,现在接同一套记忆系统,它们共享记忆库。
一个小思考
AI Agent 的能力一直在大幅提升——更长的上下文、更强的推理、更大的知识库。但所有这些能力都建立在同一个前提上:它得记得你是谁。
以前的记忆方案是"把更多信息塞进去",现在是"在无限的信息里找回你需要的那一条"。
方向反了。
塞进去是有上限的,搜出来是没有上限的。这不只是技术选择,是对 AI Agent 记忆这件事的认知差别。
本文对应的知识卡片:卡/观点/记不住的AI是假的-为什么给数字分身换了个脑子.md
技术参考:mem0ai/mem0 — 56.4k Stars · MIT协议