从聊天记录中回忆、理解和提取数据。为个性化 AI 体验提供支持。
Zep 是一种用于 AI 助手应用程序的长期记忆服务。通过 Zep,您可以让 AI 助手回忆过去的对话,无论它们有多遥远,同时还能减少幻觉、延迟和成本。
Zep 工作原理
Zep 持久化和回忆聊天记录,并自动从这些聊天记录中生成摘要和其他工件。它还会嵌入消息和摘要,使您能够搜索 Zep 以获取来自过去对话的相关上下文。Zep 会异步执行所有这些操作,确保这些操作不会影响用户的聊天体验。数据会持久化到数据库中,允许您在增长需求时进行扩展。 Zep 还为文档向量搜索提供了一个简单易用的抽象,称为文档集合。这旨在补充 Zep 的核心内存功能,但并非旨在成为通用向量数据库。 Zep 允许您更刻意地构建您的提示:- 自动添加一些最新消息,数量可根据您的应用程序进行定制;
- 在上述消息之前对最近的对话进行摘要;
- 和/或从整个聊天会话中浮现出的上下文相关摘要或消息。
- 和/或来自 Zep 文档集合的相关业务数据。
什么是 Zep Cloud?
Zep Cloud 是一项托管服务,其核心是 Zep 开源。除了 Zep 开源的内存管理功能外,Zep Cloud 还提供- 事实提取:自动从对话中构建事实表,而无需预先定义数据模式。
- 对话分类:即时准确地对聊天对话进行分类。理解用户意图和情感,对用户进行细分等等。根据语义上下文路由链条,并触发事件。
- 结构化数据提取:使用您定义的模式,快速从聊天对话中提取业务数据。了解您的助手接下来应该询问什么才能完成其任务。
Zep 开源
Zep 提供了一个开源版本,带有自托管选项。请参阅 Zep 开源 存储库以获取更多信息。您还可以找到 Zep 开源兼容的 检索器 和 向量存储 示例。Zep Cloud 安装与设置
Zep Cloud 文档- 安装 Zep Cloud SDK
检索器
Zep 的内存检索器是一个 LangChain 检索器,它使您能够从 Zep 会话中检索消息并使用它们来构建您的提示。 该检索器支持搜索单个消息和对话摘要。后者对于向 LLM 提供丰富但简洁的与过去对话相关的上下文非常有用。 Zep 的内存检索器支持相似性搜索和 最大边际相关性 (MMR) 重排序。MMR 搜索对于确保检索到的消息多样且彼此不相似非常有用。 请参阅 使用示例。向量存储
Zep 的 文档向量存储 API 使您能够使用向量相似性搜索来存储和检索文档。Zep 不需要您了解距离函数、嵌入类型或索引最佳实践。您只需传入分块文档,Zep 会处理其余部分。 Zep 支持相似性搜索和 最大边际相关性 (MMR) 重排序。MMR 搜索对于确保检索到的文档多样且彼此不相似非常有用。以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。