跳到主要内容
从聊天记录中回忆、理解和提取数据。为个性化 AI 体验提供支持。
Zep 是一种用于 AI 助手应用程序的长期记忆服务。通过 Zep,您可以让 AI 助手回忆过去的对话,无论它们有多遥远,同时还能减少幻觉、延迟和成本。

Zep 工作原理

Zep 持久化和回忆聊天记录,并自动从这些聊天记录中生成摘要和其他工件。它还会嵌入消息和摘要,使您能够搜索 Zep 以获取来自过去对话的相关上下文。Zep 会异步执行所有这些操作,确保这些操作不会影响用户的聊天体验。数据会持久化到数据库中,允许您在增长需求时进行扩展。 Zep 还为文档向量搜索提供了一个简单易用的抽象,称为文档集合。这旨在补充 Zep 的核心内存功能,但并非旨在成为通用向量数据库。 Zep 允许您更刻意地构建您的提示:
  • 自动添加一些最新消息,数量可根据您的应用程序进行定制;
  • 在上述消息之前对最近的对话进行摘要;
  • 和/或从整个聊天会话中浮现出的上下文相关摘要或消息。
  • 和/或来自 Zep 文档集合的相关业务数据。

什么是 Zep Cloud?

Zep Cloud 是一项托管服务,其核心是 Zep 开源。除了 Zep 开源的内存管理功能外,Zep Cloud 还提供
  • 事实提取:自动从对话中构建事实表,而无需预先定义数据模式。
  • 对话分类:即时准确地对聊天对话进行分类。理解用户意图和情感,对用户进行细分等等。根据语义上下文路由链条,并触发事件。
  • 结构化数据提取:使用您定义的模式,快速从聊天对话中提取业务数据。了解您的助手接下来应该询问什么才能完成其任务。

Zep 开源

Zep 提供了一个开源版本,带有自托管选项。请参阅 Zep 开源 存储库以获取更多信息。您还可以找到 Zep 开源兼容的 检索器向量存储 示例。

Zep Cloud 安装与设置

Zep Cloud 文档
  1. 安装 Zep Cloud SDK
pip install zep_cloud
poetry add zep_cloud

检索器

Zep 的内存检索器是一个 LangChain 检索器,它使您能够从 Zep 会话中检索消息并使用它们来构建您的提示。 该检索器支持搜索单个消息和对话摘要。后者对于向 LLM 提供丰富但简洁的与过去对话相关的上下文非常有用。 Zep 的内存检索器支持相似性搜索和 最大边际相关性 (MMR) 重排序。MMR 搜索对于确保检索到的消息多样且彼此不相似非常有用。 请参阅 使用示例
from langchain_community.retrievers import ZepCloudRetriever

向量存储

Zep 的 文档向量存储 API 使您能够使用向量相似性搜索来存储和检索文档。Zep 不需要您了解距离函数、嵌入类型或索引最佳实践。您只需传入分块文档,Zep 会处理其余部分。 Zep 支持相似性搜索和 最大边际相关性 (MMR) 重排序。MMR 搜索对于确保检索到的文档多样且彼此不相似非常有用。
from langchain_community.vectorstores import ZepCloudVectorStore
请参阅 使用示例
以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。
© . This site is unofficial and not affiliated with LangChain, Inc.