SemaDB 是由 SemaFind 提供的一款简单易用的向量相似度数据库,用于构建 AI 应用程序。托管的 SemaDB Cloud 提供了简单易用的开发体验,让您快速入门。
API 的完整文档以及示例和交互式沙盒可在 RapidAPI 上查阅。 本笔记本演示了 SemaDB Cloud 向量存储的使用。 您需要通过 pip install -qU langchain-community 安装 langchain-community 才能使用此集成。加载文档嵌入
为了在本地运行,我们使用 Sentence Transformers,它通常用于句子嵌入。您可以使用 LangChain 提供的任何嵌入模型。连接到 SemaDB
SemaDB Cloud 使用 RapidAPI 密钥进行身份验证。您可以通过创建免费的 RapidAPI 账户获取您的密钥。- “mycollection”:是要存储这些向量的集合名称。
- 768:是向量的维度。在我们的例子中,句子转换器嵌入生成 768 维向量。
- API_KEY:是您的 RapidAPI 密钥。
- embeddings:对应于文档、文本和查询的嵌入生成方式。
- DistanceStrategy:是使用的距离度量。如果使用 COSINE,包装器会自动对向量进行归一化。
相似度搜索
我们使用默认的 LangChain 相似度搜索接口来搜索最相似的句子。清理
您可以删除集合以删除所有数据。以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。