NebiusRetriever 允许使用来自 Nebius AI Studio 的嵌入进行高效的相似性搜索。它利用高质量的嵌入模型来对文档进行语义搜索。 此检索器针对需要对文档集合执行相似性搜索但不需要将向量持久化到向量数据库的场景进行了优化。它使用矩阵运算在内存中执行向量相似性搜索,使其对于中等大小的文档集合高效。设置
安装
Nebius 集成可以通过 pip 安装凭据
Nebius 需要一个 API 密钥,该密钥可以作为初始化参数 `api_key` 传入,或者设置为环境变量 `NEBIUS_API_KEY`。您可以通过在 Nebius AI Studio 上创建账户来获取 API 密钥。实例化
NebiusRetriever 需要一个 NebiusEmbeddings 实例和一个文档列表。以下是初始化它的方法
用法
检索相关文档
您可以使用检索器查找与查询相关的文档使用 get_relevant_documents
您也可以直接使用get_relevant_documents 方法(尽管 invoke 是首选接口)
自定义结果数量
您可以通过将k 作为参数传递来在查询时调整结果数量
异步支持
NebiusRetriever 支持异步操作处理空文档
在链中使用
NebiusRetriever 在 LangChain RAG 管道中无缝工作。以下是使用 NebiusRetriever 创建简单 RAG 链的示例创建搜索工具
您可以使用NebiusRetrievalTool 为代理创建工具
工作原理
NebiusRetriever 的工作原理-
初始化期间
- 它存储提供的文档
- 它使用提供的 NebiusEmbeddings 计算所有文档的嵌入
- 这些嵌入存储在内存中以便快速检索
-
检索期间(
invoke或get_relevant_documents)- 它使用相同的嵌入模型嵌入查询
- 它计算查询嵌入与所有文档嵌入之间的相似性分数
- 它返回按相似性排序的前 k 个文档
API 参考
有关 Nebius AI Studio API 的更多详细信息,请访问 Nebius AI Studio 文档。以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。