Pinecone 是一个功能强大的向量数据库。本笔记展示了如何使用与
Pinecone 向量数据库相关的功能。
设置
要使用PineconeSparseVectorStore,您首先需要安装合作伙伴包以及本笔记中使用的其他包。
凭据
创建一个新的 Pinecone 帐户,或登录现有帐户,然后创建一个 API 密钥以在此笔记中使用。初始化
在初始化向量存储之前,让我们连接到 Pinecone 索引。如果不存在名为 index_name 的索引,则会创建一个。pinecone-sparse-english-v0,我们这样初始化它
管理向量存储
创建向量存储后,我们可以通过添加和删除不同的项目来与其交互。向向量存储添加项目
我们可以使用add_documents 函数将项目添加到向量存储中。
从向量存储中删除项目
我们可以使用delete 方法从向量存储中删除记录,向其提供要删除的文档 ID 列表。
查询向量存储
一旦我们将文档加载到向量存储中,我们就可以开始查询了。LangChain 中有各种方法可以做到这一点。 首先,我们将通过similarity_search 方法直接查询我们的 vector_store 来执行简单的向量搜索:source=="social" 的记录
"website" 源的不同记录。在我们的后者,经过过滤的查询中,情况不再如此。
相似性搜索和分数
我们还可以进行搜索,同时以(文档,分数) 元组列表的形式返回相似度分数。其中 文档 是一个 LangChain Document 对象,包含我们的文本内容和元数据。
作为检索器
在我们的链和代理中,我们经常将向量存储用作VectorStoreRetriever。要创建它,我们使用 as_retriever 方法
invoke 方法查询我们的检索器
用于检索增强生成的使用
有关如何将此向量存储用于检索增强生成 (RAG) 的指南,请参阅以下部分API 参考
有关所有功能和配置的详细文档,请参阅 API 参考:python.langchain.com/api_reference/pinecone/vectorstores_sparse/langchain_pinecone.vectorstores_sparse.PineconeSparseVectorStore.html#langchain_pinecone.vectorstores_sparse.PineconeSparseVectorStore 稀疏嵌入:python.langchain.com/api_reference/pinecone/embeddings/langchain_pinecone.embeddings.PineconeSparseEmbeddings.html以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。