langchain-google-genai 包中的 GoogleGenerativeAIEmbeddings 类连接到 Google 的生成式 AI 嵌入服务。 这将帮助您开始使用 LangChain 的 Google 生成式 AI 嵌入模型(如 Gemini)。有关 GoogleGenerativeAIEmbeddings 功能和配置选项的详细文档,请参阅 API 参考。概览
集成详情
设置
要访问 Google 生成式 AI 嵌入模型,您需要创建一个 Google Cloud 项目,启用生成式语言 API,获取 API 密钥,并安装langchain-google-genai 集成包。
凭据
要使用 Google 生成式 AI 模型,您必须拥有 API 密钥。您可以在 Google AI Studio 中创建一个。有关说明,请参阅 Google 文档。 获取密钥后,将其设置为环境变量GOOGLE_API_KEY:安装
用法
批量处理
您还可以一次嵌入多个字符串以加快处理速度索引和检索
嵌入模型通常用于检索增强生成 (RAG) 流程,既作为数据索引的一部分,也用于后续检索数据。有关更详细的说明,请参阅我们的RAG 教程。 下面,我们将演示如何使用我们上面初始化的embeddings 对象来索引和检索数据。在此示例中,我们将在 InMemoryVectorStore 中索引和检索一个示例文档。任务类型
GoogleGenerativeAIEmbeddings 可选支持 task_type,目前必须是以下之一
SEMANTIC_SIMILARITY:用于生成优化以评估文本相似度的嵌入。CLASSIFICATION:用于生成优化以根据预设标签对文本进行分类的嵌入。CLUSTERING:用于生成优化以根据相似性对文本进行聚类的嵌入。RETRIEVAL_DOCUMENT、RETRIEVAL_QUERY、QUESTION_ANSWERING和FACT_VERIFICATION:用于生成优化以进行文档搜索或信息检索的嵌入。CODE_RETRIEVAL_QUERY:用于根据自然语言查询(例如对数组排序或反转链表)检索代码块。代码块的嵌入使用RETRIEVAL_DOCUMENT计算。
embed_documents 方法中使用 RETRIEVAL_DOCUMENT,在 embed_query 方法中使用 RETRIEVAL_QUERY。如果您提供了任务类型,我们将在所有方法中使用该类型。
API 参考
有关GoogleGenerativeAIEmbeddings 功能和配置选项的详细文档,请参阅 API 参考。
额外配置
您可以将以下参数传递给 ChatGoogleGenerativeAI 以自定义 SDK 的行为client_options:要传递给 Google API 客户端的 客户端选项,例如自定义的client_options["api_endpoint"]transport:要使用的传输方法,例如rest、grpc或grpc_asyncio。
以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。