跳到主要内容
Databricks 智能平台是全球首个由生成式 AI 提供支持的数据智能平台。将 AI 融入您业务的方方面面。
Databricks 以各种方式支持 LangChain 生态系统
  1. 🚀 模型服务 - 通过高可用和低延迟推理端点,在 Databricks 模型服务上访问最先进的 LLM,如 DBRX、Llama3、Mixtral,或您微调的模型。LangChain 提供 LLM (Databricks)、聊天模型 (ChatDatabricks) 和嵌入 (DatabricksEmbeddings) 实现,简化了将托管在 Databricks 模型服务上的模型与 LangChain 应用程序的集成。
  2. 📃 向量搜索 - Databricks 向量搜索是一个无服务器向量数据库,无缝集成到 Databricks 平台中。使用 DatabricksVectorSearch,您可以将高度可扩展和可靠的相似性搜索引擎集成到 LangChain 应用程序中。
  3. 📊 MLflow - MLflow 是一个开源平台,用于管理完整的 ML 生命周期,包括实验管理、评估、跟踪、部署等。MLflow 的 LangChain 集成简化了开发和操作现代复合 ML 系统的过程。
  4. 🌐 SQL 数据库 - Databricks SQL 已与 LangChain 中的 SQLDatabase 集成,允许您访问自动优化、性能卓越的数据仓库。
  5. 💡 开放模型 - Databricks 开源模型,如 DBRX,可通过 Hugging Face Hub 获得。这些模型可以直接与 LangChain 结合使用,利用其与 transformers 库的集成。

安装

Databricks 的第一方集成现在已在 databricks-langchain 合作伙伴包中提供。
pip install databricks-langchain
旧的 langchain-databricks 合作伙伴包仍然可用,但很快将被弃用。

聊天模型

ChatDatabricks 是一个聊天模型类,用于访问托管在 Databricks 上的聊天端点,包括 Llama3、Mixtral 和 DBRX 等最先进的模型,以及您自己的微调模型。
from databricks_langchain import ChatDatabricks

chat_model = ChatDatabricks(endpoint="databricks-meta-llama-3-70b-instruct")
有关如何在 LangChain 应用程序中使用它的更多指导,请参阅使用示例

LLM

Databricks 是一个 LLM 类,用于访问托管在 Databricks 上的完成端点。
文本完成模型已被弃用,最新和最受欢迎的模型是聊天完成模型。请改用 ChatDatabricks 聊天模型来使用这些模型和工具调用等高级功能。
from langchain_community.llm.databricks import Databricks

llm = Databricks(endpoint="your-completion-endpoint")
有关如何在 LangChain 应用程序中使用它的更多指导,请参阅使用示例

嵌入

DatabricksEmbeddings 是一个嵌入类,用于访问托管在 Databricks 上的文本嵌入端点,包括 BGE 等最先进的模型,以及您自己的微调模型。
from databricks_langchain import DatabricksEmbeddings

embeddings = DatabricksEmbeddings(endpoint="databricks-bge-large-en")
有关如何在 LangChain 应用程序中使用它的更多指导,请参阅使用示例 Databricks 向量搜索是一个无服务器相似性搜索引擎,允许您将数据的向量表示(包括元数据)存储在向量数据库中。通过向量搜索,您可以从 Delta 表(由 Unity Catalog 管理)创建自动更新的向量搜索索引,并通过简单的 API 查询它们以返回最相似的向量。
from databricks_langchain import DatabricksVectorSearch

dvs = DatabricksVectorSearch(
    endpoint="<YOUT_ENDPOINT_NAME>",
    index_name="<YOUR_INDEX_NAME>",
    index,
    text_column="text",
    embedding=embeddings,
    columns=["source"]
)
docs = dvs.similarity_search("What is vector search?)
有关如何设置向量索引并将其与 LangChain 集成的更多信息,请参阅使用示例

MLflow 集成

在 LangChain 集成的背景下,MLflow 提供以下功能
  • 实验跟踪:跟踪并存储 LangChain 实验中的模型、工件和轨迹。
  • 依赖管理:自动记录依赖库,确保开发、暂存和生产环境之间的一致性。
  • 模型评估:提供评估 LangChain 应用程序的原生功能。
  • 跟踪:可视化地跟踪 LangChain 应用程序中的数据流。
请参阅MLflow LangChain 集成,通过大量代码示例和指南了解将 MLflow 与 LangChain 结合使用的全部功能。

SQLDatabase

要连接到 Databricks SQL 或查询结构化数据,请参阅Databricks 结构化检索工具文档;要使用上述创建的 SQL UDF 创建代理,请参阅Databricks UC 集成

开放模型

要直接集成托管在 HuggingFace 上的 Databricks 开源模型,您可以使用 LangChain 的HuggingFace 集成
from langchain_huggingface import HuggingFaceEndpoint

llm = HuggingFaceEndpoint(
    repo_id="databricks/dbrx-instruct",
    task="text-generation",
    max_new_tokens=512,
    do_sample=False,
    repetition_penalty=1.03,
)
llm.invoke("What is DBRX model?")

以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。
© . This site is unofficial and not affiliated with LangChain, Inc.