跳到主要内容
vLLM 可以部署为模拟 OpenAI API 协议的服务器。这使得 vLLM 可以作为使用 OpenAI API 的应用程序的直接替代品。此服务器可以以与 OpenAI API 相同的格式进行查询。

概览

这将帮助您开始使用 vLLM 聊天模型,它利用了 langchain-openai 包。有关所有 ChatOpenAI 功能和配置的详细文档,请参阅 API 参考

集成详情

类别本地可序列化JS 支持下载量版本
ChatOpenAIlangchain_openai测试版PyPI - DownloadsPyPI - Version

模型功能

特定的模型功能,例如工具调用、多模态输入支持、令牌级流支持等,将取决于所托管的模型。

设置

请参阅 vLLM 文档 此处 要通过 LangChain 访问 vLLM 模型,您需要安装 langchain-openai 集成包。

凭据

身份验证将取决于推理服务器的具体情况。 要启用模型调用的自动跟踪,请设置您的 LangSmith API 密钥:
os.environ["LANGSMITH_TRACING"] = "true"
os.environ["LANGSMITH_API_KEY"] = getpass.getpass("Enter your LangSmith API key: ")

安装

LangChain vLLM 集成可以通过 langchain-openai 包访问
pip install -qU langchain-openai

实例化

现在我们可以实例化我们的模型对象并生成聊天完成
from langchain.messages import HumanMessage, SystemMessage
from langchain_core.prompts.chat import (
    ChatPromptTemplate,
    HumanMessagePromptTemplate,
    SystemMessagePromptTemplate,
)
from langchain_openai import ChatOpenAI
inference_server_url = "https://:8000/v1"

llm = ChatOpenAI(
    model="mosaicml/mpt-7b",
    openai_api_key="EMPTY",
    openai_api_base=inference_server_url,
    max_tokens=5,
    temperature=0,
)

调用

messages = [
    SystemMessage(
        content="You are a helpful assistant that translates English to Italian."
    ),
    HumanMessage(
        content="Translate the following sentence from English to Italian: I love programming."
    ),
]
llm.invoke(messages)
AIMessage(content=' Io amo programmare', additional_kwargs={}, example=False)

API 参考

有关通过 langchain-openai 公开的所有功能和配置的详细文档,请参阅 API 参考:python.langchain.com/api_reference/openai/chat_models/langchain_openai.chat_models.base.ChatOpenAI.html 另请参阅 vLLM 文档
以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。
© . This site is unofficial and not affiliated with LangChain, Inc.