Fireworks

您当前所在的页面记录了将 Fireworks 模型用作文本补全模型的用法。许多流行的 Fireworks 模型都是聊天补全模型。您可能正在寻找此页面。

Fireworks 通过创建创新的 AI 实验和生产平台来加速生成式 AI 的产品开发。

此示例介绍了如何使用 LangChain 与 Fireworks 模型进行交互。

概览

集成详情

类别	包	本地	可序列化	JS 支持	下载量	版本
`Fireworks`	`langchain-fireworks`	❌	❌	✅

设置

凭据

登录 Fireworks AI 获取 API 密钥以访问我们的模型，并确保将其设置为 FIREWORKS_API_KEY 环境变量。3. 使用模型 ID 设置您的模型。如果未设置模型，则默认模型为 fireworks-llama-v2-7b-chat。请访问 fireworks.ai 查看完整且最新的模型列表。

import getpass
import os

if "FIREWORKS_API_KEY" not in os.environ:
    os.environ["FIREWORKS_API_KEY"] = getpass.getpass("Fireworks API Key:")

安装

您需要安装 langchain-fireworks python 包才能使本笔记本的其余部分正常工作。

pip install -qU langchain-fireworks

Note: you may need to restart the kernel to use updated packages.

实例化

from langchain_fireworks import Fireworks

# Initialize a Fireworks model
llm = Fireworks(
    model="accounts/fireworks/models/llama-v3p1-8b-instruct", # Model library in: https://app.fireworks.ai/models
    base_url="https://api.fireworks.ai/inference/v1/completions",
)

调用

您可以直接使用字符串提示调用模型以获取补全。

output = llm.invoke("Who's the best quarterback in the NFL?")
print(output)

  That's an easy one. It's Aaron Rodgers. Rodgers has consistently been one

通过多个提示调用

# Calling multiple prompts
output = llm.generate(
    [
        "Who's the best cricket player in 2016?",
        "Who's the best basketball player in the league?",
    ]
)
print(output.generations)

[[Generation(text=' You could choose one of the top performers in 2016, such as Vir')], [Generation(text=' -- Keith Jackson\nA: LeBron James, Chris Paul and Kobe Bryant are the')]]

通过附加参数调用

# Setting additional parameters: temperature, max_tokens, top_p
llm = Fireworks(
    model="accounts/fireworks/models/llama-v3p1-8b-instruct",
    temperature=0.7,
    max_tokens=15,
    top_p=1.0,
)
print(llm.invoke("What's the weather like in Kansas City in December?"))

December is a cold month in Kansas City, with temperatures of

链接

您可以使用 LangChain 表达式语言为非聊天模型创建简单的链。

from langchain_core.prompts import PromptTemplate
from langchain_fireworks import Fireworks

llm = Fireworks(
    model="accounts/fireworks/models/llama-v3p1-8b-instruct",
    temperature=0.7,
    max_tokens=15,
    top_p=1.0,
)
prompt = PromptTemplate.from_template("Tell me a joke about {topic}?")
chain = prompt | llm

print(chain.invoke({"topic": "bears"}))

 What do you call a bear with no teeth? A gummy bear!

流式处理

如果您愿意，可以流式传输输出。

for token in chain.stream({"topic": "bears"}):
    print(token, end="", flush=True)

 Why do bears hate shoes so much? They like to run around in their

API 参考

有关所有 Fireworks LLM 功能和配置的详细文档，请访问API 参考

在 GitHub 上编辑此页面源文件。

以编程方式连接这些文档到 Claude、VSCode 等，通过 MCP 获取实时答案。

热门提供商

按组件划分的集成

概览

集成详情

设置

凭据

安装

实例化

调用

通过多个提示调用

通过附加参数调用

链接

流式处理

API 参考

热门提供商

按组件划分的集成

​概览

​集成详情

​设置

​凭据

​安装

​实例化

​调用

​通过多个提示调用

​通过附加参数调用

​链接

​流式处理

​API 参考

概览

集成详情

设置

凭据

安装

实例化

调用

通过多个提示调用

通过附加参数调用

链接

流式处理

API 参考