概览
集成详情
| 类别 | 包 | 本地 | 可序列化 | PY 支持 |
|---|---|---|---|---|
| FireCrawlLoader | @langchain/community | 🟠(详见下文) | 测试版 | ✅ |
加载器功能
| 来源 | 网页加载器 | 仅限 Node 环境 |
|---|---|---|
| FireCrawlLoader | ✅ | ❌ |
FireCrawlLoader 加载它们。设置
要访问FireCrawlLoader 文档加载器,您需要安装 @langchain/community 集成和 @mendable/firecrawl-js@0.0.36 包。然后创建一个 FireCrawl 账户并获取 API 密钥。
凭据
注册并获取您的免费 FireCrawl API 密钥 以开始使用。FireCrawl 提供 300 个免费积分供您入门,如果您想自托管,它是 开源的。 完成此操作后,设置FIRECRAWL_API_KEY 环境变量:安装
LangChain FireCrawlLoader 集成位于@langchain/community 包中
实例化
以下是如何使用FireCrawlLoader 加载网页搜索结果的示例: Firecrawl 提供 3 种模式:scrape、crawl 和 map。在 scrape 模式下,Firecrawl 将仅抓取您提供的页面。在 crawl 模式下,Firecrawl 将爬取整个网站。在 map 模式下,Firecrawl 将返回与网站相关的语义链接。 formats (crawl 模式下的 scrapeOptions.formats) 参数允许从 "markdown"、"html" 或 "rawHtml" 中进行选择。然而,加载的文档将只返回一种格式的内容,优先级如下:markdown,然后是 html,最后是 rawHtml。 现在我们可以实例化我们的模型对象并加载文档:加载
额外参数
对于params,您可以根据 Firecrawl 文档 传递任何参数。
API 参考
有关所有 FireCrawlLoader 功能和配置的详细文档,请查阅 API 参考。以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。