跳到主要内容
Bright Data 是一个网络数据平台,提供网页抓取、SERP 收集和访问受地理限制内容的工具。 Bright Data 允许开发者从网站中提取结构化数据、执行搜索引擎查询以及访问可能被阻止或受地理限制的内容。该平台旨在帮助克服常见的网页抓取挑战,包括反机器人系统、验证码和 IP 封锁。

安装和设置

pip install langchain-brightdata
您需要设置您的 Bright Data API 密钥: Bright Data注册并从您的账户设置中获取您的 API 密钥。在以下示例中,将"your-api-key"替换为您的实际 API 密钥:
import os
os.environ["BRIGHT_DATA_API_KEY"] = "your-api-key"
或者您可以在初始化工具时直接传入它
from langchain_bright_data import BrightDataSERP

tool = BrightDataSERP(bright_data_api_key="your-api-key")

工具

Bright Data 集成提供了多种工具
  • BrightDataSERP - 带有地理定位的搜索引擎结果收集
  • BrightDataUnblocker - 访问任何可能受地理限制或机器人保护的公共网站
  • BrightDataWebScraperAPI - 从 100 多个热门域名(例如 Amazon 产品详情和 LinkedIn 个人资料)中提取结构化数据

以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。
© . This site is unofficial and not affiliated with LangChain, Inc.