概览
集成详情
| 类别 | 包 | 可序列化 | JS 支持 | 版本 |
|---|---|---|---|---|
| BrightDataWebScraperAPI | langchain-brightdata | ✅ | ❌ |
工具特性
| 原生异步 | 返回工件 | 返回数据 | 定价 |
|---|---|---|---|
| ❌ | ❌ | 来自网站的结构化数据(亚马逊产品、LinkedIn 个人资料等) | 需要 Bright Data 账户 |
设置
该集成位于langchain-brightdata 包中。
实例化
这里我们展示如何实例化 BrightDataWebScraperAPI 工具。此工具允许您使用 Bright Data 的数据集 API 从各种网站提取结构化数据,包括亚马逊产品详细信息、LinkedIn 个人资料等。 该工具在实例化时接受各种参数:bright_data_api_key(必需,str):用于身份验证的 Bright Data API 密钥。dataset_mapping(可选,Dict[str, str]):一个字典,将数据集类型映射到其对应的 Bright Data 数据集 ID。默认映射包括- “amazon_product”: “gd_l7q7dkf244hwjntr0”
- “amazon_product_reviews”: “gd_le8e811kzy4ggddlq”
- “linkedin_person_profile”: “gd_l1viktl72bvl7bjuj0”
- “linkedin_company_profile”: “gd_l1vikfnt1wgvvqz95w”
调用
基本用法
带参数的高级用法
自定义选项
BrightDataWebScraperAPI 工具接受几个用于自定义的参数| 参数 | 类型 | 描述 |
|---|---|---|
URL | str | 要从中提取数据的 URL |
dataset_type | str | 要使用的数据集类型(例如,“amazon_product”) |
zipcode | str | 用于特定位置数据的可选邮政编码 |
可用数据集类型
该工具支持以下数据集类型用于结构化数据提取| 数据集类型 | 描述 |
|---|---|
amazon_product | 提取详细的亚马逊产品数据 |
amazon_product_reviews | 提取亚马逊产品评论 |
linkedin_person_profile | 提取 LinkedIn 个人资料数据 |
linkedin_company_profile | 提取 LinkedIn 公司资料数据 |
在代理中使用
API 参考
以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。