概览
Spider 允许您使用高性能代理来防止检测、缓存 AI 操作、用于爬取状态的 webhook、计划爬取等…… 本指南展示了如何使用 Spider 爬取/抓取网站,并使用 LangChain 中的SpiderLoader 加载 LLM 就绪的文档。设置
在 spider.cloud 获取您的 Spider API 密钥。用法
以下是使用SpiderLoader 的示例: Spider 提供两种抓取模式:scrape 和 crawl。Scrape 只获取所提供 URL 的内容,而 crawl 则获取所提供 URL 的内容并深入爬取子页面。附加参数
有关所有可用params 的信息,请参阅 Spider 文档。
以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。