跳到主要内容
Beautiful Soup 是一个用于解析 HTML 和 XML 文档的 Python 包(包括解析格式不规范的标记,例如未闭合的标签,因此得名“标签汤”)。它为解析过的页面创建一个解析树,可用于从 HTML 中提取数据,[3] 这对于网络爬取非常有用。

安装和设置

pip install beautifulsoup4

文档转换器

查看使用示例
from langchain_community.document_loaders import BeautifulSoupTransformer

以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。
© . This site is unofficial and not affiliated with LangChain, Inc.