维基百科是一部多语言的免费在线百科全书,由一个志愿者社区(被称为维基人)通过开放协作并使用名为 MediaWiki 的维基编辑系统编写和维护。维基百科是历史上规模最大、阅读量最大的参考作品。
本 Notebook 展示了如何将 wikipedia.org 的维基页面加载到我们下游使用的 Document 格式中。
安装
首先,你需要安装langchain_community 和 wikipedia 包。
参数
WikipediaLoader 具有以下参数:
query:用于在维基百科中查找文档的自由文本。lang(可选):默认值 = “en”。用于在维基百科的特定语言部分进行搜索。load_max_docs(可选):默认值 = 100。用于限制下载文档的数量。下载所有 100 个文档需要时间,因此在实验中使用较小的数字。目前硬性限制为 300。load_all_available_meta(可选):默认值 = False。默认情况下,只下载最重要的字段:title和summary。如果为True,则下载所有可用字段。doc_content_chars_max(可选):默认值 = 4000。文档内容的最大字符数。
示例
以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。