Docling 将 PDF、DOCX、PPTX、HTML 和其他格式解析为包含文档布局、表格等的丰富统一表示,使它们可以用于 RAG 等生成式 AI 工作流。 此集成通过 DoclingLoader 文档加载器提供 Docling 的功能。
安装和设置
只需从您的包管理器(例如 pip)安装langchain-docling
文档加载器
langchain-docling 中的 DoclingLoader 类将 Docling 无缝集成到 LangChain 中,使您能够
- 轻松快速地在您的 LLM 应用程序中使用各种文档类型,并且
- 利用 Docling 的丰富表示来实现高级的文档原生基础。
附加资源
以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。