UnDatasIO 的undatasio包可以从 PDF 等原始源文档中提取干净的文本。本页面介绍了如何在 LangChain 中使用undatasio生态系统。
安装和设置
-
使用以下命令安装 Python SDK
pip install undatasio
以及
pip install langchain-undatasio
以使用UnDatasIOLoader并远程分区到 UnDatasIO API。您需要一个 API 密钥,可以在此处免费生成:
undatas.io. - 无需本地系统依赖;所有处理都在云端运行。
数据加载器
UnDatasIO 的主要用途是通过文档加载器。
UnDatasIOLoader
请参阅使用示例,了解单文件解析和延迟加载。以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。