Doctran 是一个 Python 包。它使用 LLM 和开源 NLP 库将原始文本转换为清晰、结构化、信息密集的文档,这些文档经过优化以进行向量空间检索。您可以将 Doctran 视为一个黑盒子,其中凌乱的字符串进入,而漂亮、清晰、带标签的字符串输出。
安装和设置
文档转换器
文档询问器
查看 DoctranQATransformer 的使用示例。属性提取器
查看 DoctranPropertyExtractor 的使用示例。文档翻译器
查看 DoctranTextTranslator 的使用示例。以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。