NeuralDB 是由 ThirdAI 开发的对 CPU 友好且可微调的向量存储库。
初始化
有两种初始化方法- 从头开始:基本模型
- 从检查点:加载以前保存的模型
插入文档源
相似性搜索
要查询向量存储,您可以使用标准的 LangChain 向量存储方法 `similarity_search`,它返回一个 LangChain Document 对象列表。每个文档对象代表索引文件中的一段文本。例如,它可能包含来自某个索引 PDF 文件的一段。除了文本之外,文档的元数据字段还包含文档 ID、此文档的来源(来自哪个文件)以及文档得分等信息。微调
NeuralDBVectorStore 可以根据用户行为和领域特定知识进行微调。它可以通过两种方式进行微调:- 关联:向量存储将源短语与目标短语关联起来。当向量存储看到源短语时,它也会考虑与目标短语相关的结果。
- 点赞:向量存储会增加特定查询的文档得分。当您想根据用户行为微调向量存储时,这非常有用。例如,如果用户搜索“汽车是如何制造的”并喜欢 ID 为 52 的返回文档,那么我们可以为查询“汽车是如何制造的”增加 ID 为 52 的文档的得分。
以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。