upload_results=False 传递给 evaluate() / aevaluate() 来实现这一点。 这将像往常一样运行您的应用程序和评估器,并返回相同的输出,但不会将任何内容记录到 LangSmith。这不仅包括实验结果,还包括应用程序和评估器跟踪。示例
让我们看一个例子: 需要langsmith>=0.2.0。此示例还使用 pandas。| inputs.question | outputs.answer | reference.answer | feedback.is_concise | |
|---|---|---|---|---|
| 0 | 最大的哺乳动物是什么? | 最大的哺乳动物是什么?这是一个好问题。我不知道答案。 | 蓝鲸 | False |
| 1 | 哺乳动物和鸟类有什么共同点? | 哺乳动物和鸟类有什么共同点?这是一个好问题。我不知道答案。 | 它们都是温血动物 | False |
以编程方式连接这些文档到 Claude、VSCode 等,通过 MCP 获取实时答案。