LangSmith 评估 - LangChain 文档 - LangChain 教程

以下部分将帮助您创建数据集、运行评估和分析结果

评估概念

回顾核心术语和概念，以了解 LangSmith 中评估的工作原理。

管理数据集

通过 UI 或 SDK 创建和管理用于评估的数据集。

运行评估

使用不同的评估器和技术评估您的应用程序，以衡量质量。

分析结果

查看和分析评估结果，比较实验，筛选数据，并导出发现。

收集反馈

通过批注队列和输出上的行内批注收集人工反馈。

遵循教程

通过循序渐进的教程学习，从简单的聊天机器人到复杂的代理评估。

在 GitHub 上编辑此页面源文件。

以编程方式连接这些文档到 Claude、VSCode 等，通过 MCP 获取实时答案。

评估快速入门

⌘I

© . This site is unofficial and not affiliated with LangChain, Inc.