LangSmith 中的警报

自托管版本要求访问警报需要 Helm chart 版本 0.10.3 或更高。

概览

LLM 应用程序中的有效可观测性需要主动检测故障、性能下降和回归。LangSmith 的警报功能有助于识别关键问题，例如：

来自模型提供商的 API 速率限制违规
应用程序的延迟增加
影响反映最终用户体验的反馈分数的应用程序更改

LangSmith 中的警报是项目范围的，需要为每个受监控的项目单独配置。

配置警报

步骤 1：导航到创建警报

首先导航到您要为其配置警报的追踪项目。单击页面右上角的警报图标，查看该项目的现有警报并设置新警报。

步骤 2：选择指标类型

LangSmith 为三个核心指标提供基于阈值的警报

指标类型	描述	用例
错误运行	追踪错误状态的运行	监控应用程序中的故障。
反馈分数	测量平均反馈分数	追踪最终用户的反馈或在线评估结果，以针对回归进行警报。
延迟	测量平均运行执行时间	追踪应用程序的延迟，以针对峰值和性能瓶颈发出警报。

此外，对于错误运行和运行延迟，您可以定义过滤器以缩小触发警报的运行范围。例如，您可以为所有标记为support_agent并遇到RateLimitExceeded错误的llm运行创建错误警报过滤器。

步骤 2：定义警报条件

警报条件由以下几个组件组成

聚合方法：平均值、百分比或计数
比较运算符：>=、<=或超过阈值
阈值：触发警报的数值
聚合窗口：指标计算的时间段（目前可在 5 或 15 分钟之间选择）
反馈键（仅限反馈分数警报）：要监控的特定反馈指标

示例：上面显示的配置将在过去 5 分钟内超过 5% 的运行出现错误时生成警报。您可以预览历史时间窗口上的警报行为，以了解在选定阈值（红色表示）下会有多少数据点以及哪些数据点会触发警报。例如，为项目设置平均延迟阈值为 60 秒，可以可视化潜在警报，如下图所示。

步骤 3：配置通知渠道

LangSmith 支持以下通知渠道

选择适当的渠道以确保通知到达负责的团队成员。

最佳实践

根据应用程序的关键性调整灵敏度
从更宽泛的阈值开始，并根据观察到的模式进行细化
确保警报路由到达适当的待命人员

在 GitHub 上编辑此页面源文件。

以编程方式连接这些文档到 Claude、VSCode 等，通过 MCP 获取实时答案。

追踪设置

配置和故障排除

查看和管理追踪

自动化

反馈与评估

监控与告警

数据类型参考

概览

配置警报

步骤 1：导航到创建警报

步骤 2：选择指标类型

步骤 2：定义警报条件

步骤 3：配置通知渠道

最佳实践

追踪设置

配置和故障排除

查看和管理追踪

自动化

反馈与评估

监控与告警

数据类型参考

​概览

​配置警报

​步骤 1：导航到创建警报

​步骤 2：选择指标类型

​步骤 2：定义警报条件

​步骤 3：配置通知渠道

​最佳实践

概览

配置警报

步骤 1：导航到创建警报

步骤 2：选择指标类型

步骤 2：定义警报条件

步骤 3：配置通知渠道

最佳实践