Metrics 监控(高级功能)
Lumoswitch Gateway 提供 Prometheus 文本格式的基础运行指标。此页面只描述公开指标含义,不涉及实例部署方式。
此端点主要面向实例管理员和监控系统,普通模型客户端不需要访问。
获取指标
curl "https://your-gateway.example.com/metrics"/metrics 位于 Gateway 根路径,不在 /v1 下。实例是否允许外部访问由服务方决定;不要假定该端点默认受 Access Key 保护。
当前指标
| 指标 | 类型 | 含义 |
|---|---|---|
lumoswitch_gateway_requests_total | Counter | Gateway 进程收到的 HTTP 请求总数 |
lumoswitch_gateway_response_status_total{status} | Counter | 按 HTTP 状态码统计的响应数 |
lumoswitch_gateway_request_latency_average_ms | Gauge | 当前进程内累计请求的平均延迟 |
示例:
lumoswitch_gateway_requests_total 120
lumoswitch_gateway_response_status_total{status="200"} 115
lumoswitch_gateway_response_status_total{status="429"} 3
lumoswitch_gateway_response_status_total{status="500"} 2
lumoswitch_gateway_request_latency_average_ms 842.417解读限制
- 指标保存在当前 Gateway 进程内,进程重启后会重新累计。
- 多实例环境需要分别采集后再聚合。
- 平均延迟可能掩盖长尾请求,不能替代客户端侧 P95/P99 观测。
- 请求总数包括进入 Gateway 的 HTTP 请求,不等于成功模型调用数。
- 状态码只能说明结果类别,排查仍需结合客户端错误和上游连接测试。
建议关注
5xx是否持续增加。429是否在短时间内突增。- 平均延迟是否明显偏离日常水平。
- 请求总数是否与客户端预期流量大致一致。