/metrics
/metrics 技能是 AI 驱动的指标获取工具。描述你想查看的内容,代理会解析正确的目标、选择合理的时间窗口并返回紧凑摘要。该技能只读,永远不会改变集群状态。
调用 /metrics 技能时,代理被指示查询 metrics-server 获取实时数据、查询 Prometheus 获取历史数据。若所需工具不可用,代理会主动提议为你安装。技能还提供数据展示规范,确保输出有界且对模型处理高效。
/metrics # prompts for a target/metrics api # current usage for the api workload/metrics memory on checkout last 1h # natural-language scoping/metrics top pods by cpu in payments支持自然语言范围限定(命名空间、标签选择器、工作负载名称、时间窗口、指标名称),参见概述。代理将你的描述转换为对可用数据源的合适查询。
按查询优先顺序:
metrics-server— 通过kubectl top获取实时快照。若 Prometheus 不可用,任何查询均回退到此来源,并在输出中注明答案是时间点样本而非时间窗口数据。- Prometheus — 代理检测到集群内 Prometheus 且问题涉及时间窗口时使用。通过集群内服务以 PromQL 查询。
该技能不直接抓取 Exporter,也不从集群外部读取指标端点(如 DataDog、Grafana Cloud)。
代理收到的指引
Section titled “代理收到的指引”除指示代理从何处获取数据外,技能还说明如何行事:
- 当问题涉及时间窗口时,优先使用 Prometheus 而非
metrics-server;回退到metrics-server时,将输出标记为source: metrics-server,避免误导读者对时间窗口的理解。 - 报告摘要统计数据(p50、p95、max),而非将完整时序数据传入模型。
- 若已解析的查询覆盖的 Pod 数量或时间窗口远超用户可能预期,显示已解析的查询并在执行前询问。
- 将嵌入租户 ID、用户 ID 或路径段的标签集标注为潜在敏感内容;除非用户明确要求,否则不将这些标签回显到聊天中。
- 按下方交接部分的规则路由,而非将该技能扩展为通用可观测性工具。
/metrics 只读。它仅对你描述的目标执行 kubectl top 和 Prometheus 范围查询 — 无 exec、无写入、不访问 Pod 内容或日志。若描述解析出的 Pod 数量或时间窗口超出你的预期,代理会显示已解析的查询并在执行前询问。
指标值本身很少包含敏感数据,但标签集可以 — 嵌入租户 ID、用户 ID 或路径段的自定义指标名称或标签,会像日志行一样进入代理上下文。将查询范围限定在你关心的工作负载上,而非使用宽泛的通配符。完整信任模型参见安全。
对于资源使用之外的任何内容,代理路由到相邻技能而非扩大 /metrics:
/logs— 当你想了解 Pod CPU 或内存变化的原因时/investigate— 当使用量异常是资源故障的症状,且你需要根因上下文时/audit-cost— 进行完整的资源调优扫描,而非一次性检查
/metrics 当前不接受技能专属标志。在提示或后续问题中用自然语言指定目标、指标和时间窗口。
全局标志参见概述。