跳转到内容

/audit-cost

/audit-cost 技能用于检测过度配置的工作负载。

不带参数运行可进行全面扫描,也可指定工作流名称以限定报告范围。

/audit-cost # full sweep
/audit-cost requests # single workflow
/audit-cost idle in staging

每个工作流均支持自然语言范围限定(命名空间、标签选择器、工作负载名称),参见概述


1. CPU 和内存请求量与实际使用量对比

Section titled “1. CPU 和内存请求量与实际使用量对比”

数据来源:实时使用量来自 metrics-server,历史 p95 来自检测到的 Prometheus。

数据来源:metrics-server 和 Kubernetes API(用于 Job/CronJob 状态)。

数据来源:Kubernetes API。


资源调优需要历史数据。Prometheus 可用时,技能默认回溯 7 天;不可用时则回退到 metrics-server 实时快照。报告始终注明所用数据源及有效回溯范围。


除工作流本身外,技能还向代理说明如何报告:

  • 在报告头部注明数据来源(metrics-server 表示实时,Prometheus 表示历史)和有效回溯范围 — Prometheus 的保留时长可能短于默认的 7 天。
  • 仅有 metrics-server 时,将需要 Prometheus 才能得出的结论标注为”不可用”,而不是静默跳过。
  • 仅标记实际影响足够大的请求量与使用量差距,细微差异属于噪声。
  • 当用户希望查看特定工作负载的底层时序数据时,转交给 /metrics