Aller au contenu

/audit-cost

Le Skill /audit-cost recherche les workloads sur-provisionnés.

Exécutez-la sans arguments pour un balayage complet, ou nommez un workflow pour affiner le rapport.

/audit-cost # full sweep
/audit-cost requests # single workflow
/audit-cost idle in staging

Le ciblage en langage naturel (namespaces, sélecteurs de labels, noms de workloads) est pris en charge sur chaque workflow (voir Overview).


1. Requêtes CPU et mémoire vs utilisation réelle

Section intitulée « 1. Requêtes CPU et mémoire vs utilisation réelle »

Sources : metrics-server pour l’utilisation en direct, Prometheus lorsque détecté pour le p95 historique.

Sources : metrics-server et l’API Kubernetes pour le statut Job/CronJob.

Sources : API Kubernetes.


Le dimensionnement optimal nécessite un historique. Par défaut, le Skill remonte 7 jours lorsque Prometheus est disponible, et se replie sur le snapshot en direct de metrics-server dans le cas contraire. Le rapport indique toujours la source utilisée et la profondeur des données disponibles.


Au-delà des workflows eux-mêmes, le Skill instruit l’agent sur la manière de présenter les résultats :

  • Indiquer la source (metrics-server pour le direct, Prometheus pour l’historique) et la fenêtre d’historique effective dans l’en-tête — la rétention Prometheus peut être inférieure aux 7 jours par défaut.
  • Marquer les résultats nécessitant Prometheus comme « non disponible » lorsque seul metrics-server est présent, plutôt que de les supprimer silencieusement.
  • Ne signaler que les écarts requêtes/utilisation suffisamment importants pour avoir un impact réel — les petits deltas sont du bruit.
  • Déléguer à /metrics lorsque l’utilisateur veut voir les séries sous-jacentes pour un workload spécifique.