コンテンツにスキップ

/audit-cost

/audit-cost スキルは、過剰プロビジョニングされたワークロードを検索します。

引数なしで実行するとフルスイープ、ワークフロー名を指定するとレポートのスコープを絞り込めます。

/audit-cost # full sweep
/audit-cost requests # single workflow
/audit-cost idle in staging

自然言語スコープ(Namespace、ラベルセレクター、ワークロード名)はすべてのワークフローでサポートされています(概要を参照)。


1. CPU・メモリのリクエスト対実際の使用量

Section titled “1. CPU・メモリのリクエスト対実際の使用量”

ソース:ライブ使用量は metrics-server、履歴p95が検出された場合はPrometheus。

ソース:metrics-server およびJob/CronJobステータス用のKubernetes API。

3. 未使用のストレージとロードバランサー

Section titled “3. 未使用のストレージとロードバランサー”

ソース:Kubernetes API。


適切なサイジングには履歴が必要です。デフォルトでは、Prometheusが利用可能な場合は7日間遡り、利用できない場合はライブの metrics-server スナップショットにフォールバックします。レポートには常に使用されたソースとデータの参照期間が記載されます。


ワークフロー自体に加えて、スキルはエージェントにレポートの方法を指示します。

  • ヘッダーにソース(ライブは metrics-server、履歴はPrometheus)と有効な参照期間を記載します — Prometheusの保持期間はデフォルトの7日より短い場合があります。
  • metrics-server のみが存在する場合、Prometheusを必要とする検出結果を黙って削除するのではなく「利用不可」としてマークします。
  • 実際に問題となるほど大きなリクエストと使用量のギャップのみをフラグします。小さなデルタはノイズです。
  • ユーザーが特定のワークロードの基礎となるシリーズを確認したい場合は /metrics に渡します。