Elasticは、アラート発火と同時にインシデントを診断するエージェント型Kubernetes調査ワークフローと、MCPベースの可観測性スキルを新たに発表しました。SREがアラートを開く頃には、根本原因の特定・証拠の収集・推奨される次のステップの提示がすでに完了しています。

大規模なKubernetesを運用するチームにとって、アラートから原因究明までのタイムラグは、障害の長期化やオンコールエンジニアの疲弊を招きます。Elasticはこのギャップを埋めるため、ページングが行われる前から自動的に調査を開始します。
Elastic ObservabilityはKubernetesダッシュボード、事前構築されたアラートテンプレート、ML駆動の異常検知を基盤として、アラートから解決までを加速する2つの手段を提供します。一つは、アラート発火時に自動的に診断を実行するエージェント型調査ワークフロー、もう一つはKubernetes MCP Appです。このアプリは同等の調査機能をエンジニアがすでに使用しているAIツールやIDE(Claude、Cursor、VS Code、その他MCP対応クライアント)に組み込みます。
Elastic Observability MCP AppはSREがKubernetes環境を対話的に調査できるようにするもので、AIエージェントがElasticsearchのライブデータをクエリし、クラスターの健全性サマリー、サービス依存関係グラフ、実際の値と通常値を比較した異常詳細、ノード障害の影響範囲分析、永続的なアラートルール管理など、完全にインタラクティブなビューをツール上に直接表示します。
Elasticsearchはすべての KubernetesログとメトリクスをElasticsearchに大規模保存しており、他の可観測性ベンダーと比較して2.5倍優れたストレージ効率を実現しています。これにより、エンジニアはインシデント調査に必要な完全な運用コンテキストに常にアクセスできます。エージェント型ワークフローが確定的な根本原因を提示する場合でも、継続調査のための構造化された出発点を提示する場合でも、SREがゼロから始めることはありません。
「深夜3時にページングを受けたエンジニアは、ゼロから調査を始めたくありません。答えがほしいのです」と、ElasticのObservability担当ゼネラルマネージャーであるBahaaldine Azarmi氏は述べています。「今回のリリースにより、Elasticはアラートが発火した瞬間から調査を開始し、チームがより迅速かつ確実に解決へ到達できるようにします。また、エンジニアがすでに使用しているツール内で動作するため、コンテキストの切り替えも新しいインターフェースを覚える必要もありません。」