攻撃と防御へのAI駆動ゲーム理論アプローチ

Alias Roboticsとヨハネス・ケプラー大学リンツによる新たな研究は、サイバーセキュリティAIのためのゲーム理論的な「脳」を提案し、自動化されたペネトレーションテストと防御計画を人間レベルの性能を超える領域へ押し上げることを目指している。

本研究は、Generative Cut-the-Rope（G-CTR）を導入する。これは大規模言語モデル（LLM）駆動のエージェントの上に位置するガイダンス層であり、任意の時点でどの攻撃または防御の手が戦略的に最適かをエージェントに示す。

単にスキャンやエクスプロイト試行を高速化するのではなく、このシステムは、熟練したレッド／ブルーチームの担当者のようにAIが「ゲームをプレイ」し、サイバー戦における利得と対抗手段を常に天秤にかけることを狙っている。

過去2年間で、PentestGPTやCybersecurity AI（CAI）といったツールは、LLMが速度と網羅性において人間のペネトレーションテスターに匹敵、あるいは上回り得ることを示してきた。1時間あたり数千のアクションを実行し、手作業のワークフローより桁違いに速く脆弱性を発見できる。

著者らが指摘する問題は、生の速度がチームに未整理の発見事項を大量に押し寄せる一方で、攻撃・防御型のCapture the Flag（CTF）演習で人間が示す戦略的直観が欠けている点にある。

論文は次のフロンティアを「サイバーセキュリティ超知能」と位置づけている。人間より速く行動するだけでなく、チェスのグランドマスターのように変化する「盤面状態」を推論し、行動に踏み切る前に攻撃者と防御者の手筋を評価するエージェントであると述べている。

これを実現するため、研究者らはゲーム理論的な基盤をエージェントの推論ループに直接組み込む。

ループ内のゲーム理論

G-CTRは3つのフェーズで動作する。まず、LLMs attackを用いて、AIエージェント自身のセキュリティログから攻撃グラフを自動抽出し、そのグラフ上でナッシュ均衡を計算して最適な攻撃・防御戦略を特定する。

次に、これらの均衡結果を、双方にとって最も強力な手筋を強調する簡潔な「ダイジェスト」に変換する。最後に、このダイジェストをオープンソースのReActベースのフレームワークにおけるエージェントの計画フェーズへフィードバックし、その後のツール呼び出しや行動を誘導する。

このクローズドループのガイダンスは、エージェントの通常動作と並行して実行され、1サイクルあたりのオーバーヘッドは約50秒にとどまる。一方でエージェントは約70秒間の実行を継続できるため、サイバーレンジやライブ演習での準リアルタイム利用に適している。

論文によれば、5つの実環境演習において、G-CTRは6〜15ノードのコンパクトな攻撃グラフを生成し、人間の専門家が描いた構造の70〜90%に一致した。さらに、手作業の分析より60〜245倍高速で、コストは140倍以上安価だったという。

44回のサイバーレンジ・ベンチマークでは、ゲーム理論ダイジェストを追加することで成功率が20.0%から42.9%へとほぼ倍増し、成功あたりコストを2.7倍削減し、行動のばらつきも係数レベルで低減した。

攻撃・防御シナリオでは、レッドとブルーの間で標準ダイジェストを共有することで「パープル」エージェントが作られ、LLMのみのベースラインに対しておよそ2:1、独立にガイドされたチームに対して3.7:1で勝利したと報告されている。

著者らは、この改善を、探索空間の縮小、幻覚的な行動の減少、そして環境の中で戦略的に最も重要な部分にAIが固定され続けることに起因するとしている。

この種のアーキテクチャが堅牢にスケールできるなら、サイバー作戦が単に自動化されるだけでなく、自らがプレイしているゲームを理解する機械によってリアルタイムに戦略最適化される未来を示唆している。