LLM生成レッドチームエージェント、プロンプトからMythicの実稼働展開へ

「使い捨てツール」という概念が理論から現実へと移行しつつある中、サイバーセキュリティの世界は大きな変革を迎えています。

攻撃的能力に関する最近の研究において、研究者たちは大規模言語モデル(LLM)が初期プロンプトだけから完全に機能するMythic コマンド&コントロール(C2)エージェントを生成できることを実証しました。

この動向は、サーバーを「ペット」ではなく「家畜」として扱うクラウドインフラのパラダイムを反映しており、同じ「使い捨て」の論理を初期アクセスインプラントに適用するものです。

Mythicが選ばれた理由は、その高度に疎結合なアーキテクチャにあります。モノリシックなC2フレームワークとは異なり、MythicはRabbitMQメッセージとDockerコンテナを用いて、エージェントの開発を基盤となるサーバーアーキテクチャから分離しています。

このモジュール性により、AIによる生成のテスト環境として理想的な選択肢となっています。しかし、Claude Opus 4.6などのモデルを用いてエージェントを生成しようとした初期の試みでは、重大な障壁が明らかになりました。

基本的なサンドボックス環境でモデルを自由に動作させると、構造的には問題なさそうに見えるコードが生成されましたが、デプロイ時には失敗してしまいました。

AIはMythic RPCメソッドを頻繁にハルシネーション(幻覚)し、鍵交換プロセスを誤解し、ビルダーコード・タスキングハンドラー・実際のターゲット上のエージェントがどのように連携するかを正確に把握できませんでした。

自動エージェント開発のブレークスルーをもたらしたのは、「Oracle」と名付けられた構造化サポートハーネスの導入でした。

このフレームワークにより、LLMは単純なコード生成器から、エンドツーエンドのテストを自律的にこなせる開発者へと進化しました。

LLMには経過時間の概念が本質的に欠けており、複雑なコンテナデバッグも苦手であるため、研究者たちは専用のガードレールを構築する必要がありました。

LLMにオフラインのMarkdownドキュメントと実行中のコンテナログを取得するための専用ツールを組み合わせることで、完全に機能するStage-0インプラントの開発時間は劇的に短縮されました。

手動でのコーディングに数週間を要していたものが、システムが自律的にトラブルシューティングし、エラーを修正しながら、わずか2時間強で動作するエージェントをコンパイルできるようになりました。

SpecterOpsによると、より新しい専門特化型AIモデルへのアクセスが可能になったことで、この研究が示す意味合いは大幅に広がりました。

研究者たちがOracleハーネスをGPT-5.4-Cyber、さらにその後継となるGPT-5.5-Cyber-Previewへと移植したところ、結果は目を見張るものがある一方、強い警戒感を覚えさせるものでもありました。

AIはPython、Go、Zig、C#、Rustといった複数のプログラミング言語にわたる使い捨てエージェントを、すべて2時間以内に難なく生成しました。

生成されたコードは長期的なソフトウェアプロジェクトの品質基準を満たさないかもしれませんが、「使い捨て」のワンタイムアクセスという本来の目的には十分に適しています。

攻撃者がもはや初期足場の確立に多大なリソースを投じる必要がなくなることから、この能力は従来の防御戦略に根本的な問い直しを迫るものです。

翻訳元: https://cyberpress.org/llm-red-team-deployment/

ソース: cyberpress.org