LLMを活用した「使い捨てツール」の台頭は、攻撃者の手法を大きく塗り替えつつあり、静的シグネチャや既知のインプラント挙動に依存した検出モデルの見直しを防御側に迫っています。
プロンプトから展開までMythicエージェントを自動生成することを実証した最近の実験は、新たな脅威クラスを浮き彫りにしています。大規模言語モデルとオーケストレーションハーネスによって仕立てられた、一時的な使い捨てインプラントです。
これらのエージェントは軽量で短期間の活動に特化して構築されており、人手をほとんどかけずに大量生成できるよう設計されています。現行の多くの検出パイプラインに組み込まれた前提を根底から崩す存在です。
技術的な観点から見ると、LLM生成のMythicエージェントは3つの側面で検出を困難にしています。第一に、コードの多様性です。モデルは複数の言語(Python、Go、Zig、C#、Rust)とターゲット形式(EXE、DLL、シェルコード)にわたる実装を生成できます。
この多様性により、バイトパターン、ハードコードされた文字列、静的なコンパイル成果物を照合するシグネチャベースのエンジンは機能しなくなります。
第二に、高速な入れ替えです。「ワンショット」生成と頻繁なリビルドにより、機能的にはほぼ同等でも構文上の特徴が異なる多数のユニークなバイナリが生成されます。これにより、レピュテーションベースやハッシュブロックリストによるアプローチの効果が薄れます。
第三に、運用上の分離です。Mythic中心のアーキテクチャは、RPCメッセージングとコンテナ化されたビルダー/ハンドラーコンポーネントを介して、インプラントのランタイムをC2インフラから切り離しています。
攻撃者はネットワーク監視に露出するC2の挙動を変えることなく、インプラントを差し替えたりタスクハンドラーを調整したりでき、正規に見えるコントロールプレーンのやり取りの裏に悪意ある意図を隠すことができます。
こうしたリスクを示す実際の実験では、Oracle、LabKit、Mythicd、mythic-cliという階層型ハーネスを使用してビルド、テスト、QAサイクルを自動化しました。
モックサーバーとQAサブエージェントによりエンドツーエンドの検証が可能となり、エージェントのチェックイン、鍵交換の完了、コマンドハンドラー(ls、cd、shell、アップロード/ダウンロード、execute、stage)の実行が確認されました。

Specter Opsによると、初期のLLM出力では依存関係の欠落、幻覚によるRPC呼び出し、誤った鍵交換など大幅な手動修正が必要でしたが、ドメイン固有のドキュメントとテストハーネスを用いて反復することで、開発時間は数週間から数時間にまで短縮されました。
AI生成のMythicエージェント
その結果生まれるのは、初期アクセスや後続のステージ型置き換えに有効な、機能的かつ最小限のインプラントです。これはまさに、防御側が確実に検出することを最も難しいと感じる特性を備えた存在と言えます。
防御側にとって、この影響は緊急かつ実践的なものです。静的なYARAルール、ファイルハッシュ、または限られたテレメトリシグネチャに頼るだけでは、大量生成されたバリエーションを見逃してしまいます。

効果的な対策には、挙動とコンテキストに基づく検出へのシフトが必要です。Mythic的なRPCメッセージングにおけるプロトコル異常、疑わしいコンテナのビルド/デプロイ活動、Windowsホスト上での異常な一時的プロセスのライフサイクル、そしてテレメトリタイプ(プロセス系譜、ネットワークコールバック、コントロールプレーンAPIの使用状況)にわたる相関分析に注力することが重要です。
CI/CDやコンテナオーケストレーションプラットフォームに計測を加え、予期しないDockerfileのビルドやC2サーバーへの自動アーティファクトのプッシュにフラグを立てることで、自動エージェント生成パイプラインの悪用を検出できます。
同様に、メモリ内実行、CreateProcessやシェル呼び出しの異常な使用、短命なアーティファクトの急増を監視する強化されたエンドポイント制御は、静的シグネチャが機能しない場面でシグナルを発出します。
設計は非常にシンプルで、gRPCで通信しWindowsでMythicエージェントを実行するための複数のコマンドをサポートするGoのクライアントとサーバーで構成されていました。

脅威インテリジェンスも進化する必要があります。既知のインプラント名だけでなく、開発ハーネスの痕跡も追跡してください。Mythic GraphQLの異常なパターン、ビルダーエンドポイントへの呼び出し、「Oracle」「labkit」やmythic-cliを参照するCIアーティファクトなどがその例です。
静的なIOCを配布するだけでなく、ビルダーの呼び出しからステージ1の展開までの使い捨てエージェントのライフサイクルを記述した行動プレイブックを共有することが求められます。
LLMを活用した攻撃ツールの台頭は検出を不可能にするわけではありませんが、防御側には挙動コンテキスト、継続的な検証、インフラレベルの可観測性を重視した姿勢が求められます。
モデルが機能的なインプラントの生成ハードルを下げ続ける中、防御側は自動化された検出パイプライン、強化されたビルド環境、テレメトリエンジニアと脅威インテリジェンスチーム間のより緊密な連携によって、その機動性に対抗していく必要があります。
翻訳元: https://gbhackers.com/ai-generated-mythic-agents/