ペネトレーションテストはこれまで、専門家の時間と労力に依存してきました。専門家がネットワークやウェブアプリケーションを手動で調査するだけで、何日もかかることは珍しくありません。手動での評価には数週間を要し、熟練したコンサルタントには1日あたり数千ドルのコストがかかる上、結果はテスト担当者によってばらつきが生じます。自動化はこうしたギャップを埋める可能性を秘めています。現在、自律的に計画・実行するAIエージェントに作業を委ねるプロジェクトが増加しています。オープンソースプラットフォームのDarkMoonもそのひとつです。セキュリティ評価を一気通貫で実行し、最終的にエビデンスに裏付けられたレポートを提供します。

実行から切り離された推論レイヤー
DarkMoonは、思考を担うモデルと実行を担うツールを明確に分離しています。OpenCodeと呼ばれるオーケストレーターが大規模言語モデルと連携して各手順を計画し、実際のアクションはModel Context Protocol(MCP)上に構築されたコントロールレイヤーに委任します。このMCPレイヤーは承認済みツールの許可リストを公開し、Nuclei、sqlmap、BloodHound、NetExecなど50以上のセキュリティユーティリティを格納した隔離されたDockerコンテナ内でそれらを実行します。専門化されたサブエージェントが、ウェブアプリケーション、Active Directory、Kubernetes、ネットワークプロトコルをそれぞれカバーしています。
評価は一定の手順に従って進みます。プラットフォームはまず開いているポートとサービスを探索し、技術スタックのフィンガープリントを取得して攻撃対象領域をモデル化した後、発見した内容に対応するサブエージェントを展開します。各結果はリアクティブなループにフィードバックされるため、初期段階でWordPressサイトが検出されればCMSエージェントが起動し、後からGraphQLエンドポイントが発見されればGraphQLエージェントが呼び出されます。カバレッジはISO 27001、NIST SP 800-115、MITRE ATT&CKモデリングなど確立された方法論に沿っています。
「LLMが任意のコマンドを直接実行することはありません。」DarkMoonのリードメンテナーであるMehdi Boutayeb氏はHelp Net Securityの取材に対し、すべてのアクションはMCPサーバーを経由し、同サーバーは「承認されたツールとワークフローの明示的な許可リストのみを公開している」と語りました。
スコープ内に限定されたエージェントの行動
スコープは各実行の開始時にユーザーが設定し、ターゲット、ドメイン、IPレンジ、またはアプリケーションとして指定します。オーケストレーターは承認された境界内で発見されたアセットのみをもとに状況を把握し、承認済みの方法論に従って実行を進めます。新しいツールは、インストールされMCPサーバーに登録されてオーケストレーションレイヤーに公開されるまで利用できません。Boutayeb氏はその設計思想を次のように語っています。「目的は、無制限の自律的な動作を許可するのではなく、実行を決定論的で監査可能かつ制約された形にすることです。」
スキャンのコスト
コストは導入を検討する際に最初に挙がる質問のひとつです。Boutayeb氏によると、Claude Opusを使用した一般的なウェブアプリケーション評価のAPIコストは約10ドルとのことです。ただし、Active DirectoryやマルチホストインフラのようなAPT規模の大きな評価では、モデルが新たなエビデンスを継続的に分析しながらステップと攻撃経路を計画するため、コストは増加します。DarkMoonはOpenAI、Anthropic、OpenRouterのほか、OllamaやLlama.cppを通じてローカルモデルにも対応しています。Boutayeb氏の評価では、推論品質、計画の安定性、長いコンテキストへの対応力のバランスから、「現時点で推奨するモデルはClaudeです」とのことです。
モデルの選択には、ベンダーの安全システムに起因する注意点があります。最近のAnthropicモデルには、承認されたエンゲージメントであっても、攻撃的なセキュリティタスクを中断・拒否・暗黙的にダウングレードできる分類器が搭載されています。DarkMoon自身のテストでは、Claude Opus 4.8が評価の途中でその制限に達したのに対し、Claude Opus 4.6は中断なく評価を最後まで完了しました。プロジェクトは最も安定した選択肢としてOpus 4.6を推奨しており、承認された組織向けのオプションとしてAnthropicのCyber Verification Programも紹介しています。パラメーター数の少ない小規模モデルは、こうした自律的な実行には引き続き対応していません。
「基本的には、ローカルで実行するなら完全に無料です。フロンティアモデルの高い推論品質を求めるなら、評価1回あたり数ドルかかります。コストと性能のバランスは各ユーザーが自分で選べます」とBoutayeb氏は述べています。
エビデンスに裏付けられた検出結果
DarkMoonは、エビデンスが裏付けている場合にのみ検出結果を確定扱いとします。一般的なHTTP 200レスポンス、反射されたペイロード、曖昧な指標といった弱いシグナルはランクを下げられ、「未確認(Unconfirmed)」としてラベル付けされます。確認済みの検出結果には、それを裏付ける実行コマンド、生の出力、HTTPリクエストとレスポンスのペア、および実行トレースが添付されます。
精度についてBoutayeb氏は次のように述べています。「LLMを真実の源として扱うことは決してありません。ターゲット環境から収集したエビデンスが真実の源であり続けます。」また、アナリストによる検証を維持しつつ手動トリアージを削減し、すべての結論を追跡可能かつ再現可能にすることが目標だと付け加えました。
DarkMoonはGitHubで無償公開されています。
翻訳元: https://www.helpnetsecurity.com/2026/06/29/darkmoon-open-source-ai-pentesting-platform/