OpenHack:オープンソースのAI駆動型脆弱性リサーチ

ソースガイド型の脆弱性リサーチは、Claude CodeCodexCursorなどのコーディングハーネスにますます依存して、エージェントベースのアプリケーションコードレビューを実行しています。オランダのセキュリティ企業HadrianからのMITライセンス付きの新しいプロジェクトであるOpenHackは、このアプローチを、これらのハーネスのいずれでも実行できるファイルベースのワークスペースにパッケージ化しています。

Image

OpenHackはHadrianのリサーチチームが自動脆弱性リサーチを実行する方法をミミックするエージェントとツールのセットです。ワークフローはコーディングハーネスまたはカスタムランナー内で実行され、クローンされたソース、偵察項目、シナリオプロンプト、シナリオ結果、発見候補、トリアージ決定、発見、ログなどのプレーンファイルに永続的な状態が保持されます。ハーネスはモデル実行、ターミナルアクセス、リポジトリアクセス、およびヒューマンインザループの承認を提供します。

「私たちはこれを長い間取り組んできましたが、重大な脆弱性の発見がそれを具体化しました。OpenHackの有効性は、セキュリティチームが重大な脆弱性を見つけるためにMythosを必要としないことを証明しています」とHadrianのCEOであるRogier Fischerは述べています。

チェックポイント付き、シナリオファースト型レビュー

運用モデルはファイル上のステートマシンを中心に構築されています。コマンドは実行を次の永続的な状態に進め、エージェントはその状態のプロンプトに答え、レコーダコマンドは新しい作業を実現する前に答えを検証します。人間のオペレータは、すべてのフェーズ遷移を承認します。これには、偵察前のエキスパートスコープ、偵察後のシナリオルーティング、ルータが答えた後のシナリオバックログ、および候補作成後の発見トリアージバックログが含まれます。

永続的なチェーンは、偵察項目からルーティングユニット、シナリオ、シナリオ結果、発見候補、トリアージ決定まで実行されます。偵察エージェントは、ルート、シンク、認証境界、アップロードパス、パーサーエントリポイント、マニフェスト、管理エリアなどのレビューサーフェスを発見します。シナリオルータエージェントはそれらのサーフェスをスコープ付きシナリオに変換します。その後、エキスパートエージェントは各シナリオを証明または拒否し、独立したトリアージエージェントは検証済みの候補のどれが最終的な発見になるかを決定します。

OWASPおよびMITREに合致した12のエキスパートファミリー

現在のレジストリは12のエキスパートファミリーをMarkdownマニフェストとして定義し、それぞれがそのID、カテゴリ、所有権、標準、およびルーティング信号を宣言しています。このセットはOWASP Top 10:2025のカテゴリをカバーし、不正アクセス制御、セキュリティの設定ミス、ソフトウェアサプライチェーンの障害、暗号化の障害、インジェクション、不安全な設計、認証の障害、およびソフトウェアまたはデータの整合性の障害が含まれます。追加のファミリーはCWE-119メモリバッファエラー、CWE-200機密情報公開、CWE-22およびCWE-434パストラバーサルおよび無制限アップロード、およびAPI4:2023無制限リソース消費をカバーします。SSRFは不正アクセス制御に含まれ、CWE-918からA01:2025へのOWASP 2025マッピングと一致しています。

偵察フェーズ中にバンドルされたSemgrepルールによるオプションの拡張が利用可能です。Semgrepヒットはヒントとして扱われ、検証済みの脆弱性は記録されたシナリオおよびトリアージチェーンを通じて来る必要があります。

OpenHackはGitHubで無料で利用できます。

翻訳元: https://www.helpnetsecurity.com/2026/05/25/openhack-open-source-ai-powered-vulnerability-research/

ソース: helpnetsecurity.com