Mythos PreviewがPoC エクスプロイト開発を自動化、セキュリティ研究向け

これはCloudflareのセキュリティチームが、Anthropicの招待制プロジェクト「Project Glasswing」の一環として、50以上の内部リポジトリで数週間にわたってMythos Previewを実行した結果の結論です。

結果は、防御側と脅威アクターの両方に対して明確なシグナルを発しています:「欠陥を見つけた」から「実行可能なエクスプロイトがある」までの間隔が急速に縮小しているということです。

Cloudflareがテストした以前の最先端AIモデルは、個々の脆弱性を特定し、それらが重要な理由について一貫性のある説明を書くことができました。

彼らが一貫して失敗したのはジョブを完了することでした。エクスプロイトチェーンは不完全なままであり、悪用可能性は証明されていませんでした。Mythos Previewはこれを2つの具体的な方法で変えます。

エクスプロイトチェーンの構築により、モデルは複数の低重度のプリミティブ、use-after-freeバグ、任意のread/write、return-oriented programming(ROP)ガジェットを取得し、それらがどのように組み合わさって、より高い重度の単一の動作するエクスプロイトになるかを推論することができます。

セキュリティバックログで放置されていたバグが、実行可能な攻撃パスになります。

プルーフジェネレーションとは、モデルが疑わしいバグをトリガーするコードを書き、サンドボックス環境でコンパイルし、それを実行し、失敗出力を読み、仮説を調整し、悪用可能性を確認するか除外するまで反復することを意味します。

確認された発見はPoC添付で到着し、トリアージ時間を大幅に短縮します。AI支援の脆弱性研究における誤検知率を支配する2つの要因があります:プログラミング言語とモデルバイアスです。

CおよびC++コードベースは、Rustなどのメモリセーフ言語よりも大幅により多くのノイズを生成する一方、推測的に報告するように調整されたモデルは、「可能性がある」「潜在的に」「理論上可能である」などの曖昧な言語でトリアージキューをいっぱいにします。

Mythos Previewはこの問題を顕著に削減します。そのアウトプットは、より少ない曖昧な結論、より明確な再現手順、そしてfix-or-dismiss決定を大幅に鮮鋭化するPoC コードの特徴があります。

それらの完全なパイプラインは、recon、hunt、validate、gapfill、dedupe、trace、feedback、およびreportステージをカバーしています。最終的なtraceステージは、攻撃者が制御した入力が外部エントリポイントから確認されたバグに実際に到達できるかどうかを決定します。

Cloudflareはこれを直接フラグしました:出現するガードレールだけでは信頼できるセキュリティ境界ではありません。Cloudflareの内部バグ発見を加速させるのと同じ機能は、インターネット向けアプリケーションに対する攻撃を加速させます。

アプリケーションの前に位置するアーキテクチャの防御、爆風の半径の制限、および同時グローバルパッチロールアウトの有効化は、脆弱性開示とアクティブなエクスプロイテーションの間のウィンドウが縮小し続けるにつれて、ますます緊急になります。

翻訳元: https://cyberpress.org/mythos-preview-automates-poc-exploit/

ソース: cyberpress.org