Mythos PreviewはPoC悪用作成を自動化し脆弱性研究を変える

Anthropicからの新しいAIモデルは、セキュリティチームがソフトウェアの脆弱性を見つけ、証明する方法を変えています。同じテクノロジーが悪意のある者の手に渡った場合に何が起こるかについて、困難な質問を提起しています。

Cloudflareは、Anthropicの統制された研究プログラムであるProject Glasswingへの参加からの知見を公開し、セキュリティに特化した大規模言語モデルであるMythos Previewが、複数の低度の脆弱性をチェーンして単一の高度な攻撃チェーンにすることで、動作する概念実証(PoC)悪用を自動的に構築できることを明かしました。

Mythos PreviewはPoC悪用を自動化

バグを識別してテキストで説明できる汎用AIモデルとは異なり、Mythos Previewはさらに数段階進みます。Cloudflareの研究によれば、このモデルは以前のツールとは異なる2つの明確な能力を示しています。

1つ目は悪用チェーン構築で、メモリ使用後解放バグとリターン指向プログラミング(ROP)チェーンなどの複数の小さな攻撃プリミティブを取得し、それらを動作する多段階悪用に組み合わせる方法を推論する能力です。

2つ目は自動化された証明生成で、モデルが悪用コードを書き、サンドボックス化されたスクラッチ環境でコンパイルし、実行し、出力を読み、悪用が失敗した場合は仮説を調整し、成功するまでループを繰り返します。

これは長い間セキュリティチームを不満にさせてきたギャップを閉じます。動作するPoC抜きの疑わしい脆弱性は、実際には推測です。Mythos Previewはこのあいまいさを自ら排除します。

Cloudflareの研究者は、AI脆弱性スキャンは依然として高い量の低信頼度の知見を生成し、特にCおよびC++のようなメモリ安全でない言語で書かれたコードベースからであると述べました。モデルは存在しない知見でさえ報告するように組み込まれた偏見があり、「可能性がある」や「理論的にはあり得る」のようなフレーズで結果をヘッジします。

Mythos Previewはこれを大幅に改善します。知見が動作するPoC付きで到着する場合、トリアージはより迅速かつ信頼性が高くなり、推測的な結果が減り、再現手順がより明確になり、アナリストの浪費された時間が少なくなります。

CloudflareはシンプルにリポジトリにMythos Previewを向けてバグを求めません。代わりに、チームは複数段階の脆弱性発見ハーネスを構築し、焦点を絞った狭いスコープ全体で並行してエージェントを実行します。

重要な段階には、コードベースアーキテクチャをマップするRecon段階、特定の攻撃クラスをターゲットにしたおよそ50の同時実行エージェントを実行するHunt段階、および各知見を反証しようとする独立したエージェントを配置するValidate段階が含まれます。

Image

最終的なTrace段階は、攻撃者が制御したインプットが実際に外部からシステムの発見されたバグに到達できるかどうかを判断し、理論的欠陥を確認された到達可能な脆弱性に変換します。

Project GlasswingバージョンのMythos Previewは、公開されているモデルで見られる標準的なセーフティ制限なしで動作しました。

Cloudflareは、モデルが独自の「有機的な」拒否を生成したが、それらは一貫性がなかったことを観察しました。同じ研究タスクが、わずかに異なる方法で構成された場合、別々の実行全体で反対の結果を生成しました。

Cloudflareは、これらの創発的なガードレールがスタンドアロンの安全境界として十分ではないと明示的に警告しました。有能なサイバーAIモデルの将来の公開リリースは、モデルが独自に生成するもの以外に、追加で外部的に実施されるセーフガードを含める必要があります。

Cloudflareは、一部のセキュリティチームが現在CVE開示から本番環境パッチまで2時間のSLAで動作していると述べました。このタイムラインは、脆弱性の周りのアーキテクチャが堅化されている場合にのみ持続可能です。回帰テストパイプラインを修正せずにより高速にパッチを適用すると、新しいバグが発生します。

Mythos Previewを防御者にとって価値あるものにする同じ能力は、インターネット向けアプリケーションに対する攻撃的な操作を加速させます。研究は統制された環境で実施され、発見されたすべての脆弱性はCloudflareの正式な脆弱性管理プロセスに基づいてトリアージおよび修復されました。

翻訳元: https://gbhackers.com/mythos-preview-automates-poc-exploit-creation/

ソース: gbhackers.com