AnthropicはClaude Mythos Previewモデルが、既知の脆弱性を標的とした実動作するエクスプロイトを数時間、場合によっては数分以内に構築できると発表しました。
4月初旬に発表され、最先端AIフロンティアモデルの最高峰と位置づけられているMythosは、当初から攻撃能力を飛躍的に向上させるとして強い懸念を呼んでいました。
4月から5月にかけて、Anthropicは同モデルの脆弱性発見能力を相次いで実証しました。Firefoxの271件の欠陥や、1,000以上のオープンソースソフトウェア(OSS)プロジェクトにわたる数千件の深刻なセキュリティ欠陥の発見が報告されています。
そして今回、同社はこの最先端モデルが発見した脆弱性を武器化する能力も持つことを明らかにしました。サイバー攻撃におけるAI活用の急増が、パッチ適用の空白期間(パッチギャップ)において組織が直面する脅威を深刻化させている実態が浮き彫りになっています。
実際のテストでは、Claude Mythos PreviewがFirefoxとWindowsを標的とした実動作するエクスプロイト16件を数時間以内に作成しました。
また、セーフガードを無効化したAnthropicの公開モデルもテストされました。Mythosほどのレベルには達しなかったものの、これらも実動作するエクスプロイトを生成し、LLMがこれまで攻撃に利用されてこなかったNデイ脆弱性の脅威を大幅に高めることが証明されました。
Anthropicによると、Nデイ脆弱性はゼロデイよりも危険性が高い場合があります。攻撃者がパッチの差分解析やリバースエンジニアリングを通じてエクスプロイトを構築できるためです。
LLMが攻撃者にとって強力な武器となるのもまさにこの点で、Nデイエクスプロイトの構築プロセスを大幅に加速・自動化できます。
「エクスプロイト開発は現実のNデイキャンペーンにおける唯一のステップではありません(標的の探索、エクスプロイトの配送、検知回避にもそれぞれ時間とリソースが必要です)。しかしながら歴史的に見て、希少なリバースエンジニアリングの専門知識が最大のボトルネックとなってきたのはこのステップです」とAnthropicは説明しています。
8分で完成したFirefox脆弱性のPoC
この理論を検証するため、同社はMythos Preview、Opus、SonnetのそれぞれについてFirefox 148および149向けに提供されたSpiderMonkeyのセキュリティパッチ18件を対象として、概念実証(PoC)コードを構築する能力をテストしました。
いずれのモデルも数分以内に成果を出しました。Opus 4.8は11件のPoC、Mythos Previewは14件のPoCを作成しています。Opus 4.8が最初のPoCを8分で完成させた一方、Mythos Previewは12分で同様の成果を達成しました。
Anthropicはさらに、クラッシュを実動作するエクスプロイトへと変換する能力もテストしました。Mythos Previewは8件、Opus 4.8は2件、Opus 4.6とSonnet 4.6はそれぞれ1件を作成しています。
「ここでMythos Previewが真の実力を発揮しました。最初の実動作するエクスプロイトをわずか1時間足らずで完成させ、最終的には約12時間で8種類の異なるエクスプロイトを作成しました」とAnthropicは述べています。
18時間で8件のWindowsエクスプロイト
次に同社は、クローズドソースソフトウェアに対するエクスプロイト構築能力をテストしました。対象にはMicrosoftのWindowsプラットフォームを選択し、2026年1月から2月にかけて公開された21件のカーネル脆弱性を検証しました。
「これははるかに困難なタスクです。ソースコードが入手できないため、エージェントはコンパイル済みバイナリと、変数名・型・構造といった有用なコンテキストが除去されたデコンパイラによる再構築結果だけを頼りに作業しなければなりません」とAnthropicは指摘しています。
Sonnet 4.6とOpus 4.7は13件のバグでBSOD(ブルースクリーン)を引き起こすPoCを構築し、Opus 4.8は15件、Mythos Previewは18件全てで成功しました。Mythos Previewは最初のPoCを31分で完成させています。
さらにMythos Previewは、脆弱性のうち8件について権限昇格につながる実動作するエクスプロイトを作成し、そのすべてを18時間以内に完成させました。
Anthropicによると、フリート内の登録済みデバイスの90%にWindowsパッチが配信されるまでには通常7日かかり、強制再起動が実施されるのは一般的に11日目であることを踏まえると、このモデルはパッチギャップ内での実用的な攻撃を可能にするものです。
低コスト化するエクスプロイトとパッチ適用の加速
「この速度であれば、Mythos Previewはいずれかのデバイスにパッチが更新として届く前に、8件の完全なチェーンエクスプロイトをすべて完成させていた計算になります。これらのエクスプロイトを実際のキャンペーンへと転換するにはさらなる作業が必要ですが、Mythos Previewはこれまで最も時間を要していた工程を数時間に圧縮しました」とAnthropicは述べています。
同社によると、これらのエクスプロイト構築にかかるコストも決して高くはありません。Firefox向けのPoCおよびエクスプロイト作成では、各モデルに300万トークンの予算が割り当てられました。Windowsを標的とした完全なチェーンエクスプロイトの作成コストはAPIクレジットで15,700ドル、権限昇格1件あたり約2,000ドルでした。
「Nデイ脆弱性の悪用を縛る制約は、今やわずか数千ドルとAPIアクセスだけとなり、有能なNデイ攻撃者の裾野が劇的に広がります」とAnthropicは警告しています。
同社は、「Nデイ」から「N時間」を前提とするパッチ適用プレイブックへの刷新を求めています。パッチの武器化に数週間かかるという従来の前提は、もはや成り立たないとしています。
「Nデイ脆弱性はこれまで、パッチ適用が遅い・困難なシステムに最も大きな被害をもたらしてきました。産業用制御システム、医療機器、IoTデバイスの多くは、固定されたメンテナンスウィンドウ、ベンダーロックされたファームウェア、または稼働時間保証の制約のもとで動作しています。任意のパッチを武器化するコストがゼロに近づくにつれ、これらのデバイスやシステムはより一層危険にさらされることになります。また、確立された『責任ある』パッチ適用サイクルで運用されているシステムでさえ、以前と比べてはるかに容易な標的となっています」とAnthropicは指摘しています。
翻訳元: https://www.securityweek.com/claude-mythos-turns-n-days-into-n-hours-with-rapid-exploit-creation/