Anthropicの新しいAIモデルが主要なOSとブラウザ全体のゼロデイを発見・悪用

自動化された脆弱性発見ツールは数十年前から存在しており、バグの発見と動作する悪用コードの構築のギャップは常に攻撃者の速度を遅くしてきました。そのギャップは現在、大幅に縮小しています。Anthropicの新しい汎用言語モデルであるClaude Mythos Previewは、限定的な重要な業界パートナーとオープンソース開発者のみを対象に提供されており、主要なすべてのオペレーティングシステムと主要なWebブラウザ全体でゼロデイ脆弱性を自律的に特定し、動作する悪用コードを構築することができます。

Anthropicのセキュリティ研究チームは、2026年4月7日にMythos Previewの機能に関する技術的評価を公開し、約1ヶ月間の内部テストからの調査結果を記載しています。その結果は、先行するモデル世代が実行できたことからの大きな転換を示しています。

ゼロに近い状態から大規模な動作する悪用コードへ

Mythos Previewとその前身であるOpus 4.6間のパフォーマンスギャップは、具体的なベンチマーク用語で数値化されています。研究者が同じFirefox 147 JavaScriptエンジン脆弱性に対して両方のモデルを実行したとき、Opus 4.6は数百回の試行中の2回の機会で動作するシェル悪用コードを生成しました。Mythos Previewは同じテストで181回成功し、追加の29回がレジスタ制御を達成しました。

オープンソースリポジトリからのOSS-Fuzzコーパスで約7,000のエントリポイント全体に対してモデルを実行する内部ベンチマークでは、Sonnet 4.6とOpus 4.6はそれぞれティア5(完全な制御フロー奪取と定義)に正確に1回到達しました。Mythos Previewは10の別々の、完全にパッチされたターゲット上でティア5を達成しました。

「私たちはMythos Previewをこれらの機能を持つよう明示的に訓練していません。むしろ、それらはコード、推論、および自律性の一般的な改善の下流の結果として現れました。モデルを脆弱性のパッチングにおいて実質的により効果的にする同じ改善により、それらを悪用することはより実質的に効果的になります」とAnthropicの研究者は述べました。

ソフトウェアエコシステム全体のゼロデイ

研究チームは簡潔なエージェントスキャフォルドを使用しました:対象のコードベースを実行する隔離されたコンテナを起動し、セキュリティ脆弱性を見つけるよう求めるプロンプトでモデルを呼び出し、自律的に機能させます。モデルはソースコードを読み、仮説を形成し、ソフトウェアを実行し、必要に応じてデバッガーを使用し、概念実証付きのバグレポートを生成します。

この方法を使用して、チームは彼らが高度および重大度の脆弱性であると評価する数千の脆弱性を特定しました。プロのセキュリティ請負業者による手動で審査された198の調査結果のうち、89パーセントはモデルが割り当てた同じ重大度評価を請負業者から受け取りました。98パーセントの場合、評価は1つの重大度レベル内でした。

3つの具体的な調査結果が範囲を示しています。Mythos Previewは、OpenBSDのTCP SACK実装における27年前のサービス拒否脆弱性を特定し、TCPで応答するOpenBSDホストをクラッシュさせることを可能にする整数オーバーフロー条件です。モデルは、総コストが20,000ドル未満で、約1,000のスキャフォルド実行全体でそれを発見しました。FFmpegのH.264コーデックの16年前の脆弱性も発見され、2003年のコミットで導入され、2010年のリファクタリングで公開され、それ以来、コードを検査したすべてのファザーと人間のレビュアーに見落とされました。FreeBSDでは、Mythos Previewは自律的にNFSサーバの17年前のリモートコード実行フロー(CVE-2026-4747)を特定し、完全に悪用し、初期プロンプトの後の人間の関与なしに認証されていないルートアクセスを付与しました。

メモリ破損バグを超えて、モデルはWebアプリケーションの認証バイパス、TLS、AES-GCM、およびSSHをカバーする広く使用されている暗号化ライブラリの弱点を特定し、本番仮想マシンモニターのゲスト間のホストメモリ破損脆弱性を特定しました。Mythos Previewはまた、主要なWebブラウザすべての脆弱性を悪用し、複数の欠陥をチェーンして、レンダラーとOSサンドボックスをバイパスするJITヒープスプレー悪用を生成しました。

N-デイはより速く悪用に変わります

チームはN-デイ悪用機能を2024年と2025年からの100のLinuxカーネルCVEのセットを使用してMythos Previewを実証しました。モデルはそれらを40の悪用可能な候補にフィルタリングし、半分以上の特権昇格悪用を正常に構築しました。評価で公開された2つの詳細なウォークスルーは、KASLRバイパス、キャッシュ間のヒープ再利用、および根を達成するための認証情報構造上書きを含む悪用チェーンについて説明します。これらの悪用チェーンの1つは、CVE識別子とgitコミットハッシュから始まり、2,000ドル未満のコストで1日以内に完了しました。

歴史的に、既知の脆弱性を動作する悪用に変換することは、熟練した研究者に数日から数週間かかっていました。そのタイムラインは実質的に圧縮されました。

防御側が今できること

Anthropicはかなり機能のあるモデルが広く利用可能になる前に、Mythos Previewをパートナーと選択されたグループおよびオープンソース開発者のグループと連携して、重要なソフトウェアを保護することに向けてMythos Previewの機能を指示する努力である、プロジェクトグラスウィングを起動しました。Mythos Previewは一般大衆にリリースされていません。

チームはいくつかの近期防御推奨事項の概要を説明しています。彼らの脆弱性管理ワークフローに言語モデルをまだ統合していない組織は、チームがOSS-Fuzzターゲット、Webアプリケーション、暗号化ライブラリ、およびLinuxカーネル全体で高度および重大度のバグを見つけることができると言う、現在利用可能なフロンティアモデルで始める必要があります。

防御側はまた、パッチサイクルを短縮し、可能な場所で自動更新を有効にし、CVEタグ付き依存関係の更新を緊急として扱い、モデル支援発見が今可能な音量と速度を考慮するために脆弱性開示ポリシーを再検討する必要があります。チームはまた、より多くの脆弱性の開示がパッチが適用される前のウィンドウでより多くの悪用試行を生成するため、自動化されたインシデント応答パイプラインへの投資を推奨しています。

翻訳元: https://www.helpnetsecurity.com/2026/04/08/anthropic-claude-mythos-preview-identify-vulnerabilities/

ソース: helpnetsecurity.com