Anthropicは「Claude Mythos Preview」を発表しました。これは広く使用されているシステムにおけるゼロデイ脆弱性を自律的に発見・悪用することで、ソフトウェアセキュリティの賭け金を劇的に高める新しいAIモデルです。
同社はこのモデルを、革新的な防御ツールであり、AI支援の攻撃機能がいかに急速に進展しているかについての警告の両方として位置付けています。
Anthropicはクロード・ミソス・プレビューを、低レベルのセキュリティタスクに対して異常に強い能力を持つ汎用言語モデルとして説明しています。
並行して、同社は「プロジェクト・グラスウィング」を開始しました。これは、同様の機能が広く利用可能になる前に、主要な業界パートナーとオープンソースステークホルダーとの協力により、「世界で最も重要なソフトウェア」を強化するためにMythosを適用するプログラムです。
同社は、これが言語モデルが単なる「優れたコードレビュアー」であることをやめ、エンドツーエンドの脆弱性発見・悪用エンジンになる分水嶺の瞬間であると主張しています。
内部テストでは、Mythos Previewは明確にそうするよう指示された場合、すべての主要なオペレーティングシステムおよびウェブブラウザ全体にわたって、以前は未知の脆弱性を特定し悪用したと報告されています。
これらのバグの多くは数十年前のものであり、何年も集中的にファジングされ、手動で監査されてきた重要なコンポーネントに深く組み込まれています。
Anthropicによれば、Mythosはカーネル、暗号ライブラリ、仮想マシンモニター、ブラウザ、ウェブアプリケーション全体にわたって、数千の追加の高・重大度の問題を明らかにしており、そのほとんどはまだ協調開示下にあります。
Opus 4.6などの以前のAnthropicモデルはすでに脆弱性ベンチマークで良好なパフォーマンスを発揮していましたが、自律的な悪用成功率はほぼゼロでした。
しかし、Mythos Previewは多くの内部ベンチマークを飽和させ、本物の発見を記憶化から区別するために、評価を「実世界のゼロデイハント」へシフトさせています。
約1,000のオープンソースプロジェクトに対するOSS-Fuzzベースのテストでは、Mythosは数百の高致命度クラッシュを生成し、複数の完全にパッチが当たったターゲットで完全な制御フロー・ハイジャックを実現し、以前のモデルをはるかに上回りました。
また、KASLRバイパス、ヒープグルーミング、JITヒープスプレーなどの複数のプリミティブを組み合わせた自律的な悪用チェーンを実証し、カーネルまたはサンドボックスエスケープ条件に到達しています。
Anthropicはクロード・ミソス・プレビューを一般公開していません。代わりに、プロジェクト・グラスウィング下で、選ばれた「重要な業界パートナーとオープンソース開発者」へのアクセスを初期段階で制限しており、防御側が広範な機能拡散に先立ってセンシティブなインフラの強化を開始できるようにしています。
同社は防御側に対し、現世代モデルの採用を開始し、パッチサイクルを厳密化し、トリアージとインシデント対応を自動化するよう促しており、ゼロデイとN-デイの両方における悪用開発速度が劇的に圧縮されることになると警告しています。
Anthropicはミソス・プレビューを、AI加速脆弱性研究が長年の「摩擦による多層防御」の仮定の再考を強制する、動乱の始まりとして特徴付けています。