このAIはMozillaのウェブブラウザで数百個のバグを露出させ、防御的な利点への期待を高めながら、二重用途リスクの懸念も生じさせている。
Claude Mythos プレビューは、少なくともサイバーセキュリティの観点からは期待に応えているようだ。Anthropicが今月初めに、Firefoxの開発者であるMozillaを含む限定的なユーザーグループに展開したこのモデルは、ブラウザのバージョン148で271個の脆弱性を発見した。すべてが今週リリースされたFirefox 150で修正されたとMozillaは強調している。
これらの知見は、AIがバグを発掘する能力における新しい前例を設定し、サイバーセキュリティの取り組みを加速させる可能性がある。
「Mythosが見つけたものは何も、熟練した人間が見つけられなかったものではない」とBeauceron Securityの David Shipleyは述べた。「AIはAI限定のスーパーバグという新しいカテゴリーを見つけているわけではない。単に見落とされていた多くのものを見つけているだけだ。」
しかし、このニュースはAnthropicがMythosの不正使用を調査しているという報告が出ており、第三者のベンダー環境を経由してアクセスを得た小規模グループによるものとされており、AIの両刃の剣の性質を明らかにしている。
ファジングギャップを埋める
Firefoxは以前、脆弱性を求めてAIツール、特にAnthropicのClaude Opus 4.6をブラウザに向けてきたが、OpusはFirefox 148でセキュリティに敏感な22個のバグのみを発見したのに対し、Mythosはその10倍以上を明かにした。
Firefox CTO Bobby Holleyは、その数を見たときにチームが感じた「目眩」の感覚を説明した。「堅牢なターゲットの場合、2025年ではこのようなバグ1つでアラート警報が発せられたはずだ」と彼はブログポストで述べた「そして一度にこんなに多くのバグが出現すると、追いついていくことすら可能なのか疑問に思わずにはいられない。」
Firefoxは多層防御戦略を使用しており、複数層の「重複する防御」と自動分析技術を適用する内部レッドチームを配備している、と彼は説明した。チームは各ウェブサイトを独立したプロセスサンドボックスで実行している。
しかし、どの層も浸透不可能ではないとHolleyは指摘し、攻撃者は特権アクセスを獲得する試みで、レンダリングコードのバグとサンドボックスのバグを組み合わせている。チームは現在、Rustというより安全なプログラミング言語を採用してきたが、開発者は「特にRustは特定の(非常に一般的な)種類の脆弱性のみを軽減するため」、数十年分の既存C++コードを停止して書き直す余裕がない。
ソースコードの脆弱性やバグを明かにするファジングなどの自動分析手法は有用だが、コードの一部はファジングするのがより難しく、「カバレッジが不均衡になる」とHolleyは指摘した。人間のチームはソースコードを通じた推論によってAIが見つけることができないバグを見つけることができるが、これは時間がかかり、限られた人間資源のためにボトルネックが生じている。
今、Claude Mythos プレビューはこのギャップを埋め、ファジングが表面化させないバグを検出している。
「コンピュータは数ヶ月前はこれを全く行うことができず、今ではそれを得意としている」とHolleyは述べた。Mythos プレビューは人間の研究者と「同等に能力がある」と彼は主張し、人間が見つけることができる脆弱性の「カテゴリーや複雑さ」は、Mythosが見つけることができないものはないという。
防御側が「決定的に」勝てるようになる?
人間が発見可能でAIが発見可能でないバグ間のギャップは攻撃者に有利であり、彼らは数ヶ月の人間の努力を集中させてわずか1つの悪用可能なバグを見つけるために余裕を持つことができるとHolleyは指摘した。AIでこのギャップを埋めることは、防御側がその長期的な利点を削減するのに役立つことができる。
業界は大部分がセキュリティを「引き分け」で戦ってきたと彼は認め、セキュリティは攻撃面のサイズのため「攻撃的に優位」であり、敵に「非対称的な利点」を与えてきた。これに直面して、MozillaとセキュリティベンダーはExploitsをゼロにもたらすことが「非現実的」だったと「長く静かに認めてきた」。
しかし現在Mythos(およびその後のモデル)を使えば、防御側は「決定的に」勝つ機会がある、とHolleyは主張する。「欠陥は有限であり、最終的にすべてを見つけることができる世界に入ろうとしている。」
セキュリティチームが今何をすべきか
Firefoxのような成熟したコードベースで271個の欠陥を見つけることは、AI駆動の脆弱性発見が現在、従来の人間主導のレビューを上回る規模と深さで動作しているという事実を示しており、Ensar Seker、サイバー脅威インテリジェンス企業SOCRadarのCISOは指摘している。
Holleyの「目眩」は、防御側が攻撃面がより大きく、「以前想定されていたより急速に発見可能である」ことを実現しているためだと彼は述べた。
セキュリティチームは定期的なテストから継続的な検証へのシフトで対応する必要があると、Sekerは助言した。これはAI支援のコード分析を継続的統合/継続的配信(CI/CD)パイプラインに統合し、「完璧さより修正速度」を優先し、外部に到達可能なコードパスは最終的に発見され、武器化されると仮定することを意味する。
「目標はもはや単に脆弱性を最初に見つけることではなく、発見と修復の間の窓を縮小することだ」と彼は述べた。
Shipleyは、ソフトウェアを構築している任意の企業が、脆弱性を迅速かつ積極的に見つけて修正できるようにリソースを評価する必要があることに同意した。「しかし物事が起こるだろう」と彼は認めた。したがって、積極的な作業を行うことに加えて、企業は定期的にインシデント対応プレイブックを実行する必要がある。
「次の数年は競争ではなくマラソンになるだろう」とShipleyは述べた。
AIの二重用途の性質は課題である
しかし、これらのシステムの二重用途の性質は大きな課題を提示する。防御側が数百個の欠陥を識別するのを支援する同じ能力は、モデルまたはその出力が公開された場合、それらに対して向けることができるとSekerは指摘した。
Mythosへの報告された不正アクセスは「AI システム自体が現在高い価値のターゲットであり、攻撃面の一部になっていることを強化している」と彼は述べた。
Mythosへのアクセス方法を人々が見つけたことは全く驚くべきことではなく、Shipleyは同意した。それは避けられなかった。「また、Anthropicは、ハッキングのための独自の、克服不可能な、または排他的なAI能力を持っていない」と彼は述べ、OpenAIはすでにその面で追いついており、他の企業は「追い越し、Mythosを上回る」だろうと指摘した。
バランスを取ることは、AI モデルを特権付きインフラストラクチャのように扱うことを必要とするとSekerは指摘した。企業は厳密なアクセス制御、出力監視、および機密ワークフローの分離が必要である。一方、開発者は自動化された精査に対して復元力のあるコードを書くことで適応する必要があります。これはより強力な入力検証、より安全なデフォルト、および「曖昧さについての仮定をより少なくする」ことを必要とします。
「このパラダイムでは、セキュリティはシステムを守ることだけではなく、今ではそれらを規模で破ることができるツールを守ることについてもある」とSekerは強調した。