Claude Mythos – 誇大広告は正当化されるのか?

Anthropicのセキュリティ AI モデルが話題を呼んでいる一方で、VulnCheckの最新分析はその実際の影響に関する疑問を投げかけています。

AnthropicのセキュリティモデルMythosをめぐる誇大広告に初めて亀裂が入りました。AI競合他社のOpenAIが独自のサイバーセキュリティ焦点のAIモデルで「対抗する」計画を立てている一方で、VulnCheckのセキュリティ専門家は最新調査でClaude Mythosすなわち「Project Glasswing」の実際の影響に疑問を呈しています。

「AnthropicのProject Glasswingは大きな注目を集めていますが、具体的なデータはほとんど提供していません」とVulnCheck研究者のPatrick Garrityブログ投稿で述べています。Anthropicの研究活動は確かに脆弱性の発見に積極的に貢献し、全体的に有望ですが、プロジェクトの実証可能な影響はこれまでのところかなり限定的です。

VulnCheckのCVE分析

分析のため、VulnCheckの専門家は「Project Glasswing」の背後にある数字、すなわちこのイニシアティブに直接帰属するCVEをより詳しく調べました。

GlasswingレポートもAnthropicが公開したセキュリティアドバイザリーも、発見された脆弱性の包括的なリストを提供していません。そこで、私は’anthropic’という用語を含むCVEデータベース全体を検索し、それぞれを確認することにしました」とGarritがそのプロセスを説明しています。全体では、研究者は75個のそのようなCVEエントリを特定しました。しかし、そのうち40個だけがAnthropicの研究者に帰属しました。さらに絞り込みをすると、たった1つのCVEだけが明確に「Project Glasswing」そのものに帰属していることがわかりました。これはFreeBSDのセキュリティ脆弱性で、リモートコード実行を可能にします。これは「自律的に特定された」および「悪用された」と説明されています。

分析では、Garrityはプロジェクトのウェブサイトで言及されている3つの脆弱性を除いています。これらはエンバーゴ下にあり、パッチが利用可能になるまで詳細には表示されません。以下を含みます:

  • OpenBSDにおける27年前のセキュリティ脆弱性、
  • FFmpegにおける16年前のバグ、および
  • Linuxカーネルにおける権限昇格チェーン。

「Claude Mythosの実際の性能を最終的に理解することは、AnthropicがProject Glasswingの枠組みで発見・修復された脆弱性について、包括的に公開で説明を行うまでは可能になりません」とGarrity述べています。セキュリティ専門家はこれが2026年7月までに起こると予想しています。

専門家はどう言っているのか

VulnCheckの知見はClaude Mythosの能力、すなわちそれがどのように測定されるかについて新たな光を投げかけています。結局のところ、直接帰属可能なCVEの数は、AnthropicのAIモデルの影響を把握する一つの方法に過ぎません。

例えば、Melissa BischopingはSANSテクノロジー研究所の理事でセキュリティプロバイダーTaniumのシニアディレクターですが、Claude Mythosの可能性に関して異なる視点を示しています。「TaniumではClaude Mythosプレビューのシステムカードを分析しました。このモデルはエクスプロイトで前例のない成功率を達成しています。ほぼゼロの成功率から同じクラスの攻撃ターゲットに対して約72パーセントへの飛躍は、洗練された複雑なエクスプロイトを開発することがもはやボトルネックではないことを示唆しています。」

Claude Mythosは現在、Project Glasswingの限定的な範囲でテストされていますが、すでに将来何が可能かを示していると、このマネージャーは述べています。「最先端モデルとオープンウェイトモデル間のギャップは1年以上から数週間に短縮されました。このパフォーマンスレベルは急速に広がるでしょう。おそらく、セキュリティ対策はそのペースについていけないでしょう」とBischopingは警告しています。

この専門家は特に、Claude Mythosによって明かされた知見に企業が対応できるかどうか、そしてそのモデルが野生に放たれる前にそうできるかどうかについて懸念を示しています。「エージェンティックパッチワークフローは実現可能で、多くの場合Adversarial AIのペースについていくことができます。しかし、企業方針と変更管理は現在、AI速度では実行されていません。」(fm)

翻訳元: https://www.csoonline.com/article/4160754/claude-mythos-ist-der-hype-gerechtfertigt.html

ソース: csoonline.com