Anthropicの現在のところ最も高度なモデルであるClaude Mythos Preview(別名Mythos)は、特にサイバーセキュリティタスクにおいて、AI性能の「段階的な変化」として説明されています。
Anthropicは数週間前までMythosを秘密にしようとしていましたが、データ漏洩により、同社が現在最も強力な人工知能だと述べたものの存在が明かされました。このモデルは、強力な防御ツールであり、潜在的には深刻な攻撃型サイバー兵器の両方と見なされています。
そのため、同社はアクセスを厳しく制限しており、現在のところ広く市場にリリースする計画がないことを示唆しています。ソフトウェア脆弱性を自律的に発見し、さらに大規模に連鎖させる能力が、ハイプと危険の両方の中心にあります。
ソフトウェア、システム、プラットフォームの新しい脆弱性を独立して発見し、他の脆弱性との連鎖が必要であっても、それらをエクスプロイトに変えることができるツールを想像してください。
間違った手に渡れば、それは私たちのサイバーセーフティへの主要な脅威となる可能性があります。そのため、Anthropicは大手テクノロジー企業や政府またはセキュリティ機関の選ばれたグループを含む、世界中の少数の組織へのアクセスを制限しています。NSAは報道によるとすでにMythos Previewを使用しており、国防総省がAnthropicをサプライチェーンリスクとしてラベル付けしているにもかかわらず、機密システムのストレステストと強化のためにそれを使用しているようです。
Mythosは、既存のツールよりも大規模なコードベース全体の脆弱性をより迅速かつ確実に発見でき、1つのシステム内の複数の欠陥を探し、それらを多段階のエクスプロイトチェーンに組み合わせて侵害を完了することができます(たとえば、単純なウェブバグから完全なドメイン乗っ取りへ)。バグバウンティハンターが別の脆弱性を見つけるのに数ヶ月かかることになり、すでに発見されたものと連鎖させることができるものはなおさらです。最初のものの前にそれを達成することは極めてまれです。
実際には、これはより速い攻撃、より複雑な侵害、そして企業が脆弱性を悪用される前に修正する時間が少なくなることを意味する可能性があります。
Anthropic自体は、Mythosが長期間にわたって最小限の監視で機能できることを強調しており、人間のチームが達成できないスケールで組織的な攻撃キャンペーンを実行できることを意味しています。
Anthropicは内部文書でこれらのセキュリティリスクにフラグを立てました:
- AIは攻撃的な操作のスキルフロアを低下させます。スキルの低いアクターは非常に効果的なツールにアクセスできるようになり、高度な攻撃の数を大幅に増加させます。
- ファジング、辞書攻撃、その他のブルートフォース方法などの技術は、オートメーションによって高速化されるとはるかに効果的になります。AI支援の反復は、攻撃が気付かれる前に攻撃者にはるかに多くの試行を提供できます。
しかし、最も懸念される結論は、AI開発の現在の段階では攻撃側がより速く反復しており、セキュリティチームは一般的に敵よりもAIツール採用の後発者であるということです。
ご存知のとおり、サイバーセキュリティにおけるAIは両方向で機能します。それは新しい脅威から身を守るのに役立ちますが、それらを作成するためにも使用できます。それが、間違った手に渡れば、Mythosが強大な敵になる可能性がある理由です。
目標は同じままですが、そこに到達する方法はMythosのようなツールで舗装されています。攻撃者の視点から、目的地についての何も新しいことはありません。新しいことは、Mythosが今マップ、車両、そしてほとんどの運転を自動化しているということです。
翻訳元: https://www.malwarebytes.com/blog/news/2026/04/mythos-an-ai-tool-too-powerful-for-public-release