Anthropicはエクスプロイト記述AIを悪い手に渡らないようにできるか？

Anthropicの Mythos モデルは脆弱性管理およびセキュリティレッドチーミングにおける大きな革新を約束していますが、防御者が脅威アクターに完全に利用されないようにする方法についての問題が残っています。

Anthropicは 4 月 7 日にClaude Mythos Preview を発表しました。同社はブログ投稿で、このモデルは「全体的に優れたパフォーマンスを発揮していますが、コンピュータセキュリティタスクにおいて特に優れた能力を持っています」と述べています。同社によると、Mythos は「すべての主要なオペレーティングシステムとすべての主要なウェブブラウザ」内のゼロデイ脆弱性を特定し、ユーザーの指示に従って悪用することができます。これには、検出が難しい微妙な脆弱性も含まれます。1 つの例には、OpenBSD の 27 年前の修正済み欠陥が含まれていました。

これらの脆弱性の一部は複雑であり、モデルを正しくプロンプトするためにはセキュリティエンジニアである必要はないと同社は述べています。

「1 つのケースでは、Mythos Preview は 4 つの脆弱性を組み合わせたウェブブラウザエクスプロイトを作成し、複雑な JIT ヒープスプレーを記述してレンダラーと OS サンドボックスの両方を回避しました」とブログに記載されています。「同じく、Linux および他のオペレーティングシステムで、微妙なレース条件と KASLR バイパスを悪用して、自律的にローカル権限昇格エクスプロイトを取得しました。そして、複数のパケットに分割された 20 ガジェット ROP チェーンを悪用して、FreeBSD の NFS サーバー上でリモートコード実行エクスプロイトを自律的に記述し、認証されていないユーザーに対して完全な root アクセスを付与しました。」

脆弱性検出および悪用機能の強化は、開発者の側で明確な目標ではなく、Mythos のコードおよび推論能力を改善することの「下流の結果」として生じました。「モデルをパッチ適用の脆弱性でより効果的にするのと同じ改善により、脆弱性の悪用でもより効果的になります」と Anthropic は述べています。

目的は防御者を支援し、Mythos を攻撃者の手から遠ざけることですが、Anthropic は「数千個」の「高」リスクおよび「重大」セキュリティ脆弱性を特定し、現在責任を持って開示していると主張しています。Mythos Preview のようなモデルが、Cobalt Strike などの正当なペネトレーションテストツールを脅威アクターがどのように悪用するかと同様に、誤用される可能性があるかを理解することは、それほど大きなリーチではありません。

Project Glasswing の登場

Anthropic が「Project Glasswing」を導入したことは、おそらくこれに対する予期のものです。同社が今週、Apple、AWS、Microsoft、Palo Alto Networks、CrowdStrike などの企業と協力して立ち上げた新しいイニシアチブです。その製品発表の一部として、Anthropic は Project Glasswing がサイバーセキュリティを根本的に「再構築」でき、これが「防御目的でこれらの能力を機能させるための緊急の試みである」と主張しています。

実際的な観点から、AI ベンダーは 40 を超える組織のグループに Mythos Preview へのアクセスを拡張し、ファーストパーティおよびオープンソースシステムをスキャンして保護しています。Palo Alto Networks の最高製品・技術責任者である Lee Klarich は、初期の Mythos Preview の結果を「説得力のある」と呼んでいます。LinkedIn ブログ投稿で。

パートナーへのアクセスを制限することに加えて、Anthropic は Project Glasswing への Mythos Preview 使用クレジットで 1 億ドルをコミットし、さらにオープンソースセキュリティ組織への直接寄付として 400 万ドルをコミットしています。

Forrester シニアアナリストの Erik Nost は Dark Reading に対し、脆弱性の悪用に非常に優れたものを導入する理由は、Anthropic にとって良い PR であると述べています。同社は基本的に、その AI がサイバーセキュリティとソフトウェア開発を再構築できるほど優れていると述べています。次に、それは業界が 30 年間対処してきた脆弱性検出ギャップにも注目を集めています。

Mythos Preview を悪い手から遠ざける

Nost は、Mythos が正しい手に留まるようにするための制御が現在実施されていることを説明していますが、「防御者の競争」になりました。他の AI、悪い手に本当に発見される前に修復してパッチを当てます。」

「脆弱性管理の慣行が非常に異なろうとしていることを防御者に認識させるための行動喚起、注意です」と彼は言っています。

Veracode のシニアプリンシパルソリューションアーキテクトである Julian Totzek-Hallhuber は、これらのツールが攻撃者の手から離れたままになることができるという明確な答えがないため、防御者はその能力が拡散すると想定し、それに応じて準備する必要があると述べています。これは、予防だけではなく検出への投資、AI を支援した悪用の行動シグネチャの特定、ゼロトラストアーキテクチャと同様に積極的なパッチ適用サイクルと異常ベースの検出への投資を意味しています。

AppOmni の AI ディレクターである Melissa Ruzzi は、Dark Reading に、より深い真実を述べています。「誰もが 100％攻撃者の手からものを遠ざけることはできません。最良のことができるのは、アクセスを取得するのを難しくするだけです。」

Mythos の可能性には注意点が伴っています。Anthropic の発見された脆弱性の初期の例は説得力がありますが、2 つのデータポイントはパターンを作成しません。Totzek-Hallhuber は「Anthropic がモデルとナラティブの両方を制御しています。モデルが公開されていない場合、独立した複製は不可能です」と強調しています。

「アクセス可能な独立した研究者が独自の評価を実行するまで、健全な懐疑主義が適切な姿勢です」と彼は述べています。「これは、実質的には、制限されたアクセスモデルの別の結果です。クレームをテストすることはできないため、完全に信頼することも反論することもできません。」

Dark Reading は、誤検知とエラー率に関する統計情報について Anthropic に問い合わせました。ベンダーは報道期間までに応答しませんでした。

最新の Dark Reading Confidential ポッドキャスト「セキュリティの上司は AI にすべて参加しています：その理由は何か」を見逃さないでください。ここで、Reddit CISO Frederick Lee と Omdia アナリスト Dave Gruber は、SOC での AI とマシンラーニング、成功した展開がどのようになった（またはされていない）か、そして AI セキュリティ製品の将来について説明しています。今すぐ聞く！

翻訳元: https://www.darkreading.com/application-security/anthropic-exploit-writing-mythos-ai-safe

Anthropicはエクスプロイト記述AIを悪い手に渡らないようにできるか？

Project Glasswing の登場

Mythos Preview を悪い手から遠ざける

共有:

関連

関連記事

Incランサムウェア、SonicWall SMAのゼロデイ脆弱性を悪用

本当に恐ろしいAIの脅威は「盲目的な信頼」

ゴールドイーグル・クリアリングハウス、セキュリティの隙間を狙うも運用実態は不透明