Anthropicは、疑わしい国家関与のハッカーが同社のエージェント型AIベースのコーディングツールの1つを操作し、世界中の約30の主要組織に対して2023年9月に高度なスパイ活動を行ったと、木曜日に公開されたブログ記事で述べています。
ハッカーは同社のClaude Codeを使い、化学製造業、大手テクノロジー企業、金融機関、政府機関など幅広い組織を標的にしました。Anthropicによると、同社がGTG-1002と名付けた脅威アクターは、標的のうち少数への侵入に成功したとのことです。
同社は、この攻撃が大規模なサイバー攻撃としては人間の関与がほとんどない初めての事例の1つかもしれないと主張しています。Anthropicによれば、攻撃の80%から90%がAIによって実行され、4~6か所の重要な意思決定ポイントでのみ人間の介入が必要だったといいます。
Anthropicは、攻撃に関連する複数のアカウントを禁止し、影響を受けた組織に通知し、当局に攻撃を報告したと述べています。
さらに、攻撃の標的を人間のオペレーターが選定し、ハッキングを実行するためのフレームワークを開発したと付け加えました。Claude Codeツールは攻撃を自動的に実行するよう設定されていました。
このツールは有害な目的での利用を回避するよう訓練されていますが、攻撃者はClaude Codeをジェイルブレイクし、組み込まれたガードレールを回避できるようにしました。
ブログ記事によると、攻撃のさまざまなステップは単純なタスクに分解され、ツールはその文脈を完全に理解しないまま無害な段階的作業として解釈しました。欺瞞の一環として、ハッカーはClaudeに自分たちがサイバーセキュリティ企業の従業員であり、行動は防御テストの一部であると信じ込ませました。
このツールは偵察活動や高価値データベースの発見に利用されました。Claudeは標的システム内のセキュリティ脆弱性を特定・テストし、その後自らエクスプロイトコードを作成しました。ツールがユーザー名やパスワードを収集した後、Claudeは特権アカウントの検索、悪意あるバックドアの作成、大規模なデータ窃取にも利用されました。
Anthropicの開示は、Google Threat Intelligence GroupがAI対応マルウェアを使ったハッカーによる実際の攻撃を示すレポートを発表してから1週間以上経ってからのことです。
研究者らは、PrompfluxやPromptstealなど、大規模言語モデルを利用したマルウェアファミリーを特定しました。
北朝鮮、イラン、中国の国家関与アクターも、GoogleのAI技術であるGeminiを自らの活動強化に利用しています。
Googleの研究者は、これらの攻撃は孤立した事例ではなく、攻撃の増加傾向を示す証拠だと述べています。
「多くの他者もすぐに同じことをするか、すでにしているでしょう」とGTIGのチーフアナリスト、ジョン・ハルトクイスト氏はCybersecurity Diveに語りました。「本当の問題は、私たちが敵対者と同じ速さで適応できるかどうかです。」
翻訳元: https://www.cybersecuritydive.com/news/anthropic-state-actor-ai-tool-espionage/805550/