AIのためのAI:Anthropic「AIエージェントにはAI防御が必要」

Anthropicは、自社のClaude AIモデルを使ってブロックチェーンのスマートコントラクトの脆弱性を見つけて悪用することで、簡単に460万ドルを稼ぐことができたかもしれない。

だが、このAI新興企業は、発見した攻撃手法を使わなかった。これは違法行為であるだけでなく、同社の「もっと頑張る」イメージを損なうことにもなるからだ。さらにAnthropicにとって460万ドルは、何十億ドルもの支出の中では四捨五入で消えてしまう程度の金額でもある。

しかし、同社のセキュリティ研究者たちが説明しているように、それを実行することは可能だった。そしてそれは、ますます高性能になっていくAIモデルのセキュリティ上の影響について、いまだに無頓着な人々への警告として意図されている。

Anthropicは今週、SCONE-bench、すなわちSmart CONtracts Exploitation benchmark(スマートコントラクト悪用ベンチマーク)を発表した。これは、ツールを備えたモデルであるAIエージェントが、トランザクションを自動化するためにブロックチェーン上で動作するスマートコントラクトの欠陥を、どれだけ効果的に見つけて巧妙に突くことができるかを評価するためのものだ。

研究者たちによると、これはAIエージェントがセキュリティホールを悪用する能力を高め続けているからだ――少なくともベンチマークテストで測定される範囲では。「過去1年間で、盗まれたシミュレート資金から得られたエクスプロイト収益は、およそ1.3カ月ごとに倍増しました」とAnthropicのAI研究者たちは述べている。

彼らは、既存のサイバーセキュリティテストでは、AIエージェントがもたらす金融リスクを評価できないため、SCONE-benchが必要だと主張している。

SCONE-benchのデータセットは、3つのEthereum互換ブロックチェーン(Ethereum、Binance Smart Chain、Base)上の405件のスマートコントラクトで構成されている。これは、2020年から2025年の間に実際に悪用されたスマートコントラクトを集めたDefiHackLabsリポジトリを元にしている。

Anthropicの研究者たちは、2025年3月1日以降に悪用されたコントラクト――Opus 4.5の学習データのカットオフ日以降のもの――について、Claude Opus 4.5、Claude Sonnet 4.5、そしてOpenAIのGPT-5が、460万ドル相当のエクスプロイトコードを生成したことを突き止めた。

以下のグラフは、405件すべてのスマートコントラクトに対して、10の最先端モデルがどのような成績を収めたかを示している。

ベンチマークテストでの脆弱性悪用による収益を示すAnthropicのグラフ

ベンチマークテストでの脆弱性悪用による収益を示すAnthropicのグラフ – クリックで拡大

また研究者たちが、公開された脆弱性が一切ない、最近デプロイされた2,849件のコントラクトを対象に、Sonnet 4.5とGPT-5を用いてシミュレーションを行ったところ、この2つのAIエージェントは2件のゼロデイ脆弱性を特定し、合計3,694ドル相当のエクスプロイトを作成した。

研究者たちは「APIコストが安い」ことからGPT-5に注目し、2,849件すべての候補コントラクトをGPT-5にテストさせるのにかかった総コストは3,476ドルだったと指摘している。

彼らによれば、1回のエージェント実行あたりの平均コストは1.22ドル、脆弱なコントラクト1件を特定するのにかかる平均コストは1,738ドル、1件のエクスプロイトから得られる平均収益は1,847ドルで、平均純利益は109ドルだった。

「これは概念実証として、現実世界における自律的で収益性のあるエクスプロイトが技術的に実現可能であることを示しています。この発見は、防御のためにAIを積極的に導入する必要性を強く示すものです」とAnthropicの研究者たちはブログ投稿で述べている。

同時に、スマートコントラクトそのものの怪しさを浮き彫りにしているとも言えるだろう。

他の研究者たちも、暗号通貨を盗むための類似システムを開発している。私たちが7月に報じたように、ユニバーシティ・カレッジ・ロンドンとシドニー大学のコンピュータサイエンティストたちは、A1と呼ばれる自動エクスプロイトフレームワークを作り、シミュレートされた資金で933万ドルを盗んだとされている。

当時、関係する研究者たちは、脆弱なスマートコントラクト1件を特定するコストは約3,000ドルだったと述べていた。Anthropicの試算では、そのコストは1,738ドルまで下がっており、セキュリティ問題の発見と悪用にかかるコストが低下することで、この種の攻撃がより魅力的な金儲けの手段になっていくという警告を裏付けている。

AnthropicのAI研究者たちは最後に、AIが生み出すリスクにはAIで対抗できると主張して締めくくっている。®

翻訳元: https://go.theregister.com/feed/www.theregister.com/2025/12/05/an_ai_for_an_ai/

ソース: go.theregister.com