AIのサイバー攻撃者がより速く上達している

モーアの法則を脇に置く:AIモデルが破ることができるサイバーセキュリティ防御の難易度は約4ヶ月ごとに倍増しており、その時間間隔は短縮されている。

英国政府のAIセキュリティ研究所(AISI)が発表した新しいベンチマークによると、同じタスクに取り組む人間の能力に匹敵するエンドツーエンドの多段階ペネトレーションテストを実行するAIモデルの能力は、ここ数ヶ月で劇的に向上している。

DSIT(科学、イノベーション、技術省内の研究組織)であるAISIによると、2025年11月には、最高のモデルが完了できるサイバータスクの難易度は8ヶ月ごとに倍増していた。

今年2月までに、パフォーマンスの改善は加速し、AIモデルが完了できるタスクの難易度は4.7ヶ月ごとに倍増し、それ以来、最新のClaude Mythos PreviewとGPT-5.5モデルはさらに大きな能力を示している、とAISIが述べている

AISIが使用するタイムホライズンベンチマークは、まず人間の専門家が様々な課題を解決するのにかかる時間を測定または推定し、その難易度の代理として使用し、次にAIモデルが80%の成功率で完了できる最長タスク(人間の作業時間)を推定します。これは速度ではなく、自律的な能力の測定です。人間が4時間でペネトレーションテストの一連のタスクを正常に完了できる場合、タイムホライズンテストは、AIモデルが与えられた信頼性でこの能力にどの程度成功裏に一致できるかを測定します。

これを達成するために、AIはコンテキストを維持しながら複数のステップにわたってパフォーマンスを維持し、失敗から回復する必要があります。ステップが多いほど、ペネトレーションテストはより困難になり、結果はより意味のあるものになります。

すべてのベンチマークと同様に、注意点があります。最初のものは、時間を経てモデル間のパフォーマンスを比較するために、テストはAIシステムを250万トークンの低水準に制限したということです。これはいくつかの影響を持ち、これらのベンチマークでは、AIモデルが以前のステージで何に取り組んでいたかを追跡する能力を制限することを含みます。

AISIは分析で次のように述べています。「それらはパフォーマンスの不正確な予測因子です。AIは人間が素早く行うタスクに苦戦し、人間が難しいと感じるタスクも簡単に完了します。しかし、このタイプのベンチマークを使用するのは、AIの自律性の測定を提供し、そこからトレンドを引き出すことができるからです。」

増加するリスク

この研究は英国政府にとって懸念の原因となっています。

「私たちの独立した検査は、主要なAIシステムのサイバー機能が予想よりもはるかに速く進展していることを示しています。これは理論的ではなく、それらの進歩は既に実際のリスクに翻訳され始めており、特に弱いサイバー防御を持つ組織にとってです」と、英国のAI大臣であるKanishka Narayanはメールを通じて述べた。

「これらのツールはまた、サイバーセキュリティチームが脆弱性をより速く発見し、修正するのに役立つことができます。英国はフロンティアAIのテストと理解をリードしており、その能力は技術が継続して速く進むにつれてより重要になっていくでしょう」と彼は付け加えた。

4月、DSIT国務次官Liz KendallとセキュリティセオDan JarvisはAIモデルがもたらす増加するサイバーセキュリティリスクについて企業に警告する公開状を投稿した。

明らかなことは、現実世界のシナリオの下でのAIモデルの能力は急速に改善しており、最近のClaude Mythos PreviewのAISI評価の証拠に基づいて、おそらく加速しているということです。

AIの難しい問題を解決する能力に関するすべての最近のベンチマークが、そのような印象的な結果をもたらしたわけではありません。コーディング、結晶学、系図学、音符記法を含むタスクの範囲に対する19のAIモデルの最近のテストでは、マイクロソフトの研究者は、モデルが特に長いタスクではエラーが発生しやすく信頼性が低いことを発見した。

Kat Traxler、Vectra AIの主席セキュリティ研究者は、ベンチマークを企業が注意を払うべき有用なシグナルと見ています。「AISIベンチマークは、モデルが欠陥を発見できるかどうかを測定していません。むしろ、様々なモデルが一連のエクスプロイトを連鎖させて、実世界の攻撃者のようにエンドゴールを達成するために機能する攻撃にすることができるかどうかを測定しています。攻撃的な能力のシグナルとして、AISIの結果は実質的な重みを持ちます」と彼女は述べた。

しかし、彼女は最近のClaude MythosのXbow評価を指摘し、いくつかのタスクで混合的なパフォーマンスを見つけた。「これらの既知のモデル制限が実際にどのように実世界の自律的な攻撃的キャンペーンを制限するかはまだ決定されていますが、モデルの能力の天井を真に見るために洗練された検証ハーネスの必要性を指摘しています。」

Chris Lentricchia、Sweet Securityのディレクタークラウド・AIセキュリティ戦略によると、企業は利点も見るべきです。AIモデルは攻撃者を支援しますが、また防御者も支援します。

「これは純粋に攻撃的なストーリーではありません。攻撃者の能力を改善する同じ加速度は、プロアクティブな脅威検知と応答自動化のような領域で防御的な能力を改善することもできます。ベンチマークは、エンタープライズ防御が加速するAI能力に歩調を合わせるのに十分速く進化しているかどうかを理解するための指標として最適に見られています」とLentricchiaは述べた。

翻訳元: https://www.csoonline.com/article/4172519/ai-cyberattackers-are-getting-better-faster.html

ソース: csoonline.com