次のシナリオを想像してみてください。
火曜日の夜11時47分。ベテランSOCアナリストが、重大度の高いクリティカルなアラートへの対応を求められます。プライマリードメインコントローラーが、中堅社員の一般ワークステーションから発せられた、きわめて異常な管理コマンドシーケンスを検出したのです。
アナリストは組織のサイバーセキュリティプラットフォーム上の「エージェント」を起動し、調査を支援させます。アカウントの全認証タイムラインのマッピング、内部ネットワークログとの照合、アクティブな脅威インテリジェンスフィードのスキャン、ラテラルムーブメントを追跡するための二次検索クエリの構築——調査はマシンスピードで進んでいきます。
そのとき、画面が変わります。
「今月のAI利用上限に達しました。続けるにはEnterprise Plusにアップグレードしてください。上限は午前3時30分にリセットされます。」
セキュリティプラットフォームにAIが加わるとき
あらゆるサイバーセキュリティベンダーがこぞってAIの組み込みを急いでいます。その謳い文句は魅力的です。より迅速な検知、自律的な調査、エージェントによる対応——。しかし、十分に注目されていない点があります。それは価格設定です。業界が生成AI・エージェントAIの導入を急ぐ中、セキュリティプラットフォームの課金モデルは予測可能なソフトウェアライセンスから、機械主導の消費量に連動した変動コスト型へとシフトしています。そしてその請求書は、ほとんど警告もなく、上限もないまま、CISOのもとに届くようになっています。
その背景を理解するために、AIがサイバーセキュリティプラットフォームの中でどのように進化してきたかを振り返ってみましょう。
- 機械学習(ML)は統計的な行列と行動ベースラインを基盤として動作します。数値データ間の数学的距離を計算するのであって、言語を「読む」わけではないため、トークン消費量はゼロです。機械学習の「コスト」はCPUサイクルまたはGPUコンピュート時間で測られるため、変動費としてのトークンコストは存在しません。
- 生成AI(GenAI)はインタラクティブなアシスタント、または翻訳レイヤーとして機能します。人間がループに介在することが前提であり、プロンプトを入力すればインシデントの要約が返ってきて、その後はアイドル状態になります。トークン使用量は人間のテキスト入力量によって完全に制限されるため、少量・線形・非常に予測しやすいという特性があります。
- エージェントAIは人間というボトルネックを完全に取り除きます。「このサーバーが侵害されているかどうかを判断せよ」という高レベルの目標が一つ与えられると、エージェントは多段階の実行ループを起動します。APIを自律的に呼び出し、生のログを解析し、ペイロードを評価し、そのコンテキストをLLMに継続的にフィードバックして次の行動を計画します。人間がマシンのペースを制御することはなく、タスクが完了するまでメーターは動き続けます。
バックグラウンドで動き続けるトークンメーター
エンタープライズソフトウェアはこれまで、ユーザーごとのライセンスやデバイス・エンドポイント数といった、固定かつ予測可能な指標で課金されてきました。フロンティアAIモデルプロバイダーはそれとは異なる仕組みで動きます。ソフトウェアエコシステムに対してトークン単位で課金するのです。トークンはおおよそ単語の4分の3に相当し、マシンが読む単語(入力トークン)と書く単語(出力トークン)のそれぞれについて、1セントの何分の1かという単価で課金されます。
AnthropicのClaude Sonnet 4.6は入力100万トークンあたり3.00ドル、出力100万トークンあたり15.00ドルです。GPT-5.5は入力100万トークンあたり5.00ドル、出力100万トークンあたり30.00ドルとなっています。これらはベンダーが商用AIのAPIを呼び出す際に支払うコストであり、その後、顧客へのSaaSサブスクリプション料金にマークアップされるか吸収されます。顧客側はその内訳を評価する手段をほとんど持ちあわせていないのが現状です。
LLM APIの価格は2025年初頭から2026年初頭にかけて約80%下落しています。これは本当に喜ばしいニュースです。しかし、サイバーセキュリティにおけるトークンの経済学は、他のエンタープライズAIアプリケーションとは根本的に異なります。扱うデータ量が桁違いに大きく、セキュリティ機能はより複雑だからです。
アラートのトリアージ——基本的なコンテキストを用いた単一アラートの分類——では、消費トークンは約1,000程度です。AIが関連テレメトリを引き出してイベントの連鎖全体を推論するガイド付き調査では、インシデント1件あたり2万〜5万トークンに達することがあります。完全自律型のエージェントループはその質においても次元が異なります。エージェントは何十万行もの生テキストログを読み込み、複雑なAPIコールを組み立て、ペイロードを評価し、そのコンテキストをモデルに継続的にフィードバックします。複雑な多段階インシデント調査1件で、数分のうちに数百万トークンを消費することもあります。これに1日に生成されるセキュリティアラートの件数を掛け合わせると、AIコストが爆発的に膨らむことが現実のケースで証明され始めています。
ある企業(社名は非公開)が最近、従業員ライセンスに利用上限を設定しなかっただけで、1か月のClaudeの請求額が5億ドルに達したという事例があります。UberのCTOは2026年分のAI予算を4月の時点で使い切ってしまいました。またサイバーセキュリティの分野では、Palo Alto NetworksがAnthropicのClaude Mythosを自社ソースコードに対してテストしたところ、モデルは重大な脆弱性を20件以上発見しましたが、その過程で100万ドル以上相当のトークンを消費したとされています。
これらは、フロンティアAIモデルの運用コストとセキュリティ予算が吸収できる範囲との間に、構造的なミスマッチが生じているという初期シグナルです。セキュリティオペレーションへの影響は深刻です。
1. 予測不能な予算
長年にわたり、CISOは高度に予測可能な予算フレームワークのもとで業務を行ってきました。トークン課金型のAI搭載セキュリティへの移行は、サイバーセキュリティを上限のない変動的な運用費へと変えてしまいます。大規模なエンタープライズ全体へのマルウェアアウトブレイクや、長期化したインサイダー脅威キャンペーンが発生した場合、何千件もの自律的な調査が同時進行することになりかねません。その結果、四半期分のサイバーセキュリティ予算が一週末で消滅する可能性があります。それに備えたコンティンジェンシー予算を持つCISOは、まだどこにも存在しません。
2. 運用上の妥協を強いる状況
SIEMの業界はかつて、インジェストするデータ量に応じて組織に課金していました。コストを理由に組織はデータ収集量を制限するようになり、それがブラインドスポット(死角)を生み出しました。AIのトークン課金も、より大きなスケールでより速いペースで同じリスクをもたらします。インシデント対応の最中に消費上限に達した場合、セキュリティオペレーションマネージャーは不可能な選択を迫られます。超過分を支払うか、調査を縮小するか、手動トリアージに戻るか——。実際には、毎月のトークン残量を確保するために、エージェントワークフローを無効にしたり、優先度の低いアラートへの自動深掘りトリアージをスキップしたりするチームが出てくるかもしれません。その結果、セキュリティ上の成果が損なわれます。
3. デプロイメントアーキテクチャの再考
基盤となるデプロイメントアーキテクチャは、エージェントAIをスケールで実現できるかどうかを左右する戦略的な意思決定になっています。クラウドベースのアーキテクチャは、変動するAIコストを顧客に直接転嫁します。推論ループ、APIコール、マルチエージェントオーケストレーションの各ステップが、すべて他者のインフラ上で、他者の定めた価格で実行されます。オンプレミスのアーキテクチャは、固定の自社コンピュートによってこの課題に対処します。バックグラウンドでトークンメーターが動くことなく、複雑な推論ループをローカルで実行できるハードウェアです。エージェントAIをメータリングの制約なく常時フル稼働させる必要がある組織にとって、経済的に成立するアーキテクチャはオンプレミスだけです。
絡み合う未来
冒頭のシナリオについて、率直に申し上げましょう。「今月のAI利用上限に達しました。続けるにはEnterprise Plusにアップグレードしてください」という具体的なエラーメッセージは、あくまで例示であり、実際のメッセージではありません。サイバーセキュリティにおけるトークン枯渇の現実は、おそらくそのような形では現れないでしょう。むしろそれは、調査の途中でサイレントに処理を止めるAPIタイムアウト、プラットフォームがより安価なモデルに静かに切り替えることによる応答品質の低下、あるいはチームが正常稼働していると思い込む中で優先度の低いアラートへのトリガーが止まる自律ワークフローの停止という形をとるかもしれません。AIの消費コストが上昇するにつれ、サイバーセキュリティベンダーからクレジットベースの新たな料金モデルが続々と登場することが予想されます。クレジットベースのシステムはトークンを「オペレーション」や「AIクレジット」に抽象化します。ベンダーにとってクレジットは実際のマージン問題を解決するものです——契約を値上げすることなく、変動するAIインフラのコストを回収できるからです。CISOにとっては、準備が整っているかどうかにかかわらず、予測可能な予算から変動消費型の経済へのシフトを意味します。
しかし、根底にある構造——フロンティアAIの能力とセキュリティスケール・複雑性との衝突——は現実のものです。今やサイバーセキュリティエコシステムとフロンティアAIモデルプロバイダーは、永続的に結びついた絡み合う未来にあります。
セキュリティベンダーは、自動化された攻撃者に対する防御上の優位性を維持するために、最高水準の推論モデルを必要としています。しかし、マシンスピードのセキュリティ競争における勝者は、最も強力な自律エージェントを持つチームではありません。勝利を収めるのは、AIがセキュリティにおいて単一のテクノロジーではなく——それぞれ固有のコストモデルと最適な役割を持つ3つの異なるレイヤーで構成されていることを理解している組織です。機械学習は継続的・大量のデータ検知を担い、生成AIは調査にコンテキストと推論をもたらし、エージェントAIは自律的なアクションでループを完結させます。勝利する組織とは、最適なサイバーセキュリティ成果のために適切なプラットフォーム、アーキテクチャ、AIモデルを選択し、トークンやクレジットという経済的制約を攻撃者に利用されない組織です。
AIリスクサミットで詳細を確認 | リッツ・カールトン、ハーフムーンベイ

翻訳元: https://www.securityweek.com/the-ai-token-costs-that-can-break-cybersecurity/