AIはセキュリティチームの迅速化を助ける――しかし攻撃者も同じように加速させており、サイバーセキュリティは「機械対機械」の競争になりつつある。
デジタル資産を守ってきた長いキャリアの中で、技術の潮流が移り変わるのを数多く見てきましたが、AIと大規模言語モデル(LLM)がもたらす破壊的な力に匹敵するものはありません。サイバーセキュリティにおいてAIは、文字どおり諸刃の剣です。脅威検知の自動化や安全なコードの高速な記述を可能にする同じ能力が、敵対者によって武器化され、新世代のサイバー脅威を生み出しています。あらゆるCISOやセキュリティリーダーにとって、主眼は変わらなければなりません。私たちはもはや人間の敵対者と戦っているだけではなく、AIで強化された自動化脅威エージェントと戦っているのです。
攻撃側の優位性
私たちは、サイバー犯罪に必要なコストと専門性が劇的に低下しているのを目の当たりにしています。かつて熟練した人間が数週間かけていたことが、いまやAIエージェントによって数時間で組み立てられ、私たちが「サイバー脅威インフレ」と呼ぶ状況を加速させています。
自己改変し、検知を回避するマルウェア
より最近では、Google Threat Intelligence Group(GTIG)の研究者が憂慮すべき新たな傾向を特定しました。実行中にLLMを利用して自らの挙動を動的に変化させ、検知を回避するマルウェアです。これは事前生成されたコードではなく、実行の途中で適応するコードです。
2025年6月、GTIGはPROMPTFLUXと呼ばれる実験的マルウェアを特定しました。これは商用LLM API(Gemini APIなど)に接続し、その場で新しいコード難読化および回避スクリプトを要求します。ジャストインタイムのコード生成を可能にするこの手法は、自律的かつ適応的なマルウェアへ向けた重要な一歩を示しています。
別の事例では、GTIGはPROMPTSTEALを特定しました。これはロシアに関連するAPT28グループがウクライナに対して使用していたものです。このマルウェアは、偵察コマンドをハードコードする代わりに、LLM(Hugging Face上のQwen2.5-Coderモデル)に問い合わせて生成します。
ある分析では、LLMの寄与があるマルウェア検知の割合は、2021年のわずか2%から、2025年には50%に達する見込みへと急増したと予測しています。
ディープフェイク主導の金融詐欺
一方で、生成AIは超リアルなディープフェイクによってソーシャルエンジニアリングを増幅させました。ディープフェイクを用いた詐欺は急増し、熟練の専門家でさえ欺く音声・映像の偽造を可能にしています。劇的な例として、フェラーリの幹部がCEOの声をクローンしたディープフェイクに、危うく騙されかけた出来事がありました。
さらに最近では、世界的なデザイン企業の従業員が、同社CFOや他の幹部になりすましたAI生成のビデオ通話に騙され、詐欺師に対して2,500万ドルの損失が送金される結果となりました。
防御側の優位性
敵対者がAIの速度で動くなら、防御も同じくAIの速度でなければなりません。このデュアルユース(軍民両用)的な力学の救いは、最も強力なLLMが防御側にも活用され、根本的に新しいセキュリティ能力を生み出していることです。
脆弱性検出:ゼロデイから自律型ペンテストへ
LLMの意味理解に基づくコード理解と文脈推論は、従来のシグネチャベースの静的解析器に対して大きな優位性をもたらします。特に、悪意ある攻撃者が見つけて悪用する前に未知の脅威を発見する点で顕著です。
LLMは、未知で未修正の欠陥(ゼロデイ)を特定するうえで並外れた可能性を示しています。これらのモデルは、特に新規ソフトウェアにおける微妙なロジック欠陥やバッファオーバーフローの発見において、従来の静的解析器を大きく上回ります。例えば、GoogleのBig Sleepプロジェクトでは、業界全体で利用される重要なSQLiteデータベースに存在するゼロデイ脆弱性を、LLMを用いて特定しました。
別の例としてXBOWがあります。これはLLMを活用し、人間の担当者と同じように現実世界の攻撃をシミュレートする自律型AIペネトレーションテストエージェントです。XBOWはHackerOne US Leaderboardで1位を獲得し、AIが幅広い脆弱性(例:インジェクション欠陥、XSS)の発見において、熟練した人間のハッカーに匹敵し、ベンチマークによっては上回り得ることを示しました。
XBOWのようなAIエージェントを自社システムに対して展開することで、あらゆるエンドポイントと攻撃ベクトルを体系的にテストできます。これにより、倫理的な攻撃的セキュリティテストを、定期的な監査からオンデマンドのプレプロダクション・ワークフローへとスケールさせられます。
一方で、GoogleのDeepMindはCodeMenderと呼ばれるAI駆動エージェントを先駆けて開発しました。これは脆弱なコードを自動的に検出し、パッチを当て、書き換えることで、セキュリティ欠陥のクラス全体を排除します。この事後対応と予防の両面を備えたアプローチは、防御自動化における大きな前進を示しています。
脅威ハンティングと行動分析
LLMは、脅威ハンティングを手作業のキーワード検索から、行動上の異常に焦点を当てた知的で文脈的なクエリプロセスへと変革しています。ネットワークログ、セキュリティインシデント報告、脅威インテリジェンスフィード(OSINT)といった巨大で非構造化のデータセットを処理・相関させることで、LLMは潜在的脅威について高い確度の仮説を生成するのに必要な文脈理解を獲得します。
例えば、Geminiを用いたGoogle Threat Intelligenceは、VirusTotalやMandiantなど複数ソースのデータによる不可欠な文脈的根拠を提供することで、このプロセスを強化します。これにより、特定の業界や組織に最も関連するグローバルな脅威アクターの戦術・技術・手順(TTP)をリアルタイムで特定し、数万件のレポートの中から重要なものを優先順位付けできます。
さらに、PalantirのAIP(Artificial Intelligence Platform)はLLMを利用して、広大なデータレイク全体にわたる異常なユーザー/システム行動を分析し、複数システムにまたがる微細な侵害指標を特定し、人間のアナリストが調査すべき優先度付きの攻撃経路を提案します。
ガバナンス、コンプライアンス、規制
LLMはまた、非技術的リスクであるコンプライアンス、プライバシー、規制の複雑性の管理に対して、非常に強力でスケーラブルな解決策を提供します。これらは重大な財務・法的責任につながり得ます。LLMを活用することで、ガバナンスを定期監査から継続的なポリシー施行へと移行できます。
例えば、MicrosoftのCompliance Managerは、社内のセキュリティポリシー、法的契約、GDPRやEU AI Actのような外部規制文書といった膨大な非構造化データを取り込み、理解できます。そして、あるフレームワークの要件を別のフレームワークへ自動的にマッピングし、監査時にコンプライアンスを証明するために必要な手作業を大幅に削減します。
IBMのWatsonxは、コンプライアンスとリスク管理にLLMの能力を適用します。金融サービス企業であれば、デプロイ前に新しい取引アプリケーションのコードをモデルが継続的にスキャンし、すべてのデータ取り扱いがHIPAAやPCI DSSに整合していることを検証し、確立されたポリシーからの逸脱を自動的にフラグ付けする、といったことが可能になります。
総括
AIシステムが生成モデルから自律エージェントへと進化し続ける中、そのデュアルユースの性質は無視できません。防御側がインシデント対応を加速するのに役立つ同じツールが、攻撃者にディープフェイクの作成やソーシャルエンジニアリング・キャンペーンの展開などを可能にしてしまいます。この緊張関係は、イノベーションの一時的な副産物ではなく、AIの急速な進化に内在する構造的な現実です。
最終的な課題はAIの進歩を止めることではなく、それを責任ある形で導くことです。そのためには、モデルにガードレールを組み込み、透明性を高め、新たな能力に歩調を合わせるガバナンス枠組みを整備する必要があります。また、AIが機会であると同時にリスク増幅要因でもあることを認識し、組織がセキュリティ戦略を再考することも求められます。
結局のところ、サイバーセキュリティに対するAIの影響は、これらのシステムが何をできるかだけでなく、私たちがそれらをどう使うかによって形作られます。未来は、AIの防御力を活用しつつ、その攻撃的な可能性に対して警戒を怠らない者のものになるでしょう。
この記事はFoundry Expert Contributor Networkの一環として公開されています。
参加したいですか?