
ピート・ヘグセス米国防長官が、イーロン・マスクの人工知能モデル「Grok」を軍の機密・非機密システムに統合しようと推進しているが、この大規模言語モデルが連邦政府の主要なAIリスクおよびセキュリティ枠組みの要件を満たしていない点については考慮されていない、とサイバーセキュリティのアナリストらは指摘する。
国防総省が統合を進める場合、同モデルの公開展開で問題となってきたのと同様の失敗を防ぐため、軍は追加のガードレールやテストに依存せざるを得ない可能性が高いと、情報セキュリティ・メディア・グループに情報筋が語った。ヘグセス長官は月曜日、AI導入を加速する広範な取り組みの一環として、Grokが他の商用AIツールと並んで近く軍のシステムに統合されると発表した。ヘグセス長官は、この動きは「実験を解き放つ」ことと、部隊全体で「官僚的障壁を排除する」ことを目指す、より広範な「AI加速戦略」の一部だと述べた。
この決定は、マスクのxAIが開発するGrokについて、ユーザーが同モデルを用いて露骨な性的画像を生成したことを受け、規制当局の措置や海外当局による調査を招いた(参照: 英国、AIディープフェイク・ポルノをめぐりXを調査)など、ここ数週間にわたり監視が強まっている状況を受けたものだ。反ユダヤ的および過激主義的な出力に関する別の事案も、モデルの安全制御に対する懸念を高めており、アナリストは、一連の論争が、許容的または敵対的な条件下でモデルがどのように振る舞うかに潜在的な弱点があることを露呈していると警告している。
軍のAI検討について議論するため匿名を求めた元国防サイバーセキュリティ高官は、核心的な問題は、Grokが軍の最も機微なネットワークの一部に接続された際に適切なガードレールが備わっているかどうかだと述べた。
「本当の問いは、軍のシステム内に入った後に同じ振る舞いを再現しないことを確実にするため、どのような追加のガードレールとテストが適用されるのかという点だ」と元高官は語った。
LLMの行動パターンや応答をめぐる予測不能性は、明確に定義されたシステム挙動、ログ、故障モードに基づいて運用利用のためのソフトウェアを認証する国防総省のサイバーセキュリティ認可プロセスを複雑にする。アナリストによれば、すでに軍全体で配備されている多くのAIツールは、特定の分析、保守、または兵站タスク向けに構築された狭い範囲のシステムであり、データフローが厳密に制御され、更新メカニズムも明確に定義されている。
アナリストは、Grokを安全に配備するには、運用データを模したサンドボックス化されたテスト環境、故障モードを探るために設計された広範なレッドチーム演習、そしてモデルがアクセスできるシステムやデータセットに対する厳格な制限など、相当なハードニングが必要になる可能性が高いと述べた。そうした制御がなければ、Grokは軍のネットワークに新たな攻撃面を持ち込み、プロンプトインジェクション攻撃への露出、出力の敵対的操作、あるいはモデル応答を通じた機微な文脈の意図しない漏えいを引き起こし得ると警告した。
Swishの最高技術責任者で、元米海兵隊の情報分析官およびC4Iシステム管理者でもあるショーン・アップルゲート氏は、国防総省にとってのGrokの魅力は、モデルがどこでどのように開発・学習されているかといったサプライチェーン上の考慮に大きく依存している可能性があると述べた。
アップルゲート氏は、Grokは米国立標準技術研究所(NIST)のガイダンスを含む主要な連邦AIリスク枠組みの要件を本来的に満たしておらず、大規模言語システム向けに広く用いられている業界の脅威モデルで示されるセキュリティ懸念にも対応していないように見えると述べた。これらの枠組みや脅威モデルは、モデルの悪用、データ漏えい、信頼できない出力、敵対的な悪用といったリスクを特定し緩和するために設計されており、軍事・情報環境ではその影響が一層重大となる。
「GrokはLLMや生成AIの脆弱性から免れているわけではない」とアップルゲート氏は述べ、防衛分野で安全に配備するには、多層的なガードレールと継続的な敵対的テストが必要だと付け加えた。
軍はここ数カ月、通常の調達およびサイバーセキュリティ手続きよりも速いペースで生成AIツールを運用化する取り組みを強化しており、国防総省のGenAI.milプラットフォームを通じてGoogleのGeminiのようなLLMの利用を拡大する一方で、兵站、情報、意思決定支援のユースケースに向けて他の商用モデルの評価も継続している。
翻訳元: https://www.databreachtoday.com/pentagons-use-grok-raises-ai-security-concerns-a-30546