OpenAIは、新しいGPT-5.6モデルラインナップの限定プレビューを発表しました。Sol、Terra、Lunaという3つの階層型システムが導入されており、同社はSolをサイバーセキュリティ向けの最高性能モデルと位置づけています。
今回のリリースは米国政府との協議を経たもので、信頼できる一部のパートナーに限定した早期展開という形をとっています。
OpenAIは、この段階的なリリースはあくまで一時的な措置であると説明しています。現在、先進的なAIシステムが国家安全保障に与えるリスクを政府が評価できる枠組みを整備するため、連邦政府と協力して最近の大統領令に沿ったフレームワークの策定を進めているとのことです。
今回のGPTアップデートは、OpenAIのブランド戦略の転換を示すものです。バージョン番号がモデルの世代を表す一方、名称は恒久的な性能ティアを意味するようになりました。GPT-5.6 Solは最上位のフラッグシップモデルで、高強度の推論タスクを想定して設計されています。GPT-5.6 Terraは日常的なワークロードを対象とし、GPT-5.5と同等の性能を半分の運用コストで実現すると同社は報告しています。GPT-5.6 Lunaはラインナップ内で最も低価格な高速モデルとして位置づけられています。
ExploitBenchを使ったサイバーセキュリティテストでは、SolはMythos Previewなどの競合システムと同等の性能を発揮しつつ、出力トークン数は約3分の1に抑えられました。
同社は、Solがエンドツーエンドのサイバー攻撃よりも、脆弱性の特定やパッチ開発といった防御的なセキュリティタスクに優れた適性を持つことを強調しています。ChromiumおよびFirefoxのコードベースを用いた評価では、バグや基本的なエクスプロイトの原型の特定には成功したものの、機能する完全なチェーンエクスプロイトを独自に構築するには至りませんでした。
防御的な研究が攻撃的な行為と近接するという二重用途リスクに対処するため、GPT-5.6シリーズは多層的なセキュリティアーキテクチャを採用しています。標準的なトレーニングレベルの拒否機能に加え、生物学およびサイバーセキュリティに関する入力に対して自動化されたリアルタイム分類器を導入しています。異常が検出された場合、出力生成が一時停止され、二次的な推論モデルが会話のコンテキストをレビューする仕組みになっています。
また、場合によってはアカウントレベルの評価が発動され、正当なセキュリティ研究と悪意ある行為の区別を支援する仕組みも備えています。
OpenAIは、システム的な脆弱性に対するモデルの堅牢化を目的とした自動レッドチーミングに、A100相当のGPU時間を70万時間以上費やしたと述べています。このアプローチは、単一プロンプトの失敗ではなく、汎用的なジェイルブレイクの発見に重点を置いたものです。
現在、モデルへのアクセスは承認されたパートナー向けのAPIおよびCodexに限定されていますが、OpenAIは数週間以内にChatGPT、Codex、および広範なAPIユーザーへの一般提供を拡大する予定です。
同社はまた、政府を介した事前審査をAI展開の長期的な標準とすることに公然と反対を表明しています。長期的な制限は、必要不可欠な防御ツールがより広いサイバーセキュリティコミュニティに届くのを遅らせるというのがその主張です。
翻訳元: https://www.securityweek.com/openai-unveils-gpt-5-6-sol-as-its-most-advanced-cybersecurity-ai/