OpenAI、高度なサイバー機能と多層防御アーキテクチャを備えたAIモデル「GPT‑5.6 Sol」を発表

OpenAIは次世代AIモデルファミリー「GPT‑5.6」の限定プレビューを発表しました。フラッグシップモデル「Sol」を中心に構成されており、サイバーセキュリティ機能の大幅な強化と、新たに設計された多層防御アーキテクチャを導入しています。

2026年6月26日に公開されたこのリリースは、GPT‑5.6 Solを同社史上最も高性能なモデルと位置づけており、脆弱性調査・エクスプロイト解析・防御セキュリティワークフローにわたって測定可能な改善を実現しつつ、悪用を抑制するためのより厳格な制御も同時に実装しています。

OpenAI、GPT-5.6 Solモデルを発表

今回のリリースには、パフォーマンスとコスト効率のバランスを最適化した「Terra」と、速度と低コストを重視した軽量モデル「Luna」の2つの追加バリアントも含まれており、エンタープライズ・開発者・セキュリティの各ユースケースに対応した段階的なエコシステムを形成しています。

エンドポイントセキュリティソフトウェア

サイバーセキュリティの観点から見ると、GPT‑5.6 Solは脆弱性発見やエクスプロイトチェーン解析などの長期的な推論タスクにおいて顕著な向上を示しています。

OpenAIによると、同モデルはExploitBenchにおいて競合システムと比較して約3分の1少ない出力トークン数で同等の競争力を発揮しており、複雑なエクスプロイトシミュレーションにおける効率性の向上を示しています。

さらに、UC Berkeleyとの共同で実施されたExploitGym評価において、GPT‑5.6の全バリアントが推論の深度が増すにつれて悪用経路の特定において測定可能な改善を示しました。

Image

OpenAIは、同モデルがChromiumやFirefoxといったソフトウェアの重大な脆弱性やエクスプロイトのプリミティブを特定できる一方、制御された条件下ではエンドツーエンドの完全なエクスプロイトチェーンを自律的に生成することはなく、同社のPreparedness Frameworkで定められた「Cyber Critical」閾値を下回ることを強調しています。

今回のリリースの主要なハイライトのひとつは、AIを活用した攻撃的サイバーオペレーションへの懸念の高まりに対応するため、「多層セーフガードスタック」が導入されたことです。

これらのセーフガードには、禁止されたサイバー支援を防ぐモデルレベルの制限、悪用分類器を用いたリアルタイムの出力監視、および悪意ある活動のパターンを検出するアカウントレベルの行動分析が含まれています。

リスクの高いインタラクションについては、出力が一時停止され、配信前に二次推論システムによるレビューが行われる場合があり、実質的にランタイムセキュリティフィルターとして機能します。

この多層的なアプローチは、ペネトレーションテスト・パッチ開発・セキュアコード監査などの正当な用途を維持しつつ、悪意ある利用をより困難に・検出しやすく・リソース集約的にすることを目的としています。

OpenAIはまた、敵対的攻撃に対するモデルの堅牢性を強化するため、自動レッドチーミングへの大規模な投資を明らかにしました。同社はジェイルブレイクの試みをシミュレートし、多様な攻撃シナリオにわたる体系的な弱点を特定するために、700,000時間を超えるA100相当のGPU時間を活用しました。

これに加え、自動化システムでは見逃す可能性のある微妙な悪用技術を発見するために、人間の専門家によるレッドチーミングも実施されました。これらの演習から得られた知見は、セーフガードの改善と、モデルの動作における新たに発見された脆弱性に対する迅速対応型の修復パイプラインの構築に活用されています。

GPT‑5.6シリーズは強化された推論モードを導入しており、深い分析タスク向けの「max reasoning」設定と、多段階の脆弱性評価のような複雑なワークフローを処理するために複数のサブエージェントを活用する「ultra mode」が含まれています。

ハッキング& クラッキング

Terminal-Bench 2.1などのコーディングベンチマークでは、GPT‑5.6 Solがセキュリティオペレーションに関連するコマンドラインおよびツール連携タスクにおいて、前世代モデルや競合システムを上回る91.9%のトップスコアを達成しました。

現在、これらのモデルはAPIおよびCodexを通じて限られた信頼パートナーグループに提供されており、今後数週間以内により広く利用可能になる見込みです。

OpenAIはプレビュー段階において、実際のリスクとパフォーマンスを評価するために政府関係者や選定された企業との連携が含まれることを確認しました。料金は100万トークンあたりの単価で設定されており、Solがプレミアムティアに位置づけられ、コストを重視するデプロイメント向けにはTerraとLunaが続きます。

機能概要

機能 GPT-5.6 Sol 詳細
モデルティア フラッグシップ(最高性能)
サイバーセキュリティ機能 高度な脆弱性発見、エクスプロイトプリミティブの特定
ExploitBenchパフォーマンス 約1/3のトークン数でトップモデルと同等の競争力
ExploitGymパフォーマンス 推論深度の向上に伴うエクスプロイト経路特定の改善
Terminal-Benchスコア 91.9%(最高水準)
セーフガード 多層スタック(モデル制限、リアルタイム監視、アカウント分析)
レッドチーミング 700,000時間超のGPU時間を活用した自動化テスト+人間の専門家によるテスト
推論モード Max reasoning、Ultraマルチエージェントモード
エクスプロイト自律性 完全なエクスプロイトチェーンを生成しない(Critical閾値以下)
利用可能状況 限定プレビュー(API、Codex)、広範なロールアウトを予定
料金(100万トークンあたり) 入力$5 / 出力$30

今回のリリースは、組織が脆弱性管理や脅威インテリジェンスのワークフローに高度なモデルを積極的に統合する中、攻撃的セキュリティ研究能力と堅牢なAIガバナンスのバランスを図るという業界全体の広範なトレンドを反映しています。

翻訳元: https://gbhackers.com/openai-launches-gpt-5-6-sol-ai-model/

ソース: gbhackers.com