OpenAI、強化されたサイバー能力と安全対策を備えたGPT-5.6 Solをプレビュー公開

OpenAIは、GPT-5.6モデルシリーズの限定プレビューを発表しました。同シリーズはSol、Terra、Lunaの3段階で構成されており、Solはフラッグシップモデルとして、同社史上最高峰のサイバーセキュリティ機能と最も堅牢な安全アーキテクチャを備えています。

2026年6月26日に公開されたこのリリースによると、TerraはGPT-5.5と同等の性能を半分のコストで提供し、LunaはラインナップのなかでAI支援セキュリティ作業において最もリーズナブルな価格帯で高い能力を発揮します。GPT-5.6 Solは、AI支援セキュリティ作業において大きな飛躍を遂げています。

ExploitBenchでは、このモデルはAnthropicのMythos Previewと競合する性能を示しながら、出力トークン数を約3分の1に抑えています。これは、脆弱性調査や悪用分析をはじめとする長期的なセキュリティタスクにおいて、大きな効率向上を意味します。

ExploitGymは、UC Berkeleyの研究者がOpenAIや他の最先端AIラボと共同で開発したベンチマークです。このベンチマーク上で、GPT-5.6の3モデルすべてが、推論の深さが増すにつれてサイバータスクの性能に測定可能な改善を示しています。

TerminalBench 2.1でも最先端の結果を達成しており、計画立案・反復処理・ツール連携を必要とするコマンドラインワークフローで88.8%のスコアを記録しています。Sol Ultraではこの数値がさらに91.9%に向上しています。

OpenAIはさらに、単一エージェントの能力を超える新しいウルトラモードも導入しました。サブエージェントを活用することで、複雑かつ長期的な作業を加速させます。

GPT-5.6 SolはGeneBench v1の生物学ワークフローでも顕著な改善を示しており、出力トークン数を抑えながらGPT-5.5を上回る結果を達成しています。

OpenAIは、GPT-5.6 SolはPreparedness Frameworkにおける「Cyber Critical（サイバー重大）」の閾値を超えていないと明確にしています。ChromiumおよびFirefoxを対象としたテストでは、モデルがバグや悪用プリミティブ（エクスプロイトの構成要素）を特定できることが確認されましたが、制御された条件下では機能するフルチェーンエクスプロイトを自律的に生成するには至りませんでした。

高度なサイバー能力にはデュアルユースリスクが伴うことを認識し、OpenAIはGPT-5.6向けに特化して強化された多層的なセーフガードスタックを導入しています。

モデルレベルでは、GPT-5.6 Solは禁止されたサイバー支援要求を拒否するよう訓練されており、意図を隠したリクエストやジェイルブレイク試みにも対応しています。

リアルタイムの悪用分類器が第2層として機能し、生成中の出力を評価します。リスクの高いケースでは生成を一時停止し、より大規模な推論モデルが会話全体のコンテキストを確認した上で、出力を解放するか差し止めるかを判断します。

アカウントレベルの行動分析が第3の層として加わり、OpenAIのシステムが悪意ある持続的なパターンと正当なデュアルユースセキュリティリサーチを区別できるようにしています。攻撃的な作業と防御的な作業は、コンテキスト上では最初は似たように見える場合があることも考慮されています。

差別化されたアクセス制御によって、最も機密性の高い機能がデフォルトで広く利用可能にはならないよう保証されています。コードレビュー、脆弱性調査、パッチ開発、防御テストへのアクセスは維持しつつ、禁止された攻撃的活動は制限されています。

これらの保護機能をストレステストするため、OpenAIは自動レッドチーミングに70万A100相当GPU時間以上を投じました。特定の単一脆弱性を突くのではなく、プロンプトやコンテキストをまたいで汎用的に機能するジェイルブレイク攻撃に焦点を当てています。

プレビュー期間中、人間の専門家によるレッドチーミングも並行して継続されており、自動テストでは予測しにくい創造的な敵対シナリオを補完しています。

異例の取り組みとして、OpenAIはリリース前に米国政府と連携し、モデルの機能とリリース計画を事前に共有しました。

政府の要請に応じ、GPT-5.6はまず連邦当局に参加が開示された信頼できるパートナーの限定グループに先行提供されています。OpenAIは政権と協力して、サイバー分野の大統領令（Executive Order）の枠組みと、将来のモデルリリースに向けた再現可能なプロセスの策定に取り組んでいます。

OpenAIは声明のなかで、このプロセスを長期的な標準にするつもりはないと述べています。ディフェンダー、開発者、そしてこれらのツールを緊急に必要としている世界中のパートナーのアクセスを制限することになるためです。

現在、GPT-5.6はAPIおよびCodexを通じて選ばれた信頼できるパートナーグループに提供されており、ChatGPTおよびAPI全体への幅広いアクセス開放は数週間以内に予定されています。

料金はSolが入力$5/出力$30（100万トークンあたり）、Terraが入力$2.50/出力$15、Lunaが入力$1/出力$6となっています。キャッシュ読み取りは90%割引が適用され、キャッシュ書き込みはキャッシュなし入力料金の1.25倍で請求されます。最低キャッシュ保持時間は30分です。

OpenAIはCerebrasとのパートナーシップも発表しており、2026年7月よりSolで最大750トークン/秒の速度を目指しています。

翻訳元: https://cyberpress.org/openai-previews-gpt-5-6-sol/

OpenAI、強化されたサイバー能力と安全対策を備えたGPT-5.6 Solをプレビュー公開

共有:

関連

関連記事

Hoppscotchに深刻な脆弱性——未認証の攻撃者がJWTシークレットを上書き可能

ClawHubのランキング操作により悪意あるスキルがAIエージェントに自動感染

TurlaハッカーグループがSTOCKSTAY .NETバックドアを使用——ウクライナ政府・軍関係機関をスパイ活動