OpenAI、サイバーセキュリティ特化モデル「GPT-5.6 Sol」を発表——早期アクセスは制限付き

OpenAIは、「サイバーセキュリティ分野における同社史上最高性能のモデル」と位置付ける新フラッグシップモデル「GPT-5.6 Sol」をプレビュー公開しました。ただし、米国政府の要請により、アクセスは審査済みの限られたパートナーのみに制限されています。

6月26日に発表されたこのSolプレビューは、OpenAIのGPT-5.6シリーズにおける最初のリリースです。同社は事前に米国政府当局者へのブリーフィングを実施しており、政府の要請を受けて、名前を共有したパートナー企業に限定してプレビューアクセスを提供しています。

同シリーズでは、フラッグシップの「Sol」、ミッドレンジの「Terra」、低コスト・高速な「Luna」という3段階の新しい命名体系が導入されます。

OpenAIは、今後のリリースに向けた政府とのサイバー大統領令フレームワークの策定作業と並行しながら、数週間以内に広く一般提供する予定だと述べています。

政府が管理するプレビュー

OpenAIは今回の限定公開を恒久的な措置ではなく、あくまで短期的なステップとして位置付けています。政府によるアクセス管理プロセスをデフォルト化すべきではなく、そうすることで防御側の担当者や必要とする企業が最良のツールを利用できなくなると主張しています。それでも同社は、このアプローチが広範なリリースに向けた最速の道筋だと説明しています。

現時点では、GPT-5.6シリーズのモデルはOpenAIのAPIおよびコーディングツール「Codex」を通じて、選定されたパートナーのみが利用できます。

関連記事:OpenAI、防御側の脆弱性修正を支援する「Daybreak」を拡充

OpenAIはSolを同社史上最高のサイバーセキュリティモデルと称しており、脆弱性調査やエクスプロイト開発といった長期的・複合的な作業における性能向上を挙げています。ExploitBenchテストでは、SolがMythos Previewと同等の性能を発揮しながら、出力トークン数を約3分の1に抑えたと発表しています。

一方で、OpenAIのPreparedness Frameworkにおける「Cyber Critical」の閾値は超えていないとしています。ChromiumおよびFirefoxに対するテストでは、バグやエクスプロイトの構成要素を発見できたものの、完全に機能するエクスプロイトを自律的に生成するには至りませんでした。

強化されたセーフガード

OpenAIによると、Solは攻撃をエンドツーエンドで実行するよりも、防御側が脆弱性を発見・修正するための支援に優れており、同社史上最も厳格なセーフガードを備えているとのことです。具体的には、モデルに組み込まれた拒否応答のトレーニングと、リスクのある出力を一時停止して精査するリアルタイム分類器が含まれます。

同社は、多数のプロンプトに横断的に有効なユニバーサルジェイルブレイクを検出するため、70万GPU時間以上を自動レッドチーミングに費やしたと述べており、さらに人間の専門家によるテストも実施しています。

Solの価格は入力トークン100万件あたり5ドル、出力トークン100万件あたり30ドルで、より低コストのTerraおよびLunaティアのほか、7月にはCerebrasでのローンチも予定されています。なお、掲載されているパフォーマンス数値はすべてOpenAI自身によるもので、同社が現在も検証中のプレビュー段階のものです。

画像クレジット:Novikov Aleksey / Shutterstock.com

翻訳元: https://www.infosecurity-magazine.com/news/openai-gpt-5-6-sol-limited-preview/

ソース: infosecurity-magazine.com