GPT-5.6、サイバーセキュリティ性能が向上

OpenAIは、GPT-5.6シリーズモデルの限定プレビューを、APIおよびCodexを通じて少数の信頼できるパートナーへ提供開始しました。このシリーズには、フラッグシップモデルの「Sol」、バランス重視の「Terra」、最速かつ最もコスト効率に優れた「Luna」が含まれます。今後数週間のうちにChatGPT、Codex、APIユーザーへと展開を広げる前に、米国政府と連携しながら段階的にリリースが進められています。

「GPT-5.6 Solは、これまでで最も堅牢なセーフティスタックとともに提供を開始します。高リスクな活動、センシティブなサイバーリクエスト、繰り返しの悪用に対する保護を強化し、弱点の発見、システムへの負荷テスト、実際の攻撃への耐性向上に数週間を費やしました」と同社は述べています。

主要な機能

Solは、コーディング、生物学、サイバーセキュリティにおけるエージェント機能を強化しています。OpenAIはシステムカードも公開しました。これはモデルの機能、テスト方法、特定されたリスク、追加されたセーフガード、および既知の制限事項を説明する技術レポートです。

GPT-5.6では、max推論エフォートと、サブエージェントを活用して複雑なタスクを高速化するultraモードが導入されました。コーディング分野では、Solはツールの連携、計画立案、反復処理を必要とするコマンドラインワークフローを評価するTerminal-Bench 2.1ベンチマークでトップの成績を収めています。また、生物学ワークフローでは使用トークン数が削減されています。

サイバーセキュリティ分野では、脆弱性調査やエクスプロイトを含む長期的なセキュリティタスクにおいて、GPT-5.6はパフォーマンスと効率性の限界をさらに押し広げています。

安全性とセーフガード

OpenAIは、各モデルの機能に合わせたセーフガードを開発したと述べています。目的は、正当な用途を損なうことなく、禁止されている攻撃的活動をより困難で不確かなものにし、検出しやすくすることです。

Solはセキュリティ上の欠陥やエクスプロイトの構成要素を特定できますが、OpenAIのテストでは単独で完全なサイバー攻撃を実行することはできませんでした。同社は、いかなる評価も現実世界のあらゆるシナリオを網羅できるものではないと指摘しています。

GPT-5.6は単一のセーフガードに頼るのではなく、複数の安全レイヤーを採用しています。このモデルは、ユーザーが意図を偽装しようとした場合でも、禁止されているサイバーおよび生物学に関する支援を拒否するよう訓練されています。生成中のレスポンスには潜在的に有害なコンテンツのスクリーニングが行われ、高リスクのリクエストは配信前により高性能なモデルによるレビューのために一時停止される場合があります。

OpenAIは、悪意のある活動と正当なセキュリティ研究を区別するため、アカウントをまたいだ悪用パターンを監視しています。プレビュー期間中は、セーフガードのテストと改善が進む中で、一部の正当なリクエストがブロックまたは遅延される場合があります。

「また、エンタープライズ顧客とともに、プライバシーを保護する検出、顧客が運用するセーフティコントロール、顧客・ユーザー・ワークロードのリスクに応じたアクセス制御など、長期的なアプローチにも取り組んでいます。エンタープライズのプライバシー要件をサポートしながら、安全性を向上させていきます」とOpenAIは続けています。

レッドチーミングとセキュリティテスト

モデルのセーフガードをテストするため、OpenAIは多くのプロンプトやコンテキストをまたいで機能する汎用的なジェイルブレイクを発見するための自動レッドチーミングを実施しました。このテストにより、人間によるテストだけでは網羅できない攻撃パターンを探索し、障害パターンをより早期に特定するとともに、新たに発見された弱点への対処に要する時間を短縮することができました。

同社はサードパーティの専門家と協力してヒューマンレッドチーミングも実施しており、自動化システムでは予測できないような創造的な攻撃手法でモデルをテストしています。

AIセキュリティラボのIrregularは、現実の攻撃的セキュリティベンチマークでGPT-5.6 Solを評価し、特に長期間にわたる複雑なハッキングタスクにおいて、GPT-5.5よりもわずかに優れたパフォーマンスを発揮することを確認しました。このモデルは、広く使用されているソフトウェアやモバイルデバイスにおいて未知の脆弱性を発見しましたが、堅固に防御されたターゲットへの対応や完全なエンドツーエンド攻撃の実行は依然として課題となっています。

翻訳元: https://www.helpnetsecurity.com/2026/06/29/openai-gpt-5-6-models-preview/

GPT-5.6、サイバーセキュリティ性能が向上

主要な機能

安全性とセーフガード

レッドチーミングとセキュリティテスト

共有:

関連

関連記事

PrivacyHawk Enterprise、シャドーITの検出とサードパーティのサイバーリスク低減を支援

MozillaがAIコーディングエージェントにおける間接プロンプトインジェクションのリスクを警告

DarkMoon：オープンソースのAIペネトレーションテストプラットフォーム