OpenAIがサイバー脅威を軽減するための防御モデルを強化

モデル性能の急速な向上により、OpenAIの内部計画が変わったと、同社は水曜日に明らかにした。

新しいレポートによると、キャプチャーザフラッグ(CTF)チャレンジを使用した能力評価は、2025年8月のGPT-5で27%から2025年11月のGPT-5.1-Codex-Maxで76%に改善されたことが示されている。

OpenAIは、今後のシステムの一部がPreparedness Frameworkで「高い」能力レベルに到達する可能性があると警告しており、これは複雑な侵入操作からゼロデイエクスプロイトの開発まで、様々なタスクを支援できることを意味している。

ThreatAwareの共同創業者兼CEOであるJon Abbottは、この警告は基本的な保護に焦点を当てる必要性を強調していると述べた。

「新しいモデルが『高い』サイバーセキュリティリスクをもたらすというOpenAIの警告は、セキュリティの基礎を正しく構築することが絶対に重要である理由そのものです。AIは攻撃のペースを加速させるかもしれませんが、私たちの最善の防御は、まず基本的なことを完璧にすることであり続けるでしょう。」

同社はまた、高度な能力を防御的成果に向ける意図で、多層的なセーフガードを開発することにより、その可能性に備えていると述べた。OpenAIは、その主な目標は、数的に劣勢で資源不足のままでいるセキュリティチームの立場を強化することだと付け加えた。

業界全体の理解の強化

サイバーワークフローに固有の二重使用リスクを管理するため、同社は複数の要素に基づいた多層防御戦略を概説した:

  • アクセス制御、インフラストラクチャの強化、出口制御と監視

  • 有害なリクエストからモデルを遠ざけると同時に、教育と防御のための有用性を維持するトレーニング

  • 安全でないアクティビティをブロックまたはリルーティングできるシステム全体の検出ツール

  • 外部の専門家による包括的なレッドチーミング

「これらのセーフガードは、脅威の状況に応じて進化するように設計されている」と同社は述べた。

サイバー防御イノベーションについてもっと読む:小売業のサイバー防御の最前線に人間を配置する方法 

Abbottは、能力の向上により長年の脅威がより危険になると述べた。 

「昔ながらの脅威は、AIが可能にするスケールと精密さと組み合わせると、特に有毒な組み合わせになる」と彼は説明した。

「動作するゼロデイリモートエクスプロイトを開発したり、複雑でステルスな侵入を支援したりすることができるモデルでは、犯罪者の参入障壁が劇的に低くなった。」

OpenAIは、防御的AIの実世界での応用を改善するために世界中の専門家と協力しており、適格なユーザーのための信頼されたアクセスプログラムを準備中だと述べた。

別の取り組みであるAardvarkは、すでにプライベートベータ版である。このエージェント型セキュリティリサーチャーはコードベースをスキャンし、脆弱性を特定してパッチを提案し、オープンソースプロジェクトで新しいCVEを発見している。

OpenAIはまた、責任ある能力の使用についてアドバイスする「Frontier Risk Council」を立ち上げると述べており、共有された脅威モデルを洗練させ、エコシステム全体のリスク軽減戦略を改善することを目的とした「Frontier Model Forum」を通じたさらなる協力を行う予定である。

画像クレジット:Prathmesh T / Shutterstock.com

翻訳元: https://www.infosecurity-magazine.com/news/openai-enhances-defensive-models/

ソース: infosecurity-magazine.com