OpenAIが木曜日に発表した新しいセキュリティ重視のAIモデルは、バグの発見、パッチ適用、修復作業の自動化を目指しています。
ChatGPT-5を搭載し「Aardvark」と名付けられたこのモデルは、OpenAI社内や外部パートナーで使用されています。現在は招待制のベータ版として提供されており、ソースコードリポジトリを継続的にスキャンして既知の脆弱性やバグを発見し、その深刻度を評価・優先順位付けし、パッチ適用や修復を行うよう設計されています。
OpenAIは自社ウェブサイトに掲載したブログ記事で、Aardvarkは「ファジングやソフトウェア構成解析のような従来のプログラム解析技術には依存していない」と主張しています。
「代わりに、LLMによる推論とツール活用によってコードの挙動を理解し、脆弱性を特定します」とブログには記載されています。「Aardvarkは人間のセキュリティ研究者のようにバグを探します。コードを読み、分析し、テストを書いて実行し、ツールを使うなどの方法です。」

OpenAIによると、Aardvarkはリポジトリの内容やプロジェクトのセキュリティ目標・設計に基づいて脅威モデルを作成したり、脆弱性をサンドボックス化して悪用可能性をテストしたり、問題のあるコードに注釈を付けて人間によるレビュー用のパッチ案を提出することも可能です。
セキュリティ脆弱性の発見に加え、Aardvarkはコードベース内のロジックやプライバシーに関するバグも発見できる可能性を示しており、未特定の「ゴールデン」リポジトリにおいて既知および人工的に導入された脆弱性の92%を特定したとしています。非営利リポジトリを運営するオープンソースコミュニティのメンバーは、このスキャナーを無料で利用できます。
同社は最近、9月に協調的脆弱性開示プロセスを更新し、厳格な開示期限の順守をやめるなどの変更を導入しました。OpenAIはこれが「開発者にプレッシャーを与える」可能性があるとし、より広範なエコシステムのセキュリティを重視しています。モデルのベータ版は現在、選ばれた研究パートナーに公開されており、OpenAIは検出・検証・報告機能を改善しながら、今後ツールの利用範囲を拡大していく予定です。
「脆弱性を早期に発見し、実際の悪用可能性を検証し、明確な修正を提供することで、Aardvarkはイノベーションを妨げることなくセキュリティを強化できます」とブログには記載されています。
Aardvarkのリリースは、OpenAIが自社技術を自動脆弱性スキャンと修復に活用したいという意向を反映しています。これは、大規模言語モデルが昨年から大きな可能性を示してきた分野です。同社によれば、AardvarkはこれまでにCVE(共通脆弱性識別子)に登録された10件の脆弱性を特定しています。
他にも、スタートアップのXBOWのような企業が、過去1年でAIセキュリティモデルを開発し、HackerOneやBugCrowdのバグバウンティランキングで上位に入り、昼夜を問わず稼働して何百もの脆弱性を特定・修正できるようになっています。
XBOWの創業者であり、以前はGitHub Next(同社のソフトウェア研究開発部門)を率いていたOege de Moor氏は、7月にCyberScoopに対し、「モデルはフロントエンドで人間のガイダンス、バックエンドで手動検証を受けているが、それ以外はバグハンティング中は自律的に動作している」と語りました。
脆弱性研究の専門家は、XBOWのようなモデルを「大量・低影響のバグ」に有用と評価していますが、同社は進化するモデルがより高難度のバグやエクスプロイトに対応できる能力をアピールしようとしています。
インターネット上に蔓延する数千もの低深刻度バグに対応し、人間のオペレーターがより複雑な脆弱性に集中できるようにする自動化プログラムには、依然として大きな価値があります。一部のセキュリティ専門家は、大規模なサイバー侵入や多段階マルウェア攻撃は、ゼロデイや高深刻度バグの悪用ではなく、未パッチのシステムに存在する低・中程度の影響の脆弱性を組み合わせることが多いと指摘しています。
しかし、これらのモデルに関してもう一つ考慮すべき点は、消費する膨大なエネルギーです。de Moor氏によれば、XBOWはこれまでに数千のバグを解決し、バグバウンティや賞金も獲得してきましたが、それらの収益はXBOWの運用にかかる計算コスト全体を賄うには十分ではないとのことです。
翻訳元: https://cyberscoop.com/openai-aardvark-security-and-patching-model-beta/