ASAPPがエンタープライズAIシステム向けの敵対的テストを拡大

ASAPPは「継続的レッドチーミング」という新機能をローンチしました。これは敵対的AIテストをASAPPのモデル評価フレームワークに直接統合します。この新機能はPromptfooの上に構築されており、Promptfooは企業がAIシステムの開発段階で脆弱性を検出し対処するのに役立つAIセキュリティプラットフォームです。

PromptfooはASAPPのすべてのAIシステムで継続的に自動テストを実行し、50以上の脆弱性タイプをスクリーニングして、企業顧客が本番環境でAIを信頼するために必要なリアルタイムデータを提供します。

Image

AIエージェントが質問への回答から実行へとシフトするにつれて、セキュリティ脅威の可能性は増加します。静的なセーフティフィルターと単一回限りの監査では、もはや十分ではありません。敵対的技術は進化し、大規模言語モデルを効果的にするのと同じ推論スキルを悪用しています。大規模にAIを使用する企業は、継続的に検証できないシステムを信頼するよう求められています。ASAPPの継続的レッドチーミングはその隙間を埋めるために設計されています。

「エンタープライズAIは、規模での実証済み結果を通じて信頼を構築します」とASAPP CEO のPriya Vijayarajendran氏は述べました。「顧客との重要なインタラクションのためにAIを使用する組織は、単なる約束ではなく、確かな証拠に値します。継続的レッドチーミングへの私たちの献身は、毎日その約束を満たし、超えることを保証します。」

この機能は3つの重要なセキュリティドメイン全体で機能します:

  • コアモデルの整合性とコントロール:ASAPPのエージェンティックプラットフォームは、マルチショット攻撃や文字レベルの難読化を含む敵対的ジェイルブレイク技法、およびシステムオーバーライド試行に対して継続的にテストし、幻覚した権限をプローブします。幻覚した権限とは、モデルが無許可の法的または事業上のコミットメント作成を強要される状況です。
  • データプライバシーとナレッジベースセキュリティ:RAG駆動型デプロイメントでは、取得されたデータはモデル自体と同様に脆弱です。ASAPPは、汚染されたドキュメント経由の間接的なプロンプトインジェクション、ナレッジベースの流出、セッション間のPII漏洩に対してテストし、機密データがセッション間またはテナント間に漏洩しないことを確保します。
  • エージェンティックと運用セキュリティ:AIが会話から実行へ移行するにつれて、ASAPPは、そのエージェントが無許可のデータアクセスに操作されることはできず、内部ネットワーク偵察のプロキシとして使用されることはできず、ツール呼び出し悪用を通じて基盤となるシステムアーキテクチャを公開することはできないことを検証します。

このコア機能はリスクベンチマーキングフレームワークを備えており、ASAPPは各モデル更新の攻撃成功率(ASR)を追跡します。自動グレーダーを使用して安全性評価における人的バイアスを最小化し、LLMのOWASP Top 10とNIST AI Risk Management Frameworkの結果を整合させ、初日から監査対応可能な安全メトリクスを確保します。

「エンタープライズAIを検討しているCISOと調達チームは、ベンダーのシステムが安全であるという言葉以上のものが必要です」とASAPP CISO のKhash Kiani氏は述べました。「信頼は、特定のメトリクス、明確なアプローチ、およびボードと共有するための定期的なレポートシステムを通じて得られなければなりません。私たちは、リアルタイムで弱点を自動的に識別し修正する安全アーキテクチャを作成しました。これはエンタープライズAIが目指すべき標準であり、私たちはこの道を主導することに尽力しています。」

翻訳元: https://www.helpnetsecurity.com/2026/05/21/asapp-expands-adversarial-testing-for-enterprise-ai-systems/

ソース: helpnetsecurity.com