Meta、AIのセキュリティとプライバシー保護における新たな進展を発表

AIに関する発表が相次ぐ中、MetaはオープンソースAIコミュニティ向けに、セキュリティの強化、プライバシーの向上、そして同社のLlama大規模言語モデル(LLM)の保護を強化することを目的とした新しいツール群とアップデートを公開しました。

OpenAIのChatGPTに対抗する狙いで、マーク・ザッカーバーグ率いる同社は2025年4月29日、LlamaファミリーのAIモデルに特化したイベント「LlamaCon」の初開催に合わせて、Meta AIを発表しました。

Meta AIはLlama 4を搭載した独立型AIアプリとなり、ユーザーのFacebookおよびInstagramアカウントに基づいてパーソナライズされた回答を提供し、Meta AIグラスとも連携します。また、ソーシャルメディア上のつながりがこのツールとどのようにやり取りしているかを表示するDiscoverフィードも含まれます。

同社はLlamaConイベントにおいて、セキュリティ、プライバシー、そしてオープンソースAIコミュニティ向けツールに関するその他のアップデートおよび製品リリースも共有しました。

  • LlamaFirewall:AIモデルやアプリケーションを標的とする悪意ある活動を防ぐための、新しいセキュリティ・ガードレールツール
  • CyberSec Eval 4:Metaによる最新のオープンソース・サイバーセキュリティ・ベンチマークスイート。AIシステムの防御能力を評価するための新ツール2つ(CyberSOC EvalとAutoPatchBench)を含む
  • Llama Defenders Program:パートナー組織や開発者が、さまざまなセキュリティニーズに対応するためのオープン、早期アクセス、クローズドのAIソリューションにアクセスできるよう支援する新たな業界イニシアチブ

Metaはまた、WhatsAppユーザーがメッセージの要約などのAI機能を利用しつつ、メッセージのプライバシーを維持できると同社が主張する技術「Private Processing」も導入しました。

同社は、提供開始前にこの技術を監査し改善するため、セキュリティコミュニティと協力して取り組んでいます。

新規および更新されたLlama保護ツール

Llamaのオープンソースコミュニティにとっての主要な発表は、LlamaFirewallのリリースです。

Metaによれば、この新ツールはガードモデル間のオーケストレーションを行い、同社の保護ツール群と連携して、プロンプトインジェクション、安全でないコード、リスクの高いLLMプラグインの相互作用といったAIシステムのリスクを検知・防止できるとしています。

同社は、LlamaFirewallを技術的に詳細解説した付随論文も公開しました。

さらにMetaは、Llama Guardツールのアップデート版であるLlama Guard 4もリリースしました。これはLlamaベースのアプリケーション(画像生成およびテキスト生成の両方)向けの安全対策ツールで、暴力、性犯罪、児童性的虐待コンテンツ(CSAM)、自傷、プライバシー、知的財産で保護されたコンテンツなどを含む望ましくない内容を防止します。

Llama Guard 4は、現在限定プレビュー中の新しいLlama APIを通じて利用できます。

Hugging Faceでプロダクトおよびグロースを担当するJeff Boudier氏はLinkedInで、Llama Guard 4のリリースは「LlamaConで一番良かったもの」だと述べました

Metaはまた、分類器モデルの最新バージョンであるPrompt Guard 2 86MおよびPrompt Guard 2 22Mもリリースしました。

サイバー用途向けMetaの新しいLLMベンチマーク

LlamaConでのもう一つの重要な発表は、Metaの最新のサイバーセキュリティ用途の文脈でLLMのセキュリティリスクと能力を評価するために設計されたベンチマークスイートであるCyberSecEval 4の公開でした。

特に、CyberSecEval 4には新ツールが含まれます:

  • CyberSOC Eval:MetaがCrowdStrikeと共同で開発した新フレームワークで、セキュリティオペレーションセンター(SOC)におけるAIシステムの有効性を測定する
  • AutoPatchBench:セキュリティ研究者および実務者が、Llamaや他のAIシステムがネイティブコードのセキュリティ脆弱性を、悪用される前にファジングを通じて自動的にパッチ適用できる能力を評価するための、新しい標準化フレームワーク

AutoPatchBenchはGitHubでダウンロード可能で、CyberSOC Evalは今後数週間以内に一般公開される予定です。

MetaのLlama Defenders Program

最後に、MetaはLlama Defenders Programを開始すると発表しました。

同社は、自動機密文書分類ツール(Automated Sensitive Doc Classification Tool)や、AI生成の音声コンテンツを検出する検出器など、複数のツールを提供すると述べており、これらは詐欺やフィッシングの試みといった脅威の検知に組織が役立てられる可能性があります。

Metaは、Zendesk、Bell Canada、AT&Tなど複数の企業と協力し、これらのツールを各社のシステムに統合する取り組みを進めているとも付け加えました。

同社は、他の組織に対して、同社ウェブサイトを通じてLlama Defenders Programに関する詳細情報の提供を求めるよう呼びかけました。

翻訳元: https://www.infosecurity-magazine.com/news/meta-new-advances-ai-security/

ソース: infosecurity-magazine.com