Claude Fable 5のジェイルブレイク成功——スタックエクスプロイト生成が可能に
Anthropicが誇る最先端AIモデルが、リリースからわずか数時間でジェイルブレイクされました。その安全アーキテクチャの実効性に、深刻な疑問が投げかけられています。 Anthropicは2026年6月9日、初めて一般公開されるMythosクラスのモデルとして「Claude Fable 5」をリリースしました。コーデ
Anthropicが誇る最先端AIモデルが、リリースからわずか数時間でジェイルブレイクされました。その安全アーキテクチャの実効性に、深刻な疑問が投げかけられています。 Anthropicは2026年6月9日、初めて一般公開されるMythosクラスのモデルとして「Claude Fable 5」をリリースしました。コーデ
MicrosoftのAIレッドチームが、エージェント型AIシステムにおける障害モード分類(Taxonomy of Failure Modes)のバージョン2.0を公開しました。この報告書では、AIエージェントがどのように悪用されているかについて、重大な変化が明らかにされています。 本更新は、1年間にわたる実際のレッド
4分で読めます出典:tadamichi / Getty Imagesガートナー セキュリティ&リスク管理サミット — メリーランド州ナショナルハーバー — 4つの重大な脅威に対する企業の防御は太刀打ちできない状態にあり、早急な改善が求められています。これは今週開催されたガートナー セキュリティ&リスク管理サミットに登壇
出典:Sundry Photography/Getty ImagesSophos X-Opsのアナリストは今週、身元不明の脅威アクターが同社のいわゆる「レッドチーム」型ポストエクスプロイテーションフレームワークを通じて、AI技術を活用してエンドポイント検出・対応(EDR)の回避戦術を開発しているという調査結果を公表しま
4分で読めます出典:Suchat longthara / Getty Imagesエージェント型AIの導入が急速に進んでいますが、企業にとって残念なことに、これらのエージェントを完全に保護することは現実的に難しい状況です。これは、ガートナーのリサーチ担当バイスプレジデントであるDennis Xu氏が語ったものです。同氏
ある脅威アクターが、エンドポイント検出・対応(EDR)ソフトウェアをすり抜けることを目的としたマルウェアの開発・改良にAIコーディングツールを活用していたことが確認されました。この活動は、レッドチームプロジェクトとして偽装されていました。 この活動を発見したのはSophos X-Opsです。同チームのCounter T
大規模言語モデルを探索する攻撃者は、一度拒否されてもめったに諦めない。文脈を組み替え、複数のターンをまたいで文脈を積み上げ、ペルソナを採用し、徐々にエスカレートさせる。CiscoのAI脅威インテリジェンスチームの新たな研究により、業界全体で使用されている安全性ベンチマークがこうした挙動のほぼすべてを見
セキュリティ レドモンド、より安全なエージェント構築・維持用の2つのツールをオープンソース化
Rampartはレッドチーム調査結果を反復可能なテストに変換。Clarityはコード作成前にエージェント設計の前提条件を文書化し検証します。 マイクロソフトはAIエージェント開発ライフサイクルの早い段階でAI安全性チェックを実施する
ASAPPは「継続的レッドチーミング」という新機能をローンチしました。これは敵対的AIテストをASAPPのモデル評価フレームワークに直接統合します。この新機能はPromptfooの上に構築されており、Promptfooは企業がAIシステムの開発段階で脆弱性を検出し対処するのに役立つAIセキュリティプラ
すべての記事を読み込みました