AIエージェントのガードレールがDoS攻撃の武器に悪用される可能性
毒入りドキュメント1件でAIエージェントシステムを最大148倍遅延させ、AIの安全制御機能を企業の弱点に変えうると研究者が警告。 AIエージェントのガードレールがサービス拒否(DoS)攻撃の武器として悪用される恐れがあることが
毒入りドキュメント1件でAIエージェントシステムを最大148倍遅延させ、AIの安全制御機能を企業の弱点に変えうると研究者が警告。 AIエージェントのガードレールがサービス拒否(DoS)攻撃の武器として悪用される恐れがあることが
AIエージェントはSREの作業スピードを高める可能性を秘めていますが、信頼を得るには「作業の透明性」「権限の範囲」「本番環境での実績」が不可欠です。 信頼性の未来を左右するのは、サイト信頼性エンジニアリング(SRE)チームがAIエージ
サイバーセキュリティに特化したフロンティアAIプログラム「Project Glasswing」を拡充してからわずか数日後、AnthropicはClaude Mythos 5とClaude Fable 5の2つの新モデルをリリースしました。 Anthrop
今年初め、AnthropicのAI新モデル「Claude Mythos」は有害な用途に使われる能力が非常に高く、一般公開はできないとAnthropicの幹部たちは述べていました。 同社は火曜日、Mythosを改変したバージョンを一般向けに提供すると発表しました。ハッキングや生物兵器研究において他を圧倒するそのパフォー
Anthropicは、公共・民間ソフトウェアへのセキュリティリスクを理由に展開を延期していたMythosクラスモデルを、一般公開する計画を確認した。 Mythosは4月に制限付きモデルとして発表され、セキュリティ研究者を含む一部の選ばれた企業にのみ提供されていた。 その際、AnthropicはMythosモデルに重
Virtue AIは、企業がモデル、エージェント、アプリケーション全体でカスタムAIランタイム保護ガードレールを定義、編集、および適用できるシステムであるPolicyGuardを発表しました。 ほとんどの組織は「AI許容可能な使用ポリシー」を持っています。ただし、これらのポリシーを実施する必要があ
バイブコーディングのセキュリティ企業Backslash Securityは本日、...
今週ダボスに登場したAIエージェントをめぐっては、どう安全を確保するか、そしてエ...
Perplexityは最近、プロンプトインジェクション攻撃からAI搭載ブラウザを...
Red Hat、Chatterbox Labsの買収でAIポートフォリオを強化 ...
すべての記事を読み込みました