ガードレール – TokyoBlackHatNews

csoonline.com > 2026年6月15日 21:19

AIエージェントのガードレールがDoS攻撃の武器に悪用される可能性

毒入りドキュメント1件でAIエージェントシステムを最大148倍遅延させ、AIの安全制御機能を企業の弱点に変えうると研究者が警告。 AIエージェントのガードレールがサービス拒否（DoS）攻撃の武器として悪用される恐れがあることが

csoonline.com 4日前 19:09

AIエージェントを信頼する前にSREチームが整えるべき条件

AIエージェントはSREの作業スピードを高める可能性を秘めていますが、信頼を得るには「作業の透明性」「権限の範囲」「本番環境での実績」が不可欠です。信頼性の未来を左右するのは、サイト信頼性エンジニアリング（SRE）チームがAIエージ

infosecurity-magazine.com 5日前 20:07

新型Fable 5は全ユーザーに提供される「Mythosクラス」LLM——Anthropicが発表

サイバーセキュリティに特化したフロンティアAIプログラム「Project Glasswing」を拡充してからわずか数日後、AnthropicはClaude Mythos 5とClaude Fable 5の2つの新モデルをリリースしました。 Anthrop

cyberscoop.com 5日前 04:04

AnthropicのAI新モデル——「首輪付きのMythos」として公開へ

今年初め、AnthropicのAI新モデル「Claude Mythos」は有害な用途に使われる能力が非常に高く、一般公開はできないとAnthropicの幹部たちは述べていました。同社は火曜日、Mythosを改変したバージョンを一般向けに提供すると発表しました。ハッキングや生物兵器研究において他を圧倒するそのパフォー

bleepingcomputer.com 2026年5月29日 09:29

AnthropicがClaude Mythosクラスモデルを一般公開すると発表

Anthropicは、公共・民間ソフトウェアへのセキュリティリスクを理由に展開を延期していたMythosクラスモデルを、一般公開する計画を確認した。 Mythosは4月に制限付きモデルとして発表され、セキュリティ研究者を含む一部の選ばれた企業にのみ提供されていた。その際、AnthropicはMythosモデルに重