タグ: ガードレール

cyberscoop.com

AnthropicのAI新モデル——「首輪付きのMythos」として公開へ

今年初め、AnthropicのAI新モデル「Claude Mythos」は有害な用途に使われる能力が非常に高く、一般公開はできないとAnthropicの幹部たちは述べていました。 同社は火曜日、Mythosを改変したバージョンを一般向けに提供すると発表しました。ハッキングや生物兵器研究において他を圧倒するそのパフォー

bleepingcomputer.com

AnthropicがClaude Mythosクラスモデルを一般公開すると発表

Anthropicは、公共・民間ソフトウェアへのセキュリティリスクを理由に展開を延期していたMythosクラスモデルを、一般公開する計画を確認した。 Mythosは4月に制限付きモデルとして発表され、セキュリティ研究者を含む一部の選ばれた企業にのみ提供されていた。 その際、AnthropicはMythosモデルに重

helpnetsecurity.com

Virtue AI PolicyGuardがAIポリシーを実行可能なランタイムガードレールに変換

Virtue AIは、企業がモデル、エージェント、アプリケーション全体でカスタムAIランタイム保護ガードレールを定義、編集、および適用できるシステムであるPolicyGuardを発表しました。 ほとんどの組織は「AI許容可能な使用ポリシー」を持っています。ただし、これらのポリシーを実施する必要があ