米国家安全保障指令を受け、AnthropicがFable 5とMythos 5へのアクセスを遮断

Anthropicは、米国政府からの突然の輸出規制指令を受け、同社のAIモデル「Fable 5」および「Mythos 5」へのすべてのアクセスを無効化しました。

2026年6月13日午後5時21分(米東部時間)に発令されたこの指令は、差し迫った国家安全保障上の懸念を理由として、外国籍の人物によるモデルへのアクセスを厳しく禁止するものです。

この制限は一般ユーザーにとどまらず、Anthropic社内の外国籍従業員がシステムと接触することも法的に禁じています。厳格な規制遵守を確保するため、Anthropicは両モデルを世界規模で無効化しましたが、その他の既存モデルはすべて引き続き正常に稼働しています。

今回の政府による前例のない介入は、Fable 5の安全ガードレールを回避または「ジェイルブレイク」する新たな手法が発見されたことに起因するとされています。

AnthropicによるFable 5とMythos 5の遮断

指令には具体的な技術文書が含まれていませんでしたが、Anthropicは政府が限定的・非汎用的なジェイルブレイクに関する口頭での証拠を提示したと述べています。

この脆弱性悪用の手法は、モデルのプロンプトを操作して標的のコードベースを解析させ、ソフトウェアの欠陥を自律的に特定・修正させるというものです。

この手法を内部で検証した結果、Anthropicは当該バイパスが既知の軽微な脆弱性のごく一部しか特定できなかったことを明らかにしました。

同社は、この脆弱性悪用の手法が独自の能力向上やゼロデイ発見における優位性をまったくもたらさないと強く主張しています。

Anthropicによれば、脅威アクターは公開されているモデルを使用するだけで同様の脆弱性を容易に発見できるといいます。同社は、業界全体の能力水準を示す根拠として、OpenAIが最近公開したGPT-5.5のサイバーセキュリティ評価結果を明示的に引用しています。

Anthropicは、Fable 5が展開前に受けた広範なセキュリティ評価を根拠に、脅威の深刻度を公式に否定しています。

同モデルは、社内レッドチーム、英国AI安全研究所(AISI)、民間のサードパーティセキュリティ研究者、そして米国政府自身による数千時間に及ぶ厳格なストレステストを受けています。

米国政府は、国家安全保障上の権限を根拠に、米国内外を問わずAnthropicの外国籍従業員を含む外国籍のすべての人物によるFable 5およびMythos 5へのアクセスを一時停止する輸出規制指令を発令しました。

実質的な影響は…

— Anthropic (@AnthropicAI) 2026年6月13日

こうした包括的な評価により、Fable 5の安全機構はこれまで展開されたフロンティアモデルを大幅に上回ることが確認されました。テスターたちは、さまざまなサイバー攻撃ベクターにわたってモデルの安全対策を広く回避できる汎用ジェイルブレイクの発見に完全に失敗しています。

完全なジェイルブレイク耐性の実現が現実的に不可能であることを踏まえ、AnthropicはFable 5を厳格な多層防御アーキテクチャで設計しています。

このセキュリティフレームワークは複数の主要な緩和戦略に依拠しており、具体的には非汎用ジェイルブレイクを極めて狭い運用範囲に限定すること、および汎用ジェイルブレイクの開発を経済的に割に合わないものとするよう技術的な安全対策を構築することを核心としています。

これを支援するため、Anthropicは継続的なテレメトリ監視を展開し、異常なプロンプト動作を迅速に検知して進行中の攻撃を遮断しています。

また同社は、継続的な脅威ハンティングとパッチ開発を促進するために不可欠な、Mythosクラスモデルの顧客データ30日間保持ポリシーも適用しています。

Anthropicは異議を唱えながらも指令に従いつつ、この極端なリコール基準を適用することがテクノロジーセクター全体に萎縮効果をもたらす恐れがあると警告しています。

同社は、まったく無害な応答や軽微で独自性のない発見を理由に展開を停止することは、すべての主要AIプロバイダーの将来のモデルリリースを事実上凍結することになると主張しています。

Anthropicは、政府が明らかに危険なAIをブロックする権限を保持しなければならない一方で、そのような行動は透明性が高く、公正で、技術的に正確な基準に基づくものでなければならないと述べています。

同社は、即座に生じた業務上の混乱についてエンタープライズ顧客に謝罪し、アクセス復旧に向けて積極的に働きかけています。セキュリティ研究者は、ジェイルブレイクの仕組みに関する詳細な技術情報が24時間以内にAnthropicから公開されることを見込んでいます。

翻訳元: https://gbhackers.com/anthropic-disables-fable-5-and-mythos-5/

ソース: gbhackers.com