Anthropicは、同社最強のAIモデルクラス「Mythos」と同じ基盤モデルをベースにした新モデル「Fable」の展開を開始しました。
「これらのツールを最大限に活用できる側が優位に立つ」と、AnthropicはMythosモデルを発表した4月に警告していました。
「短期的には、フロンティアラボがモデルのリリース方法に十分な注意を払わなければ、攻撃者がその優位に立つ可能性があります。長期的には、防御者がリソースをより効率的に活用し、新しいコードが出荷される前にバグを修正するためにこれらのモデルを使いこなせるようになると考えています。」
つまり、Firefoxのようなアプリの脆弱性を発見・悪用するために悪用される恐れがあったということです。
こうしたリスクを踏まえ、AnthropicはMythosのようなモデルへのアクセスを制限し、サイバーセキュリティの専門家や信頼できる企業にのみ提供することを決定しました。
現在Anthropicは、同モデルクラスに強固なガードレールを開発したと発表しています。これにより、強力なAIモデルが悪意ある者に容易に悪用されることはなくなりました。
その結果として提供開始されるのが、より安全なバージョン「Fable 5」です。

Anthropicによると、このモデルには厳格なセーフガードが設けられており、攻撃的なサイバーセキュリティ・生物学・化学に関するクエリなど機密性の高いリクエストをブロックするか、旧モデルのOpus 4.8に転送するようになっています。
Claude Mythos 5は同じモデルのセーフガードを解除した制限なしのバージョンです。
リスクを考慮し、政府のサイバー防衛担当者や特定のライフサイエンス研究者など、厳しく審査された信頼できるパートナーにのみ提供されています。
Fable 5は期間限定で無料——トークン消費は他モデル最速
AnthropicによるとFable 5は大量のコンピューティングリソースを必要とする高コストなモデルであり、Opus 4.8や従来モデルと同様に気軽に提供できるものではないとしています。
ただし、Anthropicは6月22日までPro、Max、Enterpriseのすべてのユーザーに無料で提供すると発表しており、期間終了後は従量課金制に切り替わります。
BleepingComputerの検証では、Fable 5がわずか数分で大量のトークンを消費することが確認されました。

特にこの挙動が顕著だったのは、複雑なプロンプトを小さなタスクに分解して並列サブエージェントを起動・実行する新しい実行システム「Workflow」を使用したときです。
Claude Fable 5は、使用開始時に残量ゼロだった100ドルのMaxサブスクリプションの1日分の使用枠をわずか9分で使い切りました。

Claude Fable 5を通常のチャットとして利用する分にはこのような事態は起きませんが、Workflowモードに切り替えてモデルの思考レベルを高に設定すると、数分以内にトークンをすべて消費してしまいます。
なお、Workflowを最高負荷で使わない場合であっても、トークンの消費速度はOpusモデルの2倍になります。
これが、AnthropicがOpusなどの他モデルと同様の形でFable 5を開放することに慎重な理由です。ただし、Anthropicはモデルの制限を一度強化してから段階的に緩和するアプローチで知られており、今後数週間で状況が変わる可能性もあります。
攻撃者より先に、あらゆる層をテスト
セキュリティチームが記録に残せる攻撃成功は54%、アラートを出せるのはわずか14%。残りは環境内で検出されることなく侵入しています。
Picusのホワイトペーパーでは、侵害・攻撃シミュレーションによってSIEMおよびEDRルールを検証し、脅威が検知をすり抜けないようにする方法を解説しています。