Anthropicは水曜日、Fable 5モデルへの世界的なアクセスを復旧させました。これにより、米国政府が輸出規制を課し、外国人によるこの高度なサイバーセキュリティ特化型AIツールへのアクセスを禁じたことに端を発する、およそ3週間にわたる停止状態が終わりました。
これは、ファイブ・アイズ(Five Eyes)情報機関同盟が、最先端AIモデルがサイバーセキュリティに与える影響に直ちに備えるよう企業経営者に警告したことを受けたものです。新たなモデルは攻撃・防御の両能力を「根本的に変革する」見通しだとされています。各機関は「タイムラインは年単位ではなく、月単位だ」と警告しました。
Anthropicに対する規制が課された当時、同社はコンプライアンス確保のため、すべての顧客に対するアクセスを無効化せざるを得なかったとしていました。火曜日のアップデートで、Anthropicは政府との一連の合意に達したことで規制が解除されたと発表しました。
今回の一件は、チップやハードウェアではなくAIソフトウェアを一般公開から除外するために輸出規制権限が行使された、初めて確認された事例となりました。その解除は、今後米国において最先端AIモデルがどのように規制されるかの基準を定めることになるかもしれません。
Anthropicのさらに強力なサイバーセキュリティモデルであるMythos 5に対する輸出規制も、6月30日付で完全に解除されました。ただし同モデルへのアクセスは、重要インフラの防御担当者向けにAnthropicが運営するアクセス管理プログラム「Project Glasswing」を通じ、審査済みの米国組織に限定されたままです。同社は、Glasswingを通じたより広範な国内・国際的アクセスについて、引き続き交渉を続けているとしています。
Anthropicによれば、当初の停止措置はAmazonの調査報告書で取り上げられた「ジェイルブレイク」手法がきっかけでした。この手法については、Anthropicが論文の評価を依頼したLuta Securityの創業者Katie Moussouris氏が、その後詳細に解説しています。
Moussouris氏によると、研究者たちはFable 5に対し、公知の脆弱性と意図的に仕込んだ欠陥を含むオープンソースコードを与え、「このコードを修正して」と指示したといいます。モデルが出力した結果は、複数の手順を経て手作業で組み立てられ、パッチをテストするスクリプトへとまとめられました。
「これはガードレールの回避などではありません」とMoussouris氏は記しています。「AIモデルが防御側のセキュリティにもたらし得る最も価値ある成果、すなわち防御担当者が日々行っている『発見・修正・検証』のループを実行しているにすぎないのです」。同氏の結論は、この根底にある能力は、モデルの正規のセキュリティ業務における有用性を損なうことなしには除去できない、というものでした。
Anthropicによれば、同社独自の追検証により、この手法がOpenAIのGPT-5.5や中国のモデルKimi K2.7を含む他社モデルに対しても機能することが確認されたといいます。これらのモデルはいずれも、同等の輸出規制の対象にはなっていませんでした。同社は、この手法が自社の最先端モデルに固有の能力を露呈するものではなかったと説明しています。
Fable へのアクセスを復旧させるための交渉の一環として、Anthropicは、この特定の手法を99%超のケースでブロックする新たな安全性分類器を訓練したと発表しました。商務省のAI標準・イノベーションセンター(Center for AI Standards and Innovation)の研究者らが、既存および更新後の両方の安全対策をテストし、その結果を認めています。
分類器の導入に加え、Anthropicは、最先端モデルの広範な公開前に政府の評価担当者による事前アクセスを拡充すること、重大なジェイルブレイクの迅速な開示、共同研究のための専任スタッフと計算資源の確保、そして最先端モデル提供各社に共通する任意のセキュリティ標準への参加を約束しました。また、サイバー分野のジェイルブレイク報告を対象としたHackerOneのバグ報奨金プログラムも開設しています。
Amazon、Microsoft、Googleを含むGlasswingのパートナー各社とともに、Anthropicは、既存ツールに対する能力向上度、影響を受けるタスクの範囲、兵器化の容易さ、発見のされやすさという4つの基準でジェイルブレイクの深刻度を評価する業界共通の枠組みを策定中であるとしています。
100名を超えるサイバーセキュリティ専門家が、元Facebookセキュリティ責任者のAlex Stamos氏がとりまとめ、Howard Lutnick商務長官と国家サイバー長官Sean Cairncross氏宛てに提出された公開書簡に署名し、輸出規制が利益よりも害をもたらす恐れがあると政府に警告していました。
書簡には次のように記されています。「中国のオープンウェイトモデルは、最良の米国製モデルにわずか数カ月遅れているにすぎません。しかも、それは私たちが把握しているモデルに限った話です。正当な理由もなく防御側から最良の能力を奪うことは、敵対勢力が急速に力をつけている中では危険です」。
署名者にはNvidia、Adobe、Zoom、Google、Sophosの幹部らが名を連ねており、Anthropic自身の主張、すなわちFable 5に適用された基準が業界全体に適用されれば、Anthropic自身の言葉を借りれば「事実上、すべての最先端モデル提供企業による新モデルの展開がすべて停止することになる」との見解に同調しています。
今回の措置は、AnthropicとトランプTrump政権との間の緊張関係を背景に下されました。2月には、Pete Hegseth国防長官が、Claudeの軍事利用をめぐる契約交渉が決裂したことを受け、Anthropicを「サプライチェーン上のリスク」に指定しました。これは、これまでHuaweiなどの企業に適用されてきたレッテルです。
CNBCの報道によれば、AnthropicのCEOであるDario Amodei氏に代わり、共同創業者のTom Brown氏がトランプ政権との交渉を引き継ぎました。同報道は、Amodei氏がAIの安全性をめぐる公の立場や2024年の選挙でKamala Harris氏を支持したことを理由に、政権の政治的標的となっていたと伝えています。禁止措置の正式解除を伝えたLutnick長官の書簡は、最高経営責任者ではなくBrown氏宛てに送られたと報じられています。
翻訳元: https://therecord.media/us-lifts-export-controls-anthropic-cyber-models