最先端の人工知能モデルへのアクセスは、国家安全保障上の重大な問題として認識されるようになっています。さらに、この傾向はグローバルな技術覇権争いの激化を反映しています。Semaforが公開した独自報告によると、ホワイトハウスはAnthropicのMythos制限措置を最近実施しました。この厳格な規制措置は、中国のサイバースパイ集団が不正アクセスを行ったという懸念から生じています。
地政学的懸念とモデルの蒸留
この問題は特にFable 5とMythos 5を中心に展開しています。これらの高度なシステムは、Anthropicの最上位モデルの2つの構成を表しています。当初、同社はこの特定のAIを一般公開するには危険すぎると判断していました。しかし最終的には、すべてのユーザーにアクセスを開放しました。
これを受けて、連邦当局は国家が関与した侵害についての懸念を示しています。敵対的な勢力がモデルの挙動パターンを分析すれば、その中核的な能力を複製できる可能性があります。具体的には、蒸留(ディスティレーション)と呼ばれる手法による複製が試みられる恐れがあります。この高度な技術は、上位のAIシステムの出力を利用して下位のAIシステムを訓練するものです。
回避脆弱性をめぐる相反する主張
一方、ホワイトハウスはこれらのセキュリティに関する主張を公式に認めることを拒否しています。ドナルド・トランプ大統領の顧問であるデービッド・サックス氏は、規制措置の原因をまったく別の要因に帰しています。具体的には、コアの防御ガードレールを回避できる実行可能なエクスプロイトに関する報告を挙げています。
これに対してAnthropicは、そのような脆弱性の存在を強く否定しています。また、同社の広報担当者は、輸出規制に関する協議において当局が中国について一切言及しなかったと記者に述べています。
過去のセキュリティ侵害と拡散リスク
Mythosアーキテクチャに関わる過去のセキュリティ侵害を受けて、状況はさらに複雑になっています。以前、プライベートなDiscordグループがこのモデルへの不正アクセスを2週間にわたって維持していたことがありました。
Anthropicは異常をすみやかに検知して接続を遮断しましたが、この事件は広範な警戒感を引き起こしました。この一連の出来事は、最先端の人工知能の拡散を規制することに伴う根本的な困難を如実に示しています。
翻訳元: https://meterpreter.org/anthropic-mythos-restrictions/