Mythosとサイバーセキュリティ

先週、AnthropicはClaude Mythos Previewのベールを取り除きました。このAIモデルはソフトウェアの脆弱性を発見・悪用することに極めて優れており、同社は一般公開することは危険すぎると判断しました。代わりに、アクセスはProject Glasswingというイニシアティブの下で、Microsoft、Apple、Amazon Web Services、CrowdStrikeおよび重要インフラの他のベンダーを含む約50の組織に限定されています。

この発表には、恐ろしい逸話の数々が伴いました。OpenBSDの27年前のバグ、FFmpegの16年前の欠陥を含む、数千の脆弱性があらゆる主要なオペレーティングシステムとブラウザで発見されました。Mythosはfirefoxブラウザで発見した脆弱性セットを181の実用的な攻撃に転化することができました。Anthropicの以前のフラグシップモデルは2つしか達成できませんでした。

これは多くの点で、セキュリティ研究者が長年求めてきた責任ある情報開示そのものです。しかし、Anthropicの決定を評価するための情報が、一般に非常に限定的に提供されています。我々に示されたのはスペクタクルな成功の数々です。しかし、映画全体を見せてもらうまでは、それが大ヒット作なのかどうか判断できません。

例えば、Mythosがコードを誤って脆弱と判定した回数は分かりません。Anthropicはセキュリティ契約業者がAIの重大度評価に198回同意したこと、重大度の一致が89%だったことを述べました。これは印象的ですが、不完全です。類似モデルを検証する独立研究者は、ほぼすべての実在するバグを検出するAIが、パッチが適用された正しいコードに対して、もっともらしく聞こえる脆弱性を幻覚することを発見しています。

これは重要です。数百の脆弱性を自律的に発見・悪用できる、人間並みの精度を持つモデルはゲームチェンジャーです。しかし、数千の誤報と動作しない攻撃を生成するモデルは、依然として熟練した知識豊富な人間が必要です。Mythosのフィルタリングされていない出力における誤報率を知らなければ、紹介されている事例が代表的なものなのかどうか判断できません。

第二の、より微妙な問題があります。Mythosを含む大規模言語モデルは、訓練データに似た入力、つまり広く使われるオープンソースプロジェクト、主要なブラウザ、Linuxカーネル、人気のあるウェブフレームワークで最も良いパフォーマンスを発揮します。最大のソフトウェアベンダーの中で早期アクセスを集中させることは合理的です。敵対者が追いつく前にパッチを適用できます。

しかし、逆もまた真です。訓練データの分布の外側のソフトウェア、つまり産業制御システム、医療機器ファームウェア、カスタム金融インフラストラクチャ、地域銀行ソフトウェア、古い組み込みシステムは、まさにそこで既製のMythosが最もバグを発見・悪用する能力が低い可能性が高い場所です。

しかし、これらの分野の1つにドメイン専門知識を持つ十分に動機付けられた攻撃者であれば、Mythosの高度な推論能力を力の倍増器として活用し、Anthropicの自社エンジニアが監査する専門知識を欠く系統をプローブすることができます。危険はMythosがこれらのドメインで失敗することではなく、専門知識をもたらす者にとってMythosが成功するかもしれないことです。

学術研究者とドメイン専門家、つまり医療機器セキュリティの心臓病学者パートナー、制御システムエンジニア、より目立たない言語とエコシステムの研究者のための、より広範で体系的なアクセスは、この非対称性を有意に減らすでしょう。50企業がいかに厳選されていても、研究コミュニティ全体の分散した専門知識の代わりにはなり得ません。

これはAnthropicを非難するものではありません。見たところ同社は責任を持って行動しようとしており、モデルを保留することの決定は真摯さの証です。

しかしAnthropicは民間企業であり、ある意味ではまだスタートアップです。それなのに、世界中の重要インフラストラクチャのどの部分が最初に防御されるか、どの部分が順番を待つのかについて、一方的に決定を下しています。

同社は有限なスタッフ、有限な予算、有限な専門知識しか持っていません。漏れが生じるでしょう。漏らされたものが病院や電力網で動作しているソフトウェアに含まれている場合、その代価は発言権を持たなかった人々によって負担されるでしょう。

セキュリティの問題は1つの企業と1つのモデルをはるかに超えています。Mythos Previewが唯一のものであると信じる理由はありません。（負けじと、OpenAIはその新しいGPT-5.3-Codexが非常に危険であるため、モデルも一般公開されないと発表しました。）そして、これらの新しいモデルがどの程度の進歩を表しているのかは不明です。セキュリティ企業Aisleは、Anthropicの公開されている逸話の多くを、より小規模で安価で公開されているAIモデルを使用して複製することができました。

これらの強力なモデルを解放するかどうか、どのように解放するかについての決定は、1つの企業の責任以上のものです。最終的には、これはおそらく規制につながるでしょう。それは正しく行うのが難しく、長い協議とフィードバックのプロセスが必要です。

短期的には、よりシンプルなものが必要です。広いコミュニティとのより大きな透明性と情報共有です。これは必ずしもClaude Mythosのような強力なモデルを広く利用可能にすることを意味しません。むしろ、できるだけ多くのデータと情報を共有して、集合的に情報に基づいた決定を下せるようにすることを意味しています。

独立監査、集計パフォーマンス指標の義務的開示、学術および市民社会研究者のための資金を得たアクセスのための世界的に調整されたフレームワークが必要です。

これは国家安全保障、個人の安全、企業競争力に影響を及ぼします。我々すべてが依存するシステムで数千の悪用可能な欠陥を発見できるすべてのテクノロジーは、その作成者の内部的判断だけに統治されるべきではなく、どんなに善意であっても。

それが変わるまで、Mythosクラスのリリースのたびに世界は別の崖の端に置かれ、視界の外に着地点があるのか、それともこの場合落下が致命的であるのかについて可視性がないまま。それは営利企業が民主主義社会で下すことが許されるべき選択ではありません。また、そのような企業が社会自身のセキュリティについての選択肢を制限する能力を持つべきではありません。

このエッセイはDavid Lieとともに執筆され、もともとThe Globe and Mailに掲載されました。

翻訳元: https://www.schneier.com/blog/archives/2026/04/mythos-and-cybersecurity.html

Mythosとサイバーセキュリティ

共有:

関連

関連記事

スクリーンでもありカメラでもある映像スクリーン

AIの言語が人間の話し方を変える可能性

サイバーセキュリティにおける「技能」と「能力」のギャップ