- AnthropicがClaude Opus 4.6をリリースし、重大度の高い脆弱性の検出で大幅な改善があったと主張
- モデルは人間の研究者のようにコードを推論することで500件以上の欠陥を発見し、ファジング手法を上回る成果
- オープンソースソフトウェアの安全確保に注力し、すでにパッチの適用が進行中。AIが大規模に成果を出せるうちに迅速な対応を促す
Anthropicは、同社で最も強力な大規模言語モデルの最新バージョンであるClaude Opus 4.6(LLM)をリリースし、従来モデルと比べて重大度の高い脆弱性を見つける能力が「著しく向上した」と主張しています。実際、Opus 4.6はこれまでに、そのような欠陥を500件以上発見することに成功しています。
Anthropicは、Opus 4.6が「タスク特化のツール、カスタムの足場(scaffolding)、あるいは専門的なプロンプトなしに、導入直後から」脆弱性を見つけるやり方で際立っていたと述べました。
また、標準的な脆弱性探索手法であるファジングとは異なり、Opusは「人間の研究者が行うのと同じように」コードを推論して動作すると付け加えました。つまり、過去の修正を手がかりに未対応の類似バグを探し、問題を引き起こしがちなパターンを見つけ、さらに「どんな入力なら壊れるのかを正確に把握できるほど」ロジックを理解していたということです。
オープンソースソフトウェアの修正
最も入念にテストされているコードベースの一部、つまり何年にもわたってファザーが走り続けていたプロジェクトに対して使った場合でさえ、Opusは「数十年」にわたって見過ごされてきた重大度の高い欠陥を見つけることができたといいます。
Anthropicは、主にオープンソースソフトウェアの欠陥修正を支援するためにClaudeの利用を開始したと述べました。その理由は、このソフトウェアが「企業システムから重要インフラまで、あらゆる場所で動いている」こと、そしてこのソフトウェアの脆弱性がインターネット全体に影響を及ぼすためです。さらに、現在使われている人気のオープンソースソフトウェアの多くは少人数のボランティアチームによって保守されており、リソースが極めて限られているという事情もあります。
同社によれば、その結果は顕著でした。「これまでに、重大度の高い脆弱性を500件以上発見して検証しました。報告を開始しており、初期のパッチが適用され始めています。残りについても、メンテナと協力してパッチ適用を進めています。」
最後に同社は、AIモデルはいまや重大度の高い脆弱性を大規模に発見できるようになったと結論づけつつも、近い将来も同じ状況が続くとは限らないと強調しました。「この機会を逃さず、守る側を迅速に強化し、この“窓”が開いている間に可能な限り多くのコードを安全にするために、素早く動くべき時です。」