中国Zhipu AIのGLM-5.2、脆弱性検出タスクでClaude Mythosに匹敵する性能を発揮

Zhipu AIのオープンウェイトモデル「GLM-5.2」が、特定のサイバーセキュリティおよびソフトウェア脆弱性検出タスクにおいて、Anthropicのアクセス制限付きモデル「Claude Mythos」と同等の性能を示しています。この動向は、米国政府内でAI輸出規制戦略の実効性に対する懸念をさらに高めています。

2026年6月13日にリリースされたGLM-5.2は、許容的なオープンウェイトライセンスのもとで公開されており、研究者や開発者であれば誰でも、標準的な一般向けコンシューマーグレードのハードウェアでモデルをダウンロードして実行できます。

米国の輸出規制の対象となっているClaude Mythosとは異なり、GLM-5.2は敵対的な国家主体を含め、世界中で自由にアクセスできます。

汎用ベンチマークでは依然としてAnthropicやOpenAIのシステムに遅れをとっているGLM-5.2ですが、脆弱性特定に絞った性能はセキュリティコミュニティの注目を集めています。

Semgrepによる独立したテストでは、GLM-5.2のIDOR(Insecure Direct Object Reference)脆弱性検出におけるF1スコアは39%を記録し、同一の評価タスクにおけるClaude Codeの32〜37%を上回りました。

特筆すべき点は、このモデルが1件の脆弱性検出あたり約0.17ドルというコストでこの結果を達成したことです。これはClaudeベースの同等ワークフローの約6分の1の費用にすぎません。

CSNによると、GraphistryによるさらなるベンチマークもSemgrepの知見を裏付けており、自由にダウンロード可能な中国のオープンウェイトモデルが、特定のセキュリティ分野において米国のフロンティアAIに匹敵できることが確認されました。

トランプ政権はMythosやFableといった高度なAIモデルを重大な国家安全保障上の資産として位置づけてきました。これらのモデルがソフトウェアの脆弱性を自律的に特定する能力は、サイバー戦争を可能にする潜在的な要因として懸念されているためです。

輸出規制により、中国人研究者を含む外国の主体によるこれらモデルへのアクセスは、サイバーリスクへの懸念から特に停止されています。

GLM-5.2のリリースは、これらの規制が依拠してきた根本的な前提——フロンティアモデルへのアクセスを遮断すれば、敵対勢力が同等の攻撃的サイバー能力を開発するのを防げるという考え方——に直接異議を唱えるものです。

AnthropicのProject Glasswingは、Claude Mythosを活用して初回レポートだけで1万件以上の重大な脆弱性を発見し、脆弱性調査におけるフロンティアAIの威力をすでに示していました。GLM-5.2の登場により、こうした能力がもはや米国だけの専有物ではなくなる可能性が現実味を帯びてきました。

GLM-5.2の公開は、フロンティアモデルを厳格なアクセス制御の背後に置けば敵対勢力による同等能力の獲得を防げるという根本的な前提に、改めて直接の疑問を突きつけています。

セキュリティ研究者たちは、ニッチなバグハンティングタスクでこのレベルの性能を達成したオープンウェイトモデルの存在が、防御的自動化と攻撃的エクスプロイトの両面でタイムラインを劇的に加速させると警鐘を鳴らしています。

GLM-5.2の展開に規制当局の監督は一切必要ないため、高度な脆弱性研究ツールは世界中のAPT(Advanced Persistent Threat)グループが自由に利用できる状態となっています。GLM-5.2の台頭は、中国が特化した高度AIの分野で実質的な前進を遂げたことを示すものです。

これにより、ハードウェア規制とモデルアクセス制御だけでAI駆動のサイバーセキュリティツールにおける西側の優位性を維持できるかどうか、根本的な再評価が迫られています。

翻訳元: https://cyberpress.org/chinas-zhipu-ai-glm-5-2/

ソース: cyberpress.org