Claude Sonnet 5、危険なサイバー用途への安全対策を搭載

Anthropicは、汎用AIモデルの最新版となるClaude Sonnet 5を発表しました。推論、コーディング、ツール利用、知的作業の各能力が向上しており、計画の立案やブラウザ・ターミナルなどのツールの利用を通じて、タスクを自律的に完了できます。

Sonnet 5をSonnet 4.6およびOpus 4.8と各種評価項目で比較したスコア（出典: Anthropic）

同社によると、Sonnet 5は推論、コーディング、ツール利用、知的作業関連のタスクを改善しているといいます。

「当社の安全性評価では、Sonnet 5はSonnet 4.6と比較して望ましくない挙動の発生率が全体的に低く、エージェント的な文脈での使用がより安全であることが示されました。評価によると、現行のOpusモデル群と比べてサイバーセキュリティ関連タスクを遂行する能力は大幅に低いことも分かっています」と、Anthropicは述べています。

サイバーセキュリティ対策

Sonnet 5では、サイバーセキュリティ対策がデフォルトで有効になっています。同システムは、Opus 4.7および4.8と同じ保護機能を使い、危険なサイバーセキュリティ関連の活動をリアルタイムで検知・ブロックします。Anthropicによると、Sonnet 5は全体的なサイバーセキュリティリスクが低いと判断されているため、Fable 5に比べて制限は緩やかになっているとのことです。

Sonnet 5は、正規のセキュリティ研究向けに承認された組織へガードレールを緩和した形でアクセスを提供する、AnthropicのCyber Verification Programの対象にもなっています。同社は、制限の少なさが求められるサイバーセキュリティ業務にはOpus 4.8を推奨しています。

性能ベンチマーク

同社は、エージェント型検索向けのBrowseCompベンチマークと、コンピュータ操作タスク向けのOSWorld-Verifiedを用いて、Sonnet 5をSonnet 4.6およびOpus 4.8と比較評価しました。Anthropicによれば、Sonnet 5はすべての処理負荷レベルでSonnet 4.6を上回りつつ、コスト効率も向上させています。処理負荷を高く設定した場合には、一部のタスクでOpus 4.8に匹敵する結果も出ています。

Anthropicによると、最新モデルは悪意あるリクエストの拒否やプロンプトインジェクション攻撃への耐性がさらに高まっています。幻覚（ハルシネーション）の発生も減少しており、Sonnet 4.6と比べて迎合的な挙動の発生率も下がっているほか、同社の自動行動監査でもスコアが低下しており、望ましくない挙動が減っていることを示しています。

本モデルは日常的で無害なセキュリティ業務をこなせますが、危険なサイバーセキュリティ関連タスクにおいてはOpus 4.8やMythos 5よりも低いスコアとなりました。実際に機能するエクスプロイトを開発することはできないものの、Sonnet 4.6と比べてわずかに部分的成功の割合が高くなっており、Anthropicはこれを全般的な知能の向上によるものだとしています。

提供状況と料金

Claude Sonnet 5はすべてのClaudeプランで利用可能です。Free・Proユーザー向けのデフォルトモデルとなっており、Max、Team、Enterpriseの各顧客も利用できます。Claude CodeおよびClaude Platformにも搭載されています。

2026年8月31日までは、APIの料金は入力100万トークンあたり$2、出力100万トークンあたり$10です。それ以降は、入力100万トークンあたり$3、出力100万トークンあたり$15に値上げされます。

翻訳元: https://www.helpnetsecurity.com/2026/07/01/anthropic-claude-sonnet-5/

Claude Sonnet 5、危険なサイバー用途への安全対策を搭載

サイバーセキュリティ対策

性能ベンチマーク

提供状況と料金

共有:

関連

関連記事

ファイナンシャルプランナーがサイバーセキュリティについて教えてくれたこと

Nika：オープンソースのコード解析ツール

処理中のデータも暗号化したまま——新スーパーコンピューター「RAMSES」の挑戦