AnthropicがSonnet 5を展開——Opus 4.8に迫る性能を低価格で実現

Anthropicは現在、Sonnet 5の提供を開始しています。Opusシリーズに匹敵する性能を持ちながら、同社のフラッグシップモデルより低コストで利用できるよう設計されたモデルです。

ブログ投稿の中でAnthropicは、Claude Sonnet 5は「これまでで最もエージェント的なSonnetモデルとして構築された」と説明しており、ブラウザやターミナルなどのツールを活用して計画を立てる能力といった高度な機能も備えていると述べています。

これまでこれらの機能はほぼOpus 4.8専用でしたが、Sonnet 5はフラッグシップモデルとほぼ同等のことができるようになっています。

Anthropicによると、Sonnet 5はとりわけコーディング、リサーチ、自動化、ドキュメント作業、その他の複数ステップを要するタスクにClaudeを活用しているユーザーにとって、大きなアップグレードとなっています。

「Sonnet 5はその差を縮めます」とAnthropicは述べており、新モデルが高価なOpus 4.8にまた一歩近づいたことを認めています。

エージェント的作業に特化したClaude Sonnet 5

筆者が実際に使ってみた印象では、Sonnet 5の使用感はOpusに近いものがありました。計画の立案やツールの呼び出しが得意で、自分の出力を検証する能力も驚くほど高いと感じています。

つまり、「コードを修正してください」といったフィードバックへの対応がOpusに近いレベルで格段に向上しているのです。

Image

Anthropicは、エージェント型AIの時代はClaude Sonnet 3.5、3.6、3.7といった従来モデルを含むSonnetクラスのモデルによって幕を開けたと主張しています。

しかし近年は、エージェント能力における最大の進化がOpusクラスのモデルに限定されていました。

Anthropicはそのような状況を変えようとしており、Sonnet 5はより安価なSonnetティアにそうした改善の一部をもたらすために開発されました。

Anthropicによると、テスターたちはSonnet 5を「従来モデルよりずっとエージェント的だ」と評価しており、明示的に求めなくても自らの出力を確認できる点も注目されています。

Opus 4.8に迫りながら、コストは抑制

開発者として筆者はOpus 4.8を高く評価しており、米国政府の要請を受けて最近公開が停止されたFableに匹敵するモデルはないと今でも強く信じています。ただし、Sonnet 5はOpus 4.8やFableと比較してコストパフォーマンスに優れた選択肢になりつつあります。

筆者は月額200ドルのMaxサブスクリプションを契約していますが、OpusはSonnetよりも多くのトークンを消費しコストも大幅に高いため、使用量の上限に達することがよくあります。ヘビーユーザーである筆者でも、自分のコードを把握するためにモデルと対話する場面では、安価なモデルを使う方が理にかなっています。

ただし、Sonnet 4.6は計画立案や大規模なコードベースの把握があまり得意ではありませんでした。その点がSonnet 5で変わったようです。

筆者のテストでは、指示への追従やエージェント的な検索において、Sonnet 5はSonnet 4.6を大きく上回る結果を示しています。

こうした性能向上は、BrowseCompやOSWorld-Verifiedといったベンチマーク機関の評価によっても裏付けられています。

Sonnet 5 benchmark

Anthropicによると、ユーザーはコスト重視か最大性能重視かに応じて、Sonnet 5とOpus 4.8の間で処理レベルを調整できるとのことです。

同社はSonnet 5の導入価格として、2026年8月31日までは入力トークン100万件あたり2ドル、出力トークン100万件あたり10ドルのAPI価格を設定しています。

それ以降は、入力トークン100万件あたり3ドル、出力トークン100万件あたり15ドルに変更されます。

それでも、入力トークン100万件あたり5ドル、出力トークン100万件あたり25ドルと設定されているOpus 4.8より安価です。

一般ユーザーについては、Sonnet 5はFree、Pro、Maxの全サブスクリプションで利用可能です。

攻撃者より先に、すべての層をテストする

セキュリティチームが検知に成功しているのは攻撃の54%にとどまり、アラートを発しているのはわずか14%です。残りは検知されることなく環境内を移動しています。

Picusのホワイトペーパーでは、侵害・攻撃シミュレーションを活用してSIEMとEDRのルールをテストし、脅威が検知をすり抜けないようにする方法を解説しています。

ホワイトペーパーを入手する

翻訳元: https://www.bleepingcomputer.com/news/artificial-intelligence/anthropic-rolls-out-sonnet-5-with-near-opus-48-performance-at-a-lower-price/

ソース: bleepingcomputer.com