devops
安全性が高く、コストも安いが、サイバーセキュリティとは無関係
Anthropicは、中規模モデルの最新版であるSonnet 5をリリースしました。同社はこのモデルを、これまでで最も「エージェント的」なモデルだとしています。
単調で繰り返しの多いタスクを自動化するエージェントを開発する人々にとって、Sonnet 5は推論、ツール利用、コーディング、知識労働の各分野で能力が向上していることを約束するものです。同社の主張によれば、このバージョンは(Anthropicにとって)恥ずかしい誤解によるミスも起こしにくくなっているといいます。
「安全性の評価では、Sonnet 5はSonnet 4.6と比較して望ましくない挙動の全体的な発生率が低く、エージェント的な文脈での利用において総じてより安全であることが分かりました」と同社は火曜日に公開した紹介ブログ記事で述べています。
Sonnet 5は悪意のある要求を拒否する判断力が向上し、プロンプトインジェクション攻撃への耐性も強化されています。ハルシネーション(幻覚)の発生頻度も減り、旧世代の「おべっか使い」だったSonnet 4.6ほどユーザーにこびへつらう(「シコファンシー」)こともなくなりました。Anthropicのシステムカードに掲載されたベンチマーク結果を見る限り、ユーザーによる悪用や欺瞞行為に対する認識能力や、それをブロックする能力も向上しているようです。
SonnetはClaudeの無料版・Proユーザー向けのデフォルトモデルであり、トークンの節約に励むMax、Team、Enterpriseの各顧客も利用可能です。
ベンチマークからはまた、Sonnet 5の性能がAnthropicのエンタープライズ向けフラッグシップモデルであるOpus 4.8に迫りつつも、同じタスクをより低コストで実行できることも示されています。 Opusの場合、Anthropicは入力100万トークンあたり5ドル、出力100万トークンあたり25ドルを請求しています。
9月からは、Sonnetの利用者は入力100万トークンあたり3ドル、出力100万トークンあたり15ドルを支払うことになりますが、Anthropicは8月末までの期間限定で、入力100万トークンあたり2ドル、出力100万トークンあたり10ドルという特別価格を実施しています。
そのため、トークン予算を切り詰めたいユーザーは、Opusの代わりにSonnetでジョブを実行できると同社は提案しています。
5.0のリリースでは、タスク完了に対するモデルの「努力度」を調整する新しい設定が追加されました。単純なタスクは低めの「エフォート」設定の一つで完了でき、その分使用トークンも少なく済みます。一方、長時間稼働するエージェントベースのタスクでは、全開の設定(「xhigh」、さらにはホーマー・シンプソン好みの「max」)まで引き上げることができます。
Sonnet 5が開発者にもたらすもの
2026年の大半において、AI製品の展開は「ロングホライズンタスク」と呼ばれるようになったものをこなせるよう大規模言語モデルを強化することに焦点が当てられてきました。バグを修正したり、コードを書き出したりすること自体はモデルにとって容易かもしれません。しかし、複数のパートからなるタスクに気難しい注意力を最後まで集中させ続けることは、これまでより難しいことが判明していました。
同社によれば、新バージョンのSonnetは、以前のSonnetシリーズと比べて最後までやり遂げる力を備えているといいます。
「社内および第三者による幅広いベンチマークにおいて、Sonnet 5はコーディング、エージェント検索、マルチモーダル推論、プロフェッショナルタスクの遂行能力の面でClaude Sonnet 4.6を明確に上回っています」とシステムカードは述べています。
とはいえ、これらのタスクにおける性能は、依然としてOpusおよびMythosの各モデルには及んでいません。
Zapierのエンジニアによる体験談では、以前のSonnetでは手こずっていた2段階のジョブ、すなわち連絡先データベースを更新した上で全ユーザーに通知を送るという作業を紹介しています。バージョン5はこのタスクを「エンドツーエンド」で完了できたといいます。
サイバーセキュリティ:特筆すべきことは何もない
サンフランシスコを拠点とする同社は、ワシントンD.C.の政策立案者から余計な注目を集めないよう、あえて距離を置く姿勢を取っています。
「私たちはSonnet 5をサイバーセキュリティ関連のタスクに向けて意図的に訓練したわけではありません」と同社は述べています。
6月、米商務省は国家安全保障上の懸念を理由に、新たにリリースされたMythos 5およびFable 5モデルへの海外からのアクセスを一時的に制限する輸出管理指令をAnthropicに突きつけました。Anthropicがこの事態を、Mythosの神がかり的なバグ発見能力に関する誇張とも受け取れる主張によって自ら招いたのかどうかは、議論に値するテーマでしょう。しかしAnthropicは、ピート・タウンゼントよろしく、二度と同じ轍は踏まないつもりのようです。
日常的なサイバーセキュリティ関連のタスクは難なくこなせる一方で、Sonnet 5は攻撃的なコードの生成を防ぐガードレールが設けられています。Firefoxのエクスプロイトを書くよう指示したところ、タスクを完了できませんでした(ただし、その試みではSonnet 4.6よりも少し先まで進むことができました)。
「この後者の変化は、特定の訓練によるものというより、汎用的な知能の向上によるものと考えられます」と同社のブログ記事は指摘しています。 ®