Claude Sonnet 4がアップグレードされ、API経由で使用する場合に限り、最大100万トークンのコンテキストを記憶できるようになりました。これは今後変更される可能性があります。
これは以前の制限の5倍です。また、Claudeは1回のセッションで7万5千行以上のコードや、数百のドキュメントを記憶できることを意味します。
以前は、Claudeに詳細を小分けにして送信する必要がありましたが、それは同時に制限に達するとコンテキストを忘れてしまうことも意味していました。最大100万トークンのコンテキスト制限により、より優れたアプリを構築でき、Claudeはこれまで以上に多くのコードを記憶できます。
なお、100万トークンのコンテキスト制限はSonnet 4のみに限定されています。Opus 4.1は高価なモデルのため、従来の制限のままです。
APIのみが100万トークンのコンテキスト制限に対応
新しいコンテキスト制限は、Tier 4およびカスタムレート制限を持つ顧客向けにAnthropic APIを通じて提供が開始されており、今後数週間でより広く利用可能になる予定です。
「ロングコンテキストはAmazon Bedrockでも利用可能で、Google CloudのVertex AIにも近日中に対応予定です」とAnthropicは述べています。
「100万トークンで、すべての依存関係を含むコードベース全体の読み込み、数百のドキュメントの同時解析、数百回のツール呼び出しをまたいでコンテキストを維持するエージェントの構築が可能です。プロンプトが20万トークンを超える場合は価格が調整されますが、プロンプトキャッシュによってコストや遅延を削減できます。」
Claudeのモバイルおよびウェブアプリも、将来的に100万トークンのコンテキスト制限に対応する予定です。