xAI の Grok 4.1 が、品質と速度を向上させて無料提供でロールアウト

イーロン・マスクが所有する xAI は、既存の Grok 4 モデルをアップグレードした Grok 4.1 のロールアウトを開始しました。

xAI は、いくつかの漸進的な改良を加えた 2 つの Grok 4.1 モデルをリリースしました。

1 つは Grok 4.1、もう 1 つは Grok 4.1 Thinking です。これら 2 つのモデルは無料で利用できますが、有料ユーザーは制限が少なくなります。

xAI によると、Grok 4.1 は従来モデルと比べて幻覚（ハルシネーション）を起こす可能性が 3 倍低く、xAI によるこれまでのリリースの中でも最高クラスのモデルとなっています。

一方で、最近パフォーマンスと感情知能が向上した GPT 5.1 などのライバルと比べてどの程度の性能なのかは、まだ分かっていません。

しかし、LMArena の Text Arena は Grok 4.1 の興味深いパフォーマンスインサイトを共有しています。

LMArena の Text Arena は、ユーザーが複数の大規模言語モデル（LLM）を、並列表示・ブラインド・ランダム化テストで比較できるオープンソースツールです。

初期ベンチマークによると、Grok 4.1（thinking）と Grok 4.1 は、最も競争の激しい Text Arena において新たな高みに到達しました。

ベンチマークによると、Grok 4.1（thinking）はスコア 1510 で Arena Expert リーダーボードの第 1 位、Grok 4.1 はスコア 1437 で第 19 位にランクインしています。

「これは、わずか 2 か月前に Arena に登場した Grok 4 fast から 40 ポイント以上の改善です」と、ベンチマークプラットフォームは述べています。

Grok 4.1 は堅実なアップグレードではあるものの、今年最高のモデルにはならない可能性があります。というのも、Google は Gemini 3.0 を準備しており、これまでで最も強力なモデルになる可能性があるからです。

関連記事