
イーロン・マスクが所有する xAI は、既存の Grok 4 モデルをアップグレードした Grok 4.1 のロールアウトを開始しました。
xAI は、いくつかの漸進的な改良を加えた 2 つの Grok 4.1 モデルをリリースしました。
1 つは Grok 4.1、もう 1 つは Grok 4.1 Thinking です。これら 2 つのモデルは無料で利用できますが、有料ユーザーは制限が少なくなります。

出典: BleepingComputer
xAI によると、Grok 4.1 は従来モデルと比べて幻覚(ハルシネーション)を起こす可能性が 3 倍低く、xAI によるこれまでのリリースの中でも最高クラスのモデルとなっています。
一方で、最近パフォーマンスと感情知能が向上した GPT 5.1 などのライバルと比べてどの程度の性能なのかは、まだ分かっていません。
しかし、LMArena の Text Arena は Grok 4.1 の興味深いパフォーマンスインサイトを共有しています。
LMArena の Text Arena は、ユーザーが複数の大規模言語モデル(LLM)を、並列表示・ブラインド・ランダム化テストで比較できるオープンソースツールです。
初期ベンチマークによると、Grok 4.1(thinking)と Grok 4.1 は、最も競争の激しい Text Arena において新たな高みに到達しました。

ベンチマークによると、Grok 4.1(thinking)はスコア 1510 で Arena Expert リーダーボードの第 1 位、Grok 4.1 はスコア 1437 で第 19 位にランクインしています。
「これは、わずか 2 か月前に Arena に登場した Grok 4 fast から 40 ポイント以上の改善です」と、ベンチマークプラットフォームは述べています。
Grok 4.1 は堅実なアップグレードではあるものの、今年最高のモデルにはならない可能性があります。というのも、Google は Gemini 3.0 を準備しており、これまでで最も強力なモデルになる可能性があるからです。