フラッシュの逆転：Googleの新「Gemini 3 Flash」が主要AIベンチマークでGPT-5.2を打ち破る

AIの主導権をめぐる争いは、研究所からマスマーケット向け製品へと、ますます軸足を移しつつあります。OpenAIのGPT-Image-1.5のリリースからわずか1日後、GoogleはGemini 3 Flashを発表し、消費者向けアプリケーション全体および検索のAIモード内で、デフォルトモデルとして直ちに展開を開始しました。この新モデルは、わずか6か月前に登場したGemini 2.5 Flashに置き換わるものです。

Googleによれば、Gemini 3 Flashは低レイテンシーを維持しながら、推論、マルチモーダル、効率性の面で顕著な向上を実現したとのことです。初期評価では、このモデルがGoogleとOpenAI双方のいわゆる「フロンティア」システムに迫りつつあることが示唆されています。Humanity’s Last Examベンチマークでは、Gemini 3 Flashはツール未使用で33.7%を記録し、Gemini 3 Proの37.5%、Gemini 2.5 Flashの11%、そして最近リリースされたOpenAI GPT-5.2の34.5%と比較されます。マルチモーダルのMMMU-Proテストでは、Gemini 3 Flashが81.2%を達成し、Googleはこのカテゴリにおいて競合の中で最も強い結果だと主張しています。

こうした性能向上にもかかわらず、Googleは引き続きFlashを「速度最優先」のモデルとして位置づけています。同社は、Gemini 2.5 Proを上回る性能を、約3倍の速度で実行できると述べており、推論タスクでは平均して約30%少ないトークン消費で済むため、運用コストの低下につながる可能性があるとしています。

日常的なユーザーにとっては、Gemini 3 Flashはすでに世界中のGeminiアプリでデフォルトの選択肢となっており、数学やプログラミングなどより要求の高いタスク向けには、モデルセレクターからGemini 3 Proを引き続き利用できます。Googleはマルチモーダルのユースケースにも強く注力しており、短い動画をアップロードしてガイダンスやコーチングを受けたり、スケッチを提出して認識させたり、音声を分析やクイズ作成に活用したりできます。同社によれば、このモデルは画像や表を含む「視覚的な回答」をより頻繁に提示し、自然言語プロンプトからGeminiのインターフェース内で簡単なアプリケーションのプロトタイプを組み立てる支援まで可能だといいます。

検索では、Googleは同時に高度な機能へのアクセスを拡大しています。Gemini 3 Proは米国の全ユーザーが利用可能になり、社内の画像生成モデル「Nano Banana Pro」の検索結果内での展開も拡大しました。エンタープライズ側では、JetBrains、Figma、Cursor、Harvey、Latitudeといった企業がGemini 3 Flashを採用しているとGoogleは報告しており、このモデルはVertex AIおよびGemini Enterpriseを通じて利用できます。開発者にはAPI経由でのプレビューアクセスに加え、Googleが先月リリースしたコーディングツール「Antigravity」への統合も約束されています。

GoogleはAPI価格を、入力トークン100万あたり0.50ドル、出力トークン100万あたり3.00ドルに設定しました。これはGemini 2.5 Flashよりわずかに高く、同社はその差を品質向上によるものだと説明しています。またGoogleは、Gemini 3ファミリーの立ち上げ以降、同社のAPIが1日あたり1兆トークン超を処理しているとも主張しています。こうした状況の中でOpenAIとの競争は激化しており、12月上旬の報道では、Googleのシェア拡大に伴うChatGPTトラフィックの落ち込みを受けて、Sam Altmanが社内向けに「Code Red」メモを出したとされました。その後、OpenAIはGPT-5.2と新たな画像生成モデルをリリースし、さらにChatGPTのメッセージ量が2024年11月比で8倍に増加したとの主張も伝えられています。

翻訳元: https://meterpreter.org/the-flash-flip-googles-new-gemini-3-flash-topples-gpt-5-2-in-key-ai-benchmarks/

フラッシュの逆転：Googleの新「Gemini 3 Flash」が主要AIベンチマークでGPT-5.2を打ち破る

共有:

関連

関連記事

WordPressの深刻な脆弱性「wp2shell」が発覚

Microsoftが期限を明示、Windows 11 24H2 HomeとProは2026年10月13日にセキュリティ更新終了へ

サイレント・スレット:Chromeの同期機能がサイバーストーキングを可能にする仕組み