イーロン・マスクのxAI、最新フラッグシップモデルGrok 3をリリース

イーロン・マスクのAI企業であるxAIは、月曜日に最新のフラッグシップAIモデルであるGrok 3をリリースし、Grok iOSおよびWebアプリの新機能を公開しました。

Grokは、OpenAIのGPT-4oやGoogleのGeminiなどのモデルに対抗するxAIの回答であり、画像を分析して質問に応答し、マスクのソーシャルネットワークXの多くの機能を支えています。数カ月にわたって開発されてきたGrok 3は、2024年のリリースが楽観視されましたが、その締め切りを逃しました。

月曜日の発表は、野心的なものです。

xAIは、Grok 3を訓練するために、約20万個のGPUを含むメンフィスの巨大なデータセンターを使用しています。マスクはXの投稿で、Grok 3は、先行モデルであるGrok 2よりも計算能力が「10倍」高い状態で開発されたと主張しました。裁判所の訴訟からの記録を含む訓練データセットを拡張して使用しています。

マスク(右端)を含むxAIチームのメンバーによるGrok 3のライブ配信プレゼンテーション。画像提供:xAI

月曜日のライブ配信プレゼンテーション中にマスクは、「Grok 3はGrok 2よりも能力が10倍高い」と述べました。「それは、時には政治的に正しいものとは反対であっても、最大限に真実を求めるAIです」と述べました。

Grok 3は、正確さを犠牲にして質問に迅速に応答するGrok 3 miniというモデルファミリーです。まだ利用可能なモデルや関連機能はすべてではありません(一部はベータ版です)、が月曜日から展開が始まりました。

xAIは、Grok 3がAIME(数学のサンプリング問題でモデルのパフォーマンスを評価する)、GPQA(博士レベルの物理学、生物学、化学問題を使用してモデルを評価する)などのベンチマークでGPT-4oを上回ると主張しています。xAIによると、Grok 3の早期バージョンは、Chatbot ArenaというAIモデルを対決させ、ユーザーが好ましい回答を投票するクラウドソーシングテストで競争力のあるスコアを獲得しました。

画像提供:xAI

新しいGrok 3ファミリーの2つのモデル、Grok 3 ReasoningとGrok 3 mini Reasoningは、問題を「考える」ことができ、OpenAIのo3-miniや中国のAI企業DeepSeekのR1などの「推論」モデルに類似しています。推論モデルは、結果を提供する前に自分自身をファクトチェックしようとします。これにより、通常モデルをつまずかせるいくつかの落とし穴を回避するのに役立ちます。

xAIによると、Grok 3 Reasoningは、いくつかの人気のあるベンチマークで、o3-mini-highという最高バージョンのo3-miniを上回ります。また、AIME 2025という新しい数学のベンチマークでも競争力のあるスコアを獲得しています。

画像提供:xAI

これらの推論モデルは、Grokアプリを介してアクセスできます。ユーザーはGrok 3に「考えて」と尋ねることができます。また、より難しいクエリには、追加の計算を利用した推論に対応する「Big Brain」モードを使用することができます。xAIは、推論モデルが数学、科学、プログラミングの質問に最適であると述べています。

マスクは、Grokアプリ内で推論モデルの「考え」の一部が分かりにくいようになっていると述べ、これは他のモデルから知識を抽出するためにAIモデル開発者が使用する手法である蒸留を防ぐためです。最近、DeepSeekは、自社のモデルを作成するためにOpenAIのモデルを蒸留したとして非難されました。

Grokの推論モデルは、Grokアプリの新機能であるDeepSearchを支えています。DeepSearchは、OpenAIのdeep researchなどのAIパワードリサーチツールに対するxAIの回答です。DeepSearchはインターネットとXをスキャンして情報を分析し、質問に対する要約を提供します。

XのPremium+チーム(月額50ドル)のサブスクリバーは、最初にGrok 3にアクセスできるようになり、他の機能はxAIがSuperGrokと呼んでいる新しいプランの後ろに隠されることになります。SuperGrokは、月額30ドルまたは1年間300ドル(もしリークが信じられるならば)で提供され、追加の推論およびDeepSearchクエリが解除され、無制限の画像生成が含まれます。

画像提供:xAI

将来的には、おおよそ1週間後に、Grokアプリに「音声モード」が追加される予定だとマスクは述べ、これによりGrokモデルに合成された声が与えられます。その数週間後には、Grok 3モデルがxAIのエンタープライズAPIを介して利用可能になり、DeepSearch機能も同様に提供される予定です。

xAIは、数か月以内にGrok 2をオープンソース化する予定だとマスクは述べました。

「私たちの一般的なアプローチは、次のバージョンが完全に利用可能になった時に、前のバージョンをオープンソース化することです」と彼は続けました。「Grok 3が成熟し安定した時、おそらく数か月のうちに、Grok 2をオープンソース化する予定です。」

マスクが約2年前にGrokを発表したとき、そのAIモデルをエッジの効いた、フィルターをかけず、反「ウォーク」的(一般に、他のAIシステムが答えないような物議を醸す質問に答える意思を持つ)ものとして提示しました。一部の約束には応じました。例えば、下品にするように指示された場合、GrokやGrok 2は喜んで協力し、ChatGPTから聞くことのないカラフルな言葉を発するでしょう。

しかし、Grok 3以前のGrokモデルは、政治問題を避け、特定の境界を越えることはありませんでした。実際、ある研究では、Grokがトランスジェンダーの権利、多様性プログラム、不平等などのトピックについて政治的に左傾していることが示されました。

マスクは、この行動を公開されたウェブページによるGrokのトレーニングデータとして責任を取り、「Grokをより政治的中立に近づける」と約束しています。xAIがその目標を達成し、その結果がどれほどの影響を及ぼすかはまだ不明です。