
AIモデルは、GoogleやOpenAI、AnthropicなどのBig Tech企業から新興企業まで、めまぐるしく生産されています。最新のものを追跡することは圧倒的になることがあります。
混乱を増す要因として、AIモデルはしばしば業界のベンチマークに基づいて宣伝されています。しかし、これらの技術的なメトリクスは実際の人々や企業が実際にどのように使用しているかについてはほとんど明らかにしません。
騒音を取り除くために、TechCrunchは2024年以降にリリースされた最も高度なAIモデルの概要をまとめ、それらの使い方と最適な用途について詳細を提供しています。また、最新のローンチ情報もこのリストに常に更新しています。
実際には100万以上のAIモデルが存在しています。たとえば、HuggingFaceは140万以上のモデルをホストしています。このリストは、さまざまな点でより優れたパフォーマンスを発揮する一部のモデルを見逃すかもしれません。
2025年にリリースされたAIモデル
OpenAI o3-mini
これはOpenAIの最新の推論モデルであり、コーディング、数学、科学などのSTEM関連のタスクに最適化されています。これはOpenAIの最もパワフルなモデルではありませんが、サイズが小さいため、同社によると価格が大幅に抑えられています。無料で利用できますが、ヘビーユーザーは定期購読が必要です。
OpenAI Deep Research
OpenAIのDeep Researchは、明確な引用を使用してトピックについて研究を行うために設計されています。このサービスは、ChatGPTの月額$200のProサブスクリプションでのみ利用可能です。OpenAIは、科学からショッピングの研究まで、あらゆることにこのサービスをお勧めしていますが、AIには幻覚の問題が依然として存在します。
ミストラルLe Chat
ミストラルは、マルチモーダルAIパーソナルアシスタントであるLe Chatのアプリバージョンを発表しました。ミストラルはLe Chatが他のどのチャットボットよりも迅速に応答すると主張しています。AFPからの最新のジャーナリズムを提供する有料版もあります。Le Mondeのテストでは、Le Chatのパフォーマンスが印象的でしたが、ChatGPTよりも多くのエラーを発生させました。
OpenAI Operator
OpenAIのOperatorは、スーパーを買うなど、独立して作業を行う個人のインターンを意味しています。月額$200のChatGPTプロサブスクリプションが必要です。AIエージェントは多くの約束を持っていますが、まだ実験的です。ワシントンポストのレビュアーは、Operatorが自分で$31で卵12個を注文し、レビュアーのクレジットカードで支払ったと述べています。
Googleジェミニ2.0 Proエクスペリメンタル
Google Geminiの待望のフラッグシップモデルは、コーディングや一般的な知識の理解で優れていると言われています。また、2,000,000トークンの超長いコンテキストウィンドウを持ち、大量のテキストを迅速に処理する必要があるユーザーに役立ちます。このサービスは、Google One AIプレミアムサブスクリプションの月額19.99ドル以上が必要です。
2024年にリリースされたAIモデル
DeepSeek R1
この中国のAIモデルはシリコンバレーを席巻しました。DeepSeekのR1はコーディングと数学で優れたパフォーマンスを発揮し、オープンソースで誰でも地元で実行できるようになっています。さらに、無料です。ただし、R1は中国政府の検閲を統合しており、ユーザーデータを中国に送信する可能性があるため、規制が厳しくなっています。
Gemini Deep Research
Deep Researchは、Googleの検索結果を簡単でよく引用されたドキュメントにまとめるサービスです。このサービスは、学生やその他の誰でも迅速な研究サマリーが必要な場合に役立ちます。ただし、その品質は実際の査読済み論文ほど良くありません。Deep Researchには、Google One AIプレミアムサブスクリプションの19.99ドルが必要です。
Meta Llama 3.3 7B
これはMetaのオープンソースLlama AIモデルの最新で最も高度なバージョンです。Metaはこのバージョンを最も安価で効率的なものとして宣伝し、特に数学、一般的な知識、指示の従うことに適しているとしています。無料でオープンソースで利用できます。
OpenAIソラ
ソラはテキストに基づいて現実的なビデオを作成するモデルです。クリップではなく、シーン全体を生成できますが、OpenAIはしばしば「非現実的な物理学」を生成すると認めています。現在、ChatGPTの有料バージョンでのみ利用可能で、Plusから始まり月額20ドルです。
Alibaba Qwen QwQ-32B-Preview
このモデルは、特定の業界ベンチマークにOpenAIのo1と匹敵する数少ないモデルの1つであり、数学とコーディングで優れた性能を発揮します。アリババによると、「推論モデル」にもかかわらず、「常識の推論に改善の余地がある」と述べています。また、中国政府の検閲を組み込んでおり、TechCrunchのテストでも確認されています。無料でオープンソースです。
Anthropicのコンピューター使用
Claude’s Computer Useは、コーディングや飛行機の予約などのタスクを完了するためにコンピューターを制御することを目的としています。ただし、Computer Useはまだベータ版です。価格はAPI経由で、入力の100万トークンあたり0.80ドル、出力の100万トークンあたり4ドルです。
x.AIのGrok 2
Elon Musk所有のAI企業であるx.AIは、フラッグシップのGrok 2チャットボットの強化版を発表し、3倍速いと主張しています。無料ユーザーは、Grokでは2時間ごとに10個の質問に制限されていますが、Xのプレミアムプランおよびプレミアム+プランの購読者は使用制限が高くなります。x.AIは、高度に写実的な画像を生成するイメージジェネレーターであるAuroraも発表していますが、一部のグラフィックや暴力的なコンテンツも含まれています。
OpenAI o1
OpenAIのo1ファミリーは、隠れた推論機能を使ってより良い回答を出力することを目指しています。OpenAIは、o1がコーディング、数学、安全性で優れていると主張していますが、人間をだます問題も抱えています。O1は月額20ドルのChatGPT Plusの定期購読が必要です。
Anthropicのクロードソネット3.5
クロードソネット3.5は、Anthropicが最高クラスとして主張するモデルです。そのコーディング能力で知られており、テックインサイダーのチャットボットとしての選択肢とされています。モデルはClaudeで無料でアクセスできますが、ヘビーユーザーは月額20ドルのProサブスクリプションが必要です。画像を理解できますが、生成することはできません。
OpenAI GPT 4o-mini
OpenAIは、GPT 4o-miniを最も手頃な価格で最速のモデルとして宣伝しており、その小さなサイズのおかげで可能な広範囲のタスクを実行することができます。このモデルはChatGPTの無料版で利用できます。複雑なタスクよりも高いボリュームの単純なタスクに適しています。
Cohere Command R+
CohereのCommand R+モデルは、企業向けの複雑なRetrieval-Augmented Generation(またはRAG)アプリケーションで優れた性能を発揮します。つまり、特定の情報を見つけて引用する能力が非常に高いです。ただし、RAGはAIの幻覚の問題を完全に解決していません。