
DeepSeekは急速に拡散しました。
中国のAI研究所DeepSeekは、先週、そのチャットボットアプリがApple App Storeチャートのトップに上昇した後、メインストリームの意識に突入しました。Compute効率の良い技術を使用してトレーニングされたDeepSeekのAIモデルは、ウォール街のアナリストや技術者をリードし、米国がAIレースでのリードを維持できるかどうか、そしてAIチップの需要が持続するかどうかに疑問を投げかけています。
DeepSeekのトレーダーの起源
DeepSeekは、AIを取引決定の根拠とする中国の定量ヘッジファンドHigh-Flyer Capital Managementの支援を受けています。
AI愛好家のLiang Wenfengは2015年にHigh-Flyerを共同設立しました。浙江大学の学生だった頃から取引を試みていたと報じられているWenfengは、2019年にAIアルゴリズムの開発と展開に焦点を当てたヘッジファンドとしてHigh-Flyer Capital Managementを設立しました。
2023年、High-Flyerは、金融事業とは別にAIツールの研究に専念するラボとしてDeepSeekを立ち上げました。高フライヤーが投資家の一人であることから、ラボは独立した企業、DeepSeekとして独立しました。
DeepSeekは、モデルトレーニングのための独自のデータセンタークラスターを一から構築しました。ただし、他の中国のAI企業と同様に、DeepSeekは米国のハードウェアに対する輸出禁止措置の影響を受けています。最近のいくつかのモデルのトレーニングには、米国企業が利用可能なチップであるH100のバージョンであるNvidia H800チップを使用する必要がありました。
DeepSeekの強力なモデル
DeepSeekは、2023年11月に最初のモデルセットであるDeepSeek Coder、DeepSeek LLM、DeepSeek Chatを発表しました。しかし、このスタートアップが次世代のDeepSeek-V2モデルファミリーをリリースした春まで、AI業界は注目し始めませんでした。
DeepSeek-V2は、テキストと画像を分析する汎用システムで、さまざまなAIベンチマークで優れたパフォーマンスを発揮し、当時の他のモデルよりもランニングコストがはるかに安くなっていました。これにより、DeepSeekの国内競合他社、バイトダンスやアリババを含むいくつかのモデルの使用料金を削減し、他のモデルを完全に無料にすることが迫られました。
破壊的なアプローチ
DeepSeekにはビジネスモデルがあるとすれば、そのモデルが正確に何なのかは明確ではありません。同社は製品とサービスを市場価値よりも遥かに安く設定し、他のものは無料で提供しています。
DeepSeekの主張するところでは、効率化の突破口により、同社は極端なコスト競争力を維持できるようになりました。ただし、一部の専門家は、同社が提供した数字を疑問視しています。
DeepSeekのモデルは一般的に理解されるような意味でオープンソースではありませんが、商用利用を許可する寛大なライセンスの下で利用できます。DeepSeekのモデルをホストするプラットフォームの一つであるHugging FaceのCEOであるClem Delangueによると、Hugging Faceの開発者はR1の派生モデルを500以上作成し、合計250万回以上ダウンロードされています。
DeepSeekの成功は、規模の大きいより確立された競合他社に対抗し、「AIを転覆させ、新しいAIの瀬戸際の時代を招いた」と表現されています。同社の成功は、少なくとも一部の原因であるとされ、月曜日にNvidiaの株価を18%下落させ、OpenAIのCEOであるSam Altmanから公開の反応を引き出しました。
DeepSeekの将来については、明確ではありません。改善されたモデルは当然ですが、米国政府は有害な外国からの影響と見なしているようです。
TechCrunchにはAIに焦点を当てたニュースレターがあります! 水曜日に受信箱に届けるためにここで登録してください。