はじめに
2024年末、中国の新興AI企業DeepSeek社が発表した大規模言語モデル(LLM)「DeepSeek-V3」は、OpenAIのモデルと同等の性能を持ちながら、モデルの訓練コストを大幅に削減し、市場に衝撃を与えた。訓練はNVIDIAのH800チップわずか2,048枚をで行われ、総コストはOpenAIモデルの約 1/12と推定される558万米ドルであった。同社のモデルの発表により、半導体大手NVIDIAの株価が急落するという「DeepSeekショック」も発生した。本稿では、DeepSeekが注目される理由について分析した上で、その産業界における利活用動向および通信事業者による採用の取り組みについて考察する。
DeepSeekが注目される理由
DeepSeek社は、クオンツ運用会社「幻方量化(High-Flyer)」のインキュベーションにより、2023年7月17日に中国・杭州市に設立され、先端LLMの研究開発と応用に特化している企業である。2024年1月に初代モデル「DeepSeek LLM」を発表して以降、同年5月に「DeepSeek-V2」、12月に「DeepSeek-V3」、2025年1月には「DeepSeek-R1」などと、低コストかつ高性能のモデルを次々と発表した。同社が公表した「DeepSeek-V3 Technical Report」によれば、「MMLU(Massive Multitask Language Understanding)」など、LLMの性能を評価する各種ベンチマークテストにおいて、「DeepSeek-V3」はGPT-4やClaude3.5 Sonnetなどの競合モデルを上回るパフォーマンスを達成している。また、「DeepSeek-V3」のパラメータ数は6,710億あるが、モデルの訓練には278.8万GPU時間しかかかっておらず、使用されたH800 GPUのレンタル料金を2ドル/GPU時間と仮定すると、総訓練コストは約558万ドル(表1)となっている。これは、OpenAI による「GPT-4」モデルの訓練コストの約1/13と推定されている(図1)。

【表1】DeepSeek-V3の訓練コスト
(出典:Liu, Aixin, et al. "DeepSeek-V3 Technical Report." arXiv preprint arXiv:2412.19437 (2024). https://arxiv.org/pdf/2412.19437をもとに作成)

【図1】主なAIモデルの推定訓練コスト
(出典:Stanford HAI, ”Artificial Intelligence Index Report 2025,” https://hai-production.s3.amazonaws.com/files/ hai_ai_index_report_2025.pdf,
Liu, Aixin, et al.”DeepSeek-V3 Technical Report”をもとに作成)
DeepSeekの低コスト・高性能のモデルは、主に次のような技術の採用により実現された。
- MoE(Mixture of Experts):MoEアーキテクチャを採用し、複数の専門家モデルを組み合わせて効率的に学習と推論を行う。
- FP8(8-bit floating-point format)混合精度訓練:低精度と高精度の演算方法を組み合わせて利用することで、演算効率と精度のバランスを改善し、訓練速度を向上する。
また、2025年1月に発表された最新モデル「DeepSeek-R1」は、従来の生成AIに比べ、推論過程が完全に透明であるという画期的な特徴を備えている点も注目されている。
さらに、同社はオープンソース戦略を通じてAI技術の民主化を加速させることを目指しており、モデルの構造や技術手法を積極的に公開している。2025年2月24~28日まで開催された同社のオープンソースウィークにおいては、FlashMLA[1]やDeepEP[2]など複数のAI技術がオープンソース化された[3]。
DeepSeekのビジネスモデル
同社のビジネスモデルは、Webサービスやアプリへのアクセスを無料とした上で、APIサービスをコア収入源としている。モデルの訓練などに要するコストを大幅に抑えられたことにより、APIの価格を主要他社モデルより低く設定し、コストパフォーマンスに優れた生成AIサービスとして市場を拡大している。また、DeepSeek-V3/R1のオンラインサービスの統計データ(北京時間2025年2月27日午後12時~28日午後12時)によれば、すべてのトークンをDeepSeek-R1の価格で請求した場合、1日の総収益は56万2,027米ドル、利益率(対コスト)は545%になる。ただし、DeepSeek-V3の価格はR1よりも大幅に安く、一部のサービスのみが収益化されるなどの要因により、実際の収益はこれを下回ると考えられる。
企業ユーザー向けには、API利用サービスのほかに、第三者ベンダーを通じたオンプレミスソリューションも提供されている。APIよりも導入コストが高額になるが、安定性やセキュリティの確保、自社業務にカスタマイズしたモデルの利用といったメリットから、一定の導入事例も見られる。
一般ユーザー向けサービスについては、2025年1月11日にDeepSeekアプリもリリースされ、3月時点の月間アクティブユーザー数が7,701万に達するなど急速に普及している。
InfoComニューズレターでの掲載はここまでとなります。
以下ご覧になりたい方は下のバナーをクリックしてください。
産業界における利活用動向
通信事業者によるDeepSeek採用の取り組み
まとめ
※この記事は会員サービス「InfoCom T&S」より一部抜粋して公開しているものです。
[1] NVIDIAのHopper GPU向け高効率MLA(Multi-head Latent Attention)デコーディングカーネル
[2] MoE(Mixture of Experts)モデル向けEP通信ライブラリ
[3] https://github.com/deepseek-ai/open-infra-index/ blob/main/202502OpenSourceWeek/day_6_one_ more_thing_deepseekV3R1_inference_system_ overview.md
当サイト内に掲載されたすべての内容について、無断転載、複製、複写、盗用を禁じます。InfoComニューズレターを他サイト等でご紹介いただく場合は、あらかじめ編集室へご連絡ください。また、引用される場合は必ず出所の明示をお願いいたします。
調査研究、委託調査等に関するご相談やICRのサービスに関するご質問などお気軽にお問い合わせください。
ICTに関わる調査研究のご依頼はこちら関連キーワード
張 怡の記事
関連記事
-
データセンター市場動向2025 ~電力問題と、社会基盤としてのデータセンターの今後
- WTR No435(2025年7月号)
- データセンター
-
ICT雑感:本格普及目前?――ヒューマノイドに立ちはだかる"常識"の壁
- AI・人工知能
- ICR雑感
- WTR No435(2025年7月号)
-
通信キャリア経済圏の概観 ~NTTドコモの銀行機能獲得と今後の展望~
- NTTドコモ
- モバイル通信事業者(国内)
- 国内
- 研究員ブログ
- 金融
- 金融ICT
-
中動態の視点から考える、これからのコミュニケーションのあり方
- ICR Insight
- WTR No434(2025年6月号)
-
生成AIが増幅する認知バイアスの危険性
- AI・人工知能
- WTR No434(2025年6月号)
- 生成AI
ITトレンド全般 年月別レポート一覧
ランキング
- 最新
- 週間
- 月間
- 総合