DeepSeek-V3登場低コストでオープンな生成AIモデルの衝撃 - NewsTomo

中国のAI企業が大規模言語モデル「DeepSeek-V3」を発表しました。低コストでオープンに利用できるこのモデルは、国際ニュースとしても注目されており、AIのアクセスと価格の常識を揺さぶっています。

DeepSeek-V3とは何か：オープンで強力な新しい言語モデル

DeepSeek-V3は、中国のAI企業が開発した最新の大規模言語モデルです。英語と中国語に加え、プログラミングや数学にも強みを持ち、OpenAIのGPT-4oのような商用モデルに匹敵すると会社の内部テストでは説明されています。

モデルの規模は6710億パラメータとされ、MetaのLlama 2（700億）やLlama 3.1（4050億）より大きい構成です。この巨大なサイズが、言語理解やコード生成などでの性能向上につながっていると見られます。

個人ユーザーは、DeepSeekのウェブサイト上に用意された無料チャットボットを通じて、モデルの能力を体験できます。このチャットボットはウェブ検索にも対応し、回答の裏側にある推論プロセスを表示するのが特徴です。

ユーザーは、モデルがどのようなステップで結論にたどり着いたかを確認できるため、「なぜこの答えなのか」を理解しやすくなります。生成AIの振る舞いがブラックボックスになりがちな中で、透明性を高めようとする試みと言えます。

DeepSeek-V3が国際的な注目を集めている大きな理由は、そのコスト構造にあります。DeepSeekによると、このモデルの学習にかかった費用は約550万ドルで、OpenAIのGPT-4の学習費用とされる1億ドル超と比べて大幅に抑えられていると説明されています。

オンラインサービスの利用価格も攻めた設定です。

同等クラスとされるモデルの中で、ここまで低価格を打ち出す例はまだ多くありません。開発コストと提供価格の両面で、DeepSeek-V3は「高性能AIは高価でクローズド」というこれまでのイメージに挑戦していると言えます。

DeepSeek-V3のもう一つの特徴は、モデル本体を無料でダウンロードし、ローカル環境で実行できる点です。これはクラウド経由でしか利用できないMicrosoftのCopilot、GoogleのGemini、OpenAIのGPTシリーズなどと対照的です。

ローカル実行が可能であることは、次のようなユーザーにとって大きな意味を持ちます。

企業にとっては、自社ネットワーク内でモデルを動かすことで、情報漏えいリスクを抑えつつ最新の生成AIを活用できる可能性があります。データを自社のサーバーにとどめたまま高度な言語処理を行える点は、日本企業を含む多くの組織にとって魅力的な選択肢となり得ます。

一方で、DeepSeek-V3の巨大さはそのまま課題にもなっています。モデルがあまりに大きいため、一般的なPCやスマートフォンで完全版を動かすのは現実的ではありません。

現時点で確認されているローカル実行の事例は限られており、とあるブロガーは、AppleのMac Mini Proを8台（それぞれM4チップと64GBメモリ搭載）組み合わせることで動かせたと報告しています。ただし、この構成だけで1万ドルを超えるコストがかかります。

DeepSeek側も、モデルのサイズが大きく、動作速度も理想的とは言えないことを認めており、その要因を現在のハードウェア性能の制約にあるとしています。今後、計算資源の価格が下がり、ハードウェアが進化することで、こうした制約が自然に解消されると見ているようです。

DeepSeekによると、DeepSeek-V3は英語、中国語、コーディング、数学などで既存の先端モデルに匹敵する性能を示しているとされています。ただし、こうした結果の多くは現時点では同社の内部テストに基づくものであり、第三者による検証はまだ十分ではありません。

ローカル実行の成功例も限られているため、開発コミュニティや研究者、企業による独立したベンチマークや実運用の報告が今後の焦点になります。特に、以下の点が注目されるでしょう。

こうした検証が進むことで、DeepSeek-V3が本当に「低コストで開かれたフロンティアモデル」として定着するのか、それとも特定の用途に強みを持つニッチな存在になるのかが見えてくるはずです。

DeepSeek-V3の登場は、AIをめぐるいくつかの重要な問いを改めて浮かび上がらせています。

同社の研究論文によると、最終的な目標は「汎用人工知能」（AGI）の実現であり、その過程でもオープンアクセスと長期的な開発へのコミットメントを維持する方針だとされています。

日本語で国際ニュースを追う読者にとっても、DeepSeek-V3は単なる新製品発表ではなく、「AIの力を誰がどの条件で手にできるのか」という大きな流れの一端を示す出来事と言えます。今後、どのようなコミュニティや企業がこのモデルを採用し、どのような実例が積み上がっていくのかに注目が集まりそうです。

Reference(s):

DeepSeek-V3 model: A cost-effective and open challenge to AI giants
cgtn.com