DeepSeekは新しいAIモデルV3.1をリリースしました。

deepseek# DeepSeekが新しいAIモデルV3.1をリリース

中国のAIスタートアップDeepSeekは、フラッグシップAIモデルV3を更新し、チャットボットから推論ニューラルネットワークR1の言及を削除しました。これについてSCMPが報じています。

会社はWeChatでV3.1のリリースを発表しました。このアップデートにより、モデルのコンテキストウィンドウが128,000トークンに拡張され、ユーザーとの対話時により多くの情報を保持できるようになります。この容量は約300ページの本に相当します。

また、トークンの使用効率が高いことが指摘されています。

データ:複数の言語で複雑なプログラミング問題を解決するLLMを評価するAider Polyglotベンチマーク X.In、DeepSeek V3.1はClaude 4 Opusを上回っています。

DeepSeek V3.1 が Claude 4 Opus を Aider Polyglot で上回る

これにより、非TTCコーディングモデルとして最高のものとなり、すべてが約$1で実現されます pic.twitter.com/QyJZnVRdVK

— リサン・アル・ガイブ (@scaling01) 2025年8月19日

V3.1は、生成の速度と品質のバランスを保っています。6850億のパラメータを含み、対話、推論、プログラミングのタスクにおいて高いパフォーマンスを提供するハイブリッドアーキテクチャに基づいています。

DeepSeekは、ディープシンキング機能からR1の言及を削除しました。SCMPでは、これは期待されるR2の開発における困難を示唆している可能性があると推測しています。

AIスタートアップDeepSeekは、推論に特化したモデルR1を1月に発表し、注目を集めました。それは低い資本投入で高い効率を示し、専門家の間でAIセクターへの数十億の投資の必要性や業界の膨張について疑念が生じました。

6月に中国のスタートアップが病院での人工知能の応用を改善するために医療データのラベリングを行うインターンを雇い始めたことを思い出させます。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)