DeepSeekの新しい論文はDualPath推論システムを提案し、エージェントの負荷スループットがほぼ2倍に向上

PANews 2月27日報道、業界が新世代フラッグシップモデルDeepSeek V4に期待を寄せる中、DeepSeekチームは静かに新たな学術論文を発表した。新論文では、DualPathと呼ばれる革新的な推論システムを紹介しており、これはインテリジェントエージェントの作業負荷下における大規模モデル(LLM)の推論性能を最適化することを目的としている。双方向のKVキャッシュ(記憶キャッシュに類似)読み取り機構を導入し、ストレージネットワークの負荷を再配分することで、オフライン推論のスループットを最大1.87倍向上させ、オンラインサービスにおいてはエージェントの平均稼働数を1.96倍増加させた。論文の序論では、大規模モデルは単一の対話ロボットや独立した推論モデルから、自己計画・ツール呼び出し・多輪対話を通じて実務的なタスクを解決できるインテリジェントエージェントシステムへと急速に進化していると述べている。この応用パラダイムの変化は、大規模モデルの推論負荷に大きな変革をもたらし、従来の人間と大規模モデルの一対一のインタラクションから、人間・大規模モデル・環境の三者間のインタラクションへと進化し、対話のラウンド数は数十から数百に達することもある。

原文表示
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский язык
  • Français
  • Deutsch
  • Português (Portugal)
  • ภาษาไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)