A nova tese da DeepSeek propõe o sistema de raciocínio DualPath, com o throughput de carga do agente quase a duplicar

PANews 27 de fevereiro — Enquanto a indústria aguarda ansiosamente a nova geração de modelos flagship DeepSeek V4, a equipe DeepSeek lançou silenciosamente um novo artigo acadêmico. O novo artigo apresenta um sistema de raciocínio inovador chamado DualPath, projetado especificamente para otimizar o desempenho de inferência de grandes modelos (LLMs) sob cargas de trabalho de agentes inteligentes. Ao introduzir o mecanismo de “leitura de KV-Cache de caminho duplo” (semelhante a uma memória cache), redistribui a carga de armazenamento da rede, aumentando a taxa de throughput de inferência offline em até 1,87 vezes e a média de execuções de agentes por segundo em serviços online em 1,96 vezes. Na introdução, o artigo menciona que os grandes modelos estão evoluindo rapidamente de chatbots de uma única rodada e modelos de raciocínio independentes para sistemas de agentes — capazes de planejar autonomamente, chamar ferramentas e resolver tarefas reais por meio de múltiplas rodadas de interação. Essa mudança de paradigma na aplicação impulsiona uma transformação significativa na carga de trabalho de inferência de grandes modelos: de uma interação tradicional entre humanos e grandes modelos para uma interação entre humanos, grandes modelos e o ambiente, podendo chegar a dezenas ou centenas de rodadas de interação.

Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)