PANews сообщил 27 февраля, что в стремлении отрасли к новому поколению флагманской модели DeepSeek V4 команда DeepSeek тихо выпустила новую научную статью. В новой статье представлена инновационная система вывода под названием DualPath, которая специально оптимизирована для производительности вывода больших моделей (LLM) при нагрузках агентов. Вводя механизм «двухпутного чтения KV-кэша (аналогично кэшу памяти)» для перераспределения нагрузки на сеть хранения, пропускная способность офлайн-вывода увеличивается до 1,87 раза, а количество агентов, запущенных в секунду онлайн-сервисов, увеличивается в среднем в 1,96 раза. В статье во введении упоминается, что крупные модели быстро эволюционируют от однораундных разговорных роботов и независимых моделей рассуждения к агентным системам, способным автономно планировать, использовать инструменты и решать практические задачи через несколько раундов взаимодействия. Этот сдвиг в парадигме применения привёл к значительным изменениям в нагрузках по выводу больших моделей: от традиционного взаимодействия человека с большой моделью к взаимодействию человека и большой модели и среды раунд взаимодействия может охватывать десятки или даже сотни раундов.