Новая статья DeepSeek представляет систему рассуждения DualPath, которая почти удвоила пропускную способность нагрузки агента

PANews сообщил 27 февраля, что в стремлении отрасли к новому поколению флагманской модели DeepSeek V4 команда DeepSeek тихо выпустила новую научную статью. В новой статье представлена инновационная система вывода под названием DualPath, которая специально оптимизирована для производительности вывода больших моделей (LLM) при нагрузках агентов. Вводя механизм «двухпутного чтения KV-кэша (аналогично кэшу памяти)» для перераспределения нагрузки на сеть хранения, пропускная способность офлайн-вывода увеличивается до 1,87 раза, а количество агентов, запущенных в секунду онлайн-сервисов, увеличивается в среднем в 1,96 раза. В статье во введении упоминается, что крупные модели быстро эволюционируют от однораундных разговорных роботов и независимых моделей рассуждения к агентным системам, способным автономно планировать, использовать инструменты и решать практические задачи через несколько раундов взаимодействия. Этот сдвиг в парадигме применения привёл к значительным изменениям в нагрузках по выводу больших моделей: от традиционного взаимодействия человека с большой моделью к взаимодействию человека и большой модели и среды раунд взаимодействия может охватывать десятки или даже сотни раундов.

Посмотреть Оригинал
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев