PANews đã báo cáo vào ngày 27 tháng 2 rằng trong sự háo hức của ngành công nghiệp đối với thế hệ mới của mô hình hàng đầu DeepSeek V4, nhóm DeepSeek đã lặng lẽ phát hành một bài báo học thuật mới. Bài báo mới giới thiệu một hệ thống suy luận sáng tạo có tên là DualPath, được tối ưu hóa đặc biệt cho hiệu suất suy luận mô hình lớn (LLM) trong khối lượng công việc của tác nhân. Bằng cách giới thiệu cơ chế “KV-Cache đọc đường dẫn kép (tương tự như bộ nhớ đệm)” để phân phối lại tải mạng lưu trữ, thông lượng suy luận ngoại tuyến được tăng lên đến 1,87 lần và số lượng tác nhân chạy mỗi giây của các dịch vụ trực tuyến được tăng trung bình 1,96 lần. Bài báo đề cập trong phần giới thiệu rằng các mô hình lớn đang phát triển nhanh chóng từ robot đàm thoại một vòng và các mô hình suy luận độc lập sang các hệ thống tác nhân có thể tự lập kế hoạch, gọi các công cụ và giải quyết các nhiệm vụ thực tế thông qua nhiều vòng tương tác. Sự thay đổi trong mô hình ứng dụng này đã thúc đẩy một sự thay đổi lớn trong khối lượng công việc suy luận mô hình lớn: từ tương tác giữa con người và mô hình lớn truyền thống đến tương tác giữa con người và mô hình lớn với môi trường, vòng tương tác có thể đạt hàng chục hoặc thậm chí hàng trăm vòng.