Tin tức Cổng, 27 tháng 4 — Nhóm PAI của Alibaba đã phát hành và mã nguồn mở AgenticQwen, một mô hình ngôn ngữ dạng tác nhân quy mô nhỏ được thiết kế cho các ứng dụng gọi công cụ ở mức công nghiệp. Mô hình có hai phiên bản: 8B và 30B-A3B. Được huấn luyện thông qua một khung học tăng cường “dual data flywheel” sáng tạo, AgenticQwen đạt được các năng lực cấp độ tác nhân gần tương đương mô hình hàng nghìn tỷ tham số, đồng thời giảm đáng kể chi phí suy luận.
Cơ chế dual data flywheel giải quyết vấn đề đồng nhất hóa trong dữ liệu tổng hợp truyền thống. Flywheel lý luận tự động tạo ra các biến thể khó hơn từ lỗi của mô hình, trong khi flywheel tác nhân mở rộng các quy trình tuyến tính đơn giản (như các quy trình đặt chỗ) thành các cây hành vi nhiều nhánh có ràng buộc, các tình huống bị từ chối và điều kiện đối kháng, mô phỏng các kịch bản ra quyết định phức tạp trong thực tế. Các bài benchmark cho thấy AgenticQwen-8B đạt 47.4 trên các benchmark môi trường công cụ thực tế (TAU-2 và BFCL-V4), vượt xa đáng kể Qwen3-8B gốc (23.8) và tiệm cận Qwen3-235B (52.0). AgenticQwen-30B-A3B (với chỉ 3B tham số được kích hoạt) đạt 50.2.
Mô hình đã được triển khai trong các hệ thống sản xuất nội bộ tương tự Manus, thu hẹp đáng kể khoảng cách với các mô hình 235B về thời gian suy luận end-to-end. Tuy nhiên, mô hình bị giới hạn bởi độ dài ngữ cảnh gốc 40K token, điều này hạn chế hiệu năng của nó đối với các tác vụ tìm kiếm sâu.
Related News
DeepSeek V4 Pro trên Ollama Cloud: Claude Code kết nối một lần
郭明錤: OpenAI muốn làm AI Agent trên điện thoại, MediaTek, Qualcomm, Luxshare Precision trở thành chuỗi cung ứng then chốt
Tencent Cloud QClaw tích hợp vào khung Hermes, hỗ trợ chuyển đổi nhiều mô hình như DeepSeek-V4 Pro