Tin tức Gate News: Ngày 10 tháng 4, hôm nay nền tảng đánh giá AI uy tín toàn cầu LMArena (nền tảng đánh giá các mô hình AI với hàng triệu người tham gia thử nghiệm mù) đã cập nhật bảng xếp hạng chuyên đề Code Arena. GLM-5.1 vươn lên vị trí số 1 trong các mô hình mã nguồn mở hàng đầu toàn cầu, đồng thời xếp thứ 3 trên toàn cầu về mô hình.
GLM-5.1 không chỉ kế thừa năng lực mã hóa mã nguồn mở SOTA của thế hệ mô hình trước, mà còn đạt bước đột phá trong các tác vụ dài hạn (Long-Horizon Task), cụ thể là: xây dựng máy tính để bàn Linux từ số 0 trong 8 giờ; 655 lần lặp để phá vỡ nút thắt tối ưu hóa của cơ sở dữ liệu vector; và tối ưu hóa mức tải của mô hình học máy thực tế bằng 1000 lượt gọi công cụ.
Đáng chú ý, theo cùng tiêu chuẩn đánh giá trên bảng METR, GLM-5.1 là mô hình mã nguồn mở duy nhất đạt mức làm việc liên tục cỡ 8 giờ, và cũng là một trong số ít mô hình trên phạm vi toàn cầu ngoài Claude Opus 4.6 có được khả năng này.