Ant Group mở mã nguồn mô hình Ling-2.6-flash: 104B tham số với 7,4B tham số hoạt động, đạt nhiều mốc SOTA

Tin tức từ Gate, ngày 29 tháng 4 — Trọng số mô hình Ling-2.6-flash của Ant Group hiện đã được mở mã nguồn công khai, trước đây chỉ có sẵn thông qua API. Mô hình có tổng cộng 104 tỷ tham số với 7,4 tỷ tham số được kích hoạt cho mỗi lần suy luận, cửa sổ ngữ cảnh 256K và giấy phép MIT. Các phiên bản độ chính xác BF16, FP8 và INT4 có sẵn trên HuggingFace và ModelScope.

Ling-2.6-flash giới thiệu các cải tiến chú ý tuyến tính lai (hybrid linear attention) so với Ling 2.0, nâng cấp GQA gốc lên kiến trúc hybrid 1:7 MLA kết hợp Lightning Linear, cùng với MoE có độ thưa cực cao. Hiệu suất suy luận vượt đáng kể các mô hình tương đương: tốc độ tạo đỉnh đạt 340 token/giây trên 4 GPU H20, với thông lượng prefill và decode cao hơn khoảng 4 lần so với các mô hình mã nguồn mở tương đương. Các benchmark liên quan đến tác nhân cho thấy hiệu suất mạnh: BFCL-V4, TAU2-bench, SWE-bench Verified (61,2%), Claw-Eval và PinchBench đạt hoặc tiến gần mức SOTA. Trong toàn bộ bộ bài benchmark Artificial Analysis, tổng mức tiêu thụ token chỉ là 15 triệu. Trên AIME 2026, mô hình đạt 73,85%.

Trang web chính thức của Ant Group cũng liệt kê phiên bản flagship Ling-2.6-1T (phiên bản nghìn tỷ tham số) và phiên bản nhẹ (lightweight) Ling-2.6-mini (phiên bản nhẹ), tuy nhiên tính đến thời điểm xuất bản, trọng số của họ vẫn chưa được phát hành trên HuggingFace, chỉ có dòng flash hiện có thể tải xuống.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Các mô hình OpenAI sẽ dần chuyển sang chip Trainium do Amazon tùy chỉnh, Altman cho biết anh ấy đã 'mong chờ' điều đó

Tin tức cổng, ngày 29 tháng 4 — Theo những nhận xét gần đây từ Giám đốc điều hành OpenAI Sam Altman và các lãnh đạo của AWS, các mô hình OpenAI đang chạy trên Amazon Web Services' Bedrock sẽ dần dần chuyển sang Trainium, con chip AI do Amazon tự thiết kế. Hiện tại, các mô hình hoạt động trong một môi trường kết hợp, sử dụng cả GPU và Tr

GateNews12phút trước

Altman: Định giá theo token sắp trở nên lỗi thời khi GPT-5.5 chuyển trọng tâm sang hoàn thành tác vụ thay vì đếm token

Tin tức từ Gate, 29 tháng 4 — CEO OpenAI Sam Altman cho biết trong một cuộc phỏng vấn với Ben Thompson trên Stratechery rằng mô hình định giá dựa trên token không phải là lựa chọn khả thi lâu dài cho các dịch vụ AI. Lấy GPT-5.5 làm ví dụ, Altman nhận xét rằng mặc dù giá mỗi token cao hơn đáng kể so với GPT-5.4, nhưng mô hình này sử dụng ít token hơn nhiều để hoàn thành cùng một tác vụ, nghĩa là khách hàng không quan tâm đến số lượng token—họ chỉ quan tâm liệu tác vụ có được hoàn thành hay không và tổng chi phí.

GateNews16phút trước

Sam Altman 发布 Codex 双模式截图,办公與编程功能正式分流

Giám đốc điều hành OpenAI Sam Altman đã đăng vào ngày 29 tháng 4 trên nền tảng X những ảnh chụp và tuyên bố, Codex đang ra mắt phiên bản giao diện hướng dẫn mới: khi người dùng lần đầu truy cập phải chọn một trong hai chế độ, lần lượt là Excelmogging và Codemaxxing. Người dùng hoạt động hàng tuần của Codex hiện đã vượt quá 4 triệu, và các kịch bản sử dụng đã mở rộng từ tạo mã sang các mục đích không mang tính kỹ thuật.

MarketWhisper51phút trước

Codex của OpenAI ra mắt giao diện hai chế độ: Excelmogging cho công việc văn phòng, Codemaxxing cho lập trình

Tin tức từ Gate News, ngày 29 tháng 4 — Giám đốc điều hành OpenAI Sam Altman hôm nay đã công bố trên X một giao diện Codex được thiết kế lại, giới thiệu hai chế độ riêng biệt cho người dùng. "Excelmogging" nhắm đến các tác vụ văn phòng hằng ngày với giao diện được đơn giản hóa và khẩu hiệu "Cùng công cụ, giao diện đơn giản hơn," kèm các tác vụ ví dụ như

GateNews1giờ trước

Mỹ: Dự thảo lệnh hành pháp của Nhà Trắng cho phép mô hình Anthropic Mythos gia nhập chính phủ

Theo một báo cáo do Axios dẫn từ các nguồn tin cho biết vào ngày 28 tháng 4, Nhà Trắng đang xây dựng các hướng dẫn, cho phép mọi cơ quan liên bang bỏ qua việc công nhận rủi ro chuỗi cung ứng (SCRD) của Anthropic, đồng thời giới thiệu các mô hình mới để chính phủ sử dụng, bao gồm cả mô hình Mythos thuộc hệ sinh thái Anthropic. Về vấn đề này, trong tuyên bố chính thức của mình, Nhà Trắng cho biết rằng bất kỳ tuyên bố chính sách nào cũng sẽ được công bố trực tiếp bởi Tổng thống, và mọi thông tin khác chỉ là suy đoán.

MarketWhisper1giờ trước

Taylor Swift nộp đơn đăng ký thương hiệu âm thanh và hình ảnh, nhằm ngăn chặn việc lan truyền nội dung giả mạo do AI tạo ra

Theo một báo cáo của BBC vào ngày 28 tháng 4, ca sĩ nhạc pop nổi tiếng của Mỹ Taylor Swift đã nộp ba đơn đăng ký nhãn hiệu tại Mỹ, bao gồm các đoạn âm thanh giọng nói và hình ảnh sân khấu, với mục đích bảo vệ giọng nói và diện mạo của mình khỏi bị AI giả mạo; luật sư nhãn hiệu Josh Gerben trước tiên đã tiết lộ chi tiết các đơn đăng ký nói trên trên blog của mình.

MarketWhisper2giờ trước
Bình luận
0/400
Không có bình luận