Google Gemini 3.1 Flash-Lite chính thức ra mắt: giá đầu vào rẻ hơn 75% so với Claude 4.5 Haiku, điểm GPQA đạt 86,9%

Theo Beating, Google Gemini 3.1 Flash-Lite đã chuyển từ giai đoạn preview sang khả dụng chung (GA) vào ngày 8/5, trở thành mẫu rẻ nhất và nhanh nhất trong dòng Gemini 3. Giá nhập được đặt ở mức 0,25 USD cho mỗi 1 triệu token và giá xuất ở mức 1,50 USD cho mỗi 1 triệu token—chi phí nhập thấp hơn 75% so với Claude 4.5 Haiku (1,00 USD) và chi phí xuất thấp hơn 70% (5,00 USD). Mô hình có cửa sổ ngữ cảnh 1 triệu token và đạt thông lượng 363 token mỗi giây, nhanh hơn 45% so với Gemini 2.5 Flash.

Các bài benchmark hiệu năng cho thấy GPQA Diamond (lập luận khoa học ở trình độ sau đại học) đạt 86,9%, vượt Claude 4.5 Haiku (73,0%) và GPT-5 mini (82,3%). MMMU-Pro (lập luận đa phương thức) đạt 76,8%. Nhóm người dùng sớm gồm nền tảng dịch vụ khách hàng Gladly, cho biết giảm 60% chi phí và tỷ lệ thành công 99,6% trên các tác vụ chạy thực tế, cùng JetBrains, tích hợp Flash-Lite vào các công cụ hỗ trợ trong IDE.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận