Theo Beating, Google Gemini 3.1 Flash-Lite đã chuyển từ giai đoạn preview sang khả dụng chung (GA) vào ngày 8/5, trở thành mẫu rẻ nhất và nhanh nhất trong dòng Gemini 3. Giá nhập được đặt ở mức 0,25 USD cho mỗi 1 triệu token và giá xuất ở mức 1,50 USD cho mỗi 1 triệu token—chi phí nhập thấp hơn 75% so với Claude 4.5 Haiku (1,00 USD) và chi phí xuất thấp hơn 70% (5,00 USD). Mô hình có cửa sổ ngữ cảnh 1 triệu token và đạt thông lượng 363 token mỗi giây, nhanh hơn 45% so với Gemini 2.5 Flash.
Các bài benchmark hiệu năng cho thấy GPQA Diamond (lập luận khoa học ở trình độ sau đại học) đạt 86,9%, vượt Claude 4.5 Haiku (73,0%) và GPT-5 mini (82,3%). MMMU-Pro (lập luận đa phương thức) đạt 76,8%. Nhóm người dùng sớm gồm nền tảng dịch vụ khách hàng Gladly, cho biết giảm 60% chi phí và tỷ lệ thành công 99,6% trên các tác vụ chạy thực tế, cùng JetBrains, tích hợp Flash-Lite vào các công cụ hỗ trợ trong IDE.
Related News