De acuerdo con Beating, Google Gemini 3.1 Flash-Lite pasó de vista previa a disponibilidad general (GA) el 8 de mayo, convirtiéndose en el modelo más barato y rápido de la serie Gemini 3. El precio de entrada se fija en 0,25 USD por millón de tokens y el de salida en 1,50 USD por millón de tokens: el coste de entrada es 75% menor que Claude 4.5 Haiku (1,00 USD) y la salida es 70% menor (5,00 USD). El modelo incluye una ventana de contexto de 1 millón de tokens y logra un rendimiento de 363 tokens por segundo, un 45% más rápido que su predecesor Gemini 2.5 Flash.
Los benchmarks de rendimiento muestran GPQA Diamond (razonamiento científico a nivel de posgrado) en 86,9%, superando a Claude 4.5 Haiku con 73,0% y a GPT-5 mini con 82,3%. MMMU-Pro (razonamiento multimodal) alcanza 76,8%. Entre los primeros adoptantes están Gladly, plataforma de atención al cliente, que informa una reducción de costes del 60% y una tasa de éxito del 99,6% en cargas de trabajo de producción, y JetBrains, que integra Flash-Lite en herramientas de asistencia dentro de IDE.
Related News