De acordo com a CEO da Abacus.AI, Bindu Reddy, a Google planeia revelar o Gemini 3.2 Flash durante a sua conferência I/O a 20 de maio, com desempenho a atingir 92% do GPT-5.5 em tarefas de programação e raciocínio, ao mesmo tempo que reduz os custos de inferência para apenas um-quinto a um-vigésimo do anterior. A maior parte das consultas terá uma latência abaixo de 200 milissegundos. Reddy atribuiu a conquista às técnicas de destilação e de esparsidade da Google, que comprimem um modelo de fronteira para o nível Flash sem o típico fosso de desempenho geralmente observado na otimização de modelos.
Related News
Especialistas afirmam que as provas Zk dão às DePINs uma vantagem à medida que aumenta a procura de confiança na IA
A Google lança o seu primeiro portátil “AI”: Googlebook com integração profunda do Gemini como melhor parceiro de colaboração
Google: grandes modelos de linguagem estão a ser usados para ataques reais, a IA pode contornar mecanismos de segurança de autenticação em duas etapas