Selon le suivi de Beating.AI, une nouvelle option de modèle nommée gemini-3.2-flash-lite-live-preview est apparue dans la liste de sélection des modèles de Google Cloud au 17 mai. Les suffixes « lite » et « live » indiquent que Google crée une version spécialisée optimisée pour des interactions temps réel à ultra-faible latence.
Le PDG d’Abacus.AI, Bindu Reddy, a précédemment révélé que Gemini 3.2 Flash atteint 92 % des capacités de codage et de raisonnement de GPT-5.5 tout en maintenant les coûts d’inférence à seulement 1/20e de ceux de GPT-5.5, la plupart des requêtes renvoyant des réponses en moins de 200 millisecondes. Des observateurs du secteur s’attendent à ce que ce modèle léger optimisé pour les coûts soit officiellement dévoilé lors de Google I/O le 20 mai.
Related News
Les prochains grands gagnants de la crypto : les meilleures cryptomonnaies avec un potentiel de 1 000x
X publie le code source de l’algorithme de recommandation « For You » : un guide pratique pour gérer des comptes Twitter avec l’algorithme
OpenAI ajoute la détection des conversations de crise sur ChatGPT, améliorant la capacité d’alerte en cas de violence d’automutilation