Google abandonne Nano Banana 2 : le nouveau roi de la génération d'images IA ?

Decrypt

2026-02-26 19:26:05

En bref

Le nouveau modèle Nano Banana 2 de Google offre une génération d’images de niveau professionnel désormais à la vitesse Flash
La recherche web en temps réel du modèle donne une base factuelle aux images générées par l’IA
Seedream 5, un modèle chinois lancé quelques jours avant cette annonce, offre plus de flexibilité et peut être un concurrent intéressant.

Google a récemment publié des logiciels d’IA à un rythme effréné. Rien que la semaine dernière, nous avons vu Gemini 3.1, Lyria et Pali, ce dernier proposant une fonction de séance photo qui a vraiment plu au public. Et maintenant, voici la suite de l’un des plus grands succès de génération d’images de l’année dernière. Nano Banana 2, lancé jeudi, « apporte l’intelligence à grande vitesse de Gemini Flash à la génération visuelle, permettant des modifications rapides et des itérations », a déclaré Google dans un billet de blog officiel, ajoutant que « cela rend les fonctionnalités Pro autrefois exclusives accessibles à un public plus large ». Voici un résumé rapide. Le Nano Banana original s’appelait en fait Gemini 2.5 Flash Image, et était essentiellement cela : un générateur d’images basé sur Gemini 2.5 Flash. Ensuite, Nano Banana Pro est arrivé, alias Gemini 3 Pro Image, qui est devenu la référence en matière de retouche d’images IA lors de son lancement en novembre dernier.

Présentation de Nano Banana 2 : notre meilleur modèle de génération et de retouche d’images à ce jour. 🍌

Qualité de niveau Pro, à la vitesse Flash. Déployé aujourd’hui sur @GeminiApp, Search, et nos outils pour développeurs et créateurs. pic.twitter.com/6oNWYhVSqp

— Google (@Google) 26 février 2026

Nano Banana 2 est techniquement Gemini 3.1 Flash Image — ce n’est donc pas une suite directe de Pro, mais plutôt une version considérablement améliorée de l’original, fonctionnant désormais sur la nouvelle architecture Gemini 3 Flash. Confus ? Oui. L’idée est simple : prendre tout ce qui rendait Nano Banana Pro spécial, et le faire fonctionner à la vitesse Flash. Le nouveau Nano Banana 2 est déployé aujourd’hui dans l’écosystème Google. Dans l’application Gemini, il remplace Nano Banana Pro en tant que modèle par défaut pour les versions Fast, Thinking et Pro. Les abonnés à Google AI Pro et Ultra peuvent toujours accéder à Nano Banana Pro pour des tâches spécifiques en régénérant via le menu à trois points. Il est également disponible en mode IA dans Google Search et Lens, via l’API Gemini dans AI Studio et sur Vertex AI en version bêta, et c’est le nouveau modèle par défaut pour la génération d’images dans Flow, sans crédits pour tous les utilisateurs. Google étend aussi la fonctionnalité de filigrane SynthID et ajoute la prise en charge des Content Credentials C2PA pour offrir aux plateformes de meilleurs outils d’identification des médias générés par IA. La fonction de vérification SynthID a déjà été utilisée plus de 20 millions de fois depuis novembre.

Nouveautés de Nano Banana 2 La plus grande nouveauté est la connaissance du monde réel. Nano Banana 2 peut effectuer des recherches web en temps réel lors de la génération d’images, ce qui lui permet de représenter avec précision des sujets spécifiques. Logos, monuments, événements récents, identités de marques — il sait à quoi ressemblent les choses parce qu’il peut les rechercher, pas seulement deviner à partir des données d’entraînement. La génération de texte a également été sérieusement améliorée. Vous pouvez désormais générer du texte précis et lisible à l’intérieur des images, que vous l’écriviez dans le prompt ou que le modèle décide quoi écrire en fonction du contexte. Il gère aussi la traduction dans l’image, permettant de localiser une campagne publicitaire dans plusieurs langues sans reconstruire le visuel de zéro. La cohérence des sujets progresse aussi dans de nouveaux domaines. Le modèle peut maintenir la ressemblance des personnages sur jusqu’à cinq sujets, et préserver la fidélité visuelle de jusqu’à 14 objets dans un seul flux de travail, selon Google. C’est un gros avantage pour ceux qui créent des narrations, storyboards ou assets de marque cohérents. Côté production, vous pouvez obtenir tout, du 512px jusqu’à la 4K, avec un support natif pour une large gamme de formats d’aspect. La capacité à suivre des instructions est également plus précise qu’avec les modèles Flash précédents, ce qui signifie en pratique moins de prompts pour obtenir ce que vous souhaitez, et plus de prompts qui font exactement ce que vous demandez. Le raisonnement est aussi désormais configurable. Les développeurs peuvent définir des niveaux de réflexion allant de Minimal (par défaut) à High ou Dynamic, permettant au modèle de réfléchir à des prompts complexes avant de rendre une image. Cette combinaison de vitesse et de réflexion optionnelle explique en partie les gains de qualité.

Test du modèle Les affirmations concernant la vitesse sont véridiques. Nous avons demandé à Nano Banana 2 de générer une chronologie complète de l’écosystème Bitcoin, incluant recherche et œuvre finale. Le processus complet a pris à peu près le même temps que Nano Banana Pro pour réaliser uniquement la chronologie Bitcoin. Lorsqu’on lui a demandé une chronologie Ethereum, cela n’a presque pas ajouté de temps. C’est un écart significatif pour ceux qui gèrent des pipelines itératifs ou construisent à grande échelle.

La capacité de connaissance du monde réel modifie vraiment la façon dont le résultat se présente. Lorsqu’on a demandé une chronologie historique de la crypto, le modèle a recherché dans plusieurs sources, sélectionné les événements les plus pertinents, et structuré l’art autour d’eux. Ce n’était pas générique. Le modèle a pris des décisions éditoriales. La seule faiblesse que nous avons remarquée était l’absence d’un lien visuel entre la fin d’une section et le début d’une autre. Tout le reste est cohérent. Nano Banana Pro, en comparaison, a produit quelque chose de plus artistique de manière générique, sans effort apparent pour sourcer ou prioriser les événements. Par exemple, voici ce que Nano Banana 2 a généré lorsqu’on lui a demandé « Créez une chronologie de l’histoire de Bitcoin, en mettant en évidence les événements les plus importants depuis sa création jusqu’à aujourd’hui. style dessin d’enfants, écran large » en utilisant la réflexion.

Pour comparer, voici la même génération avec Nano Banana Pro :

La cohérence des personnages et la gestion du texte ont été les aspects les plus impressionnants lors de nos tests. Nous avons demandé au modèle de créer la couverture d’un magazine, et chaque ligne de texte était précise et bien définie. Pas de caractères brouillés, pas de typographie qui dérive.

Nano Banana Pro est également performant ici, mais il présente plus de ratés, et sa sortie pour la couverture de magazine avait une qualité de rendu 3D qui paraissait synthétique.

Le résultat de Nano Banana 2 paraît photoréaliste. Il montre aussi globalement moins de caractères brouillés lorsqu’il génère du texte par sa propre réflexion, pas seulement lorsqu’on lui indique explicitement quoi écrire. Cela dit, le modèle a une limite claire. Nous avons demandé à Nano Banana 2 de modifier une photo réelle en changeant la tenue en sous-vêtements. Après un long cycle de raisonnement, il a refusé. Ce qui est attendu, sauf que, dans ce cas, il a refusé de modifier la photo d’une femme, mais pas celle d’un homme.

Une demande de changement de maillot de bain a fonctionné sans problème. Le niveau de censure semble à peu près équivalent à Nano Banana Pro, ce qui signifie que tout contenu à caractère explicite ou manipulation de personnes réelles dans des contextes suggestifs sera bloqué. Cela a plus d’importance qu’il n’y paraît, et nous y reviendrons dans un instant. Seedream 5 : Nano Banana 2 face à la concurrence

Voici ce qu’il faut retenir du lancement d’un modèle d’image phare fin février 2026 : ByteDance a lancé Seedream 5 la même semaine.
Seedream est devenu un favori de la communauté au cours de l’année dernière, et pour de bonnes raisons. Il est flexible, économique — environ 0,035 $ par image via l’API, soit environ un tiers du prix de Google — et sa modération de contenu est nettement plus permissive que celle de Google. Ce dernier point lui a permis de fidéliser une communauté de créateurs qui ont besoin de plus de liberté pour travailler avec des personnes réelles ou repousser les limites visuelles. Seedream 5 intègre la recherche web en temps réel dans son processus de génération, améliore le raisonnement, la cohérence des références, et supporte jusqu’à 14 images de référence dans un flux d’édition multi-étapes. Il génère en 2K et 4K en quelques secondes. Il peut aussi fonctionner localement, ce que Google ne permet pas, et est disponible dans CapCut et Jianying de ByteDance, ainsi que via l’API standard.

En résumé, Google et ByteDance ont tous deux lancé en même temps des modèles d’image basés sur la recherche web et le raisonnement avancé. Cela en dit long sur la direction que prend toute cette catégorie.

Voir l'original

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Commentaire

0/400

Aucun commentaire