L'API Google Gemini affiche des prix astronomiques : faille de « facture fantôme » : suppression du cache entraîne des débits, sortie nulle aussi facturée

robot
Création du résumé en cours

Selon le système de surveillance Beating, récemment, le forum des développeurs d'IA de Google a révélé plusieurs appels d'urgence concernant une perte de contrôle du système de facturation de l'API Gemini. Plusieurs développeurs ont été confrontés à des débits anormaux importants lors de leur utilisation normale, en raison de vulnérabilités sous-jacentes du système, par exemple, certains ont été débités près de 27 000 RMB en seulement 12 heures. Actuellement, l'équipe de facturation et l'équipe technique de Google se rejettent mutuellement la responsabilité, sans publier de déclaration officielle de correction ou de canal de remboursement rapide.

Après investigation, les principales bugs responsables des factures astronomiques des développeurs sont deux : d'une part, la vulnérabilité du « cache fantôme », où, après l'expiration ou la suppression du cache de contexte créé via l'API, la liste de gestion frontale est vidée, mais le backend de Google continue de facturer à un rythme de plusieurs milliers de yuan par heure ; d'autre part, le piège du « cycle de pensée infini », lorsque des outils comme la recherche en ligne sont activés, la « limite de budget de réflexion » du modèle devient invalide, ce qui entraîne une boucle de raisonnement infinie lors du traitement de tâches simples, consommant jusqu'à 64 000 tokens avant de planter par timeout, même si aucune sortie utile n'est renvoyée (« zéro réponse »), Google facture quand même en totalité des frais de réflexion augmentant de 1500 fois.

En raison d’un retard sévère de 32 à 72 heures dans le système de facturation de Google Cloud, et de l’absence de mécanisme automatique de coupure en cas de dépassement de limite, les développeurs ont été débités de montants importants avant même de recevoir une alerte. En raison du déni de responsabilité de l’assistance officielle et de l’absence de réponse sur le forum, certains développeurs victimes ont annoncé qu’ils abandonnaient complètement l’utilisation du cache de contexte et du modèle de raisonnement Gemini en production pour éviter des risques financiers.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé