D’après Beating, à la suite du lancement de 25 modèles open-source, dont Nvidia Nemotron 3 Ultra et Google Gemma 4 12B, l’écart de capacité entre les modèles de pointe open-source et les modèles fermés se réduit rapidement, mais les prix restent fortement désalignés. L’investisseur en technologie Chamath Palihapitiya a souligné que pour les entreprises consommant 1 milliard de jetons en entrée et 1 milliard de jetons en sortie par mois, GPT-5.5 Pro coûte 105 000 dollars, Claude Opus 4.8 coûte 30 000 dollars, tandis que DeepSeek R1 ne coûte que 2 740 dollars — ce qui fait que GPT-5.5 Pro affiche une prime de 40x.
Chamath a averti que la plupart des PDG ne savent pas que leurs équipes d’ingénierie utilisent par défaut les API des modèles de langage de grande taille les plus coûteux, sans gouvernance ni audits, ce qui entraîne des dépassements de budget. Il a prédit que, à mesure que les plans de contrôle de routage des modèles seront adoptés, les entreprises mettront en place des architectures indépendantes du modèle, en se tournant vers des fournisseurs d’inférence plus rentables par défaut, et en réservant les API premium uniquement pour les cas d’usage à forte valeur.