Microsoft est en pourparlers pour fournir à Anthropic, la société d’IA de San Francisco à l’origine de Claude, ses puces IA Maia 200 via Azure. L’accord n’est pas finalisé, mais il pourrait aider Microsoft à réduire l’écart avec Amazon et Google dans l’offre de puces IA sur mesure aux clients cloud. En novembre, Microsoft a investi 5 milliards de dollars US dans Anthropic. Anthropic s’est engagé à dépenser 30 milliards de dollars US sur Azure, tandis que le jeune pousse utilise aussi des GPU Nvidia, plus des puces sur mesure d’Amazon et de Google.
Maia 200 Vise l’efficacité de l’inférence IA
Le Maia 200 de Microsoft est conçu pour l’inférence IA — le travail consistant à exécuter un modèle entraîné pour générer des réponses — plutôt que comme une puce à usage général. Faire tourner des services IA à grande échelle dans le temps peut coûter plus cher que l’entraînement du modèle lui-même. Microsoft affirme que le Maia 200 offre 30% de performances en plus par dollar, ce qui pourrait réduire les coûts quotidiens pour un client à fort volume ou permettre des fonctionnalités comme des fenêtres de contexte plus longues sans augmenter le budget. La puce vise aussi à maintenir des temps de réponse plus stables pendant les pics de trafic, ce qui compte pour les entreprises qui construisent des produits sur les modèles d’Anthropic.
Des puces sur mesure reconfigurent la concurrence IA
Les discussions suggèrent que la course s’éloigne de l’achat de plus de GPU Nvidia. Les entreprises associent des fabricants de modèles à des plateformes de puces sur mesure et aux systèmes cloud qui les font tourner. Anthropic adopte déjà cette approche avec Google et Broadcom, un concepteur de puces et une entreprise d’infrastructure. Elle ajuste ses modèles Claude pour fonctionner plus étroitement avec la pile matérielle et logicielle de l’Unité de traitement des tenseurs (TPU) de Google. Un accord similaire avec Microsoft pour Maia 200 pourrait soutenir un plan multicloud s’appuyant sur plus d’un fournisseur de puces, élargissant l’accès d’Anthropic au silicium sur mesure via Azure. Les livraisons de puces sur mesure de fournisseurs cloud devraient augmenter de 44,6% en 2026, contre 16,1% de croissance pour les GPU.