Mensagem do Gate News, 23 de abril — A Google anunciou em 22 de abril que lançará chips separados de TPU de oitava geração para treinamento e inferência ainda este ano, substituindo seu projeto anterior combinado. A iniciativa mira cargas de trabalho de agentes de IA e oferece aos clientes da Google Cloud uma alternativa ao hardware da Nvidia.
O chip de treinamento entrega 2,8 vezes o desempenho da TPU Ironwood de sétima geração da Google pelo mesmo preço, enquanto o chip de inferência é 80% mais rápido e traz 384 MB de SRAM, o triplo da quantidade na Ironwood. A separação das capacidades de treinamento e inferência reflete uma mudança na forma como as empresas otimizam para diferentes demandas computacionais.
A iniciativa é apoiada por uma parceria de longo prazo com Broadcom e Anthropic. A Anthropic planeja usar aproximadamente 3,5 gigawatts de computação com TPU via Broadcom a partir de 2027, com a Broadcom cuidando da fabricação dos chips e dos componentes de rede até 2031. A Anthropic, a startup de IA por trás do Claude, viu sua receita anualizada recentemente ultrapassar $30 bilhões. Enquanto isso, Apple, Microsoft, Meta e Amazon também estão expandindo esforços de chips personalizados de IA para reduzir a dependência da Nvidia, que segue como líder de mercado.
Related News
Entregas do Nvidia H200 para a China atrasadas por aprovação e discordâncias sobre termos
Google Ironwood TPU: 10x de desempenho + quatro parceiros contra a Nvidia
Google lança o Deep Research Max: suporta MCP e pode acessar dados privados de empresas