Mensagem de Gate News, 23 de abril — A Google anunciou a 22 de abril que vai lançar, mais tarde este ano, chips TPU de 8.ª geração separados para treino e inferência, substituindo o seu design anterior combinado. A medida visa cargas de trabalho de agentes de IA e oferece aos clientes do Google Cloud uma alternativa ao hardware da Nvidia.
O chip de treino oferece 2,8 vezes o desempenho do TPU Ironwood de 7.ª geração da Google ao mesmo preço, enquanto o chip de inferência é 80% mais rápido e inclui 384 MB de SRAM, o triplo da quantidade no Ironwood. A separação das capacidades de treino e inferência reflecte uma mudança na forma como as empresas optimizam para diferentes exigências computacionais.
A iniciativa é apoiada por uma parceria de longo prazo com a Broadcom e a Anthropic. A Anthropic planeia usar cerca de 3,5 gigawatts de computação com TPU através da Broadcom a partir de 2027, com a Broadcom a assumir a fabricação dos chips e componentes de rede até 2031. A Anthropic, a startup de IA por detrás do Claude, tem visto recentemente as receitas anualizadas ultrapassar $30 mil milhões. Entretanto, a Apple, a Microsoft, a Meta e a Amazon também estão a expandir os seus esforços de chips de IA personalizados para reduzir a dependência da Nvidia, que continua a ser a líder de mercado.
Related News
Envios da Nvidia H200 para a China atrasados devido a aprovação pendente e desacordos sobre os termos
Google Ironwood TPU: desempenho 10x + quatro parceiros a enfrentar a Nvidia
A Google lança o Deep Research Max: suporta MCP e pode aceder a dados privados de empresas