Gate News 消息,4 月 22 日——Google Cloud 宣布于 4 月 22 日发布其第八代自研定制 TPU (Tensor Processing Unit) 芯片。新产品阵容包括 TPU 8t,专为 AI 训练任务而设计;以及 TPU 8i,为 AI 推理工作负载进行了优化。两款芯片都将在今年晚些时候开始供货。谷歌还发布了用于构建 AI 代理的新工具,并宣布一项 $750 百万基金以推动企业采用 AI。
TPU 8t 在相同价格水平下,其性能比谷歌上一代 Ironwood TPU 提升 2.8 倍。TPU 8i 相较其前代产品性能提升 80%,并采用静态随机存取存储器 (SRAM) 架构,实现“具有成本效益的大规模吞吐和低延迟,使数百万个代理能够同时运行”,据首席执行官 Sundar Pichai 表示。与 Ironwood 相比,TPU 8t 和 TPU 8i 的每瓦效率均实现了超过两倍的提升,其中 TPU 8t 提升 124%,TPU 8i 提升 117%。谷歌在整个技术栈中优化了能效,并集成动态功耗管理系统,根据实时需求调整能耗。
谷歌自研模型现在通过直接客户 API 调用,每分钟处理超过 1600 亿个 token,高于上个季度的 1000 亿。如今,AI 在谷歌产生了 75% 的所有新增代码,而去年秋季为 50%。谷歌的企业产品 Gemini Enterprise,其付费月活用户环比增长 40%。该公司预计到 2026 年,将其机器学习计算预算中略多于一半投入云服务,以更好地服务云端客户及合作伙伴。谷歌也在扩大与博通(Broadcom)的合作,以开发并供给未来世代的定制 TPU 芯片,因为大型科技公司正寻求对英伟达(NVIDIA)和 AMD 价格昂贵且供给受限的 GPU 的替代方案。
Related News
La versión internacional de QClaw de Tencent se abre para pruebas en fase inicial; en Japón, 700 dólares en tokens para entrar primero
Google busca ampliar el ecosistema de chips de IA con Marvell mientras se intensifica la competencia con Nvidia
Amazon incrementa su apuesta por Anthropic: 25 mil millones de dólares: 5 GW de capacidad informática, vinculación de AWS por un billón