Google 推出第八代 TPU 芯片:价格-性能提升更好,并将训练与推理分离

Gate News 消息,4 月 22 日——Google Cloud 宣布于 4 月 22 日发布其第八代自研定制 TPU (Tensor Processing Unit) 芯片。新产品阵容包括 TPU 8t,专为 AI 训练任务而设计;以及 TPU 8i,为 AI 推理工作负载进行了优化。两款芯片都将在今年晚些时候开始供货。谷歌还发布了用于构建 AI 代理的新工具,并宣布一项 $750 百万基金以推动企业采用 AI。

TPU 8t 在相同价格水平下,其性能比谷歌上一代 Ironwood TPU 提升 2.8 倍。TPU 8i 相较其前代产品性能提升 80%,并采用静态随机存取存储器 (SRAM) 架构,实现“具有成本效益的大规模吞吐和低延迟,使数百万个代理能够同时运行”,据首席执行官 Sundar Pichai 表示。与 Ironwood 相比,TPU 8t 和 TPU 8i 的每瓦效率均实现了超过两倍的提升,其中 TPU 8t 提升 124%,TPU 8i 提升 117%。谷歌在整个技术栈中优化了能效,并集成动态功耗管理系统,根据实时需求调整能耗。

谷歌自研模型现在通过直接客户 API 调用,每分钟处理超过 1600 亿个 token,高于上个季度的 1000 亿。如今,AI 在谷歌产生了 75% 的所有新增代码,而去年秋季为 50%。谷歌的企业产品 Gemini Enterprise,其付费月活用户环比增长 40%。该公司预计到 2026 年,将其机器学习计算预算中略多于一半投入云服务,以更好地服务云端客户及合作伙伴。谷歌也在扩大与博通(Broadcom)的合作,以开发并供给未来世代的定制 TPU 芯片,因为大型科技公司正寻求对英伟达(NVIDIA)和 AMD 价格昂贵且供给受限的 GPU 的替代方案。

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.
Comentar
0/400
Sin comentarios