Tin tức Cổng, ngày 23 tháng 4 — Google đã công bố vào ngày 22 tháng 4 rằng họ sẽ phát hành các chip TPU thế hệ thứ tám tách riêng cho huấn luyện và suy luận vào cuối năm nay, thay thế thiết kế gộp trước đó. Động thái này nhắm đến khối lượng công việc tác nhân AI và mang đến cho khách hàng Google Cloud một lựa chọn thay thế cho phần cứng của Nvidia.
Chip huấn luyện cho hiệu năng cao gấp 2,8 lần TPU Ironwood thế hệ thứ bảy của Google ở cùng mức giá, trong khi chip suy luận nhanh hơn 80% và có 384 MB SRAM, gấp ba lượng SRAM trong Ironwood. Việc tách riêng khả năng huấn luyện và suy luận phản ánh sự thay đổi trong cách các công ty tối ưu cho các nhu cầu tính toán khác nhau.
Sáng kiến này được hậu thuẫn bởi quan hệ hợp tác dài hạn với Broadcom và Anthropic. Anthropic dự kiến sẽ sử dụng khoảng 3,5 gigawatt điện toán TPU thông qua Broadcom bắt đầu từ năm 2027, trong đó Broadcom sẽ chịu trách nhiệm sản xuất chip và các thành phần mạng cho đến năm 2031. Anthropic, công ty khởi nghiệp AI đứng sau Claude, gần đây đã chứng kiến doanh thu được quy đổi theo năm vượt quá $30 tỷ. Trong khi đó, Apple, Microsoft, Meta và Amazon cũng đang mở rộng nỗ lực chip AI tùy chỉnh để giảm sự phụ thuộc vào Nvidia, công ty vẫn là nhà dẫn đầu thị trường.
Related News
Lô hàng Nvidia H200 tới Trung Quốc bị trì hoãn do phê duyệt, bất đồng về điều khoản
Google Ironwood TPU: Hiệu năng gấp 10 lần + Bốn đối tác cùng đối đầu Nvidia
Google 推出 Deep Research Max: Hỗ trợ MCP, có thể kết nối dữ liệu riêng tư của doanh nghiệp